Desempenho de Algoritmos e uma Estratégia de Ensemble para Detecção de Mudanças de Conceito Heterogêneos.

Data

2025-02-04

Autores

Sakurai, Guilherme Yukio

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

A mineração de dados tem se tornado cada vez mais popular devido à sua capacidade de oferecer algoritmos e metodologias que atendem demandas da Internet das Coisas (IoT) e dos sistemas modernos de aprendizado de máquina. Dentro desse contexto, a detecção de mudanças de conceito é primordial, especialmente para identificar alterações na distribuição dos dados durante a operação de soluções de aprendizado de máquina. Um dos maiores desafios enfrentados por algoritmos de detecção de mudanças de conceito é a capacidade de lidar com diferentes tipos de mudanças, como mudanças abruptas, graduais e incrementais. Este trabalho atua em duas frentes para melhorar a detecção dessas mudanças heterogêneas. Primeiramente, realizamos um estudo que estabelece um benchmark para quatro algoritmos de detecção de mudanças de conceito (EDDM, DDM, HDDMW e HDDMA), avaliando seu desempenho em termos de detecção, tempo de resposta e atraso na detecção, utilizando conjuntos de dados sintéticos. Os resultados indicam que o HDDMW oferece o melhor equilíbrio entre os indicadores de desempenho, especialmente na detecção de mudanças de conceito abruptas, embora apresente limitações em termos de tempo de resposta e detecção de mudanças incrementais. Na segunda frente de atuação, propomos o método Self-tuning Drift Ensemble (StDE), um novo algoritmo de ensemble para detecção de mudanças de conceito que utiliza mecanismos dinâmicos para adaptar-se às mudanças nas características dos fluxos de dados em tempo real. Diferente de outros detectores de mudanças de conceito baseados em ensemble, o StDE ajusta dinamicamente o número de detectores base, mantendo uma solução leve e eficiente. Experimentos realizados em diversos cenários de mudança de conceito demonstram que o método proposto supera os algoritmos estabelecidos, apresentando alta taxa de precisão na detecção de mudanças.

Descrição

Palavras-chave

Stream mining, Concept Drift, Drift Detection, Turning, Ensemble learning, Internet das coisas, Aprendizado do computador, Algoritmos computacionais, Mineração de dados (Computação)

Citação