Strict very fast decision tree : a memory conservative algorithm for data stream classification

Data

Autores

Costa, Victor Guilherme Turrisi

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Resumo: Lidar com restrições de memória e tempo são desafios presentes quando deseja-se aprender com fluxos massivos de dados Diversos algoritmos foram propostos para lidar com essas dificuldades, entre eles, a Very Fast Decision Tree (VFDT) Apesar da VFDT ser amplamente utilizada para a mineração de fluxos de dados, nos últimos anos, diversos autores sugeriram mudanças para melhorar a capacidade preditiva desse algoritmo, mas ignorando os altos custos adicionais de memória e tempo ocasionados por essas modificações Além disso, mais recentemente, a maioria dos algoritmos para mineração de fluxos de dados são baseados em ensembles, sendo bem custosos considerando os recursos de memória e tempo Esse estudo apresenta um novo algoritmo baseado na VFDT chamado de Strict VFDT (SVFDT) que reduz custos de memória mantendo capacidade preditiva similar a VFDT Além disso, como as árvores de decisão geradas são mais rasas, a SVFDT acaba reduzindo o tempo computacional necessário para se processar um fluxo de dados Esse algoritmo aplica medidas heurísticas para bloquear divisões de folhas que não resultam em um aumento significativo na capacidade preditiva Foram realizados experimentos comparando a SVFDT com a VFDT em 26 fluxos de dados Após realizar diversas análises, cada qual focando em algum dos múltiplos aspectos dos algoritmos, foi possível observar que o algoritmo proposto é capaz de reduzir drasticamente o consumo de memória enquanto possui capacidade preditiva similar e sendo mais rápido em muitos casos

Descrição

Palavras-chave

Mineração de dados (Computação), Algoritmos de computador, Aprendizado do computador, Data mining (Computing), Computer algoritms

Citação