Strict very fast decision tree : a memory conservative algorithm for data stream classification

dataload.collectionmapped02 - Mestrado - Ciência da Computaçãopt_BR
dataload.filenamenourau6675.pdfpt_BR
dataload.handlemapped123456789/50pt_BR
dataload.idpergamum112180pt_BR
dataload.idvirtuanourauvtls000226754pt_BR
dataload.idvirtuapergamumvtls000226754pt_BR
dataload.idvirtuapergamum.sameurlnourauSIMpt_BR
dataload.linknourauhttp://www.bibliotecadigital.uel.br/document/?code=vtls000226754pt_BR
dataload.linknourau.regularSIMpt_BR
dataload.linknourau.retificadohttp://www.bibliotecadigital.uel.br/document/?code=vtls000226754pt_BR
dataload.linknourau.size64.00pt_BR
dc.contributor.advisorBarbon Junior, Sylvio [Orientador]pt_BR
dc.contributor.authorCosta, Victor Guilherme Turrisipt_BR
dc.contributor.bancaZarpelão, Bruno Bogazpt_BR
dc.contributor.bancaMantovani, Rafael Gomespt_BR
dc.coverage.spatialLondrinapt_BR
dc.date.accessioned2024-05-01T12:44:48Z
dc.date.available2024-05-01T12:44:48Z
dc.date.created2019.00pt_BR
dc.date.defesa27.03.2019pt_BR
dc.description.abstractResumo: Lidar com restrições de memória e tempo são desafios presentes quando deseja-se aprender com fluxos massivos de dados Diversos algoritmos foram propostos para lidar com essas dificuldades, entre eles, a Very Fast Decision Tree (VFDT) Apesar da VFDT ser amplamente utilizada para a mineração de fluxos de dados, nos últimos anos, diversos autores sugeriram mudanças para melhorar a capacidade preditiva desse algoritmo, mas ignorando os altos custos adicionais de memória e tempo ocasionados por essas modificações Além disso, mais recentemente, a maioria dos algoritmos para mineração de fluxos de dados são baseados em ensembles, sendo bem custosos considerando os recursos de memória e tempo Esse estudo apresenta um novo algoritmo baseado na VFDT chamado de Strict VFDT (SVFDT) que reduz custos de memória mantendo capacidade preditiva similar a VFDT Além disso, como as árvores de decisão geradas são mais rasas, a SVFDT acaba reduzindo o tempo computacional necessário para se processar um fluxo de dados Esse algoritmo aplica medidas heurísticas para bloquear divisões de folhas que não resultam em um aumento significativo na capacidade preditiva Foram realizados experimentos comparando a SVFDT com a VFDT em 26 fluxos de dados Após realizar diversas análises, cada qual focando em algum dos múltiplos aspectos dos algoritmos, foi possível observar que o algoritmo proposto é capaz de reduzir drasticamente o consumo de memória enquanto possui capacidade preditiva similar e sendo mais rápido em muitos casospt_BR
dc.description.abstractother1Abstract: Memory and time constraints are current challenges when learning from massive data streams Many algorithms have been proposed to handle these difficulties, among them, the Very Fast Decision Tree (VFDT) Although it has been widely used in data stream mining, in the last years, several authors have suggested modifications to increase its predictive performance, putting aside the high memory and time demands of these modifications Besides, recently, most data stream mining solutions have been centred around ensembles, which are very costly from a memory and time point of view This study presents a novel algorithm based on the VFDT called Strict VFDT (SVFDT) that reduces memory costs while maintaining predictive performance Moreover, since it creates much shallower trees than VFDT, the SVFDT can achieve a shorter computational time It works by blocking splits which would not yield a significant increase in predictive performance using heuristic measures Experiments were carried out comparing the SVFDT with the VFDT in 26 data stream datasets By performing different analysis focusing on multiple aspects of the algorithms, the proposed algorithm was able to greatly reduce memory consumption while yielding similar predictive performance and being faster in many casespt_BR
dc.description.notesDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computaçãopt_BR
dc.identifier.urihttps://repositorio.uel.br/handle/123456789/10561
dc.languagepor
dc.relation.coursedegreeMestradopt_BR
dc.relation.coursenameCiência da Computaçãopt_BR
dc.relation.departamentCentro de Ciências Exataspt_BR
dc.relation.ppgnamePrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectAlgoritmos de computadorpt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectData mining (Computing)pt_BR
dc.subjectComputer algoritmspt_BR
dc.titleStrict very fast decision tree : a memory conservative algorithm for data stream classificationpt_BR
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
6675.pdf
Tamanho:
1.6 MB
Formato:
Adobe Portable Document Format