Mineração de texto e wavelets aplicadas na classificação de contas em redes sociais digitais
Arquivos
Data
Autores
Igawa, Rodrigo Augusto
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Resumo: Para auxiliar a descoberta de fraudes em Redes Sociais Digitais (RSD), este trabalho propõe um modelo para classificação de contas de usuários baseada na Transformada Discreta Wavelet para caracterização do conteúdo textual O principal objetivo da classificação é distinguir os padrões das classes em: Humanos, Cyborgs ou Bots A abordagem proposta analisa a distribuição dos termos chaves da base de dados utilizada e visa manter o custo computacional adequado para RSD Para a caracterização dos documentos em um processo de discretização, este trabalho propõe um novo esquema de peso chamado Lexicon Based Coefficient Attenuation (LBCA) A etapa de classificação é efetuada por meio do uso dos classificadores Random Forests e Perceptron Multi-Camadas Os experimentos foram realizados com um conjunto de postagem obtidas durante os jogos da Copa do Mundo da FIFA de 214 Os resultados mostraram que o modelo proposto obteve acurácias variando entre 94% e 1% na classificação entre as classes, permitindo a validação da discretização por meio das wavelets e com a contribuição do novo esquema de pesagem, adequado ao cenário das RSD
Descrição
Palavras-chave
Mineração de dados (Computação), Processamento de imagens, Técnicas digitais, Redes sociais on-line, Wavelets (Matemática), Data mining (Computing), Digital techniques, Online social networks, Wavelets (Mathematics), Image processing