Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
Data
2024-04-04
Autores
Dionisio, Gustavo Marcelino
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Um dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no Brasil
Descrição
Palavras-chave
Seleção de atributos, Aprendizagem de máquina, Evasão, Ensino superior - Brasil, Evasão universitária - Brasil, Aprendizado do computador, Aprendizagem - computação