Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro

dc.contributor.advisorMenolli, André Luís Andrade
dc.contributor.authorDionisio, Gustavo Marcelino
dc.contributor.bancaBrancher, Jacques Duílio
dc.contributor.bancaBoscarioli, Clodis
dc.coverage.extent57 p.
dc.coverage.spatialLondrina
dc.date.accessioned2024-10-21T19:28:44Z
dc.date.available2024-10-21T19:28:44Z
dc.date.issued2024-04-04
dc.description.abstractUm dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no Brasil
dc.description.abstractother1One of the major challenges in machine learning in some domains is the high dimensionality of features. Thus, this study proposes a process focused on attribute selection and dimensionality reduction to enhance predictive models, with one of its outputs being the most relevant attributes for the prediction at hand. The object of study for applying this process is the phenomenon of dropout in Brazilian Higher Education Institutions, with a special focus on face-to-face courses, using data provided by the National Institute for Educational Studies and Research. By adopting Machine Learning techniques and algorithms, the process aims to identify the most impactful attributes on dropout, optimizing predictive analysis by eliminating variables irrelevant to the context. This procedure includes essential steps such as data transformation and balancing, context selection, empirical and algorithmic attribute selection, as well as iterative steps to refine predictive models, resulting in the generation of machine learning models specialized in specific contexts. The process was applied in five different contexts of Brazilian higher education. With the results of these experiments, through the proposed process, it was possible to generate predictive models of reduced dimensionality with higher accuracy than the original models. Furthermore, compared to other feature selection techniques, the models generated through the process achieved superior accuracy. Regarding the study on dropout, it was possible to identify the main characteristics related to specific contexts. Finally, it was found that there is a set of common characteristics to all studied scenarios, which are essential in predicting dropout in face-to-face higher education in Brazil
dc.identifier.urihttps://repositorio.uel.br/handle/123456789/18185
dc.language.isopor
dc.relation.departamentCCE - Departamento de Computação
dc.relation.institutionnameUniversidade Estadual de Londrina - UEL
dc.relation.ppgnamePrograma de Pós-Graduação em Ciência da Computação
dc.subjectSeleção de atributos
dc.subjectAprendizagem de máquina
dc.subjectEvasão
dc.subjectEnsino superior - Brasil
dc.subjectEvasão universitária - Brasil
dc.subjectAprendizado do computador
dc.subjectAprendizagem - computação
dc.subject.capesCiências Exatas e da Terra - Ciência da Computação
dc.subject.cnpqCiências Exatas e da Terra - Ciência da Computação
dc.subject.keywordsFeature selection
dc.subject.keywordsMachine learning
dc.subject.keywordsDropout
dc.subject.keywordsHigher education - Brazil
dc.subject.keywordsCollege dropouts - Brazil
dc.subject.keywordsMachine learning
dc.subject.keywordsLearning - Computing
dc.titleUm processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
dc.title.alternativeA process based on feature selection and machine learning to generate predictive models: an study on higher education dropout
dc.typeDissertação
dcterms.educationLevelMestrado Acadêmico
dcterms.provenanceCentro de Ciências Exatas

Arquivos

Pacote Original
Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
CE_COM_Me_2024_Dionísio_Gustavo_M.pdf
Tamanho:
731.59 KB
Formato:
Adobe Portable Document Format
Descrição:
Texto completo ID. 192724
Nenhuma Miniatura disponível
Nome:
CE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf
Tamanho:
137.01 KB
Formato:
Adobe Portable Document Format
Descrição:
Termo de compromisso
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
555 B
Formato:
Item-specific license agreed to upon submission
Descrição: