Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
dc.contributor.advisor | Menolli, André Luís Andrade | |
dc.contributor.author | Dionisio, Gustavo Marcelino | |
dc.contributor.banca | Brancher, Jacques Duílio | |
dc.contributor.banca | Boscarioli, Clodis | |
dc.coverage.extent | 57 p. | |
dc.coverage.spatial | Londrina | |
dc.date.accessioned | 2024-10-21T19:28:44Z | |
dc.date.available | 2024-10-21T19:28:44Z | |
dc.date.issued | 2024-04-04 | |
dc.description.abstract | Um dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no Brasil | |
dc.description.abstractother1 | One of the major challenges in machine learning in some domains is the high dimensionality of features. Thus, this study proposes a process focused on attribute selection and dimensionality reduction to enhance predictive models, with one of its outputs being the most relevant attributes for the prediction at hand. The object of study for applying this process is the phenomenon of dropout in Brazilian Higher Education Institutions, with a special focus on face-to-face courses, using data provided by the National Institute for Educational Studies and Research. By adopting Machine Learning techniques and algorithms, the process aims to identify the most impactful attributes on dropout, optimizing predictive analysis by eliminating variables irrelevant to the context. This procedure includes essential steps such as data transformation and balancing, context selection, empirical and algorithmic attribute selection, as well as iterative steps to refine predictive models, resulting in the generation of machine learning models specialized in specific contexts. The process was applied in five different contexts of Brazilian higher education. With the results of these experiments, through the proposed process, it was possible to generate predictive models of reduced dimensionality with higher accuracy than the original models. Furthermore, compared to other feature selection techniques, the models generated through the process achieved superior accuracy. Regarding the study on dropout, it was possible to identify the main characteristics related to specific contexts. Finally, it was found that there is a set of common characteristics to all studied scenarios, which are essential in predicting dropout in face-to-face higher education in Brazil | |
dc.identifier.uri | https://repositorio.uel.br/handle/123456789/18185 | |
dc.language.iso | por | |
dc.relation.departament | CCE - Departamento de Computação | |
dc.relation.institutionname | Universidade Estadual de Londrina - UEL | |
dc.relation.ppgname | Programa de Pós-Graduação em Ciência da Computação | |
dc.subject | Seleção de atributos | |
dc.subject | Aprendizagem de máquina | |
dc.subject | Evasão | |
dc.subject | Ensino superior - Brasil | |
dc.subject | Evasão universitária - Brasil | |
dc.subject | Aprendizado do computador | |
dc.subject | Aprendizagem - computação | |
dc.subject.capes | Ciências Exatas e da Terra - Ciência da Computação | |
dc.subject.cnpq | Ciências Exatas e da Terra - Ciência da Computação | |
dc.subject.keywords | Feature selection | |
dc.subject.keywords | Machine learning | |
dc.subject.keywords | Dropout | |
dc.subject.keywords | Higher education - Brazil | |
dc.subject.keywords | College dropouts - Brazil | |
dc.subject.keywords | Machine learning | |
dc.subject.keywords | Learning - Computing | |
dc.title | Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro | |
dc.title.alternative | A process based on feature selection and machine learning to generate predictive models: an study on higher education dropout | |
dc.type | Dissertação | |
dcterms.educationLevel | Mestrado Acadêmico | |
dcterms.provenance | Centro de Ciências Exatas |
Arquivos
Pacote Original
1 - 2 de 2
Carregando...
- Nome:
- CE_COM_Me_2024_Dionísio_Gustavo_M.pdf
- Tamanho:
- 731.59 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Texto completo ID. 192724
Nenhuma Miniatura disponível
- Nome:
- CE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf
- Tamanho:
- 137.01 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Termo de compromisso
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 555 B
- Formato:
- Item-specific license agreed to upon submission
- Descrição: