Avaliação de modelos preditivos baseados em aprendizagem de máquina no contexto da evasão escolar considerando um cenário multicampi

Dissertação de Mestrado
Aluno: Francisco Alysson da Silva Sousa

Resumo: A evasão escolar e os fatores diversos relacionados a esse comportamento despontam como um dos grandes desafios ao pleno desenvolvimento da educação. No contexto nacional, estima-se que 27% do número total de alunos matriculados não concluem o percurso formativo previsto nas respectivas ofertas. Delimitando-se na proposta da Rede Federal de Educação Profissional, Científica e Tecnológica (RFEPCT), especificamente na Educação Profissional Técnica de Nível Médio (EPTNM) ofertada no Instituto Federal do Piauí(IFPI), esse estudo identificou um alarmante decréscimo no número de concluíntes que já supera os 47% no percentual acumulado nos últimos 5 (cinco) anos, conforme estatísticas oficiais apresentadas na Plataforma Nilo Peçanha (PNP). Assim, a identificação de forma prévia da tendência a esse comportamento certamente contribui como subsídio para o direcionamento de estratégias de enfrentamento. Nesse sentido, o uso da inteligência artificial, especificamente na subárea aprendizado de máquina, apresenta-se como importante recurso preditivo de apoio à gestão educacional. É nessa perspectiva que se define a proposta deste trabalho em avaliar classificadores quanto a ocorrência de evasão no âmbito do ensino técnico multicampi, para tanto, foram aplicados os algoritmos de Decision Tree (DT), Random Forest (RF), Gradient Boost (GB), Multi-Layer Perceptron (MLP) e Support Vector Machine (SVM).

Os modelos utilizados foram submetidos a análises comparativas a partir de estudos de casos com dados extraídos da PNP, sistema do Ministério de Educação alimentado e validado diretamente pelas instituições. Os resultados dos modelos melhor avaliados (DT e RF) apresentam médias superiores a 90% quando consideradas todas as unidades da instituição em testes segmentados e agrupados destacando ainda uma tendência de evolução nas performances que favorece o potencial escalável da proposta a toda a rede. Os valores obtidos avaliam a sensibilidade e a precisão com suas relevâncias equiparadas e resumidas pela métrica F-score.

Download do Trabalho