Data Mining para traçar perfil e predizer o desempenho dos alunos

Propaganda
Data Mining para traçar perfil e predizer o desempenho dos alunos que ingressam no
ensino superior
Tércio Jorge da Silva
Raimundo de Acácio Leonel Júnior
Ticiana Linhares Coelho da Silva
Algumas mudanças tem ocorrido no sistema de avaliação para ingresso no ensino superior no Brasil. Talvez uma das
mais impactantes mudanças seja a implantação do Enem como critério único de seleção em diversas universidades
públicas, entre elas a Universidade Federal do Ceará(UFC). Nesse contexto, é importante conhecer o perfil dos alunos
que ingressam na universidade todo ano. Essa análise pode ser realizada utilizando, por exemplo, dados de desempenho
dos alunos no ensino médio e no Enem, além dos fatores socioeconômicos. O objetivo é a partir dos resultados da
análise evitar altas taxas de abandono e direcionar os alunos a terem um bom desempenho dentro da universidade. Esse
conhecimento pode ser extraído das bases da própria universidade usando técnicas de mineração de dados, por exemplo.
A mineração de dados (ou em inglês, data mining) apresenta um conjunto de técnicas para analisar grandes quantidades
de dados tentando encontrar um padrão consistente, sumarizar os dados, extrair conhecimento ou realizar predições. No
trabalho [KABAKCHIEVA et al, 2012], foram utilizados dados dos alunos, referentes ao período da faculdade e ensino
médio. Por meio da aplicação de técnicas de mineração de dados, foi possível classificar os alunos em grupos de acordo
com o desempenho(ruim, mediano, bom, muito bom e excelente). Em [Silva et al, 2012], foi usada a base de dados do
Enem de 2010, do qual foi retirada uma amostra somente com os estudantes da região sul do Brasil. Os quesitos levados
em consideração foram: o desempenho do aluno, e alguns fatores socioeconômicos, tais como, grau de instrução dos
pais, acesso à internet e o tipo de escola no ensino médio(pública ou particular). O resultado do estudo foi capaz de
estabelecer regras sobre o desempenho dos estudantes, exemplificando, se o estudante não tem internet e vem de escola
pública, ele tem um resultado insatisfatório na prova. Este trabalho tem objetivo aplicar técnicas de mineração para
extração de conhecimento na base de dados referente aos alunos da UFC, que ainda se encontra em processo de
obtenção. A ferramenta Weka que é um software livre composto por algoritmos de mineração de dados, será utilizada a
priori para classificar os alunos de acordo com seu desempenho, levando em conta quesitos como: notas do aluno no
Enem, tipo de escola em que estudou no ensino médio(pública ou particular), métodos de ingresso(cotas raciais, sociais),
se ficam na cidade onde estudam nos finais de semana, entre outros. Também extrair informações importantes, como as
taxas de abandono e possíveis explicações nesse contexto. Inicialmente os dados a serem manipulados serão coletados
somente dos alunos da Universidade Federal do Ceará – Campi Quixadá, em seguida serão analisados os dados
referentes a todos alunos da instituição, fazendo uso a priori de técnicas como classificação e clusterização. O processo
de validação dos dados será feito mediante os gestores da universidade e os resultados serão apresentados em um
sistema, provavelmente integrado a outros sistemas da universidade, tornando assim o acesso ao conhecimento extraído
publico para todos os que compõe a instituição. Enquanto os dados da universidade não são disponibilizados, dados
abertos similares a base da universidade estão sendo utilizados com o propósito de experimentação durante a disciplina
de Tópicos Avançados em Banco de Dados.
Palavras-chaves: Mineração de dados. Weka. Dados abertos.
Download