Data Mining para traçar perfil e predizer o desempenho dos alunos que ingressam no ensino superior Tércio Jorge da Silva Raimundo de Acácio Leonel Júnior Ticiana Linhares Coelho da Silva Algumas mudanças tem ocorrido no sistema de avaliação para ingresso no ensino superior no Brasil. Talvez uma das mais impactantes mudanças seja a implantação do Enem como critério único de seleção em diversas universidades públicas, entre elas a Universidade Federal do Ceará(UFC). Nesse contexto, é importante conhecer o perfil dos alunos que ingressam na universidade todo ano. Essa análise pode ser realizada utilizando, por exemplo, dados de desempenho dos alunos no ensino médio e no Enem, além dos fatores socioeconômicos. O objetivo é a partir dos resultados da análise evitar altas taxas de abandono e direcionar os alunos a terem um bom desempenho dentro da universidade. Esse conhecimento pode ser extraído das bases da própria universidade usando técnicas de mineração de dados, por exemplo. A mineração de dados (ou em inglês, data mining) apresenta um conjunto de técnicas para analisar grandes quantidades de dados tentando encontrar um padrão consistente, sumarizar os dados, extrair conhecimento ou realizar predições. No trabalho [KABAKCHIEVA et al, 2012], foram utilizados dados dos alunos, referentes ao período da faculdade e ensino médio. Por meio da aplicação de técnicas de mineração de dados, foi possível classificar os alunos em grupos de acordo com o desempenho(ruim, mediano, bom, muito bom e excelente). Em [Silva et al, 2012], foi usada a base de dados do Enem de 2010, do qual foi retirada uma amostra somente com os estudantes da região sul do Brasil. Os quesitos levados em consideração foram: o desempenho do aluno, e alguns fatores socioeconômicos, tais como, grau de instrução dos pais, acesso à internet e o tipo de escola no ensino médio(pública ou particular). O resultado do estudo foi capaz de estabelecer regras sobre o desempenho dos estudantes, exemplificando, se o estudante não tem internet e vem de escola pública, ele tem um resultado insatisfatório na prova. Este trabalho tem objetivo aplicar técnicas de mineração para extração de conhecimento na base de dados referente aos alunos da UFC, que ainda se encontra em processo de obtenção. A ferramenta Weka que é um software livre composto por algoritmos de mineração de dados, será utilizada a priori para classificar os alunos de acordo com seu desempenho, levando em conta quesitos como: notas do aluno no Enem, tipo de escola em que estudou no ensino médio(pública ou particular), métodos de ingresso(cotas raciais, sociais), se ficam na cidade onde estudam nos finais de semana, entre outros. Também extrair informações importantes, como as taxas de abandono e possíveis explicações nesse contexto. Inicialmente os dados a serem manipulados serão coletados somente dos alunos da Universidade Federal do Ceará – Campi Quixadá, em seguida serão analisados os dados referentes a todos alunos da instituição, fazendo uso a priori de técnicas como classificação e clusterização. O processo de validação dos dados será feito mediante os gestores da universidade e os resultados serão apresentados em um sistema, provavelmente integrado a outros sistemas da universidade, tornando assim o acesso ao conhecimento extraído publico para todos os que compõe a instituição. Enquanto os dados da universidade não são disponibilizados, dados abertos similares a base da universidade estão sendo utilizados com o propósito de experimentação durante a disciplina de Tópicos Avançados em Banco de Dados. Palavras-chaves: Mineração de dados. Weka. Dados abertos.