INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar Orientador: Prof. Heitor Garcia de Carvalho, Ph.D INTRODUÇÃO Assim como o trabalho desenvolvido pelo bolsista PIBIC Minervino Martins Neto, este projeto avaliará dados recolhidos nos processos seletivos do CEFET-MG. Porém, a análise fatorial do conjunto de dados será substituída pela técnica de datamining com o intuito de captar bem certas informações em formato de texto e buscar padrões de dados em subconjuntos da população com cardinalidade reduzida. O QUE É DATAMINING? A Mineração dos Dados, denominada Datamining, é uma das etapas principais dentro do Processo de Extração de Conhecimento em Base de Dados ( KDD – Knowledge Discovery Database). Através do uso de suas técnicas e algoritmos, padrões são “descobertos” dentro de uma Base de Dados, provendo assim, recursos para que o Analista do Conhecimento possa identificar informações relevantes e inteligentes no que antes, era uma massa de Dados. O QUE É WEKA? WEKA (Waikato Enviroment for Knowledge Analysis) é uma ferramenta livre e disponível para download na Internet. Foi desenvolvida pela Universidade de Waikato na Nova Zelândia, sendo utilizada para Mineração de Dados. OBJETIVOS 1. Investigar os padrões implícitos nos conjuntos de dados numéricos e em variáveis textuais dos bancos de dados relativos ao vestibular dos cursos de engenharia do CEFET-MG ; 2. A partir da investigação, identificar características dos perfis dos alunos que demandam o ingresso na escola e confrontá-los com o dos aprovados; 3. Após identificar tais características, subsidiar medidas de interesse pedagógico e administrativo. METODOLOGIA 1. Estudo da teoria, do software e dos métodos; 2. Obtenção de dados do exame vestibular e derivados de documentos, além das respostas aos formulários de inscrição, fornecidos pelos candidatos; 3. Adaptação dos dados obtidos aos formatos eletrônicos requeridos para utilização no software de mineração de dados; 4. Crítica e depuração do banco de dados obtidos de forma a adequá–lo aos requisitos da ferramenta de datamining (WEKA); 5. Elaboração de hipóteses de pesquisa de padrões de associação (estudo da probabilidade de um item ocorrer dado que outro item esteja presente) e de clusterização (identificação das classes dentro da base de dados e agrupamento de objetos em classes semelhantes); 6. Aplicação do software de datamining; 7. Interpretação e análise crítica dos resultados; 8. Elaboração de conclusões e de relatórios de pesquisa; EXEMPLOS 1. QUESTIONÁRIO 2. DADOS PASSADOS PARA PLANILHA Q1 Q2 Q3 Q4 nome contato sexo faixa_etaria Q5.1a Q5.1b Q5.1c curso_magist instituicao_magist conclusao_magist Q5.2a curso_grad Q5.2b Q5.2c instituicao_grad conclusao_grad EntrA1 ProfHA 34854399 2 5 EntrA2 ProfGA 32259250 2 7 0 0 0 0 0 0 Licenciatura Plena em História Geografia Fafi-BH Católica - MG 1985 1974 3. LISTAGEM DAS RESPOSTAS POSSIVEIS Q2 sexo 0 1 2 9998 9999 Nenhum Feminino Masculino Outros Branco Q3 faixa_etaria 0 1 2 3 4 5 6 7 9998 9999 Nenhum 18 aos 25 anos 26 aos 30 anos 31 aos 35 anos 36 aos 40 anos 41 aos 45 anos 46 aos 50 anos mais de 50 anos Outros Branco sexo faixa_etaria curso_grad1 tipo_instituicao_grad1 instituicao_grad1 conclusao_grad1 curso_grad2 tipo_instituicao_grad2 instituicao_grad2 conclusao_grad2 4. DADOS PRONTOS PARA O WEKA PROCESSAR 2 2 1 1 1 2 1 2 1 1 1 2 1 5 7 3 4 7 6 5 2 5 7 6 4 3 13 12 23 3 19 20 15 15 14 5 7 17 3 7 7 8 7 7 11 7 8 7 8 8 7 7 11 16 22 14 11 28 16 18 16 13 18 15 14 3 1 5 4 2 2 2 5 4 1 3 5 5 0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 0 0 0 0 18 0 0 0 0 0 0 0 0 0 0 0 0 5 0 RESULTADOS ESPERADOS 1. Informações sobre os perfis de alunos que demandam o ingresso nos cursos de engenharia do CEFET-MG contrastando-os com as características dos aprovados e que sejam relevantes para o seu atendimento pedagógico durante o curso; 2. Aquisição de proficiência pelo aluno bolsista em uma técnica aplicável a problemas no seu campo profissional. BIBLIOGRAFIA OLIVEIRA, Araceli Garcia. Descoberta de Conhecimento na Base de Dados do Processo Seletivo do UNIFOR-MG. Formiga, MG: Monografia, 2004. MONTEIRO, Mário do Socorro Jardim; ROCHA, Vanderlene Covre. Descoberta de Conhecimento na Base de Dados do Processo Seletivo Seriado da UFPA – 2004, Usando Regras de Associação. Belém, PA: Monografia, 2005.