Apresentação do PowerPoint - lplc - Cefet-MG

Propaganda
INFERÊNCIAS SOBRE OS PERFIS DE
VESTIBULANDOS DOS CURSOS DE
ENGENHARIA DO CEFET-MG
UTILIZANDO A FERRAMENTA WEKA
DE DATAMINING
Aluna: Lúcia Salomé de Aguilar
Orientador: Prof. Heitor Garcia de Carvalho, Ph.D
INTRODUÇÃO
Assim como o trabalho desenvolvido pelo
bolsista PIBIC Minervino Martins Neto, este
projeto avaliará dados recolhidos nos
processos seletivos do CEFET-MG. Porém,
a análise fatorial do conjunto de dados será
substituída pela técnica de datamining com o
intuito de captar bem certas informações em
formato de texto e buscar padrões de dados
em subconjuntos da população com
cardinalidade reduzida.
O QUE É DATAMINING?
A Mineração dos Dados, denominada
Datamining, é uma das etapas principais
dentro do Processo de Extração de
Conhecimento em Base de Dados ( KDD –
Knowledge Discovery Database). Através do
uso de suas técnicas e algoritmos, padrões
são “descobertos” dentro de uma Base de
Dados, provendo assim, recursos para que o
Analista do Conhecimento possa identificar
informações relevantes e inteligentes no que
antes, era uma massa de Dados.
O QUE É WEKA?
WEKA (Waikato Enviroment for Knowledge
Analysis) é uma ferramenta livre e disponível para
download na Internet. Foi desenvolvida pela
Universidade de Waikato na Nova Zelândia, sendo
utilizada para Mineração de Dados.
OBJETIVOS
1. Investigar os padrões implícitos nos conjuntos de
dados numéricos e em variáveis textuais dos
bancos de dados relativos ao vestibular dos cursos
de engenharia do CEFET-MG ;
2. A partir da investigação, identificar características
dos perfis dos alunos que demandam o ingresso na
escola e confrontá-los com o dos aprovados;
3. Após identificar tais características, subsidiar
medidas de interesse pedagógico e administrativo.
METODOLOGIA
1. Estudo da teoria, do software e dos métodos;
2. Obtenção de dados do exame vestibular e
derivados de documentos, além das respostas
aos formulários de inscrição, fornecidos pelos
candidatos;
3. Adaptação dos dados obtidos aos formatos
eletrônicos requeridos para utilização no
software de mineração de dados;
4. Crítica e depuração do banco de dados obtidos
de forma a adequá–lo aos requisitos da
ferramenta de datamining (WEKA);
5. Elaboração de hipóteses de pesquisa de padrões
de associação (estudo da probabilidade de um item
ocorrer dado que outro item esteja presente) e de
clusterização (identificação das classes dentro da
base de dados e agrupamento de objetos em
classes semelhantes);
6. Aplicação do software de datamining;
7. Interpretação e análise crítica dos resultados;
8. Elaboração de conclusões e de relatórios de
pesquisa;
EXEMPLOS
1. QUESTIONÁRIO
2. DADOS PASSADOS PARA PLANILHA
Q1
Q2
Q3
Q4
nome
contato
sexo
faixa_etaria
Q5.1a
Q5.1b
Q5.1c
curso_magist
instituicao_magist
conclusao_magist
Q5.2a
curso_grad
Q5.2b
Q5.2c
instituicao_grad
conclusao_grad
EntrA1
ProfHA
34854399
2
5
EntrA2
ProfGA
32259250
2
7
0
0
0
0
0
0
Licenciatura Plena em História
Geografia
Fafi-BH
Católica - MG
1985
1974
3. LISTAGEM DAS RESPOSTAS POSSIVEIS
Q2
sexo
0
1
2
9998
9999
Nenhum
Feminino
Masculino
Outros
Branco
Q3
faixa_etaria
0
1
2
3
4
5
6
7
9998
9999
Nenhum
18 aos 25 anos
26 aos 30 anos
31 aos 35 anos
36 aos 40 anos
41 aos 45 anos
46 aos 50 anos
mais de 50 anos
Outros
Branco
sexo
faixa_etaria
curso_grad1
tipo_instituicao_grad1
instituicao_grad1
conclusao_grad1
curso_grad2
tipo_instituicao_grad2
instituicao_grad2
conclusao_grad2
4. DADOS PRONTOS PARA O WEKA PROCESSAR
2
2
1
1
1
2
1
2
1
1
1
2
1
5
7
3
4
7
6
5
2
5
7
6
4
3
13
12
23
3
19
20
15
15
14
5
7
17
3
7
7
8
7
7
11
7
8
7
8
8
7
7
11
16
22
14
11
28
16
18
16
13
18
15
14
3
1
5
4
2
2
2
5
4
1
3
5
5
0
0
0
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
0
0
0
0
18
0
0
0
0
0
0
0
0
0
0
0
0
5
0
RESULTADOS ESPERADOS
1. Informações sobre os perfis de alunos que
demandam o ingresso nos cursos de
engenharia do CEFET-MG contrastando-os
com as características dos aprovados e que
sejam relevantes para o seu atendimento
pedagógico durante o curso;
2. Aquisição de proficiência pelo aluno
bolsista em uma técnica aplicável a
problemas no seu campo profissional.
BIBLIOGRAFIA
OLIVEIRA, Araceli Garcia. Descoberta de
Conhecimento na Base de Dados do Processo
Seletivo do UNIFOR-MG. Formiga, MG: Monografia,
2004.
MONTEIRO, Mário do Socorro Jardim; ROCHA,
Vanderlene Covre. Descoberta de Conhecimento na
Base de Dados do Processo Seletivo Seriado da
UFPA – 2004, Usando Regras de Associação.
Belém, PA: Monografia, 2005.
Download