Universidade de Pernambuco Programa de Pós

Propaganda
Código: PPGEC_2011_2_CJABF2
ESCOLA POLITÉCNICA
DE PERNAMBUCO
Universidade de Pernambuco
Programa de Pós-Graduação em Engenharia da
Computação (PPGEC)
Proposta de Dissertação de Mestrado
Área: Computação Inteligente e Reconhecimento de Padrões
Título: Mineração de Dados para Determinação de Perfis Acadêmicos na
Universidade de Pernambuco
Orientador – Carmelo José Albanez Bastos Filho ([email protected])
Descrição
Historicamente, encontrar padrões em dados é conhecido por diferentes nomes em
diferentes comunidades (por exemplo, extração de conhecimento, descoberta de
informação, arqueologia de dados, processamento de padrões de dados, e mineração de
dados). O termo mineração de dados é muitas vezes utilizado em comunidades de
estatísticos, pesquisadores de banco de dados, e mais recentemente por gerentes de
sistemas de informação. Segundo Fayyad, Piatetsky-shapiro e Smyth [1], o termo KDD
referencia o processo global de descobrir conhecimento útil em grandes bases de
dados, sendo a mineração de dados um passo particular desse processo que consiste na
execução de algoritmos de reconhecimento padrões em base de dados. Mineração de
dados é um dos principais passos do processo KDD, que consiste na aplicação de
algoritmos com a finalidade de extrair padrões de comportamento em uma base de
dados [1]. A seguir, são apresentadas as principais tarefas da mineração de dados:
Classificação, Regressão, Detecção de desvios, sumarização, modelos de dependência
e Análises de séries temporais.
Atualmente, existe uma dificuldade enorme nas universidades brasileiras para
aquisição de dados sobre a produção do seu corpo docente. Entretanto, a maior parte
destes dados pode ser encontrada na plataforma Lattes, mantida pelo Conselho
Nacional de Desenvolvimento Científico e Tecnológico [2]. O objetivo desta
dissertação é desenvolver uma ferramenta para extração de dados da plataforma Lattes,
com funcionalidades de mineração de dados, como aglutinação [3] e regras de
associação [4], com o intuito de classificar docentes segundo perfis diferentes. A
proposta é que as informações oriundas desta ferramenta possam ser utilizadas para
definir ações de investimentos em docentes e cursos na Universidade de Pernambuco.
Referências Bibliográficas
[1]FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge
discovery in databases. AI Magazine, v. 17, p. 37-54,1996.
[2] PLATAFORMA LATTES. Disponı́vel em: <http://lattes.cnpq.br/>. Acesso em: 21 set
2010.
[3] BERKHIN, P. Survey Of Clustering Data Mining Techniques. San Jose, CA, 2002.
Disponı́vel em: <http://www.ee.ucr.edu/ barth/EE242/clustering_survey.pdf>. Acesso
em: 18 set 2010
[4] AGRAWAL, R.; SRIKANT, R. Fast algorithms for mining association rules. Proceedings
20th International Conference Very Large Data Bases, VLDB, p. 487-499,1994.
Download