Código: PPGEC_2011_2_CJABF2 ESCOLA POLITÉCNICA DE PERNAMBUCO Universidade de Pernambuco Programa de Pós-Graduação em Engenharia da Computação (PPGEC) Proposta de Dissertação de Mestrado Área: Computação Inteligente e Reconhecimento de Padrões Título: Mineração de Dados para Determinação de Perfis Acadêmicos na Universidade de Pernambuco Orientador – Carmelo José Albanez Bastos Filho ([email protected]) Descrição Historicamente, encontrar padrões em dados é conhecido por diferentes nomes em diferentes comunidades (por exemplo, extração de conhecimento, descoberta de informação, arqueologia de dados, processamento de padrões de dados, e mineração de dados). O termo mineração de dados é muitas vezes utilizado em comunidades de estatísticos, pesquisadores de banco de dados, e mais recentemente por gerentes de sistemas de informação. Segundo Fayyad, Piatetsky-shapiro e Smyth [1], o termo KDD referencia o processo global de descobrir conhecimento útil em grandes bases de dados, sendo a mineração de dados um passo particular desse processo que consiste na execução de algoritmos de reconhecimento padrões em base de dados. Mineração de dados é um dos principais passos do processo KDD, que consiste na aplicação de algoritmos com a finalidade de extrair padrões de comportamento em uma base de dados [1]. A seguir, são apresentadas as principais tarefas da mineração de dados: Classificação, Regressão, Detecção de desvios, sumarização, modelos de dependência e Análises de séries temporais. Atualmente, existe uma dificuldade enorme nas universidades brasileiras para aquisição de dados sobre a produção do seu corpo docente. Entretanto, a maior parte destes dados pode ser encontrada na plataforma Lattes, mantida pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico [2]. O objetivo desta dissertação é desenvolver uma ferramenta para extração de dados da plataforma Lattes, com funcionalidades de mineração de dados, como aglutinação [3] e regras de associação [4], com o intuito de classificar docentes segundo perfis diferentes. A proposta é que as informações oriundas desta ferramenta possam ser utilizadas para definir ações de investimentos em docentes e cursos na Universidade de Pernambuco. Referências Bibliográficas [1]FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AI Magazine, v. 17, p. 37-54,1996. [2] PLATAFORMA LATTES. Disponı́vel em: <http://lattes.cnpq.br/>. Acesso em: 21 set 2010. [3] BERKHIN, P. Survey Of Clustering Data Mining Techniques. San Jose, CA, 2002. Disponı́vel em: <http://www.ee.ucr.edu/ barth/EE242/clustering_survey.pdf>. Acesso em: 18 set 2010 [4] AGRAWAL, R.; SRIKANT, R. Fast algorithms for mining association rules. Proceedings 20th International Conference Very Large Data Bases, VLDB, p. 487-499,1994.