UNIVERSIDADE FEDERAL DE UBERLÂNDIA FICHA DE DISCIPLINA DISCIPLINA: MINERAÇÃO DE DADOS SEMESTRE CÓDIGO PGC201 PROGRAMA PG EM CIÊNCIA DA FACULDADE DE COMPUTAÇÃO COMPUTAÇÃO CARGA HORÁRIA CRÉDITOS OBRIGATÓRIA ( ) 90h 5 OPTATIVA ( x ) REQUISITOS Nenhum OBJETIVOS GERAIS DA DISCIPLINA Adquirir uma compreensão abrangente sobre mineração de dados (data mining) e descoberta de conhecimento em bancos de dados. Entender as principais técnicas e temas de pesquisa nesta subárea de bancos de dados. Estar apto a aplicar ferramentas de mineração de dados (data mining) a problemas práticos. EMENTA DO PROGRAMA O que é Data Mining - Regras de Associação - Padrões Sequenciais – Classificação, Técnicas de Amostragem- Avaliação de Classificadores - Clusterização - Avaliação de Clusters– Mineração com Restrições - Web Mining DESCRIÇÃO DO PROGRAMA 1. O que é Data Mining ? Que tipo de dados minerar ? As diversas fases do processo de descoberta de conhecimento em bancos de dados : a) Pré-processamento - Redução : Agregação, Compressão, Discretização. b) Mineração c) Pós-processamento dos padrões minerados. 2. Mineração de Regras de Associação em grandes volumes de dados – Algoritmo Apriori – Técnicas de Otimização – Mineração de Regras com Restrições 3. Mineração de Sequências - Algoritmo GSP – Algoritmo PrefixSpan- Análise Comparativa da metodologia e da performance dos dois algoritmos. 4. Mineração de Sequências com Restrições - Algoritmos SPIRIT 5. Classificadores 5.1 Tipos de Classificadores - Criterios de Avaliação 5.2 Método da Árvore de Decisão - Algoritmos ID3 – J48 5.3 Backpropagation - Redes Neurais 5.4 Classificadores Bayesianos 5.5 Método KNN 5.6 Previsão – Regressão Linear 5.7 Técnicas de Amostragem 5.8 Avaliação de Classificadores - dados com classes não-balanceadas Curvas Roc 6. Análise de Clusters 6.1 Tipos de Clusters 6.2 Métodos por Particionamento - K-means - K-medóides (PAM - CLARA) 6.3 Métodos Hierárquicos - CURE, BIRCH 6.4 Métodos baseados em densidade- DBSCAN 6.5 Avaliação de Clusteres 7. Outliers - Detecção de Anomalias 8 . Mineração de Arvores – Web Mining BIBLIOGRAFIA Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Introduction to Data Mining. Addison-Wesley, 2006. J.Han, M. Kamber : Data Mining : Concepts and Techniques. Morgan Kaufmann, 2nd Edition, 2006 I. H. Witten, E. Frank : Data Mining : Practical Machine Learning - Tools and Techniques. Morgan Kaufmann, 2nd Edition, 2005. Artigos de pesquisa atual sobre o tema. DATA ____/____/____ ________________________________ Diretor da Faculdade _______________________________ Coordenadora do Programa