UNIVERSIDADE FEDERAL DE VIÇOSA ESTE DOCUMENTO NÃO SUBSTITUI O ORIGINAL Programa Analítico de Disciplina SIN460 Mineração de Dados Campus Rio Paranaíba - Campus Rio Paranaíba Número de créditos: 4 Duração em semanas: 15 Períodos - oferecimento: I e II Carga horária semanal Carga horária total Teóricas 4 60 Práticas 0 0 Total 4 60 Pré-requisitos (Pré ou co-requisitos)* SIN110 Ementa Introdução. Dados. Explorando os dados. Introdução do problema de classificação. Algoritmos de classificação. Análise de grupos. Oferecimento aos Cursos Curso Sistemas de Informação Modalidade Optativa Período - ______________________________________________________ Catálogo de Graduação 2016 da UFV 0 UNIVERSIDADE FEDERAL DE VIÇOSA ESTE DOCUMENTO NÃO SUBSTITUI O ORIGINAL SIN460 Mineração de Dados Seq 1 Aulas Teóricas Introdução Horas/Aula 4 1.1. O que é mineração de dados? 1.2. Desafios 1.3. Origens da mineração de dados 1.4. Tarefas de mineração de dados 2 Dados 6 2.1. Tipos de dados 2.2. Qualidade dos dados 2.3. Pré-processamento de dados 2.3.1. Agregação e amostragem 2.3.2. Seleção de atributos e redução da dimensionalidade 2.4. Medidas de semelhança e diferença 3 Explorando os dados 6 3.1. Estatísticas e resumo 3.2. Visualização 3.3. OLAP 3.4. Análise de dados multidimensionais 4 Introdução do problema de classificação 18 4.1. Noções preliminares 4.2. Abordagem Geral 4.3. Árvores de decisão 4.3.1. Como uma árvore de decisão funciona 4.3.2. Construção da árvore de decisão 4.3.3. Aprimoramento 4.3.4. Algoritmo de indução de árvore de decisão 4.4. Overfitting 4.4.1. Problemas com ruídos 4.4.2. Falta de amostras 4.4.3. Comparação múltipla 4.4.4. Lidando com Overfitting 4.5. Avaliando o desempenho 4.5.1. Houldout 4.5.2. Sub-amostragem aleatória 4.5.3. Validação cruzada 4.5.4. Bootstrap 4.6. Métodos para comparar classificadores ______________________________________________________ Catálogo de Graduação 2016 da UFV 1 UNIVERSIDADE FEDERAL DE VIÇOSA ESTE DOCUMENTO NÃO SUBSTITUI O ORIGINAL 5 Algoritmos de classificação 14 5.1. Classificador do vizinho mais próximo 5.1.1. Algoritmo 5.1.2. Principais características 5.2. Classificadores Bayesianos 5.2.1. Teorema de Bayes 5.2.2. Usando o Teorema de Bayes para classificação 5.2.3. Classificador de Bayes simples 5.3. Redes Neurais Artificiais (ANN) 5.3.1. Perceptron 5.3.2. Treinamento 5.3.3. Aprendizado 5.3.4. ANN multicamadas (MLP) 5.3.5. Características de ANN 6 Análise de grupos 12 6.1. Visão geral 6.1.1. O que é análise de grupos? 6.1.2. Diferentes tipos de grupos 6.1.3. Diferentes tipos de agrupamentos 6.2. K-médias 6.2.1. O algoritmo k-médias básico 6.2.2. Dividindo k-médias 6.2.3. Pontos fortes e fracos 6.2.4. K-médias como problema de otimização 6.2.5. Determinando o número de grupos 6.3. Agrupamento hierárquico 6.3.1. Principais conceitos 6.3.2. Algoritmo hierárquico aglomerativo 6.3.3. Medidas de similaridade entre grupos 6.3.4. Questões chave no agrupamento hierárquico 6.3.5. Pontos fortes e fracos ______________________________________________________ Catálogo de Graduação 2016 da UFV 2 UNIVERSIDADE FEDERAL DE VIÇOSA ESTE DOCUMENTO NÃO SUBSTITUI O ORIGINAL SIN460 Mineração de Dados Referências Bibliográficas Bibliografia Básica: 1 - PINHEIRO, C.A.R. Inteligência Analítica - Mineraçao de Dados e Descoberta de Conhecimento. 1ª ed. Ciência Moderna, 2008. [Exemplares disponíveis: Não informado.] 2 - SILVA, I.N., SPATTI, D.H. e FLAUZINO, R. A. Neurais Artificiais para engenharia e ciências aplicadas: curso prático. Edição 1. Artliber, 2010. [Exemplares disponíveis: Não informado.] 3 - STEINBACH, M.; KUMAR, V.; TAN, P. Introdução ao Data Mining (Mineração de Dados). Edição 1. Ciência Moderna, 2009. [Exemplares disponíveis: Não informado.] ___________________________________________________________________________________ Bibliografia Complementar: 4 - AGUIAR, O.J.H. Inteligência Computacional Aplicada à Administração, Economia e Engenharia em Matlab. Edição 1. Thomson, 2007. [Exemplares disponíveis: Não informado.] 5 - Duda, R.O.; Hart, P.E. and Stork, D.G. Pattern Classification. Edição 2. Wiley-Interscience, 2000. [Exemplares disponíveis: 2] 6 - LINDEN, R. Algoritmos Genéticos. Edição 2. Brasport, 2008. [Exemplares disponíveis: Não informado.] 7 - MITCHELL, T. Machine Learning, Edição 1. McGraw Hill, 1997. [Exemplares disponíveis: 2] 8 - Theodoridis, S.; Koutroumbas, K. Pattern Recognition. Edição 1. Elsevier, 2008. [Exemplares disponíveis: Não informado.] ______________________________________________________ Catálogo de Graduação 2016 da UFV 3