Ementa da disciplina

Propaganda
UNIVERSIDADE FEDERAL DE UBERLÂNDIA
FICHA DE DISCIPLINA
DISCIPLINA: MINERAÇÃO DE DADOS
SEMESTRE
CÓDIGO
PGC201
PROGRAMA PG EM CIÊNCIA DA
FACULDADE
DE
COMPUTAÇÃO
COMPUTAÇÃO
CARGA HORÁRIA
CRÉDITOS
OBRIGATÓRIA
( )
90h
5
OPTATIVA
( x )
REQUISITOS
Nenhum
OBJETIVOS GERAIS DA DISCIPLINA
Adquirir uma compreensão abrangente sobre mineração de dados (data mining) e descoberta
de conhecimento em bancos de dados. Entender as principais técnicas e temas de pesquisa
nesta subárea de bancos de dados. Estar apto a aplicar ferramentas de mineração de dados
(data mining) a problemas práticos.
EMENTA DO PROGRAMA
O que é Data Mining - Regras de Associação - Padrões Sequenciais – Classificação, Técnicas
de Amostragem- Avaliação de Classificadores - Clusterização - Avaliação de Clusters–
Mineração com Restrições - Web Mining
DESCRIÇÃO DO PROGRAMA
1. O que é Data Mining ? Que tipo de dados minerar ? As diversas fases do processo de
descoberta de conhecimento em bancos de dados :
a) Pré-processamento - Redução : Agregação, Compressão, Discretização.
b) Mineração
c) Pós-processamento dos padrões minerados.
2. Mineração de Regras de Associação em grandes volumes de dados – Algoritmo Apriori –
Técnicas de Otimização – Mineração de Regras com Restrições
3. Mineração de Sequências - Algoritmo GSP – Algoritmo PrefixSpan- Análise Comparativa
da metodologia e da performance dos dois algoritmos.
4. Mineração de Sequências com Restrições - Algoritmos SPIRIT
5. Classificadores
5.1 Tipos de Classificadores - Criterios de Avaliação
5.2 Método da Árvore de Decisão - Algoritmos ID3 – J48
5.3 Backpropagation - Redes Neurais
5.4 Classificadores Bayesianos
5.5 Método KNN
5.6 Previsão – Regressão Linear
5.7 Técnicas de Amostragem
5.8 Avaliação de Classificadores - dados com classes não-balanceadas
Curvas Roc
6. Análise de Clusters
6.1 Tipos de Clusters
6.2 Métodos por Particionamento - K-means - K-medóides (PAM - CLARA)
6.3 Métodos Hierárquicos - CURE, BIRCH
6.4 Métodos baseados em densidade- DBSCAN
6.5 Avaliação de Clusteres
7. Outliers - Detecção de Anomalias
8 . Mineração de Arvores – Web Mining
BIBLIOGRAFIA
Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Introduction to Data Mining. Addison-Wesley,
2006.
J.Han, M. Kamber : Data Mining : Concepts and Techniques. Morgan Kaufmann, 2nd Edition,
2006
I. H. Witten, E. Frank : Data Mining : Practical Machine Learning - Tools and Techniques.
Morgan Kaufmann, 2nd Edition, 2005.
Artigos de pesquisa atual sobre o tema.
DATA ____/____/____
________________________________
Diretor da Faculdade
_______________________________
Coordenadora do Programa
Download