Exercício - DC

Propaganda
Mineração de Dados - Trabalho Final
junho/julho de 2008
• Selecionar um arquivo de dados entre os
sugeridos
no
repósitório
UCI
(http://archive.ics.uci.edu/ml/) e aplicar as tarefas
de Mineração de dados, usando a ferramento
WEKA (http://www.cs.waikato.ac.nz/~ml), de
acordo com as recomendações a seguir.
• Arquivos sugeridos: Forest Fires, Car evaluation,
Credit Approval, Mushruoom
1
• Aplicar as três etapas principais da mineração de
dados :pré-processamento, extração de padrões
e pós-processamento, conforme a necessidade,
dependendo das características do arquivo de
dados.
• Pré-processamento:
– eliminar exemplos com dados ausentes, discretizar os
atributos, transformar valores (se for necessário),
etc...
– transformar para o formato arff
• Extração de Padrões:
– aplicar o algoritmo Apriori, definindo os parâmetros
para obter 10 regras
– aplicar um algoritmo de classificação ou regressão,
conforme as características do conjunto de dados
• Pós-processamento:
– explicar o significado das 3 melhores regras obtidas
pelo Apriori
– analisar o resultado do algoritmo de classificação ou
regressão, com padrões do tipo: “carros do ano xx e
fabricante yy tem consumo abaixo de zz”.
• Entregar um relatório contendo:
• Introdução – breve descrição do que são regras de
associação e como funciona o algoritmo Apriori
• Pré-processamento – operações realizadas nos dados,
como eliminação de exemplos com dados ausentes e
discretização
• Descrição dos dados – descrição da forma final dos
dados, incluindo descrição dos atributos, valores
discretizados, número de instâncias
• Resultados – apresentar para cada uma dos algoritmos,
os parâmetros utilizados, como por exemplo, o valor de
suporte mínimo, a confiança mínima, o número de
ciclos. Apresentar os resultados pedidos acima no item
“pós-processamento”.
• A avaliação será feita com base nos
resultados encontrados e no relatório final
(50%).
• Data de entrega: 29/08/2008
Download