Mineração de Dados - Trabalho Final junho/julho de 2008 • Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (http://archive.ics.uci.edu/ml/) e aplicar as tarefas de Mineração de dados, usando a ferramento WEKA (http://www.cs.waikato.ac.nz/~ml), de acordo com as recomendações a seguir. • Arquivos sugeridos: Forest Fires, Car evaluation, Credit Approval, Mushruoom 1 • Aplicar as três etapas principais da mineração de dados :pré-processamento, extração de padrões e pós-processamento, conforme a necessidade, dependendo das características do arquivo de dados. • Pré-processamento: – eliminar exemplos com dados ausentes, discretizar os atributos, transformar valores (se for necessário), etc... – transformar para o formato arff • Extração de Padrões: – aplicar o algoritmo Apriori, definindo os parâmetros para obter 10 regras – aplicar um algoritmo de classificação ou regressão, conforme as características do conjunto de dados • Pós-processamento: – explicar o significado das 3 melhores regras obtidas pelo Apriori – analisar o resultado do algoritmo de classificação ou regressão, com padrões do tipo: “carros do ano xx e fabricante yy tem consumo abaixo de zz”. • Entregar um relatório contendo: • Introdução – breve descrição do que são regras de associação e como funciona o algoritmo Apriori • Pré-processamento – operações realizadas nos dados, como eliminação de exemplos com dados ausentes e discretização • Descrição dos dados – descrição da forma final dos dados, incluindo descrição dos atributos, valores discretizados, número de instâncias • Resultados – apresentar para cada uma dos algoritmos, os parâmetros utilizados, como por exemplo, o valor de suporte mínimo, a confiança mínima, o número de ciclos. Apresentar os resultados pedidos acima no item “pós-processamento”. • A avaliação será feita com base nos resultados encontrados e no relatório final (50%). • Data de entrega: 29/08/2008