Tela Inicial WEKA Data Mining Edilberto M. Silva Introdução ! O Weka é uma coleção de algoritmos de machine learning para resolver problemas de data mining do mundo real. Os algoritmos podem ser aplicados tanto a um conjunto de dados ou chamados do seu código Java. Além disso, o Weka apresenta facilidades para desenvolvimento de novos esquemas de machine learning. Esquemas implementados para predição numérica: • • • • • • linear regression model tree generators locally weighted regression instance-based learners decision tables multi-layer perceptron Esquemas implementados para classificação: • • • • • • • • • • decision tree inducers rule learners naive Bayes decision tables locally weighted regression support vector machines instance-based learners logistic regression voted perceptrons multi-layer perceptron "meta-schemes“ implementados: • • • • • • bagging stacking boosting regression via classification classification via regression cost sensitive classification 1 Arquivo ARFF Arquivo ARFF Arquivo ARFF Arquivo ARFF ! ! Pré - processamento Valores faltantes são colocados no arquivo arff com o símbolo “?”. Qualquer atributo pode se tornar o atributo classe. Clustering 2 Associação Avaliação de atributos Visualização de dados Classificação Exercícios ! ! Rodar arquivo weather-nominal.arff nos classificadores ZeroR,OneR,ID3 e J48, comparar resultados obtidos. Rodar o arquivo labor.arff no J48 uma vez com prunning e outra vez sem prunning e comparar resultados. 3