Aula 8 - Prof. Edilberto Silva

Propaganda
Tela Inicial
WEKA
Data Mining
Edilberto M. Silva
Introdução
!
O Weka é uma coleção de algoritmos
de machine learning para resolver
problemas de data mining do mundo
real. Os algoritmos podem ser
aplicados tanto a um conjunto de dados
ou chamados do seu código Java. Além
disso, o Weka apresenta facilidades
para desenvolvimento de novos
esquemas de machine learning.
Esquemas implementados
para predição numérica:
•
•
•
•
•
•
linear regression
model tree generators
locally weighted regression
instance-based learners
decision tables
multi-layer perceptron
Esquemas implementados
para classificação:
•
•
•
•
•
•
•
•
•
•
decision tree inducers
rule learners
naive Bayes
decision tables
locally weighted regression
support vector machines
instance-based learners
logistic regression
voted perceptrons
multi-layer perceptron
"meta-schemes“
implementados:
•
•
•
•
•
•
bagging
stacking
boosting
regression via classification
classification via regression
cost sensitive classification
1
Arquivo ARFF
Arquivo ARFF
Arquivo ARFF
Arquivo ARFF
!
!
Pré - processamento
Valores faltantes são colocados no
arquivo arff com o símbolo “?”.
Qualquer atributo pode se tornar o
atributo classe.
Clustering
2
Associação
Avaliação de atributos
Visualização de dados
Classificação
Exercícios
!
!
Rodar arquivo weather-nominal.arff nos
classificadores ZeroR,OneR,ID3 e J48,
comparar resultados obtidos.
Rodar o arquivo labor.arff no J48 uma vez
com prunning e outra vez sem prunning e
comparar resultados.
3
Download