Trabalho 1

Propaganda
Trabalho de Regras de Associação
O objetivo do trabalho é explorar a resolução da tarefa de regras de associação:
• usando pelo menos dois algoritmos implementados no Weka, R, Matlab ou em
bibliotecas de Python, Java ou C. Os algoritmos indicados são: Apriori / FPGrowth /
Predictive Apriori / Tertius; ou
• implementar o algoritmo Apriori em Java, C ou outra linguagem de propósito geral
(neste caso, o código completo deve ser de autoria do aluno).
É esperado que os alunos explorem a tarefa de regras de associação usando o conjunto
de dados disponível em:
• https://archive.ics.uci.edu/ml/machine-learning-databases/voting-records/
Para relatar os resultados da exploração dos algoritmos, os alunos deverão preparar
um conjunto de slides a ser usado em uma aula que objetiva explicar:
•
•
•
•
•
•
os dois algoritmos, ou o Apriori no caso de escolha por implementação própria;
suas implementações no Weka considerando o entendimento no nível do usuário do
software; seu código no caso de implementação própria;
a aplicação dos algoritmos sobre o conjunto de dados;
os resultados obtidos;
a análise dos resultados em termos de eficiência e eficácia dos algoritmos;
a análise dos resultados considerando o contexto das regras (talvez seja necessário ler
um pouco sobre a história política americana).
O conteúdo dos slides deve ser tão didático e completo quanto possível. Imagine que
os slides seriam usados para ministrar de 3 aulas de 50 minutos cada uma, e também se
lembre que geralmente colocamos mais informação nos slides do que realmente discutimos
em aula.
Heurística: existe uma heurística que diz que, em uma palestra, cada slide deve
suportar 2 minutos de fala. Seguindo a heurística, vocês deveriam propor cerca de 75 slides.
Contudo, visto que se trata de aula e não palestra, podemos relaxar a heurística para 3 minutos
por slide, em média. Seguindo essa heurística, seria razoável apresentar, no mínimo, 50 slides.
Contudo, tudo depende da estrutura escolhida para distribuir o conteúdo no conjunto de
slides.
Sugestão: somar aos slides um vídeo tutorial de uso dos algoritmos no Weka; ou um
video tutorial explicando o código criado.
Cuidado: não recheie seus slides com "dados" (tabelas, figuras, etc) sem que
elementos textuais os expliquem de alguma forma (passem a informação). A avaliação vai
considerar a criatividade, a didática e a organização dos slides, mas considerará com peso
ainda maior o conhecimento do aluno sendo evidenciado no conteúdo dos slides.
Opcional: Para aqueles que desejarem agregar valor para seu trabalho, considere trabalhar,
em algum nível (ainda que parcialmente) com um dos conjuntos de dados esparsos (Sparse
Datasets) disponível em: http://goo.gl/FTGdhC
Download