Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora: Dra. Marcela Xavier Ribeiro Colaboração: Grupo de Banco de Dados UFSCar Área: Banco de Dados Roteiro Introdução Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma 16/11/2009 Status Projeto- Mauricio J. Cerri 2/21 Roteiro Introdução Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma 16/11/2009 Status Projeto- Mauricio J. Cerri 3/21 Resumo do Projeto - Contextualização Mineração de Dados Tarefa de mineração de dados: Regra de Associação (AGRAWAL; IMIIELINSKI; SWAMI, 1993) Obtenção de Padrão Sequencial (AGRAWAL; SRIKANT, 1995) Melhorias na busca de informações relevantes Busca cada vez (Semanticamente) maior por informações NARFO (Non-redundant and generalized Association Rule based on Fuzzy Ontologies) 16/11/2009 Status Projeto- Mauricio J. Cerri relevantes (MIANI et al., 2009) 4/21 Resumo do Projeto - Contextualização Mineração de Dados utilizando Ontologias Difusas Ontologias conhecimento de apoio na mineração de dados Taxonomias 16/11/2009 grau difuso de especialização entre classes na Ontologia Status Projeto- Mauricio J. Cerri Fonte: Miani et al. (2009) 5/21 Resumo do Projeto - Objetivos Baseado no algoritmo NARFO Explorar grau de especialização classes na taxonomia difusa Utilizar a análise do grau de especialização para obter padrões sequenciais 16/11/2009 Status Projeto- Mauricio J. Cerri 6/21 Roteiro Introdução Atividades Realizadas Próximas Atividades e Cronograma 16/11/2009 Status Projeto- Mauricio J. Cerri 7/21 Atividades Realizadas Estudo sobre grau de especialização entre Classes da Ontologia; Estudo do código fonte do algoritmo NARFO; Inicio dos testes e adaptações sobre grau de especialização entre classes; Criação e adaptação de Ontologias para testes; Busca de algoritmos sobre padrão sequencial e estudo de adaptações. 16/11/2009 Status Projeto- Mauricio J. Cerri 8/21 Atividades Realizadas Projeto para aplicação de padrão sequencial em base médica; Estudo contínuo. 16/11/2009 Status Projeto- Mauricio J. Cerri 9/21 Atividades Realizadas Grau similaridade poderá contexto também Grau dede especialização considerando considerar contexto Formato Sabor 0.8 0.9 0.6 0.9 16/11/2009 0.7 0.1 Status Projeto- Mauricio J. Cerri 10/21 Aplicação para Padrão Sequencial 16/11/2009 Status Projeto- Mauricio J. Cerri 11/21 Aplicação para Padrão Sequencial 16/11/2009 Status Projeto- Mauricio J. Cerri 12/21 Aplicação para Padrão Sequencial 16/11/2009 Status Projeto- Mauricio J. Cerri 13/21 Roteiro Introdução Atividades Realizadas Próximas Atividades e Cronograma 16/11/2009 Status Projeto- Mauricio J. Cerri 14/21 Próximas Atividades e Cronograma Conclusão da adaptação da busca pelo grau de especialização; Finalização dos testes e busca por contexto; Escrita de artigo; Melhorarias contínuas no código fonte; Término das adaptações do Padrão Sequencial; Inicio testes; Escrita de Artigos. 16/11/2009 Status Projeto- Mauricio J. Cerri 15/21 Cronograma de Atividades Preparação e Defesa da Qualificação Levantamento bibliográfico contínuo sobre os Melhoramento doà proposta NARFO apresentada para explorar temas pertinentes Refinamento e iníciona dos testes do NARFO regras de pertinência taxonomia difusa Escrita de artigo explorar adaptações estendido para para regras deas associação, feitas Adaptação grau do de NARFO para padrões considerando pertinência sequenciais Refinamento e início dos testes das adaptações para padrões sequenciais Escrita de artigo para explorar as adaptações feitas referente padrões sequenciais Refinamento e ateste do NARFO estendido e adaptado para padrões sequenciais Início dos testes comparativos com outros algoritmos e análise de Escrita de para as adaptações impacto naartigo busca de explorar padrão sequencial, mantendo os itemsets feitas não frequentes Redação da dissertação de mestrado Preparação para a defesa da dissertação de mestrado 16/11/2009 Qualificação - Mauricio J. Cerri 17/21 Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora: Dra. Marcela Xavier Ribeiro Colaboração: Grupo de Banco de Dados UFSCar Área: Banco de Dados Referências AGRAWAL, R.; IMIELINSKI, T.; SWAMI, A. Mining association rules between sets of items in large databases. In: ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 1993, Washington, D.C. Proceedings... ACM, 1993. p. 207-216. AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules in Large Databases. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 20th, 1994, Proceedings... Morgan Kaufmann Publishers Inc., 1994. DUBOIS, D.; HULLERMEIER, E.; PRADE, H. A systematic approach to the assessment of fuzzy association rules. Data Min. Knowl. Discov., v. 13, n. 2, p. 167-192, 2006. ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4 ed. Pearson Addison Wesley, 2005. 624-642 p. FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery: an overview. In: (Ed.). Advances in knowledge discovery and data mining. American Association for Artificial Intelligence, 1996. p. 1-34. 16/11/2009 Status Projeto- Mauricio J. Cerri 19/21 Referências (cont. 1) HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. 2nd ed. San Francisco: 2006. 770 p. HAN, J. et al. Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach. Data Min. Knowl. Discov., v. 8, n. 1, p. 53-87, 2004. HULLERMEIER, E.; YI, Y. In Defense of Fuzzy Association Analysis. IEEE Transactions on Systems, Man, and Cybernetics Part B, v. 37, n. 4, p. 1039-1043, Aug,2007, 2007. MIANI, R. G. et al. NARFO Algorithm: Mining Non-redundant and Generalized Association Rules Based on Fuzzy Ontologies. In: INTERNATIONAL CONFERENCE ENTERPRISE INFORMATION SYSTEMS (ICEIS), 11th, 2009, Milan, Italy. Proceedings... 2009. PASQUIER, N. et al. Efficient mining of association rules using closed itemset lattices. Inf. Syst., v. 24, n. 1, p. 25-46, 1999. PEI, J. et al. PrefixSpan: Mining Sequential Patterns Efficiently by PrefixProjected Pattern Growth. In: INTERNATIONAL CONFERENCE ON DATA ENGINEERING, 17th, 2001, Proceedings... IEEE Computer Society, 2001. p. 16/11/2009 Status Projeto- Mauricio J. Cerri 20/21 Referências (cont. 2) SRIKANT, R.; AGRAWAL, R. Mining Generalized Association Rules. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 21th, 1995, Proceedings... Morgan Kaufmann Publishers Inc., 1995. p. 407-419. ZAKI, M. J. SPADE: An Efficient Algorithm for Mining Frequent Sequences. Mach. Learn., v. 42, n. 1-2, p. 31-60, 2001. 16/11/2009 Qualificação - Mauricio J. Cerri 21/21 Assunto Extra Prontuário Eletrônico do Paciente, evolução para RES (Registro Eletrônico de Saúde) – Palestra Beatriz Faria Leão Software Inglês feito em .NET, será adaptado para JAVA (Brasil); Utilização de Data Mining no projeto RES (Brasil). 16/11/2009 Qualificação - Mauricio J. Cerri 22/21 Assunto Extra 16/11/2009 Qualificação - Mauricio J. Cerri 23/21 Assunto Extra 16/11/2009 Qualificação - Mauricio J. Cerri 24/21