UNIVERSIDADE FEDERAL DE SANTA CATARINA CTC - CENTRO TECNOLÓGICO CURSO DE GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO Disciplina: INE 5631 – Projetos I. Professor: Renato Cislaghi. Graduando:Royquener Reuter Data: 11.06.2004 - Resumo de Artigo Data Mining: uma visão geral sob a perspectiva de Banco de Dados. Minerar e descobrir informações em grandes bancos de dados tem sido reconhecido por muitos pesquisadores como um tópico chave de pesquisa em sistemas de banco de dados, aprendizado de máquina, e por muitas companhias industrias como uma importante área de oportunidade para de maiores rendimentos. Pesquisas em diferentes campos têm mostrado grande interesse em Data Mining. Várias aplicações que surgiram para prover serviços de informação, como por exemplo Data Warehousing e serviços on-line via internet, tem utilizado técnicas de mineração para melhor entender o comportamento dos usuários, melhorar os serviços e incrementar novas oportunidades de negócio. Em resposta para tal demanda, o artigo propõe uma avaliação e classificação das técnicas disponíveis e um estudo de comparação de tais técnicas. O artigo é uma tentativa de apresentar uma compreensão razoável de um banco de dados sobre o ponto de vista de um pesquisador através de técnicas recentes de mineração de dados. A diferença da nossa pesquisa do artigo está no foco da pesquisa nas técnicas desenvolvidas por pesquisadores de banco de dados, com ênfase nos métodos mais eficientes de mineração em grandes bases de dados. Uma classificação das técnicas de mineração disponíveis é apresentada e um estudo de comparação de todas as técnicas é apresentado. O artigo é somente uma breve introdução ao assunto, não sendo portanto completa. Para um efetivo processo de mineração em banco de dados, alguns requisitos e desafios precisam ser analisados. O primeiro requisito é o tratamento de diferentes tipos de dados pelo algoritmo minerador. Bancos de dados contêm diferentes tipos de dados usados em diferentes aplicações. Desde que os dados estão disponíveis em bases relacionais, é crucial que o sistema minerador seja eficiente na descoberta de informação nestes modelos. Além disto, muitos bancos de dados contêm tipos de dados complexos, como iguais a dados estruturados e dados de objetos complexos, hipertextos e dados de multimídia, dados especiais e temporais, etc. Outro grande desafio é a eficiência e escalabidade dos algoritmos mineradores para a extração de informações de bancos de dados gigantes como por exemplo Data Warehouses. Algoritmos com complexidades exponenciais não são bem aceitos. Ainda podemos apresentar como objetivos a utilidade, certeza e expressividade dos resultados que precisam ser expressos em linguagens acessíveis ou em interfaces gráficas para usuários não muito experientes, porque os grandes bancos de dados pressupõem muitos acessos. A seguir o artigo apresenta uma visão geral de diferentes técnicas de mineração como: o Técnicas de classificação; o Regras de associação; o Algoritmo Apriori e DHP; o Regras de associação em múltiplos-níveis; o OLAP; o Classificação baseada em Árvores de Decisão; o Clustering Analysis e outras; O Data Mining é um campo promissor onde ainda há muitos desafios e problemas não resolvidos que precisam de estudos. Por exemplo promover o desenvolvimento de eficientes métodos para minerar tipos de conhecimentos sob múltiplos níveis de abstração (OLAP Mining), interface ou linguagem de mineração flexível, o desenvolvimento de técnicas de mineração em sistemas de banco de dados avançados como bancos orientados a objetos, etc. Referência Bibliográfica: M-S. Chen, Jiawei Han, and Philip S. Yu, "Data Mining: An Overview from a Database Perspective", IEEE Transactions on Knowledge and Data Engineering, 8(6): 866-883, 1996.Han, J. Chen, Ming-Syan. Yu, Philip S. Data Mining: An Overview from Database Perspective.