UNIVERSIDADE FEDERAL DE SANTA CATARINA CTC

Propaganda
UNIVERSIDADE FEDERAL DE SANTA CATARINA
CTC - CENTRO TECNOLÓGICO
CURSO DE GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO
Disciplina: INE 5631 – Projetos I.
Professor: Renato Cislaghi.
Graduando:Royquener Reuter
Data: 11.06.2004 - Resumo de Artigo
Data Mining: uma visão geral sob a perspectiva
de Banco de Dados.
Minerar e descobrir informações em grandes bancos de dados tem
sido reconhecido por muitos pesquisadores como um tópico chave de pesquisa
em sistemas de banco de dados, aprendizado de máquina, e por muitas
companhias industrias como uma importante área de oportunidade para de
maiores rendimentos.
Pesquisas em diferentes campos têm mostrado grande interesse em
Data Mining. Várias aplicações que surgiram para prover serviços de
informação, como por exemplo Data Warehousing e serviços on-line via
internet, tem utilizado técnicas de mineração para melhor entender o
comportamento dos usuários, melhorar os serviços e incrementar novas
oportunidades de negócio.
Em resposta para tal demanda, o artigo propõe uma avaliação e
classificação das técnicas disponíveis e um estudo de comparação de tais
técnicas. O artigo é uma tentativa de apresentar uma compreensão razoável de
um banco de dados sobre o ponto de vista de um pesquisador através de
técnicas recentes de mineração de dados. A diferença da nossa pesquisa do
artigo está no foco da pesquisa nas técnicas desenvolvidas por pesquisadores
de banco de dados, com ênfase nos métodos mais eficientes de mineração em
grandes bases de dados.
Uma classificação das técnicas de mineração disponíveis é
apresentada e um estudo de comparação de todas as técnicas é apresentado.
O artigo é somente uma breve introdução ao assunto, não sendo
portanto completa.
Para um efetivo processo de mineração em banco de dados, alguns
requisitos e desafios precisam ser analisados.
O primeiro requisito é o tratamento de diferentes tipos de dados pelo
algoritmo minerador. Bancos de dados contêm diferentes tipos de dados usados
em diferentes aplicações. Desde que os dados estão disponíveis em bases
relacionais, é crucial que o sistema minerador seja eficiente na descoberta de
informação nestes modelos. Além disto, muitos bancos de dados contêm tipos
de dados complexos, como iguais a dados estruturados e dados de objetos
complexos, hipertextos e dados de multimídia, dados especiais e temporais, etc.
Outro grande desafio é a eficiência e escalabidade dos algoritmos
mineradores para a extração de informações de bancos de dados gigantes
como por exemplo Data Warehouses. Algoritmos com complexidades
exponenciais não são bem aceitos.
Ainda podemos apresentar como objetivos a utilidade, certeza e
expressividade dos resultados que precisam ser expressos em linguagens
acessíveis ou em interfaces gráficas para usuários não muito experientes,
porque os grandes bancos de dados pressupõem muitos acessos.
A seguir o artigo apresenta uma visão geral de diferentes técnicas de
mineração como:
o
Técnicas de classificação;
o
Regras de associação;
o
Algoritmo Apriori e DHP;
o
Regras de associação em múltiplos-níveis;
o
OLAP;
o
Classificação baseada em Árvores de Decisão;
o
Clustering Analysis e outras;
O Data Mining é um campo promissor onde ainda há muitos desafios
e problemas não resolvidos que precisam de estudos. Por exemplo promover o
desenvolvimento de eficientes métodos para minerar tipos de conhecimentos
sob múltiplos níveis de abstração (OLAP Mining), interface ou linguagem de
mineração flexível, o desenvolvimento de técnicas de mineração em sistemas
de banco de dados avançados como bancos orientados a objetos, etc.
Referência Bibliográfica:
M-S. Chen, Jiawei Han, and Philip S. Yu, "Data Mining: An Overview
from a Database Perspective", IEEE Transactions on Knowledge and Data
Engineering, 8(6): 866-883, 1996.Han, J. Chen, Ming-Syan. Yu, Philip S. Data
Mining: An Overview from Database Perspective.
Download