Mineração de dados é um termo usado para

Propaganda
Mineração de dados é um termo usado para generalizar a todas as técnicas
e método computacionais usado para analisar e extrair informação de banco de
dados, resumindo – o de uma forma compacta e descobrindo padrões validos
potencialmente úteis, que seria impossível através de uma observação mais
superficial.
Na verdade o termo mineração de dados,é uma fase de um conceito maior
que é denominada de descoberta de conhecimento em base de dados - DCBD
(Knowledge Discovery in Databases - KDD) esse conceito foi formalizado em 1989
em referência ao amplo conceito de procurar conhecimento em dados. O termo
mineração de dados,é então a etapa de aplicação de técnicas/ ferramentas para
apresentar e analisar dados. A denominação "mineração de dados" tem sido
muito utilizado pelos estatísticos enquando que KDD tem sido utilizada por
pesquisadores na área de inteligência artificial.
Mineração de Dados é uma área de pesquisa multidisciplinar, que consisti
essencialmente em extrair informação de gigantescas bases de dados, analisar e
descobrir padrões ocultos procurando encontrar relações entre dados não
explícitas que possam ser usadas em modelos matemáticos com capacidade
preditiva e explanatória, incluindo tecnologia de bancos de dados, inteligência
artificial, aprendizado de máquina, redes neurais, estatística(análise exploratória
de dados), reconhecimento de padrões, sistemas baseados em conhecimento,
lógica fuzzy, recuperação da informação, computação de alto desempenho e
visualização de dados.
A historia da mineração de dados vem se formando desde 1960 com o
objetivos comercias que era a coleção de dados em computadores, essas coleção
era feita em fitas e discos esses produtos era fornecidos pelas empresas IBM e
CDC e suas caracteristica principal era fazer a retrospectiva e a distribuição
estática dos dados. Em 1980 o objetivo principal era o acesso aos dados a
tecnologia disponivel para facilitar esse acesso sãos os Banco de dados
relacionais(RDBMS), structured query language(SQL) e ODBC, os principais
fornecedores desses produtos são a Oracle, Sybase, Infomix, IBM e Microsoft e
suas principais caracteristicas é fazer retrospectiva e a distribuição de dados
dinamicos a nível de registro. Em 1990 surgio o Dada warehousing & Suporte à
decisão. a tecnologia disponivel é a On-Line Analytical Processing(OLAP), Banco
de dados Multidimensionais, data warehouses essas tecnologias é fornecida
pelas empresas Pilot, Comshare, Arbor, Cognos, e Microstrategy, e suas
prinicipais carateristica e a retrospectiva e a distribuição dinamica de dados em
múltiplos níveis.
Apenas agora começou se formar a idéia da Mineração de dados, com a
introdução de varias tecnicas de análises de dados inclusive tecnicas estatisticas,
algumas das muitas motivações em se usar essas tecnicas de mineração de
dados é que ela pode levar o analista a fazer descobertas em bancos de dados,
previões e até mesmo modelar um determinado tipo de cliente, por exemplo
pode-se querer responder as seguintes questão :
Qual a previsão para as vendas em curitiba no próximo mês ? Por que ?
Técnicas de mineração de dados têm sido crescentemente estudadas, pode
se encontrar muitas dessas tecnologia disponivel como algoritmos avançados,
computadores multiprocessado e banco de dados massivos, as empresas
fornecedores dessas tecnologia é a Pilot, Lockheed, IBM, SGI, e outras( novas
empresas). As caraterstica principais desse tipo de analise é a prospectiva e a
distribuição de informação ativa de dados. Como podemos perceber existe varias
tecnicas para mineração de dados, uma das grandes vantagem do uso da
estatistica nesse tipo de analise é que se pode construir modelos que são
abstrações da realidade mostrada nos dados.
Download