Mineração de dados é um termo usado para generalizar a todas as técnicas e método computacionais usado para analisar e extrair informação de banco de dados, resumindo – o de uma forma compacta e descobrindo padrões validos potencialmente úteis, que seria impossível através de uma observação mais superficial. Na verdade o termo mineração de dados,é uma fase de um conceito maior que é denominada de descoberta de conhecimento em base de dados - DCBD (Knowledge Discovery in Databases - KDD) esse conceito foi formalizado em 1989 em referência ao amplo conceito de procurar conhecimento em dados. O termo mineração de dados,é então a etapa de aplicação de técnicas/ ferramentas para apresentar e analisar dados. A denominação "mineração de dados" tem sido muito utilizado pelos estatísticos enquando que KDD tem sido utilizada por pesquisadores na área de inteligência artificial. Mineração de Dados é uma área de pesquisa multidisciplinar, que consisti essencialmente em extrair informação de gigantescas bases de dados, analisar e descobrir padrões ocultos procurando encontrar relações entre dados não explícitas que possam ser usadas em modelos matemáticos com capacidade preditiva e explanatória, incluindo tecnologia de bancos de dados, inteligência artificial, aprendizado de máquina, redes neurais, estatística(análise exploratória de dados), reconhecimento de padrões, sistemas baseados em conhecimento, lógica fuzzy, recuperação da informação, computação de alto desempenho e visualização de dados. A historia da mineração de dados vem se formando desde 1960 com o objetivos comercias que era a coleção de dados em computadores, essas coleção era feita em fitas e discos esses produtos era fornecidos pelas empresas IBM e CDC e suas caracteristica principal era fazer a retrospectiva e a distribuição estática dos dados. Em 1980 o objetivo principal era o acesso aos dados a tecnologia disponivel para facilitar esse acesso sãos os Banco de dados relacionais(RDBMS), structured query language(SQL) e ODBC, os principais fornecedores desses produtos são a Oracle, Sybase, Infomix, IBM e Microsoft e suas principais caracteristicas é fazer retrospectiva e a distribuição de dados dinamicos a nível de registro. Em 1990 surgio o Dada warehousing & Suporte à decisão. a tecnologia disponivel é a On-Line Analytical Processing(OLAP), Banco de dados Multidimensionais, data warehouses essas tecnologias é fornecida pelas empresas Pilot, Comshare, Arbor, Cognos, e Microstrategy, e suas prinicipais carateristica e a retrospectiva e a distribuição dinamica de dados em múltiplos níveis. Apenas agora começou se formar a idéia da Mineração de dados, com a introdução de varias tecnicas de análises de dados inclusive tecnicas estatisticas, algumas das muitas motivações em se usar essas tecnicas de mineração de dados é que ela pode levar o analista a fazer descobertas em bancos de dados, previões e até mesmo modelar um determinado tipo de cliente, por exemplo pode-se querer responder as seguintes questão : Qual a previsão para as vendas em curitiba no próximo mês ? Por que ? Técnicas de mineração de dados têm sido crescentemente estudadas, pode se encontrar muitas dessas tecnologia disponivel como algoritmos avançados, computadores multiprocessado e banco de dados massivos, as empresas fornecedores dessas tecnologia é a Pilot, Lockheed, IBM, SGI, e outras( novas empresas). As caraterstica principais desse tipo de analise é a prospectiva e a distribuição de informação ativa de dados. Como podemos perceber existe varias tecnicas para mineração de dados, uma das grandes vantagem do uso da estatistica nesse tipo de analise é que se pode construir modelos que são abstrações da realidade mostrada nos dados.