FUNDAÇÃO EDUCACIONAL SERRA DOS ÓRGÃOS FACULDADES UNIFICADAS CENTRO DE CIÊNCIAS HUMANAS E SOCIAIS CURSO DE GRADUAÇÃO EM ADMINISTRAÇÃO DE EMPRESAS DATA MINING E DATA WAREHOUSE BRUNO DA COSTA Conhecer a importância do data mining e data warehouse para a Administração TERESÓPOLIS JUNHO/2006 2 SUMÁRIO 1. INTRODUÇÃO ..................................................................................................... 3 2. DATA WAREHOUSE ........................................................................................... 3 2.1. EXTRAINDO INFORMAÇÕES DO DATA WAREHOUSE ............................ 5 3. DATA MINING ..................................................................................................... 5 4. CONSIDERAÇÕES FINAIS ................................................................................. 6 BIBLIOGRAFIA........................................................................................................... 7 3 1. INTRODUÇÃO No mundo atual dos negócios a empresa precisa não só reter a informação disponível, mas criar a partir dela condições de obter vantagens competitivas sobre seus concorrentes. E para se obter a informação adequada depende-se não só da disponibilidade de dados, mas também de como estes são coletados, armazenados e interpretados. Quem consegue tomar decisões corretas num curto espaço de tempo aumenta suas chances de sucesso e de permanência no mercado. Por isso, esta tarefa exige dos profissionais tomadores de decisão, tais como executivos, gerentes e analistas, sistemas de suporte à decisão, chamados de SAD (Sistema de Apoio a Decisão) ou SAE (Sistema de Apoio ao Executivo), mais recursos para análise, suportando consultas ad hoc, interfaces gráficas apropriadas, etc. Dessa forma o Data Warehouse numa organização se faz necessário para que os dados de diversas áreas da empresa possam ser integrados e extraídos uma riqueza maior de informações através de ferramentas como o Dada Mining, visando que produtos e serviços possam ser melhorados sem aumentar os custos, tornando a organização cada vez mais competitiva. 2. DATA WAREHOUSE Foi no final da década de 1940 e no início da década de 1950 que através de 4 pesquisas operacionais, teorias comportamentais e científicas de gerência e controle de processos estatísticos que formaram a base para os sistemas de apoio à decisão. O princípio básico, e ainda é, coletar dados operacionais do negócio e reduzi-los de maneira que pudessem ser utilizados para ajudar a entender e modificar o comportamento da empresa. Já entre 1960 e 1970 pesquisadores de Harvard e do MIT começaram a utilizar computadores para auxiliar no processo decisório. Seu uso era limitado a automatizar a geração de relatórios. A partir de 1980 que começou a utilização de banco de dados relacional para fins de apoio à decisão, sendo que os primeiros usos comerciais foram: a consulta ad hoc e geração de relatórios. No primeiro livro dedicado a data warehouse (Building the Data Warehouse) o autor W. H. Immon define o termo como “um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo para apoiar as decisões da gerência”, onde o termo não volátil significa que, os dados inseridos não possam ser modificados, ou seja, somente leitura. Mas de todas as características notamos que a integração é mais importante de todas, pois ela é a responsável por padronizar os dados de todos os sistemas que irão compor a base de dados do warehouse. Para que esse conteúdo de depósito de dados, criado a partir dos negócios da organização, auxilie a análise e permita o acesso às várias faces das informações apresentando a realidade da empresa ele deve se tornar um tipo de banco de dados especializado, onde os dados colhidos de diversas fontes devem ser reunidos, de maneira organizada e eficiente. Isso se faz necessário porque para o processo de construção de um data warehouse é preciso ter em mente que o conhecimento virá a partir da transformação do dado. Portanto, podemos dizer que o data warehouse é um sistema de coleta de dados, junto a vários sistemas das diversas áreas da organização de modo a agrupá-los disponibilizando o acesso desses dados aos usuários. 5 2.1. EXTRAINDO INFORMAÇÕES DO DATA WAREHOUSE Existem várias maneiras de recuperar informações de um data warehouse, as formas de extração mais comuns no mercado hoje são: • Ferramentas de consulta e emissão de relatórios; • SAE (Sistema de Apoio ao Executivo); • Ferramentas OLAP; • Ferramentas Data Mining. 3. DATA MINING Utilizando-se métodos de análise estatística e de inteligência artificial é possível desenvolver o processo do data mining ou mineração de dados na organização. Descobrindo a partir de padrões e associações de dados novas relações entre 6 produtos, prever vendas, traçar novas estratégias do negócio, identificar comportamento e necessidade de consumidores, localizar áreas com potencial lucrativo, etc., que não poderiam ser descobertos a olho nu devido ao grande volume de dados. O data mining é considerado como sendo a principal fase do processo do descobrimento de conhecimento em bancos de dados (KDD - Knowledge Discovery in Databases), área de pesquisa em evidência no momento, que envolve inteligência artificial. A extração de conhecimento do banco de dados ganhou força com o surgimento do data warehouse. Isto porque como para o data warehouse é necessário que os dados estejam de forma organizada e consolidada fica facilitado o processo do data mining. Outro fator que contribuiu para o crescimento do data mining foi a “Machine Learning” (combinação entre estatística e inteligência artificial). Para descobrir relacionamentos a estatística utiliza-se de conceitos como distribuição normal, variância, análise de regressão, desvio padrão e intervalos de confiança. A inteligência artificial baseia-se na estrutura de pensamento humano. Desta forma a Machine Learning faz com que os programas aprendam a medida em que estudam os dados, acrescentando novas regras de decisão. As novas relações obtidas pela análise de dados devem ser utilizadas pela organização de maneira que essa demonstre reação quando houver detecção de problemas e seja estimulada quando vislumbrar novas possibilidades de negócio. 4. CONSIDERAÇÕES FINAIS Para a permanência no mercado de hoje é preciso que as empresas estejam sempre aprimorando suas rotinas e preparadas para mudanças. Por isso, novas informações que forem obtidas através de ferramentas como o Data Mining podem 7 contribuir para que a organização melhore o relacionamento com seus clientes, administre melhor seu negócio, detecte novos nichos de mercado, auxilie na definição de estratégia da corporação, etc, ficando assim à frente de sua concorrência. Para que o Data Mining seja desenvolvido de forma mais eficiente se faz necessário na organização o Data Warehouse, porque uma vez que os dados de diversas áreas da empresa estejam integrados possibilitará a extração de um maior número de informação. Dominando essas tecnologias os tomadores de decisão terão maior eficiência no mundo dos negócios já que seus produtos e serviços poderão ser melhorados sem aumentar os custos e que suas decisões não serão em função de intuições ou especulações, mas sim em fatos, diminuindo-se a margem de erro e acelerando os negócios tornando a organização cada vez mais competitiva. BIBLIOGRAFIA DATE, C. J. Introdução a sistemas de bancos de dados. americana. Rio de Janeiro: Campos, 2000. tradução da 7ª ed. CARVALHO, Luís Alfredo Vidal de. Datamining: A mineração de dados no marketing, medicina, economia, engenharia e administração. 2ª ed. São Paulo: Érica, 2001. 8 OLIVEIRA, Wilson José de. Data Warehouse. Florianópolis: Visual Books, 2002. A utilização do data warehouse na geração de informações para tomada de decisão. http://www.fsanet.com.br/contabeis/noticia.php?id=1491. Acesso em 08 de maio de 2006.