Data Warehouse e Data Mining Prof. Luiz da Guia Aula 051 -052 Data Warehouse Data Warehouse Em termos simples, um Data Warehouse, ou em português, Armazém de Dados, pode ser definido como: Um banco de dados especializado, o qual integra e gerencia o fluxo de informações a partir dos bancos de dados corporativos e fontes de dados externas à empresa. Data Warehouse A função do Data Warehouse (DW) é tornar as informações corporativas acessíveis para o seu entendimento, gerenciamento e uso. Data Warehouse Não é como um software, que pode ser comprado e instalado em todos os computadores da empresa em algumas horas, na realidade sua implantação exige a integração de vários produtos e processos. Data Warehouse Um DW oferece os fundamentos e os recursos necessários para um Sistema de Apoio a Decisão (SAD). fornecendo dados integrados e históricos que servem desde a alta direção, que necessita de informações mais resumidas, até as gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais táticos da empresa. Data Warehouse Nele, os executivos podem obter de modo imediato, respostas para perguntas que normalmente não possuem respostas em seus sistemas operacionais e, com isso, tomar decisões com base em fatos, não com intuições ou especulações. Data Warehouse Com o surgimento do DW são necessários novos métodos de estruturação de dados e novas tecnologias, tanto para armazenamento, como para recuperação de informações. Data Warehouse A necessidade destes novos métodos e tecnologias surgiu da constatação: primeiro de que existe uma necessidade de informação não atendida pelos aplicativos comerciais convencionais, que atuam a nível operacional do negócio segundo, pelo fato de que a tecnologia de armazenamento de dados utilizada nestes aplicativos não atende às necessidades detectadas. Data Warehouse Graças aos avanços nos bancos de dados relacionais, no processamento paralelo e na tecnologia distribuída, finalmente a tecnologia da informação pode permitir que qualquer organização elabore um Data Warehouse. Data Warehouse Como as empresas demoram vários anos para gerar e armazenar um volume considerável de informações, é normal que estes dados estejam espalhados por diversos locais e que tenham sido gerados por sistemas desenvolvidos em diferentes ambientes e linguagens. Um dos desafios da implantação de um DW é justamente a integração destes dados, eliminando as redundâncias. Data Warehouse Estudar e conhecer a tecnologia de DW pode ajudar os empresários: a descobrir novas formas de competir em uma economia globalizada trazendo melhores produtos ou serviços para o mercado mais rápido do que os concorrentes sem aumentar o custo do produto ou do serviço Data Warehouse Não existem ainda metodologias formais para implementação de um DW. Ela deve ser adaptada às características e às expectativas de cada empresa. Características do Data Warehouse São sete: Orientação por assunto: Integração; Variação no Tempo; Não Volatilidade; Localização; Credibilidade dos Dados; Granularidade. Características do Data Warehouse Orientação por assunto A orientação por assunto é uma característica marcante de um DW, pois toda modelagem será voltada em torno dos principais assuntos da empresa. Enquanto todos os sistemas transacionais estão voltados para processos e aplicações específicas, os DWs objetivam assuntos. Mas o que são assuntos? Assuntos são o conjunto de informações relativas à determinada área estratégica de uma empresa. Características do Data Warehouse Integração Esta característica talvez seja a mais importante do DW. É através dela que iremos padronizar uma representação única para os dados de todos os sistemas que formarão a base de dados do DW. Por isso, grande parte do trabalho na construção de um DW está na análise dos sistemas transacionais e dos dados que eles contêm. Características do Data Warehouse Integração Esses dados geralmente encontram-se armazenados em vários padrões de codificação, isso se deve aos inúmeros sistemas existentes nas empresas, e que eles tenham sido codificados por diferentes analistas. Isso quer dizer que os mesmos dados podem estar em formatos diferentes. Por exemplo: Masculino é M e feminino é F ou Masculino é 1 e feminino é 0. Características do Data Warehouse Variação no Tempo Os DW são variáveis em relação ao tempo, isso nada mais é do que manter o histórico dos dados durante um período de tempo muito superior ao dos sistemas transacionais. Data Mining Processo de Data-Mining Processamento Fontes de dados Pesquisa de perfis Análise, revisão e saída Interpretação dos resultados Relatórios encontrados Revisão/ Data Warehouse Melhoramento das pesquisas Tomada de decisão baseada nos achados Endereços na Internet http://www.dwbrasil.com.br http://www.geocities.com/SiliconValley/Port/5072/ http://www.decisionwarehouse.com.br http://www.inf.ufrgs.Br/~feidens/iain.html