Tenho como objetivo descrever o conceito do Data Warehouse com a utilização de algumas ferramentas OLAP. Com a globalização, as empresas se concentraram mais nos seus modelos de negócio e deixaram um pouco de lado seu modelo físico, com isso passaram a adaptar suas estratégias de acordo com as mudanças de mercado. Mas como conseguir essas informações? Os sistemas transacionais não traziam essas informações devido a algumas características próprias, por exemplo: não guardam históricos, são modelados de forma a guardar registro a registro o que não é possível consolidar grandes volumes de dados onde de uma forma geral não estão bem integrados entre si. Com isso surgiu o conceito de Data Warehouse, que é um processo que preocupa-se em extrair, integrar e limpar as informações tanto dos sistemas transacionais, quanto as informações externas. Alem disso o Data Warehouse dimensionaliza e consolida esses dados, organizando-os de forma que melhore a performance das consultas. Genericamente o Data Warehouse é composto por três camadas: Staging Área, Data Warehouse e Data Marts. A Staging Área é um conjunto de tabelas de dados externos. A partir daí os dados são tratados, limpos e carregados no Data Warehouse. O Data Mart é um banco de dados relacional ou multidimensional, modelado de forma multidimensional. Com a necessidade de melhorar a performance das consultas, surgiu um novo conceito de modelagem de dados, que diferencia do modelo entidade relacionamento (relacional), esse modelo surgiu com o nome de star schema, onde temos uma tabela fato rodeada de dimensões com as quais se relaciona e o snowflake schema que é uma extensão do modelo star. Ele é o resultado de uma ou mais dimensões, formando hierarquias. As tabelas de fato contem as métricas usadas para medir a performance do negocio bem como as chaves primarias das dimensões com as quais ela se relaciona. Já as tabelas de dimensão contem atributos sobre as entidades que estão relacionadas as medidas. Mas para que se tenha acesso as informações tratadas no Data Warehouse é preciso utilizar-se de ferramentas próprias para obter essas informações. O que é uma ferramenta OLAP? O termo OLAP – On Line Analytical Processing – refere-se a um conjunto de tecnologias voltadas para acesso e análise ad-hoc, com o objetivo de transformar dados em informações capazes de dar suporte a decisões gerenciais de forma amigável e flexível ao usuário em tem pó hábil. Cada ferramenta tem sua filosofia, nomenclatura, modelo de metadados e forma de dividir suas funcionalidades entre os diferentes módulos. Serão apresentadas algumas ferramentas OLAP com seus principais módulos e arquiteturas. DSS MicroStrategy O DSS Microstrategy é uma ferramenta fornecida pela Microstrategy e seus principais módulos são: DSS Agent, DSS Architect, DSS Executive e DSS Object. O DSS Architect é um módulo de entrada de metadados. O DSS Agent pode operar de duas formas: como ambiente de análise e execução de consultas ad-hoc ou como ambiente de EIS. O DSS Executive é um módulo usado para construção de EIS e o módulo DSS Object é usado para o gerenciamento de projetos e dos objetos definidos nesses projetos. O DSS da Microstrategy é, claramente, uma ferramenta ROLAP pois acessa um banco de dados relacional via comandos SQL. BusinessObjects A ferramenta BusinessObjects, fornecida pela empresa de mesmo nome, tem como principais módulos o Designer, o Supervisor e o BusinessObjects. No Designer são definidas que tabelas fazem parte de cada “universo”, nome dado a cada aplicação, e os joins entre essas tabelas. Também nele é construída a camada semântica com a definição de objetos que podem ser de quatro tipos: dimensão, medida, detalhe (uma variante de dimensão) e filtro. O arquivo gerado pelo BusinessObjects, de extensão “.rep”, é um “cubo virtual” montado quando o SQL gerado na construção da consulta é executado. O BusinessObjects é o módulo onde são construídas e executadas as consultas. Nele o usuário pode definir fórmulas e novos filtros além dos já definidos no universo. Hyperion Wired for OLAP A arquitetura do Wired for OLAP, fornecido pela Hyperion, possui três camadas. Uma delas é, obviamente, o banco de dados multidimensional (que pode ser Essbase, SQL Server OLAP Services ou IBM DB2 OLAP Server) ou relacional (qualquer uma que permita comunicação via ODBC). A camada intermediária é a Wired Application Layer, que é responsável por manter em seu repositório informações relativas aos relatórios, preferências dos usuários, etc, bem como controlar os acessos feitos por esses usuários e passar as consultas para os bancos de dados. Por fim, temos o Analyzer que é a camada de interface com o usuário onde ele pode construir suas consultas, e o Designer onde se constroem as aplicações. A ferramenta Wired for OLAP é usualmente classificada como MOLAP apesar de possuir uma funcionalidade, Virtual Cube, que permite acesso a bancos de dados relacionais. Isso ocorre porque a filosofia do produto não é o acesso direto a bases relacionais mas, sim, o acesso quando é necessário um drill a partir de bancos multidimensionais. Leandro Silva Bibliografia KIMBALL, R. The Data Warehouse Toolkit ; o guia completo para modelagem multidimensional / Ralfh Kimball, Margy Ross ; tradução de Ana Beatriz Tavares, Daniela Lacerda – Rio de Janeiro : Campus, 2002 Sites: www.businessobjects.com www.hyperion.com www.microstrategy.com