Alguns conceitos sobre DW O Data Warehouse (DW) é um conjunto de técnicas que aplicadas em conjunto geram um sistema de dados que nos proporcionam informações para tomada de decisões. Ele funciona tipicamente na arquitetura cliente/servidor. Todos os grandes bancos de dados do mercado podem, em teoria, ser usados como gerenciadores do DW. Contudo, é importante salientar duas características fundamentais para um SGBD que vai comportar uma imensa quantidade de dados e que será acessado por uma quantidade cada vez maior de usuários. São elas: Capacidade de compressão de dados e otimização de performance de queries. Procure por essas qualidades quando for escolher o seu SGBD. Os principais do mercado são: Oracle 8, Sybase IQ 12, DB2 (IBM), Informix e SQL Server 7.0. O DW é um banco de dados físico que fica separado do sistema OLTP, feito numa modelagem dimensional. Ele será alimentado pelos sistemas OLTP da empresa, chamados de sistemas transacionais. Existe uma série de ferramentas que automatizam esse processo, chamadas “ferramentas de extração, filtragem e carga dos dados”. Como exemplo temos a Platinum, Prism e o Power Stage (Sybase). Mas antes da implantação do DW necessariamente deverá ser aplicada uma metodologia que levante os “objetos gerenciais”. A partir deste trabalho, parte-se para a modelagem lógica/física, que deverá ser num esquema dimensional, de preferência o star-schema. Nesta etapa é importante a documentação através de ferramentas Case, como o System Architect, o Erwin ou o Power Designer (módulo Warehouse Architect). Para a visualização dos dados, existe uma classe específica de ferramentas, comumente conhecidas como ferramentas OLAP. Há várias sub-classes como ROLAP (Relational OLAP), DOLAP (Desktop OLAP), MOLAP ( Multidimensional OLAP) e HOLAP (hybrid OLAP que vem a ser DOLAP OU ROLAP + MOLAP). Uma breve descrição de cada uma:·ROLAP – Neste caso a arquitetura se compõe de: SGBD + ferramenta ROLAP. Aqui, a engine OLAP fica em um servidor dedicado, que armazena os vários “cubos” de informação. O usuário acessa os vários cubos, e analisa as informações com o processamento OLAP sendo realizado no servidor. Pode trazer problemas de escalabilidade (o número crescente de usuários pode derrubar o servidor) e de tráfego de rede. Por outro lado, permite análise de grandes volumes de dados. Exemplos de ferramentas: DSS Agent (Microestrategy), Power Dimension (Sybase). DOLAP – A arquitetura é composta de SGBD + ferramenta DOLAP. O processamento OLAP acontece na máquina cliente, sem tráfego de rede nem problemas de escalabilidade. Contudo, pode trazer problemas em alguns relatórios, quando o volume de dados fica muito grande, apesar das boas ferramentas tratarem os dados de maneira compactada. Exemplos: Business Objects, Cognos, Brio e Oracle Discovery. MOLAP – Tem-se SGBD + servidor MOLAP. Neste caso, no SGBD ficam os dados num formato simples, e no Servidor MOLAP, que é na verdade um banco de dados multidimensional, ficam os dados consolidados. O usuário visualiza diretamente o Servidor MOLAP, usando os módulos de consulta desta ferramenta. Exemplos: Essbase (Hyperion), Metacube (Informix), Oracle Express, e Plato (Microsoft). É uma arquitetura não muito “user friendly”, não sendo muito aceita em seu formato puro. HOLAP – Neste caso, junta-se uma ferramenta OLAP ao sistema MOLAP, sendo que os usuários usam essa interface para fazer suas consultas. É um sistema 1 extremamente completo, contudo é o mais caros de todos, sendo que muitas vezes a análise custo/benefício mostra a inviabilidade desta opção. Apesar de outras ferramentas possibilitarem a visualização dos dados, como o Excel ou o Access, as mesmas não apresentam nem performance adequada nem capacidade de ver os dados multidimensionalmente, como Slice-and-Dice e Drill que são os recursos mais importantes para analisar as informações. Fonte VIEIRA, Fernando. Alguns conceitos sobre DW. São Paulo, 2000. 2