Alguns conceitos sobre DW

advertisement
Alguns conceitos sobre DW
O Data Warehouse (DW) é um conjunto de técnicas que aplicadas em conjunto
geram um sistema de dados que nos proporcionam informações para tomada de
decisões. Ele funciona tipicamente na arquitetura cliente/servidor.
Todos os grandes bancos de dados do mercado podem, em teoria, ser usados como
gerenciadores do DW. Contudo, é importante salientar duas características
fundamentais para um SGBD que vai comportar uma imensa quantidade de dados e
que será acessado por uma quantidade cada vez maior de usuários. São elas:
Capacidade de compressão de dados e otimização de performance de queries.
Procure por essas qualidades quando for escolher o seu SGBD. Os principais do
mercado são: Oracle 8, Sybase IQ 12, DB2 (IBM), Informix e SQL Server 7.0.
O DW é um banco de dados físico que fica separado do sistema OLTP, feito numa
modelagem dimensional. Ele será alimentado pelos sistemas OLTP da empresa,
chamados de sistemas transacionais. Existe uma série de ferramentas que
automatizam esse processo, chamadas “ferramentas de extração, filtragem e carga
dos dados”. Como exemplo temos a Platinum, Prism e o Power Stage (Sybase).
Mas antes da implantação do DW necessariamente deverá ser aplicada uma
metodologia que levante os “objetos gerenciais”.
A partir deste trabalho, parte-se para a modelagem lógica/física, que deverá ser
num esquema dimensional, de preferência o star-schema.
Nesta etapa é importante a documentação através de ferramentas Case, como o
System Architect, o Erwin ou o Power Designer (módulo Warehouse Architect).
Para a visualização dos dados, existe uma classe específica de ferramentas,
comumente conhecidas como ferramentas OLAP. Há várias sub-classes como
ROLAP (Relational OLAP), DOLAP (Desktop OLAP), MOLAP ( Multidimensional OLAP)
e HOLAP (hybrid OLAP que vem a ser DOLAP OU ROLAP + MOLAP).
Uma breve descrição de cada uma:·ROLAP – Neste caso a arquitetura se compõe
de: SGBD + ferramenta ROLAP. Aqui, a engine OLAP fica em um servidor dedicado,
que armazena os vários “cubos” de informação. O usuário acessa os vários cubos, e
analisa as informações com o processamento OLAP sendo realizado no servidor.
Pode trazer problemas de escalabilidade (o número crescente de usuários pode
derrubar o servidor) e de tráfego de rede. Por outro lado, permite análise de
grandes volumes de dados. Exemplos de ferramentas: DSS Agent (Microestrategy),
Power Dimension (Sybase).



DOLAP – A arquitetura é composta de SGBD + ferramenta DOLAP. O
processamento OLAP acontece na máquina cliente, sem tráfego de rede nem
problemas de escalabilidade. Contudo, pode trazer problemas em alguns
relatórios, quando o volume de dados fica muito grande, apesar das boas
ferramentas tratarem os dados de maneira compactada. Exemplos: Business
Objects, Cognos, Brio e Oracle Discovery.
MOLAP – Tem-se SGBD + servidor MOLAP. Neste caso, no SGBD ficam os dados
num formato simples, e no Servidor MOLAP, que é na verdade um banco de
dados multidimensional, ficam os dados consolidados. O usuário visualiza
diretamente o Servidor MOLAP, usando os módulos de consulta desta
ferramenta. Exemplos: Essbase (Hyperion), Metacube (Informix), Oracle
Express, e Plato (Microsoft). É uma arquitetura não muito “user friendly”, não
sendo muito aceita em seu formato puro.
HOLAP – Neste caso, junta-se uma ferramenta OLAP ao sistema MOLAP, sendo
que os usuários usam essa interface para fazer suas consultas. É um sistema
1
extremamente completo, contudo é o mais caros de todos, sendo que muitas
vezes a análise custo/benefício mostra a inviabilidade desta opção.
Apesar de outras ferramentas possibilitarem a visualização dos dados, como o Excel
ou o Access, as mesmas não apresentam nem performance adequada nem
capacidade de ver os dados multidimensionalmente, como Slice-and-Dice e Drill
que são os recursos mais importantes para analisar as informações.
Fonte
VIEIRA, Fernando. Alguns conceitos sobre DW. São Paulo, 2000.
2
Download