Tenho como objetivo explicar através desse artigo o uso das

Propaganda
Tenho como objetivo descrever o conceito do Data Warehouse com a utilização de
algumas ferramentas OLAP.
Com a globalização, as empresas se concentraram mais nos seus modelos de
negócio e deixaram um pouco de lado seu modelo físico, com isso passaram a
adaptar suas estratégias de acordo com as mudanças de mercado. Mas como
conseguir essas informações?
Os sistemas transacionais não traziam essas informações devido a algumas
características próprias, por exemplo: não guardam históricos, são modelados de
forma a guardar registro a registro o que não é possível consolidar grandes volumes
de dados onde de uma forma geral não estão bem integrados entre si.
Com isso surgiu o conceito de Data Warehouse, que é um processo que preocupa-se
em extrair, integrar e limpar as informações tanto dos sistemas transacionais, quanto
as informações externas. Alem disso o Data Warehouse dimensionaliza e consolida
esses dados, organizando-os de forma que melhore a performance das consultas.
Genericamente o Data Warehouse é composto por três camadas: Staging Área, Data
Warehouse e Data Marts. A Staging Área é um conjunto de tabelas de dados externos.
A partir daí os dados são tratados, limpos e carregados no Data Warehouse. O Data
Mart é um banco de dados relacional ou multidimensional, modelado de forma
multidimensional.
Com a necessidade de melhorar a performance das consultas, surgiu um novo
conceito de modelagem de dados, que diferencia do modelo entidade relacionamento
(relacional), esse modelo surgiu com o nome de star schema, onde temos uma tabela
fato rodeada de dimensões com as quais se relaciona e o snowflake schema que é
uma extensão do modelo star. Ele é o resultado de uma ou mais dimensões, formando
hierarquias.
As tabelas de fato contem as métricas usadas para medir a performance do negocio
bem como as chaves primarias das dimensões com as quais ela se relaciona. Já as
tabelas de dimensão contem atributos sobre as entidades que estão relacionadas as
medidas.
Mas para que se tenha acesso as informações tratadas no Data Warehouse é preciso
utilizar-se de ferramentas próprias para obter essas informações.
O que é uma ferramenta OLAP?
O termo OLAP – On Line Analytical Processing – refere-se a um conjunto de
tecnologias voltadas para acesso e análise ad-hoc, com o objetivo de transformar
dados em informações capazes de dar suporte a decisões gerenciais de forma
amigável e flexível ao usuário em tem pó hábil.
Cada ferramenta tem sua filosofia, nomenclatura, modelo de metadados e forma de
dividir suas funcionalidades entre os diferentes módulos.
Serão apresentadas algumas ferramentas OLAP com seus principais módulos e
arquiteturas.
DSS MicroStrategy
O DSS Microstrategy é uma ferramenta fornecida pela Microstrategy e seus principais
módulos são: DSS Agent, DSS Architect, DSS Executive e DSS Object. O DSS
Architect é um módulo de entrada de metadados. O DSS Agent pode operar de duas
formas: como ambiente de análise e execução de consultas ad-hoc ou como ambiente
de EIS. O DSS Executive é um módulo usado para construção de EIS e o módulo
DSS Object é usado para o gerenciamento de projetos e dos objetos definidos nesses
projetos.
O DSS da Microstrategy é, claramente, uma ferramenta ROLAP pois acessa um banco
de dados relacional via comandos SQL.
BusinessObjects
A ferramenta BusinessObjects, fornecida pela empresa de mesmo nome, tem como
principais módulos o Designer, o Supervisor e o BusinessObjects. No Designer são
definidas que tabelas fazem parte de cada “universo”, nome dado a cada aplicação, e
os joins entre essas tabelas. Também nele é construída a camada semântica com a
definição de objetos que podem ser de quatro tipos: dimensão, medida, detalhe (uma
variante de dimensão) e filtro.
O arquivo gerado pelo BusinessObjects, de extensão “.rep”, é um “cubo virtual”
montado quando o SQL gerado na construção da consulta é executado.
O BusinessObjects é o módulo onde são construídas e executadas as consultas. Nele
o usuário pode definir fórmulas e novos filtros além dos já definidos no universo.
Hyperion Wired for OLAP
A arquitetura do Wired for OLAP, fornecido pela Hyperion, possui três camadas.
Uma delas é, obviamente, o banco de dados multidimensional (que pode ser Essbase,
SQL Server OLAP Services ou IBM DB2 OLAP Server) ou relacional (qualquer uma
que permita comunicação via ODBC). A camada intermediária é a Wired Application
Layer, que é responsável por manter em seu repositório informações relativas aos
relatórios, preferências dos usuários, etc, bem como controlar os acessos feitos por
esses usuários e passar as consultas para os bancos de dados. Por fim, temos o
Analyzer que é a camada de interface com o usuário onde ele pode construir suas
consultas, e o Designer onde se constroem as aplicações.
A ferramenta Wired for OLAP é usualmente classificada como MOLAP apesar de
possuir uma funcionalidade, Virtual Cube, que permite acesso a bancos de dados
relacionais. Isso ocorre porque a filosofia do produto não é o acesso direto a bases
relacionais mas, sim, o acesso quando é necessário um drill a partir de bancos
multidimensionais.
Leandro Silva
Bibliografia
KIMBALL, R. The Data Warehouse Toolkit ; o guia completo para modelagem
multidimensional / Ralfh Kimball, Margy Ross ; tradução de Ana Beatriz Tavares,
Daniela Lacerda – Rio de Janeiro : Campus, 2002
Sites:
www.businessobjects.com
www.hyperion.com
www.microstrategy.com
Download