Armazéns de Dados Introdução Gabriel David [email protected] MEI, ARMD 2003, Gabriel David ‹#› Objectivos de um AD Tornar a informação acessível Elevar a qualidade da informação • Consistente / correcta • Completa Constituir uma fonte robusta e adaptativa • Para novas pesquisas • Para adições Proteger a informação Fundamentar a tomada de decisões MEI, ARMD 2003, Gabriel David ‹#› Arquitectura geral Fontes Fonte 1 Área de Servidores Transformação Data Mart Acesso Perguntas ad-hoc 1 Relatórios Armazena Fonte 2 Extrai Fonte 3 Data Mart Processa Transforma Carrega 2 Data Mart 3 MEI, ARMD 2003, Gabriel David Aplicações Modelos ‹#› Conceitos base Sistema fonte 1 • Sistema operacional regista as transacções (legado) • Não interrogável • Chaves de produção Área de transformação (estágio) 2 • Uma área de armazenamento e um conjunto de processos de limpeza, transformação, combinação e preparação dos dados – oficina • Heterogénea (relacional ou outra) • Não fornece serviços de consulta e apresentação Servidores de apresentação do Armazém de Dados 3 • Máquinas onde os dados estão armazenados e organizados para interrogação directa • Modelo dimensional MEI, ARMD 2003, Gabriel David ‹#› Conceitos base (2) Modelo dimensional • Tabelas de factos (medidas) • Dimensões (entidades envolvidas num ou mais factos) Processo administrativo (processo de negócio) Data mart Armazém de dados • Interrogável • Actualizado • Conjunto de data marts Sistema (base de dados) operacional MEI, ARMD 2003, Gabriel David ‹#› Conceitos base (3) OLAP (on-line analytic processing) ROLAP – OLAP relacional MOLAP – OLAP Multidimensional Aplicação de utilizador Ferramenta de interrogação ad hoc Modelos Metadados MEI, ARMD 2003, Gabriel David ‹#› Processos básicos Processo ETL (Extraction – Transformation – Loading) • Extracção • Transformação • Carregamento (povoamento e indexação) Verificação da qualidade dos dados Publicação Actualização Interrogação Realimentação de dados Auditoria Segurança Backup e recuperação MEI, ARMD 2003, Gabriel David ‹#› Contabilidade – sistema operacional Categoria categoria_id desc_categoria Pessoa pessoa_id número nome categoria_id departamento_id Classificação classificação_id rubrica orçamento Departamento departamento_id designação orçamento CentroCusto centroCusto_id número descrição responsável_id Movimento movimento_id data centroCusto_id pessoa_id classificação_id valor MEI, ARMD 2003, Gabriel David ‹#› Contabilidade – armazém de dados Pessoa pessoa_id número nome categoria_id categoria departamento_id departamento tipo Movimento tempo_id centroCusto_id pessoa_id classificação_id valor Classificação classificação_id rubrica orçamento MEI, ARMD 2003, Gabriel David CentroCusto centroCusto_id Número Descrição Responsável_id Responsável Tempo tempo_id data dia dia_da_semana mês mês_extenso ano ‹#›