Manual DO PROCESSO

Propaganda
MANUAL DO
PROCESSO
OBSERVATÓRIO
Universidade Católica de Brasília - UCB
QS 07 Lote 01 - Bl. E - Sala 008 - EPCT - Águas Claras
Taguatinga/DF - CEP 72.030-170
Fone: (61) 3356.9652
1
1.
OBJETIVO ....................................................................................................................................................... 3
2.
PROCESSO ..................................................................................................................................................... 3
2.1
FLUXOGRAMA ................................................................................................................................................... 3
2.2
DEFINIÇÃO DE CADA PASSO DO PROCESSO ............................................................................................................... 3
2.2.1
Definição dos Dados .............................................................................................................................. 3
2.2.1.1
2.2.1.2
2.2.2
2.2.2.1
2.2.2.2
2.2.2.3
2.2.3
2.2.3.1
2.2.3.2
2.2.4
3.
Fluxograma ........................................................................................................................................................ 3
Documentos de Saída ........................................................................................................................................ 3
Staging .................................................................................................................................................. 3
Definição ............................................................................................................................................................ 3
Fluxograma ........................................................................................................................................................ 3
Documentos de Saída ........................................................................................................................................ 4
Data Warehouse - DW .......................................................................................................................... 4
Fluxograma ........................................................................................................................................................ 4
Documentos de Saída ........................................................................................................................................ 4
Sistema de Suporte à Decisão - SSD ...................................................................................................... 4
FERRAMENTAS .............................................................................................................................................. 4
3.1
CONFIGURAÇÕES................................................................................................................................................ 5
3.1.1
Pentaho ................................................................................................................................................. 5
3.1.2
Postgres ................................................................................................................................................. 5
Universidade Católica de Brasília - UCB
QS 07 Lote 01 - Bl. E - Sala 008 - EPCT - Águas Claras
Taguatinga/DF - CEP 72.030-170
Fone: (61) 3356.9652
2
1. Objetivo
Este documento tem como objetivo expor o passo a passo do processo para inserção de novos dados na base
integrada do observatório. Será aqui explicado o que é cada passo do processo, bem como serão definidos os
artefatos que devem ser produzidos em cada etapa.
Para que o trabalho realizado possa ser continuado e que todos os envolvidos possam ter acesso e consigam
visualizar cada parte do processo para cada nova entrada do observatório, serão aqui também definidas as
ferramentas a serem utilizadas para elaboração dos artefatos. Sendo assim, será criado um padrão de ferramentas a
serem utilizadas.
2. Processo
2.1 Fluxograma
1.
Definição
dos Dados
3. Data
Warehouse
2. Staging
4. Sistema de
Suporte à
Decisão
*OBS.: Para cada artefato/documento a ser elaborado em cada etapa do processo que serão detalhados nos passos a
seguir deve ser consultado o documento da “Estrutura Organizacional de Diretórios” para que se saiba onde cada
artefato deve ser armazenado.
2.2 Definição de Cada passo do processo
2.2.1 Definição dos Dados
2.2.1.1 Fluxograma
Identificar
Origem dos
Dados
Entender os
Dados
Determinar
Período de
Extração
Definir
Consultas
esperadas
Modelo de
Domínio
Determinar
dados a serem
extraídos
2.2.1.2 Documentos de Saída
DOCUMENTO
TEMPLATE
Definição de Dados
Definição de Dados
2.2.2 Staging
2.2.2.1 Definição
A área de Staging é uma área temporária utilizada para armazenar temporariamente os dados extraídos
das fontes definidas.
2.2.2.2 Fluxograma
Modelo
Relacional
Físico
Script de
Criação/Alteração
do Banco
Criar/Alterar
o Banco
Universidade Católica de Brasília - UCB
QS 07 Lote 01 - Bl. E - Sala 008 - EPCT - Águas Claras
Taguatinga/DF - CEP 72.030-170
Fone: (61) 3356.9652
Definição do
Processo de
ETL
3
Dicionário de
Dados
*OBS.: Deve-se criar um processo de ETL automatizado para que quando a Rotina de Sincronização execute não
seja necessário um trabalho manual por parte dos envoldidos.
2.2.2.3 Documentos de Saída
DOCUMENTO
Modelo Relacionado Físico do Staging
Script do Banco
Dicionário de Dados do Staging
Processo de ETL Staging
TEMPLATE
Dicionário de Dados
Definição Processo de ETL Staging
2.2.3 Data Warehouse - DW
2.2.3.1 Fluxograma
Modelo
Dimensional
Físico
Script de
Criação/Alteração
do Banco
Definição do
Processo de
ETL
Criar/Alterar
o Banco
Dicionário de
Dados
*OBS.: Deve-se criar um processo de ETL automatizado para que quando a Rotina de Sincronização execute não
seja necessário um trabalho manual por parte dos envolvidos.
2.2.3.2 Documentos de Saída
DOCUMENTO
Modelo Dimensional Físico
Script do Banco
Dicionário de Dados do DW
Processo de ETL DW
TEMPLATE
Dicionário de Dados
Definição Processo de ETL DW
2.2.4 Sistema de Suporte à Decisão - SSD
Vide o documento de “Definição dos Dados” devem ser implementadas as consultas que neles foram
especificadas;
3. Ferramentas
DOCUMENTO / ETAPA
FERRAMENTA
Modelo de Domínio
Jude Community
Modelo Relacional / Dimensional
Power Designer
ETL
Pentaho
Universidade Católica de Brasília - UCB
QS 07 Lote 01 - Bl. E - Sala 008 - EPCT - Águas Claras
Taguatinga/DF - CEP 72.030-170
Fone: (61) 3356.9652
4
SSD
QlikView
Banco de Dados
Postgres SQL
3.1 Configurações
3.1.1 Pentaho
DIRETÓRIO
C:\Fontes\ + “Nome da Entrada”
Ex.: C:\Fontes\IDEB
C:\Transformacoes\ + “Nome da Entrada” + \Staging
Ex.: C:\Transformacoes\IDEB\Staging
C:\Transformacoes\ + “Nome da Entrada” + \DW
Ex.: C:\Transformacoes\IDEB\DW
CONTEÚDO
Arquivos fontes dos dados.
Transformações realizadas pelo Pentaho para a área de
Staging.
Transformações realizadas pelo Pentaho para a área de
Data Warehouse.
3.1.2 Postgres
Porta
Hostname
Database Staging
Database Dimensional
Username
Password
5432
localhost
Será criado um novo banco para cada nova entrada com
o“Nome da Entrada”
observatorio
postgres
postgres
Universidade Católica de Brasília - UCB
QS 07 Lote 01 - Bl. E - Sala 008 - EPCT - Águas Claras
Taguatinga/DF - CEP 72.030-170
Fone: (61) 3356.9652
5
Download