Data Warehouse e Data mining

Propaganda
Data Warehouse e Data
Mining
Prof. Luiz da Guia
Aula 051 -052
Data Warehouse
Data Warehouse
Em termos simples, um Data
Warehouse, ou em português,
Armazém de Dados, pode ser definido
como:
Um banco de dados especializado, o qual
integra e gerencia o fluxo de informações a
partir dos bancos de dados corporativos e
fontes de dados externas à empresa.
Data Warehouse
A função do Data Warehouse (DW) é
tornar as informações corporativas
acessíveis para o seu entendimento,
gerenciamento e uso.
Data Warehouse
Não é como um software, que pode ser
comprado e instalado em todos os
computadores da empresa em algumas
horas, na realidade sua implantação
exige a integração de vários produtos e
processos.
Data Warehouse
Um DW oferece os fundamentos e os
recursos necessários para um Sistema
de Apoio a Decisão (SAD).
fornecendo dados integrados e históricos
que servem desde a alta direção, que
necessita de informações mais resumidas,
até as gerências de baixo nível, onde os
dados detalhados ajudam a observar
aspectos mais táticos da empresa.
Data Warehouse
Nele, os executivos podem obter de
modo
imediato,
respostas
para
perguntas que normalmente não
possuem respostas em seus sistemas
operacionais e, com isso, tomar
decisões com base em fatos, não com
intuições ou especulações.
Data Warehouse
Com o surgimento do DW são
necessários
novos
métodos
de
estruturação de dados e novas
tecnologias,
tanto
para
armazenamento,
como
para
recuperação de informações.
Data Warehouse
A necessidade destes novos métodos e
tecnologias surgiu da constatação:
primeiro de que existe uma necessidade de
informação não atendida pelos aplicativos
comerciais convencionais, que atuam a nível
operacional do negócio
segundo, pelo fato de que a tecnologia de
armazenamento de dados utilizada nestes
aplicativos não atende às necessidades
detectadas.
Data Warehouse
Graças aos avanços nos bancos de dados
relacionais, no processamento paralelo e
na tecnologia distribuída, finalmente a
tecnologia da informação pode permitir
que qualquer organização elabore um
Data Warehouse.
Data Warehouse
Como as empresas demoram vários anos
para gerar e armazenar um volume
considerável de informações, é normal que
estes dados estejam espalhados por diversos
locais e que tenham sido gerados por
sistemas desenvolvidos em diferentes
ambientes e linguagens. Um dos desafios da
implantação de um DW é justamente a
integração destes dados, eliminando as
redundâncias.
Data Warehouse
Estudar e conhecer a tecnologia de DW
pode ajudar os empresários:
a descobrir novas formas de competir em
uma economia globalizada
trazendo melhores produtos ou serviços
para o mercado
mais rápido do que os concorrentes
sem aumentar o custo do produto ou do
serviço
Data Warehouse
Não existem ainda metodologias
formais para implementação de um DW.
Ela
deve
ser
adaptada
às
características e às expectativas de
cada empresa.
Características do Data
Warehouse
São sete:
Orientação por assunto:
Integração;
Variação no Tempo;
Não Volatilidade;
Localização;
Credibilidade dos Dados;
Granularidade.
Características do Data Warehouse
Orientação por assunto
A orientação
por
assunto
é
uma
característica marcante de um DW, pois toda
modelagem será voltada em torno dos
principais assuntos da empresa.
Enquanto todos os sistemas transacionais
estão voltados para processos e aplicações
específicas, os DWs objetivam assuntos.
Mas o que são assuntos?
Assuntos são o conjunto de informações relativas
à determinada área estratégica de uma empresa.
Características do Data Warehouse
Integração
Esta característica talvez seja a mais
importante do DW.
É através dela que iremos padronizar uma
representação única para os dados de todos
os sistemas que formarão a base de dados
do DW. Por isso, grande parte do trabalho na
construção de um DW está na análise dos
sistemas transacionais e dos dados que eles
contêm.
Características do Data Warehouse
Integração
Esses dados geralmente encontram-se
armazenados em vários padrões de
codificação, isso se deve aos inúmeros
sistemas existentes nas empresas, e que
eles tenham sido codificados por diferentes
analistas.
Isso quer dizer que os mesmos dados podem
estar em formatos diferentes.
Por exemplo: Masculino é M e feminino é F ou
Masculino é 1 e feminino é 0.
Características do Data Warehouse
Variação no Tempo
Os DW são variáveis em relação ao
tempo, isso nada mais é do que manter
o histórico dos dados durante um
período de tempo muito superior ao dos
sistemas transacionais.
Data Mining
Processo de Data-Mining
Processamento
Fontes
de dados
Pesquisa de
perfis
Análise,
revisão e
saída
Interpretação
dos resultados
Relatórios
encontrados
Revisão/
Data
Warehouse
Melhoramento
das pesquisas
Tomada de
decisão
baseada nos
achados
Endereços na Internet
http://www.dwbrasil.com.br
http://www.geocities.com/SiliconValley/Port/5072/
http://www.decisionwarehouse.com.br
http://www.inf.ufrgs.Br/~feidens/iain.html
Download