Análise de Informações em Teoria e Exercícios p

Propaganda
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Aula 00
Análise de Informações – TCU (Turma: 10)
Aula Demonstrativa – Noções de Modelagem Dimensional (Parte I)
Professora: Patrícia Lima Quintão
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
1
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Aula 00 – Aula Demonstrativa
Olá, querido(a) amigo(a)!
É com muita satisfação que inicio no Ponto dos Concursos a 10ª edição
deste
curso
de
Análise
de
Informações
(em
Teoria
e
Exercícios
Comentados), totalmente direcionada ao certame do TCU.
O curso é composto por 07 aulas (além desta aula demonstrativa),
em que teremos resumos teóricos contemplando os pontos que
podem ser explorados no edital e os comentários de questões
atualizadas
(provenientes
dos
concursos
realizados
prioritariamente pelo Cespe/UnB e bancas similares), para que
você possa se antecipar ao estilo de cobrança dessa banca e gabaritar
a sua prova!
Antes de continuar, lembre-se de que a CONFIANÇA é um dos grandes
segredos do SUCESSO. Acredite!
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
2
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Vamos à luta, com FOCO no grande objetivo e dedicação ao concurso do
TCU, para que em seguida possam ter a bonificação. Tenho certeza de que até o
final do curso vocês “tirarão de letra” as questões de informática vindouras !
Que Deus os abençoe e sucesso nos estudos!
Vamos juntos gabaritar novamente a prova de Análise de Informações
do TCU!
Aula
00
Conteúdo Programático do Curso
Apresentação da professora e do curso. Aula Inaugural – Proposta
do curso e questões de demonstração sobre noções de modelagem
dimensional: conceito e aplicações (Parte I).
01
Dado,
informação,
conhecimento
e
inteligência.
Dados
estruturados e não estruturados. Dados abertos. Coleta, tratamento,
armazenamento, integração e recuperação de dados.
02
Banco de dados relacionais: conceitos básicos e características.
Metadados. Tabelas, visões (views) e índices. Chaves e relacionamentos.
03
Noções de modelagem dimensional: conceito e aplicações (Parte 2).
04
Noções de Big Data: conceito, premissas e aplicação.
Visualização e análise exploratória de dados.
05
Noções de sistemas de informação da Administração Pública
Federal: SIAFI, SIASG e SICONV. Finalidade. Principais informações.
06
Lei de Acesso a Informação (Lei nº 12.527/2011): conceitos e
aplicação.
07
Noções de mineração de dados: conceituação e características.
Modelo de referência CRISP-DM. Técnicas para pré-processamento de
dados. Técnicas e tarefas de mineração de dados. Classificação. Regras
de associação. Análise de agrupamentos (clusterização). Detecção de
anomalias. Modelagem preditiva. Aprendizado de máquina. Mineração
de texto.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
3
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Quanto ao conteúdo desse curso, temos algumas informações complementares:
a) em nossas aulas pretendemos apresentar o maior número de questões
possíveis a fim de familiarizar você com o estilo de questões normalmente
utilizado pelo Cespe.
No entanto, tendo-se em vista a quantidade limitada de questões dessa
banca, também lançaremos no curso questões de outras bancas para
complementar ou mesmo para introduzir um determinado conteúdo.
Sempre que fizermos isso será levando em conta o formato e a
profundidade das questões de informática que costumamos encontrar nas
provas do Cespe/UnB.
b) O curso está sendo criado com todo o capricho e profissionalismo de
sempre! Então, espero que aproveitem!
A satisfação e motivação estão cada vez maiores, e será um enorme prazer
trabalhar com cada um de vocês neste curso rumo ao tão sonhado cargo
público!
Antes de partir para o desenvolvimento da teoria e dos exercícios,
gostaria de me apresentar. Vamos lá!
Sou a Profa Patrícia Lima Quintão, moro em Belo Horizonte e tenho ministrado
aulas de informática no Ponto dos Concursos desde 2009 (visando certames
como Senado Federal, Banco do Brasil, DEPEN, Câmara dos Deputados, STF,
Polícia Federal, Polícia Rodoviária Federal, Polícia Civil do Distrito Federal, Polícia
Civil- PA, PC-GO, MPU, INSS, MTE, TCU, TCE, Ministério da Fazenda, Petrobrás,
MPOG, ABIN, TRE, TRT, TSE, ANEEL, SEFAZ-DF, SEFAZ-RJ, SEFAZ-SC, SEFAZSP, ISS-RJ, ISS-BH, ISS-SP, SUSEP, TJ-DFT, TJ-CE, ANVISA, CGU, TRE, dentre
outros).
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
4
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Também atuo no processo de Coaching para Concursos do Ponto,
assessorando os candidatos para que consigam atingir seu objetivo: a
aprovação em concurso público, de forma mais rápida e eficiente.
Auxilio também os candidatos na elaboração dos recursos (Ponto Recursos) e
sou coordenadora de todos os cursos de TI e informática básica do Ponto.
Cabe ressaltar que ministrei, desde 2009, TODOS os cursos da área fiscal
no Ponto dos Concursos, e é grande a satisfação que tenho de poder participar
dessa trajetória de sucesso com todos vocês! Como exemplo, mapeamos
95% da última prova da SEFAZ-RJ e 100% da última prova direcionada
à
SEFAZ-RS/SEFAZ-PI/SEFAZ-PE,
dentre
outras,
então,
não
será
diferente dessa vez. A experiência nas diversas turmas já ministradas, bem
como o entendimento dos anseios da banca (rs!) são fundamentais para esse
resultado!
Também tenho lecionado disciplinas técnicas do curso de bacharelado em
Sistemas de Informação e do MBA em Segurança da Informação do IGTI, e atuo
como Gerente de Segurança da Informação na PRODABEL.
Sou instrutora autorizada CISCO e autora dos seguintes livros:
1) 1001 questões comentadas de informática (Cespe/UnB) pela Editora
Gen/Método. 2ª. Edição. NOVO! O livro já está disponível em
https://goo.gl/tiqTbY.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
5
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
2) Informática FCC - Questões comentadas e organizadas por assunto,
pela Editora GEN/Método, sob a coordenação dos grandes mestres Vicente
Paulo e Marcelo Alexandrino. Aliás, vale destacar aqui que a terceira
edição
desse
livro
pode
ser
obtida
também
pelo
site
http://www.editorametodo.com.br/produtos_descricao.asp?codigo_produt
o=2303.
Quanto à formação, tenho mestrado em Engenharia de Sistemas e Computação
pela COPPE/UFRJ, sou pós-graduada em Gerência de Informática e bacharel em
Informática pela Universidade Federal de Viçosa (UFV). Atuo como membro:

da Sociedade Brasileira de Computação,

da Sociedade Brasileira de Coaching,

do PMI - Project Management Institute (e do Brazil Chapter do PMI, com
sede em BH),
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
6
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão

da ISACA (associada também ao Capítulo Belo Horizonte),

da Comissão de Estudo de Técnicas de Segurança (CE-21:027.00) da ABNT
(Associação Brasileira de Normas Técnicas), responsável pela elaboração
das normas brasileiras sobre gestão da Segurança da Informação.
Ainda, sou editora da revista InfraMagazine; tenho certificações técnicas na área
de segurança, redes e perícia forense; além de artigos publicados a nível nacional
e internacional com temas da área de informática.
E como não poderia deixar de ser, nas horas vagas, também concurseira, tendo
sido aprovada em vários concursos, como:

Professora titular do Departamento de Ciência da Computação do
Instituto Federal de Educação, Ciência e Tecnologia;

Professora substituta do Departamento de Ciência da Computação da
Universidade Federal de Juiz de Fora;

Analista de Tecnologia da Informação/Suporte, Prodabel;

Analista do Ministério Público MG;

Analista de Sistemas, Dataprev, Segurança da Informação;

Analista de Sistemas, Infraero;

Analista - TIC, Prodemge;

Analista de Sistemas, Prefeitura de Juiz de Fora;

Analista de Sistemas, SERPRO;

Analista Judiciário (Informática), TRF 2ª Região RJ/ES, etc.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
7
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Bem, passada a apresentação inicial, espero que este curso seja de grande valia
para o seu estudo, fazendo-o superar os desafios vindouros na prova!
Planejamento das Aulas
Esta é a nossa Aula Demonstrativa. As demais aulas estão estruturadas,
preferencialmente, conforme tabela aqui destacada, dando ênfase aos
conteúdos de maior relevância a este certame.
Alterações na ordem das aulas poderão ocorrer se necessárias por questões
didáticas, e, caso isso ocorra, serão devidamente alteradas no calendário do
curso.
No decorrer do curso disponibilizarei os pontos teóricos de relevância, e, em
seguida, trabalharemos as questões comentadas em sua íntegra. Também estarei
destacando, ao final de cada aula, no MEMOREX, o que devo tomar nota como
mais importante da matéria, permitindo melhor fixação dos assuntos
apresentados por aula.
Por fim, desejo-lhes muito sucesso nos estudos! Tenham a certeza e a convicção
de que qualquer esforço feito nessa fase será devidamente compensado. Em
outras
palavras,
esforce-se,
mantenha-se
focado
e
determinado,
pois,
certamente, valerá à pena!
Vamos começar então? Força, garra e determinação, e fiquem com Deus
sempre!
Profa Patrícia Lima Quintão
E-mail: [email protected]
Periscope: @patriciaquintao
Instagram: @coachpatriciaquintao
Twitter: http://www.twitter.com/pquintao
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
8
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Facebook: http://www.facebook.com/professorapatriciaquintao
Livro FCC (-Impresso ou digital =>
http://www.grupogen.com.br/catalogsearch/result/?q=inform%C3%
A1tica+fcc).
Livro Cespe/2016 (2ª. Edição) Novo! Lançamento!
http://www.grupogen.com.br/1001-questoes-comentadas-de-informaticacespe.html
Iniciamos o curso com um assunto bastante cobrado nas provas do
Cespe/UnB – Datarehouse e Data Mart. Totalizamos, nesta aula
inaugural, 12 questões, para mapeamento do estilo de prova que
você irá encontrar. Sucesso nos estudos!
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
9
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Tópicos da Aula
Planejamento das Aulas......................................................................... 8
Data Warehouse .................................................................................. 11
Data Mart ............................................................................................. 18
Data Mining (Mineração de Dados) ...................................................... 20
Abordagens para o Projeto de Data Warehouse ................................... 21
ETL (Extract Transform Load – Extração, Transformação e Carga de
Dados) em Data Warehouse ................................................................ 23
Memorex .............................................................................................. 25
Lista das Questões Comentadas na Aula .............................................. 27
Considerações Finais ........................................................................... 42
Bibliografia .......................................................................................... 43
Lista das Questões Apresentadas na Aula ............................................ 44
Gabarito ............................................................................................... 48
Acompanhe a Evolução do seu Aproveitamento ................................... 49
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
10
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Aula 00 – Noções de Modelagem Dimensional: Conceito e Aplicações
(Parte I)
Para iniciar a parte teórica do curso, optei por destacar a diferença entre o Data
Mart e o Data Warehouse, de grande importância para a prova. Espero que
aproveitem!
Data Warehouse
 Um Data Warehouse (armazém de dados, ou ainda depósito de dados),
é um repositório de informações colhidas de várias origens,
armazenadas sob um esquema unificado, em um único local, que
propõe sustentar a tomada de decisão com dados.
 Para que serve?
 Para criar uma visão única e centralizada dos dados que estavam
dispersos em diversos Bancos de Dados.
 Permite que usuários finais executem consultas, gerem relatórios e
façam análises.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
11
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
 Características:
Trata-se de uma coleção de dados orientada por assunto, integrada,
não-volátil, variante no tempo, que dá apoio às decisões da
administração.
Figura. Características do Data Warehouse
o Orientado a assunto: refere-se ao fato do Data Warehouse (DW) ser
organizado conforme diferentes visões de negócio, ou seja, armazena
informações sobre temas específicos importantes para o negócio da empresa.
Exemplo: Vendas, Compras, etc.
Figura. Visões de negócio
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
12
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
o Integrado a partir de fontes de dados heterogêneas: refere-se à
consistência de nomes, das unidades, das variáveis, etc., no sentido de que
os dados foram transformados até um estado uniforme. Por exemplo,
considere sexo como um elemento de dado. Uma aplicação pode codificar sexo
como M/F, outra como 1/0 e uma terceira como H/M.
Assim, conforme os dados são inseridos no Data Warehouse, eles são
convertidos para um mesmo padrão.

Sexo é codificado apenas de uma forma.

Da mesma maneira, se um elemento de dado é medido em
centímetros em uma aplicação, em polegadas em outra, ele será
convertido para uma representação única ao ser colocado no Data
Warehouse.
Figura. Exemplo integração dados de fontes heterogêneas
o Não volátil: os dados são sempre inseridos, nunca excluídos. Isso significa
que em um DW não existem alterações de dados, somente a carga inicial e
as consultas posteriores. No ambiente operacional, ao contrário, os dados
são, em geral, atualizados registro a registro, em múltiplas transações.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
13
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Por definição, os dados em um Data Warehouse não são voláteis, ou seja,
eles não mudam, salvo quando é necessário fazer correções de dados
previamente carregados. Os dados estão disponíveis somente para leitura
e não podem ser alterados.
Figura. Carregamento e acesso a dados no DW
o Variante
no
tempo:
posições
históricas
das
atividades
no
tempo.
Refere-se ao fato do dado em um Data Warehouse referir-se a algum
momento específico, significando que ele NÃO É ATUALIZÁVEL. Enquanto
que o dado de produção é atualizado de acordo com mudanças de
estado do objeto em questão, refletindo, em geral, o estado do objeto no
momento do acesso. Em um Data Warehouse, a cada ocorrência de uma
mudança, uma nova entrada é criada, para marcar esta mudança.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
14
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Figura. Variação de preços no tempo
o Granularidade de dados: refere-se ao nível de sumarização dos
elementos e de detalhes disponíveis nos dados, considerado o mais
importante aspecto do projeto de um Data Warehouse.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
15
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Quanto menor a granularidade, mais detalhada é a informação
disponível.
Definir a granularidade adequada é vital para que o DW atenda seus objetivos.
 Mais detalhes  Mais dados  Análise mais longa 
Informação mais detalhada.
 Menos detalhes  Menos dados  Análise mais curta 
Informação menos detalhada.
Para evitar que se perca informação são criados vários níveis de granularidade.
Em um nível de granularidade muito alto:
o o espaço em disco e o número de índices necessários se tornam bem
menores;
o há, porém, uma diminuição da possibilidade de utilização dos dados
para atender a consultas detalhadas.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
16
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
O Data Warehouse é um armazém centralizado de dados, ou seja, um
banco de dados ou um agrupamento de bases de dados que contêm
dados sobre os negócios organizados por assunto. Por exemplo, uma
indústria automotiva poderia ter um Data Warehouse com uma base de dados
destinada a armazenar registros inerentes ao setor de Vendas. Poderia haver
também uma outra base de dados que contivesse dados inerentes ao
departamento de Produção de Automóveis. A cada uma dessas bases de
dados dá-se o nome de Data Mart, e ao agrupamento de todos esses Data
Marts damos o nome de Data Warehouse.
Conforme visto, Data Warehouse é o processo de integração dos d a d o s
corporativos de uma empresa em um único rep ositório.
É u m a m b i e n t e d e suporte à decisão que alavanca dados armazenados em
diferentes fontes e os organiza e entrega aos tomadores de decisões. Resumindo,
é uma tecnologia de gestão e análise de dados.
(CESPE/2015/DEPEN/AGENTE PENITENCIÁRIO FEDERAL - TECNOLOGIA
DA INFORMAÇÃO) Acerca de datawarehouse e datamining, julgue o item
subsequente: [O datawarehouse possibilita a análise de grandes volumes de
dados, que, por sua vez, permitem a realização de uma melhor análise de eventos
futuros].
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
17
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Comentários
Um Data Warehouse é um repositório de informações colhidas de várias
origens, armazenadas sob um esquema unificado, em um único local.
Quando reunidos, os dados são armazenados por muito tempo, permitindo o
acesso a dados históricos. Ainda, o desenho da base de dados favorece os
relatórios, a análise de grandes volumes de dados e a obtenção de informações
estratégicas que podem facilitar a tomada de decisão.
O Data Warehouse possibilita a análise de grandes volumes de dados,
coletados dos sistemas transacionais (OLTP). São as chamadas séries
históricas que possibilitam uma melhor análise de eventos passados,
oferecendo suporte às tomadas de decisões presentes e a previsão de
eventos futuros.
Gabarito: item errado.
Data Mart
O Data Mart (DM) nada mais é que um subconjunto de dados de um
Data Warehouse, em que tipicamente desempenham o papel de um DW
departamental, regional ou funcional.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
18
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Figura. Data Warehouse e Data Marts
Alguns autores e especialistas dizem que o DW é uma evolução do DM que
começou localizado e cresceu para atender um escopo maior.
Data Mart: são armazéns de dados com informações de
interesse particular para um determinado setor da
empresa.
Data Warehouse: é o conjunto de armazéns de dados
particulares (Data Mart) com informação de interesse para
a empresa em geral.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
19
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Data Mining (Mineração de Dados)
É o processo de análise de conjuntos de dados que tem por objetivo a
descoberta de padrões interessantes e que possam representar
informações úteis.
A Mineração de Dados surgiu com a motivação de
“garimpar” informações relevantes das Bases de Dados, de
forma automática.
A mineração de dados é um processo de negócio utilizado para explorar
grandes quantidades de dados em busca de padrões e regras significativas.
Um exemplo clássico de utilização do Data Mining na área de marketing, é o das
fraldas próximas das cervejas. Uma das maiores redes de varejo dos Estados
Unidos detectou, em seu gigantesco armazém de dados, que a venda de fraldas
descartáveis estava associada à de cerveja. De uma maneira geral, os
compradores eram homens, que saíam à noite para comprar fraldas e
aproveitavam para levar algumas latinhas para casa. Os produtos foram postos
lado a lado. Resultado: a venda de fraldas e cervejas disparou.
Veja mais:
http://exame.abril.com.br/revista-exame/edicoes/633/noticias/o-que-cervejatem-a-ver-com-fraldas-m0053931.
O uso prático de data mining envolve o emprego de processos, ferramentas,
técnicas e métodos oriundos da matemática, da estatística e da computação,
inclusive de inteligência artificial.
“A mineração de dados é um campo interdisciplinar que reúne técnicas de
aprendizado de máquina, reconhecimento de padrões, estatísticas,
banco de dados e visualização para abordar a questão da extração de
informações a partir de grandes bases de dados” (Evangelos Simoudis, citado em
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
20
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Daniel T. Larose, Discovering Knowledge in Data – An Introduction to Data
Mining).
Os processos de Data Mining são muito facilitados quando a empresa já
possui seu Data Warehouse bem estruturado, por isso esses dois termos
Data Warehouse e Data Mining caminham tão juntos.
As empresas comumente irão primeiramente amadurecer seus processos de
organização dos dados sobre o negócio e agrupá-los por assunto, formando seus
Data Marts. Em seguida, irão compor seu Data Warehouse, para após, iniciar
os processos de Data Mining com a finalidade de encontrar algum
conhecimento de valor em meio aos dados sobre o negócio.
Abordagens para o Projeto de Data Warehouse
No que se refere aos métodos de construção de Data Warehouse, existem
formalmente dois:

Top-down, no qual é realizada a modelagem integral do DW, seguida pelas
extrações de dados. Considera que deve-se desenvolver um DW
completo e centralizado antes que partes dele, sumarizadas,
possam ser derivadas na forma de Data Marts. A principal vantagem
é a criação de um modelo único. O revés fica por conta do maior tempo de
projeto;

Bottom-up, em que o foco é em uma área por vez, com o crescimento
gradual do DW. Considera que um DW possa ser composto a partir
de Data Marts previamente desenvolvidos. A
vantagem
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
é
a
21
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
obtenção
de
resultados
a
intervalos
mais
curtos,
garantindo
muitas vezes sustentação ao projeto. A desvantagem é a
m a i o r d i f i c u l d a d e d e s e consolidar informações entre as diversas
áreas.
Podem-se visualizar pela imagem seguinte as duas formas de construção, uma
na qual o DW gera os DM (Data Mart) e outra em que os DM geram o
DW.
Figura. Exemplos das duas formas de construção de um
Data Warehouse
Para os p r o c e s s o s d e c o n s t r u ç ã o d e u m D a t a W a r e h o u s e ( D W )
é altamente importante a compreensão do negócio que envolve a empresa ou
instituição em que se está desenvolvendo o trabalho.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
22
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Operational Data Storage (ODS) ou Staging Area (SA), no
âmbito dos DWs, representa um armazenamento intermediário dos dados,
que facilita a integração dos dados do ambiente operacional antes de sua
atualização no DW. Atualmente, alguns autores passaram a denominá-lo
Dynamic Data Storage (DDS).
ETL (Extract Transform Load – Extração, Transformação e Carga de
Dados) em Data Warehouse

O processo inicial é a extração de dados das bases de dados
transacionais, dados de sistemas ERP, dados locais, externos ou web.
Fonte: Microsoft (2011)
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
23
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão

Após a extração, os dados devem ser transformados para que seja
possível a carga dos dados em um Data Warehouse ou Data Mart,
dependendo do método de construção adotado.
Fonte: Microsoft (2011)

Algumas das ferramentas conhecidas de ETL (Extract – Transform – Load)
são: IBM InfoSphere DataStage , Informática Power Center, Business
Objects Data Integrator , Data Transformation Services, Pentaho Data
Integration, Oracle Data Integrator, entre outras.
Interrompemos aqui a nossa aula demonstrativa do curso. Na aula 3
daremos continuidade à temática desta aula.
A partir deste momento vamos revisar alguns pontos
IMPORTANTES da aula por intermédio de quadros sinóticos,
mapas mentais ou colocação de tópicos e palavras-chave, o que
teremos em todas as aulas desse curso.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
24
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Memorex
Data Mart: são armazéns de dados com informações de
interesse particular para um determinado setor da
empresa.
Data Warehouse: é o conjunto de armazéns de dados
particulares (Data Mart) com informação de interesse para
a empresa em geral.

Data Warehouse (DW) é o processo de integração dos d a d o s
corporativos de uma empresa em um único repositório. É
u m a m b i e n t e d e suporte à decisão que alavanca dados armazenados em
diferentes fontes e os organiza e entrega aos tomadores de decisões.
Resumindo, é uma tecnologia de gestão e análise de dados.

Requisitos básicos para um Data Warehouse:

DW: organizados em assuntos;

DW: capacidade de integração;

DW: deve ser flexível o suficiente para atender às exigências
de mudança rapidamente;

Dados: considerados NÃO voláteis e devem ser carregados em
massa;

Dados: existem em vários níveis de granularidade.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
25
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Data Mining (Mineração de Dados)
É o processo de análise de conjuntos de dados que tem por objetivo a
descoberta de padrões interessantes e que possam representar
informações úteis.
A Mineração de Dados surgiu com a motivação de
“garimpar” informações relevantes das Bases de Dados, de
forma automática.

A mineração de dados é um processo de negócio utilizado para explorar
grandes quantidades de dados em busca de padrões e regras
significativas.

No contexto de data mining, o processo de descoberta de conhecimento em
base de dados consiste na extração não trivial de conhecimento previamente
desconhecido e potencialmente útil.

O uso prático de data mining envolve o emprego de processos,
ferramentas, técnicas e métodos oriundos da matemática, da estatística
e da computação, inclusive de inteligência artificial.

As ferramentas de software ETL (extract transform load) têm como função
a extração de dados de diversos sistemas, a transformação desses dados
de acordo com as regras de negócio e a carga dos dados em um data mart
ou um DW.
Rumo às questões!
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
26
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Lista das Questões Comentadas na Aula
1. (CESPE/2016/TCE-PA/Auditor de Controle Externo - Área Informática
- Analista de Sistema) Julgue o item a seguir, em relação a data warehouse
e data mining.
No contexto de data mining, o processo de descoberta de conhecimento em base
de dados consiste na extração não trivial de conhecimento previamente
desconhecido e potencialmente útil.
Comentários
O Data Mining é considerado uma parte de um processo maior conhecido como
KDD (Knowledge Discovery in Databases) – em português, Descoberta de
Conhecimento em Bases de Dados –, que, segundo Eduardo Gimenes, busca
extrair informação válida, previamente desconhecida e de máxima abrangência
a partir de grandes bases de dados, usando-as para efetuar de decisões cruciais.
Addrians & Zantinge (1996) cita que o Data Mining, ou Mineração de Dados,
permite
a
extração
não
trivial
de
conhecimento
previamente
desconhecido e potencialmente útil de um banco de dados.
Outra definição clássica para esse termo é a de FAYYAD et al. (1996): “processo,
não trivial, de extração de informações implícitas, previamente desconhecidas e
potencialmente úteis, a partir dos dados armazenados em um banco de dados”,
ou seja, buscar por informações em uma base de dados com os mais variados
atributos e assuntos.
Já Laudon&Laudon destaca que Data Mining é a análise de grandes quantidades
de dados a fim de encontrar padrões e regras que possam ser usadas para
orientar a tomada de decisões e prever o comportamento futuro.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
27
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
“Mineração de dados, ou data mining, é o processo de análise de conjuntos
de dados que tem por objetivo a descoberta de padrões interessantes e que
possam representar informações úteis”.
Gabarito: item correto.
2. (Q104752/CESPE/2016/TCE-PA/Auditor de Controle Externo - Área
Informática - Analista de Sistema) Julgue o item a seguir, em relação a
data warehouse e data mining. [Data warehouse é um repositório de dados
dinâmico, que sofre alterações frequentes, de modo a permitir que sejam
feitas consultas em base de dados constantemente atualizada].
Comentários
A questão tornou-se inadequada ao destacar que o Data Warehouse sofre
alterações frequentes.
Os dados em um Data Warehouse não são voláteis, ou seja, eles não mudam,
salvo quando é necessário fazer correções de dados previamente carregados. No
ambiente operacional, ao contrário, os dados sofrem alterações frequentes, pois
são, em geral, atualizados registro a registro, em múltiplas transações.
Figura. Carregamento e acesso a dados no DW
Gabarito: item errado.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
28
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
3. (CESPE/2015/TCU/Auditor Federal de Controle Externo) O uso prático de
data mining envolve o emprego de processos, ferramentas, técnicas e
métodos oriundos da matemática, da estatística e da computação, inclusive
de inteligência artificial.
Comentários
Data Mining é a etapa do KDD (Knowledge Discovery in Databases - Descoberta
de Conhecimento em Bases de Dados) em que os dados preparados são
processados, ou seja, é onde se faz a mineração dos dados propriamente dita.
Nesse contexto, são aplicadas técnicas para identificação de padrões sobre os
dados disponíveis. Esse processo tem o intuito de trabalhar os dados registrados
ao longo do tempo de vida de um negócio a fim de se identificar padrões que
representam alguma informação sobre o comportamento do negócio.
A figura a seguir apresenta um esquema que descreve o KDD.
O processo de KDD envolve os seguintes passos:
1. entendimento do domínio da aplicação e identificação do objetivo do
processo de KDD;
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
29
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
2. seleção: criação de um conjunto-alvo de dados;
3. pré-processamento: limpeza de dados e operações básicas como remoção
de ruído, tratamento para a falta de dados, etc.;
4. transformação: encontrar características úteis para representar os dados,
conforme o objetivo definido e realizar a redução ou transformação da
dimensionalidade;
5. mineração de dados: casar os objetivos do processo de KDD com um
método particular de mineração de dados e realizar a análise
exploratória e seleção de modelo e hipótese, buscando padrões de
interesse;
6. interpretação: interpretar e avaliar os padrões minerados, podendo retornar
a passos anteriores caso seja necessário;
7. agir a partir do conhecimento descoberto.
No Data Mining são aplicadas técnicas e ferramentas matemáticas,
estatísticas e computacionais visando a extração de informações implícitas,
previamente desconhecidas, e potencialmente úteis, a partir de dados. Para
isso é necessário um programa de computador para detectar padrões e
regularidades nos dados. Os termos destacados na questão estão de acordo com
essa teoria, e a assertiva é correta.
Gabarito: item correto.
4. (CESPE/2015/TCU/Auditor Federal de Controle Externo) No ambiente
organizacional, devido à grande quantidade de dados, não é recomendado o
emprego de data mining para atividades ligadas a marketing.
Comentários
Não existe restrição de setor para o emprego das técnicas de Data mining. Em
relação à quantidade de dados também não há restrição desde que a empresa
possua capacidade de tratamento (armazenagem e processamento) dos dados.
Gabarito: item errado.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
30
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
5. (CESPE/2015/TCU/Auditor Federal de Controle Externo) A finalidade do
uso do data mining em uma organização é subsidiar a produção de afirmações
conclusivas acerca do padrão de comportamento exibido por agentes de
interesse dessa organização.
Comentários
A mineração de dados (Data Mining) pode ser utilizada para encontrar novos
padrões, visando:

predição:
o
sistema
encontra
padrões
para
predizer
(prever)
o
comportamento futuro de algumas entidades;

descrição: o sistema encontra padrões relevantes sobre os dados, em uma
forma compreensível para o usuário.
A mineração de dados envolve o ajuste de modelos aos dados observados ou a
determinação de padrões a partir destes dados. Os modelos ajustados fazem o
papel do conhecimento inferido, sobre o qual o julgamento humano subjetivo é
exigido na verificação se os modelos refletem conhecimento útil ou interessante.
Gabarito: item correto.
6. (CESPE/2015/DEPEN/AGENTE
PENITENCIÁRIO
FEDERAL
-
TECNOLOGIA DA INFORMAÇÃO) Acerca de datawarehouse e datamining,
julgue o item subsequente: [O datawarehouse possibilita a análise de grandes
volumes de dados, que, por sua vez, permitem a realização de uma melhor
análise de eventos futuros].
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
31
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Comentários
Um Data Warehouse é um repositório de informações colhidas de várias
origens, armazenadas sob um esquema unificado, em um único local.
Quando reunidos, os dados são armazenados por muito tempo, permitindo o
acesso a dados históricos.
Ainda, o desenho da base de dados favorece os relatórios, a análise de grandes
volumes de dados e a obtenção de informações estratégicas que podem facilitar
a tomada de decisão.
O Data Warehouse possibilita a análise de grandes volumes de dados,
coletados dos sistemas transacionais (OLTP). São as chamadas séries
históricas que possibilitam uma melhor análise de eventos passados,
oferecendo suporte às tomadas de decisões presentes e a previsão de
eventos futuros.
Gabarito: item errado.
7. (Q104754/CESPE/2014/TJ-SE/Analista
Judiciário/Análise
de
Sistemas) Com relação a sistemas de suporte à decisão, julgue os seguintes
itens.
Assim como o Data Mining, os Data Marts são voltados para a obtenção de
informações estratégicas de maneira automática, ou seja, com o mínimo de
intervenção humana a partir da análise de dados oriundos de Data
Warehouses.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
32
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Comentários
O Data Warehouse é um conjunto de dados orientado por assuntos, não volátil,
variável com o tempo e integrado, criado para dar suporte à decisão.
Data Marts são subconjuntos de dados de um Data Warehouse.
E, por fim, é o Data Mining (Mineração de Dados) o processo de identificar
informações relevantes, tais como padrões, associações, mudanças,
anomalias e estruturas, em grandes conglomerados de dados que
estejam em banco de dados ou outros repositórios de informações.
Gabarito: item errado.
8. (CESPE/2014/TJ-SE/Programação de Sistemas) Os dados armazenados
em um DataWarehouse devem estar integrados, temporalmente identificados,
orientados ao assunto e devem ser protegidos, de modo a se evitar o acesso
do usuário.
Comentários
Segundo Bill Inmon (1997), um data warehouse é uma coleção de dados
orientada a assuntos, integrada, não-volátil e variante ao longo do
tempo, para suporte à tomada de decisão.
•
É orientado a assuntos
o o DW é criado de forma orientada em torno dos principais assuntos
da organização (clientes, vendas, produtos, estoques, etc.).
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
33
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
•
É integrado
o Na convenção consistente de nomes;
o Na estrutura consistente da codificação; etc.
•
É não volátil
o Somente existem cargas e acessos (atualizações existe, mas devido
às manutenções).
•
É variante no tempo
o Qualquer unidade de dado deve ter precisão em um ponto bem
definido do tempo.
Por fim, deve-se definir o nível de segurança a ser implementado no DW, de modo
a que se permita o acesso devido aos usuários autorizados. A questão afirma
que o acesso do usuário deve ser evitado, o que está errado!
Gabarito: item errado.
9. (FCC/2013/TRT9R/Téc.Jud./Tec.Informação)
A
revista
ClubeDelphi
publicou o seguinte artigo:
Com o crescente aumento do volume de dados, surge a necessidade de
ferramentas e mecanismos que permitam que eles possam ser analisados de
forma otimizada, uma vez que armazenam toda a trajetória da empresa.
Uma solução é a utilização de I que, em síntese, é utilizado para armazenar
conjuntos de dados organizados por assuntos, mantendo todo um histórico
corporativo.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
34
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Outro recurso muito utilizado e dos mais importantes quando o objetivo é a busca
de conhecimento, é o II, que é um processo que consiste na identificação de
informações relevantes que estão presentes em grandes bancos de dados ou
repositórios, geralmente realizado em três etapas: a exploração, a definição dos
padrões e a validação dos dados.
Estas ferramentas e técnicas fazem parte do III, definido como um conjunto de
métodos e conceitos que podem ser implementados através de softwares com o
intuito de utilizar os dados importantes da organização para auxiliar no processo
de tomada de decisões, proporcionando melhorias para a alta administração.
Outra tecnologia que pode prover uma melhor e mais flexível análise das
informações, é o IV que permite uma visão conceitual de forma multidimensional
das informações da organização, de maneira que as informações possam ser
visualizadas e analisadas de diferentes perspectivas pelo usuário.
(http://www.devmedia.com.br/mineracao-de-dados-data-warehouse-datamining-bi-e-olap-atraves-do-fastcube-revista-clubedelphi-146/26537)
As lacunas que completam corretamente o texto estão expressas em:
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
35
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Comentários
Lacuna
Conceito
I
Data
Warehouse
Descrição
Utilizado
para
organizados
armazenar
por
assuntos,
conjuntos
de
mantendo
dados
todo
um
histórico corporativo. Trata-se de uma coleção de
dados orientada por assunto, integrada, nãovolátil, variante no tempo, que dá apoio às
decisões da administração.
II
Data Mining Processo que consiste na identificação de informações
(Mineração
relevantes que estão presentes em grandes bancos
de Dados)
de dados ou repositórios, geralmente realizado em
três etapas: a exploração, a definição dos padrões e
a validação dos dados.
Em outras palavras, é o processo de identificar
informações relevantes, tais como padrões,
associações, mudanças, anomalias e estruturas,
em
grandes
estejam
em
conglomerados
banco
de
de
dados
dados
ou
que
outros
repositórios de informações.
III
Business
Um conjunto de métodos e conceitos que podem
Intelligence
ser implementados através de softwares com o
intuito de utilizar os dados importantes da
organização para auxiliar no processo de tomada
de decisões, proporcionando melhorias para a alta
administração.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
36
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
IV
OLAP
Permite uma visão conceitual de forma
(Online
multidimensional das informações da organização,
Analytical
de maneira que as informações possam ser
Processing)
visualizadas e analisadas de diferentes perspectivas
pelo usuário.
Gabarito: letra D.
10.
(FCC/2014/ICMS-RJ/Auditor Fiscal da Receita Estadual) Com o
advento da tecnologia de Data Warehousing, os ambientes de apoio à decisão
passaram a ser denominados ambientes de Data Warehouse (DW).
Em relação à tecnologia DW, é correto afirmar:
a) Um DW tem duas operações básicas: a carga dos dados (inicial e
incremental) e o acesso a estes dados em modo leitura. Depois de carregado,
um DW não necessita de operações de bloqueio por concorrência de usuários
no acesso aos seus dados.
b) Em um DW as convenções de nomes, valores de variáveis e outros atributos
físicos de dados como data types são bastante flexíveis. Para facilitar a tomada
de decisões, as informações são apresentadas de diferentes formas, da mesma
maneira que foram carregadas dos sistemas legados.
c) Um projetista de DW deve ter seu foco na modelagem dos dados e no
projeto de banco de dados. Um sistema transacional armazena as informações
agrupadas por assuntos de interesse da empresa que são mais importantes,
enquanto um DW é orientado a processos e deve ser desenvolvido para manter
disponíveis as transações realizadas diariamente.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
37
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
d) Os dados de um DW são um conjunto dinâmico de registros de uma ou mais
tabelas, capturados em um momento de tempo predeterminado, por isso têm
que ser sempre atualizados.
e) Um sistema multidimensional, como o DW, deve atualizar o valor corrente
das informações e sua exatidão é válida por um tempo curto, por exemplo, o
valor total das notas fiscais processadas pela Receita às 12:00 de um dia pode
ser diferente às 18:00 do mesmo dia.
Comentários
Bill Inmon destaca que o Data Warehouse (DW) “é uma coleção de dados
orientados por assuntos, integrados, variáveis com o tempo e não
voláteis, para dar suporte ao processo de tomada de decisão“. Essas
características podem ser descritas da seguinte forma:
•
Orientado a assunto: refere-se ao fato do Data Warehouse (DW) ser
organizado conforme diferentes visões de negócio, ou seja, armazena
informações sobre temas específicos importantes para o negócio da empresa.
Ex.: Vendas, Compras, etc.
•
Integrado a partir de fontes de dados heterogêneas.
•
Não volátil: os dados são sempre inseridos, nunca excluídos. Em um DW
não existem alterações de dados, somente a carga inicial e as
consultas posteriores.
•
Variável com tempo: posições históricas das atividades no tempo.
Conforme visto, a restrição de não volatilidade permite basicamente duas
operações em um DW, que são: a carga (inicial ou incremental) e consulta dos
dados. Via de regra não há operações de atualizações de registros, nem
necessidade de operações de bloqueio por concorrência de usuários no acesso
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
38
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
aos seus dados (o que acontece tipicamente em operações de escrita de dados),
pois os dados em um DW são apenas para leitura. Assim, a letra A é a resposta
da questão.
Gabarito: A.
Acerca de soluções de suporte a decisão, julgue os dois itens seguintes.
11.
(CESPE/Correios/Analista
de
Correios/Analista
de
Sistemas/Desenvolvimento de Sistemas/2011) As ferramentas de
software ETL (extract transform load) têm como função a extração de dados
de diversos sistemas, a transformação desses dados de acordo com as regras
de negócio e a carga dos dados em um data mart ou um DW.
Comentários
As ferramentas de software ETL (Extract Transform Load - E x t r a ç ã o
T r a n s f o r m a ç ã o C a r g a ) , conforme visto na figura seguinte, têm como
função a extração de dados a partir dos sistemas de origem e, geralmente,
gravação em disco no ambiente de ETL antes de qualquer reestruturação dos
dados.
Em seguida, é realizada a transformação desses dados de acordo com as regras
de negócio e, por fim, a carga dos dados em um Data Mart ou em um Data
Warehouse (DW).
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
39
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Gabarito: item correto.
12.
(CESPE/Correios/Analista
de
Correios/Analista
de
Sistemas/Desenvolvimento de Sistemas/2011) Em um ambiente data
warehouse (DW), é possível a análise de grandes volumes de dados, os quais
ficam disponíveis para serem alterados e manipulados pelo usuário.
Comentários
Segundo Laudon & Laudon, um Data Warehouse (DW) é um banco de dados, com
ferramentas de consulta e relatório, que armazena dados atuais e históricos
extraídos de vários sistemas operacionais e consolidados para fins de análises e
relatórios administrativos.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
40
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Em um ambiente DW, é possível a análise de grandes volumes de dados. No
entanto, diferentemente do ambiente operacional em que os dados são, em
geral, atualizados registro a registro, em múltiplas transações, o DW permite
apenas a carga inicial dos dados e consultas a estes dados. Após serem
integrados e transformados, os dados são carregados em bloco para o Data
Warehouse, para que estejam disponíveis aos usuários para acesso.
Gabarito: item errado.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
41
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Considerações Finais
Bom, pessoal, acho que já foi suficiente para que se tenha a ideia do que o espera
e também de como será o nosso curso. A partir de agora, as aulas serão
agrupadas por assuntos específicos, preferencialmente com a distribuição listada
no planejamento das aulas.
Finalizando, espero que continue conosco pegando os macetes e atalhos da
caminhada que serão importantes para a sua prova, de forma a tentar encurtar
essa longa trajetória e ajudá-lo(a) a chegar ao objetivo almejado.
Fique com Deus, e até a nossa próxima aula aqui no Ponto dos Concursos!
Profa Patrícia Lima Quintão
Email: [email protected]
Outubro/2016
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
42
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Bibliografia
QUINTÃO, PATRÍCIA LIMA. Informática para Concursos, 2016.
QUINTÃO, PATRÍCIA LIMA. Tecnologia da Informação para Concursos, 2016.
QUINTÃO,
PATRÍCIA
LIMA.
Informática-FCC-Questões
Comentadas
e
Organizadas por Assunto, 4ª. Edição. Ed. Gen/Método, 2016 (Em breve nas
livrarias).
QUINTÃO, PATRÍCIA LIMA. 1001 Questões Comentadas de Informática Cespe, 2ª. Edição. Ed. Gen/Método, 2016 (Novo!).
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
43
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Lista das Questões Apresentadas na Aula
1. (CESPE/2016/TCE-PA/Auditor de Controle Externo - Área Informática
- Analista de Sistema) Julgue o item a seguir, em relação a data warehouse
e data mining.
No contexto de data mining, o processo de descoberta de conhecimento em base
de dados consiste na extração não trivial de conhecimento previamente
desconhecido e potencialmente útil.
2. (Q104752/CESPE/2016/TCE-PA/Auditor de Controle Externo - Área
Informática - Analista de Sistema) Julgue o item a seguir, em relação a
data warehouse e data mining. [Data warehouse é um repositório de dados
dinâmico, que sofre alterações frequentes, de modo a permitir que sejam
feitas consultas em base de dados constantemente atualizada].
3. (CESPE/2015/TCU/Auditor Federal de Controle Externo) O uso prático de
data mining envolve o emprego de processos, ferramentas, técnicas e
métodos oriundos da matemática, da estatística e da computação, inclusive
de inteligência artificial.
4. (CESPE/2015/TCU/Auditor Federal de Controle Externo) No ambiente
organizacional, devido à grande quantidade de dados, não é recomendado o
emprego de data mining para atividades ligadas a marketing.
5. (CESPE/2015/TCU/Auditor Federal de Controle Externo) A finalidade do
uso do data mining em uma organização é subsidiar a produção de afirmações
conclusivas acerca do padrão de comportamento exibido por agentes de
interesse dessa organização.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
44
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
6. (CESPE/2015/DEPEN/AGENTE
PENITENCIÁRIO
FEDERAL
-
TECNOLOGIA DA INFORMAÇÃO) Acerca de datawarehouse e datamining,
julgue o item subsequente: [O datawarehouse possibilita a análise de grandes
volumes de dados, que, por sua vez, permitem a realização de uma melhor
análise de eventos futuros].
7. (Q104754/CESPE/2014/TJ-SE/Analista
Judiciário/Análise
de
Sistemas) Com relação a sistemas de suporte à decisão, julgue os seguintes
itens.
Assim como o Data Mining, os Data Marts são voltados para a obtenção de
informações estratégicas de maneira automática, ou seja, com o mínimo de
intervenção humana a partir da análise de dados oriundos de Data
Warehouses.
8. (CESPE/2014/TJ-SE/Programação de Sistemas) Os dados armazenados
em um DataWarehouse devem estar integrados, temporalmente identificados,
orientados ao assunto e devem ser protegidos, de modo a se evitar o acesso
do usuário.
9. (FCC/2013/TRT9R/Téc.Jud./Tec.Informação)
A
revista
ClubeDelphi
publicou o seguinte artigo:
Com o crescente aumento do volume de dados, surge a necessidade de
ferramentas e mecanismos que permitam que eles possam ser analisados de
forma otimizada, uma vez que armazenam toda a trajetória da empresa.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
45
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Uma solução é a utilização de I que, em síntese, é utilizado para armazenar
conjuntos de dados organizados por assuntos, mantendo todo um histórico
corporativo.
Outro recurso muito utilizado e dos mais importantes quando o objetivo é a busca
de conhecimento, é o II, que é um processo que consiste na identificação de
informações relevantes que estão presentes em grandes bancos de dados ou
repositórios, geralmente realizado em três etapas: a exploração, a definição dos
padrões e a validação dos dados.
Estas ferramentas e técnicas fazem parte do III, definido como um conjunto de
métodos e conceitos que podem ser implementados através de softwares com o
intuito de utilizar os dados importantes da organização para auxiliar no processo
de tomada de decisões, proporcionando melhorias para a alta administração.
Outra tecnologia que pode prover uma melhor e mais flexível análise das
informações, é o IV que permite uma visão conceitual de forma multidimensional
das informações da organização, de maneira que as informações possam ser
visualizadas e analisadas de diferentes perspectivas pelo usuário.
(http://www.devmedia.com.br/mineracao-de-dados-data-warehouse-datamining-bi-e-olap-atraves-do-fastcube-revista-clubedelphi-146/26537)
As lacunas que completam corretamente o texto estão expressas em:
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
46
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
10.
(FCC/2014/ICMS-RJ/Auditor Fiscal da Receita Estadual) Com o
advento da tecnologia de Data Warehousing, os ambientes de apoio à decisão
passaram a ser denominados ambientes de Data Warehouse (DW).
Em relação à tecnologia DW, é correto afirmar:
a) Um DW tem duas operações básicas: a carga dos dados (inicial e
incremental) e o acesso a estes dados em modo leitura. Depois de carregado,
um DW não necessita de operações de bloqueio por concorrência de usuários
no acesso aos seus dados.
b) Em um DW as convenções de nomes, valores de variáveis e outros atributos
físicos de dados como data types são bastante flexíveis. Para facilitar a tomada
de decisões, as informações são apresentadas de diferentes formas, da mesma
maneira que foram carregadas dos sistemas legados.
c) Um projetista de DW deve ter seu foco na modelagem dos dados e no
projeto de banco de dados. Um sistema transacional armazena as informações
agrupadas por assuntos de interesse da empresa que são mais importantes,
enquanto um DW é orientado a processos e deve ser desenvolvido para manter
disponíveis as transações realizadas diariamente.
d) Os dados de um DW são um conjunto dinâmico de registros de uma ou mais
tabelas, capturados em um momento de tempo predeterminado, por isso têm
que ser sempre atualizados.
e) Um sistema multidimensional, como o DW, deve atualizar o valor corrente
das informações e sua exatidão é válida por um tempo curto, por exemplo, o
valor total das notas fiscais processadas pela Receita às 12:00 de um dia pode
ser diferente às 18:00 do mesmo dia.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
47
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Acerca de soluções de suporte a decisão, julgue os dois itens seguintes.
11.
(CESPE/Correios/Analista
de
Correios/Analista
de
Sistemas/Desenvolvimento de Sistemas/2011) As ferramentas de
software ETL (extract transform load) têm como função a extração de dados
de diversos sistemas, a transformação desses dados de acordo com as regras
de negócio e a carga dos dados em um data mart ou um DW.
12.
(CESPE/Correios/Analista
de
Correios/Analista
de
Sistemas/Desenvolvimento de Sistemas/2011) Em um ambiente data
warehouse (DW), é possível a análise de grandes volumes de dados, os quais
ficam disponíveis para serem alterados e manipulados pelo usuário.
Gabarito
1. Item correto.
10.
Letra A.
2. Item errado.
11.
Item correto.
3. Item correto.
12.
Item errado.
4. Item errado.
5. Item correto.
6. Item errado.
7. Item errado.
8. Item errado.
9. Letra D.
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
48
Análise de Informações em Teoria e Exercícios
p/ Cargos de Auditor do TCU - Turma: 10 – Foco: CESPE e Similares
Aula 00 – Aula Demonstrativa - Profa. Patrícia Quintão
Acompanhe a Evolução do seu Aproveitamento
Data Nº
Acertos %
questões
acerto
Data Nº
questões
12
Data Nº
12
acerto
12
Acertos %
questões
Acertos %
acerto
Data Nº
Acertos %
questões
acerto
12
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão
49
Download