Implantação de um Data Warehouse para Acompanhamento de

Propaganda
Implantação de um Data Warehouse para Acompanhamento de Desempenho
dos Cursos em uma Instituição de Ensino Superior
Deploying a Data Warehouse for Performance Monitoring Course in an Institution of
Higher Education
Implementación de un Data Warehouse para la Supervisióndel Rendimiento de
los Cursos en una Institución de EducaciónSuperior
Edgar Luiz de Lima Júnior1
Fabrício Pires Vasconcellos2
Rodrigo Vitorino Moravia3
Resumo: Este artigo tem como objetivo apresentar a implantação um Data Warehouse em uma
Instituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico. Foi
desenvolvido um modelo dimensional com uma base intermediária, rotinas de tratamento de extração,
transformação e limpeza dos dados extraído do Excel, além da ferramenta Web, onde os usuários
podem gerar relatórios on-line conforme a necessidade.
Palavras-chave: Data Warehouse (DW). Extração, Transformação e Carga (ETL). On-Line Analytical
Processing (OLAP).
Abstract: This article aims to present a Data Warehouse deployment in an Institution of Higher
Education in Belo Horizonte to aid in their strategic planning. A dimensional model was developed with
an intermediate base handlers extraction, processing and cleaning of extracted data from Excel, plus
web tool where users can generate on-line reports as needed.
Keywords: Data Warehouse (DW). Extract, Transform, Load (ETL). On-Line Analytical Processing
(OLAP).
Resumen: Este artículo tiene como objetivo presentar undespliegue de Data Warehouseen una
Institución de Educación Superior en Belo Horizonte para ayudaren suplanificación estratégica. Un
modelo tridimensional se hadesarrolladocon una extracción manejadores de bases intermedias,
elprocesamiento y lalimpieza de losdatos extraídos de Excel, además de laherramienta web donde
losusuariospuedengenerar informes on-line, segúnseanecesario.
Palabras clave: Data Warehouse (DW). Extracción, Transformación y Carga (ETL). On-Line Analytical
Processing (OLAP).
1 - INTRODUÇÃO
Constitui-se tema deste artigo a implantação de um Data Warehouse em uma
Instituição de Ensino Superior no qual os diretores e coordenadores não possuem
informações históricas sobre o desempenho dos cursos.
Devido à expansão e popularização da tecnologia em geral, a sociedade ficou
conhecida como a sociedade da informação e, ao elencar características a ela
pertinentes, mencionam o fenômeno do caos informacional. Nunca havia se
observado um contexto no qual as informações surgem e são disseminadas de modo
1
Graduando do curso Bacharelado em Sistemas de Informação pela Faculdade Infórium de Tecnologia.
[email protected]
2
Mestre em Sistemas de Informação e Gestão do conhecimento pela Fundação Mineira de Educação e Cultura.
Professor da Faculdade Infórium de Tecnologia. [email protected]
3
Especialista em Gestão da Informação pelo Instituto de Educação Continuada da Pontifícia Universidade Católica
de Minas Gerais. Professor da Faculdade Infórium de Tecnologia. [email protected]
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
tão rápido entre seus usuários, ainda que haja grandes distâncias entre eles. Os
indivíduos podem buscar e acessar informações dos mais variados tipos, porém, por
existir tantas informações oriundas de múltiplas fontes, os usuários se veem diante do
desafio de se manter atualizados em meio a esse caos informacional, em uma
sociedade cujo ritmo de vida é acelerado.
Quando se tem informações antes dos concorrentes, é possível inovar e
surpreender as expectativas dos clientes, desta forma, aumenta a probabilidade de
fazer com que a empresa se torne referência de mercado no segmento em questão,
tendo assim um diferencial de sucesso (BARBIERI, 2001).
A informação por si só não é um diferencial competitivo para as organizações,
depende da forma como é utilizada. Uma empresa pode ser diferenciada em relação
aos seus concorrentes quando consegue obter algum tipo de diferença ou vantagem
que possa ser comparada e sustentada. Uma das formas de obter essa vantagem é
através do rastreamento de informações disponíveis que auxilie a empresa a alcançar
um percentual maior de mercado no seu ramo de atuação.
Com tantas informações e observando-se que estas mudam constantemente,
um dos problemas que as organizações enfrentam na era da informação é a forma de
organizar tantos dados para, enfim, transformá-los em informações úteis, relevantes
e estratégicas para o negócio. Dentre as possíveis opções de tecnologias para auxiliar
o gerenciamento e organização destas informações, o Data Warehouse, também
conhecido como DW, está na listagem como um dos candidatos, por se tratar de uma
cópia dos dados transacionais, estruturado para relatórios de análise de nível
gerencial.
Com um recurso de permitir que seus usuários unifiquem dados obtidos
externamente à organização com os dados internos da empresa, para a mesma base
de análises, o Data Warehouse vem se destacando no mercado e sendo utilizado em
diversas organizações.
O Data Warehouse visa automatizar e melhorar os processos relacionados à
tomada de decisão, o uso desta ferramenta nas organizações de pequeno, médio ou
grande porte, possibilita a realização de diversas análises e projeções, podendo
estimar as previsões de crescimento da empresa e contribuir para a elaboração de
estratégias (PRIMAK, 2008).
Assim, delimitou-se o tema deste artigo a criação de um Data Warehouse para
o acompanhamento de desempenho de cursos em uma instituição de ensino superior.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
A pergunta norteadora deste estudo é no sentido de investigar como a
implantação de um Data Warehouse pode influenciar uma Instituição de Ensino
Superior no seu planejamento estratégico.
O objetivo geral é apresentar como se realizou a implantação de um Data
Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio
em seu planejamento estratégico. São objetivos específicos: definir e conceituar Data
Warehouse; implantar uma solução para o auxílio ao planejamento estratégico da
Instituição de Ensino Superior.
A relevância deste estudo trabalho consiste em mostrar como o Data
Warehouse na instituição auxiliará os tomadores de decisão, além dos coordenadores
de cursos com informações históricas sobre o desempenho dos cursos dentro da
instituição, facilitará o planejamento estratégico da mesma.
A pesquisa bibliográfica, fontes secundárias, tem como base em autores tais
como Barbieri, (2001); Primak (2008), e pesquisa documental é baseado na
Microstrategy e Microsoft.
Para compreensão deste tema dividiu-se este artigo em nove seções. A seção
1, esta introdução, e indicativa do estudo; a seção 2 apresenta o Data Warehouse; a
seção 3 aborda a modelagem de dados para Data Warehouse; a seção 4 trata
extração, transformação e carga dos dados; a seção 5 apresenta a On-Line Analytical
Processing; a seção 6 aborda o Data Warehouse como estratégia competitiva; a
seção 7 apresenta a implantação prática de um Data Warehouse em uma instituição
de ensino superior de Belo Horizonte; a seção 8 elabora a discussão referente a
implantação do Data Warehouse; a seção 9, tece as conclusões do artigo.
2 - DATA WAREHOUSE
O termo Data Warehouse (DW) foi criado por Willian H. Inmon, no início da
década de 1990 e é definido por uma série de autores conforme quadro 1:
O conceito de DW objetiva a definição de uma base de dados preparada em
vários níveis de granularidade. A ideia via DW é armazenar os dados em vários graus
de relacionamento e sumarização, de forma a facilitar e agilizar os processos de
tomada de decisão por diferentes níveis gerenciais.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Quadro 1 - Definições de Data Warehouse.
Autor:
Definição:
Peterson, (2001, p.
“Um Data Warehouse é organizado em áreas funcionais e fornece uma
65)
perspectiva histórica sobre operações corporativas.O Data Warehouse
também é uma origem de dados. Como seus dados já foram unificados,
homogeneizados e limpos, eles frequentemente são a melhor origem de
dados para análise de negócio.“
Barbieri, (2001, p. 49)
“Pode ser definido como um banco de dados, destinado a sistemas de apoio
à decisão. “
Gomes
e
Ribeiro,
“[...] é um repositório central para todos os tipos significativos de dados que
(2004, p. 191)
vários sistemas de negócios de uma empresa coletam.“
Primak, (2008, p. 5)
“[...] é uma grande base de dados, ou seja, um repositório único de dados
(os
quais
foram
consolidados
e
organizados)
considerado
pelos
especialistas da área da informática como a "peça" essencial para a
execução prática de um projeto de Business Intelligence.“
Fonte: elaboração do autor
O ambiente de um DW tem como objetivo produzir informações que deverão
atender às necessidades de seus usuários. (ROSINI:PALMISANO, 2003). Observase que o DW é definido pelos autores como um repositório de dados estratégicos para
o auxílio da tomada de decisão.
3 - MODELAGEM DE DADOS PARA DATA WAREHOUSE
O DW é orientado por assunto, integrado, variante no tempo e não volátil, para
modelagem de dados quando utiliza-se o modelo dimensional.
O modelo dimensional, conforme Barbieri (2001), é formado por tabelas Fato e
tabelas de Dimensão. Esse modelo modifica alguns conceitos que estavam
cristalizados nos projetos tradicionais de Banco de Dados, como por exemplo, a
ordem de distribuição de campos por entre as tabelas, permitindo assim que a
estrutura seja mais voltada para os muitos pontos de entradas específicos, conhecidos
como Dimensão, e menos para os dados granulares em si, conhecidos como Fatos.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Na figura 1, está representado no modelo dimensional um sistema de vendas
a varejo. Neste modelo tem-se uma tabela Fato chamada Vendas, que tem como
métrica os campos quantidade vendida e o valor em reais. Outra tabela Fato chamada
Estoque que tem como métrica a quantidade em estoque. E ainda seis tabelas de
Dimensão: Tempo, Produto, Loja, Promoção, Atendente e Nota Fiscal.
Figura 1 - Exemplo de um modelo Dimensional.
Fonte:
BARBIERI, Carlos. B. Business intelligence:
modelagem e tecnologia. Rio de Janeiro: Axcel
Books, 2001
Esse é o conceito de modelo Dimensional, que possui as entradas de acesso,
as tabelas de Dimensão, e as tabelas Fatos contendo os fatos que são relevantes.
Dessa forma é possível acessar as métricas desejadas, combinando atributos das
diversas dimensões, de uma forma objetiva e direta (BARBIERI, 2001).
O Esquema Estrela ”[...] é o formato mais eficiente para armazenar dados
utilizados para análise do negócio.” (PETERSON, 2001, p. 71) O Esquema Estrela
recebe este nome, pela sua aparência e é composto por uma tabela Fato central e um
conjunto de tabelas de Dimensão. Nas Tabelas Fatos, são armazenados os fatos que
serão analisados, e nas tabelas de Dimensão estão contidas todas as perspectivas
pelas quais os fatos serão analisados.
Para Peterson (2001, p.78) “a tabela de Fato é o coração do esquema em
estrela”, o autor acrescenta, que corresponde à tabela central que armazena um
conjunto de medidas numéricas, que estão associadas a eventos de negócio.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Nesse sentido Barbieri (2001, p.81), assinala que “[...] uma tabela Fato contém
vários fatos, correspondentes a cada uma de suas linhas.” Em cada fato pode ser
armazenado uma ou mais medidas numéricas, que representa os valores objetos da
análise dimensional.
A tabela de Fatos não possui um campo separado para uma chave primária,
ela é formada pela composição de todas as chaves estrangeiras das tabelas
Dimensão. Nas tabelas de Fatos, os registros nunca são atualizados a menos que
seja necessário corrigir um erro, ou fazer uma alteração. Os registros da tabela de
fatos nunca são excluídos exceto quando registros antigos estão sendo arquivados.
Exemplificando os valores de medidas que podem ser colocadas em uma
tabela de Fato: o número total de itens vendidos; a quantidade monetária da venda; o
lucro sobre o item vendido (BARBIERI, 2001). Na figura 2 foram utilizadas como
valores de medidas: Vendas, Comissão e Desconto.
Figura 2 - Valores de medidas da tabela de fatos
.
Fonte: ROCHA, Reydeval. Introdução ao
Analysis Services 2005. Disponível
em
<
http://www.devmedia.com.br/introduca
o-ao-analysis-services-2005-parte2/5730> Acesso em: 08 abr. 2014
As tabelas Dimensão, para Barbieri (2001, p.81), representam as entidades de
negócios e constituem as estruturas de entrada que servem para armazenar
informações como tempo, geografia, produto, cliente, etc.” As tabelas de Dimensão
são quase sempre muito pequenas, e armazenam um número significativamente
menor de linhas do que as tabelas Fato. Comparado à tabela Fatos que sempre tem
mais registros sendo adicionados a ela, as tabelas de Dimensão são relativamente
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
estáveis. Algumas delas como a dimensão de tempo raramente são alteradas após a
sua criação.
Em uma tabela de Dimensão, a chave primária deve ser um campo único com
um tipo de dados inteiro, afirma Peterson (2001). O autor também enfatiza que em um
esquema em estrela quase sempre há uma dimensão de tempo.
A dimensão de Tempo, para Barbieri (2001), é necessária em projetos de DW
onde a evolução dos dados históricos é fundamental. Em um DW, segundo Barbieri
(2001, p. 94), as informações são reunidas com relação a períodos particulares de
tempo. Cada dado vai refletir o seu próprio estado em diferentes momentos no tempo.
Em uma dimensão de tempo, a hierarquia pode ser agregada de diversas
maneiras. O nível mais baixo da hierarquia de tempo pode ser definido de diferentes
formas, variando, por exemplo, de ano, trimestre, mês e dia, conforme exemplificado
na figura 3.
Figura 3 - Dimensão Tempo.
Fonte: BARBIERI, Carlos. B. Business intelligence:
modelagem e tecnologia. Rio de Janeiro: Axcel
Books, 2001
4 - EXTRAÇÃO, TRANSFORMAÇÃO E CARGA
A etapa de Extração, Transformação e Carga, do inglês Extract, Transform,
Load (ETL) é uma das mais críticas de um projeto de DW, pois envolve a fase de
movimentação dos dados.
Os sistemas chamados de ETL, conforme Primak (2008), são fundamentais
para preparar os dados que serão armazenados no DW. Embora atualmente já
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
existam produtos que facilitem esse trabalho, este ainda é um processo trabalhoso,
detalhado e complexo, e que requer expertise para ser executado de forma adequada
e correta.
Os dados, afirma Rezende (2003), podem apresentar problemas advindos do
processo de coleta, estes problemas podem ser erros de digitação ou erro na leitura
dos dados pelos sensores. O uso de técnicas de limpeza deve ser aplicado aos dados
para garantir a qualidade. A qualidade dos dados é um fator essencial, pois,
possivelmente o resultado do processo de extração será utilizado em um processo de
tomada de decisão.
O Structured Query Language (SQL) Server Integration Services (SSIS), de
acordo com Ramalho (2005), é uma plataforma utilizada para construir aplicações de
integração de dados, que inclui as tarefas conhecidas do pacote ETL para projetos em
DW. Além de conectar-se a diversas fontes de dados, com o SSIS é possível fazer a
extração dos dados e misturar os diversos formatos de dados em um único formato.
A figura 4 mostra como normalmente o SSIS é utilizado. Os dados de vários
bancos de dados, incluindo o SQL Server 2008, podem ser combinados com dados
de outras fontes (RAMALHO, 2005).
Figura 4 - Descrevendo o Server Integration Services
(SSIS)
Fonte: Adaptado de:
MICROSOFT. Entendendo as tecnologias de
Integração Microsoft. [Redmond], 2005.
Disponível em <http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XS
LTsection128121120120> Acesso em: 3 out.
2013
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Em alguns casos, faz-se necessário a limpeza dos dados, para garantir a
padronização dos dados. Como exemplo, formatos de datas. Em uma fonte de dados
pode-se ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o
formato da data como 2 de maio de 2014 (RAMALHO, 2005).
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
5 - ON-LINE ANALYTICAL PROCESSING (OLAP)
O termo On-Line Analytical Processing (OLAP) foi citado pela primeira vez em
um artigo escrito por Edgar Frank Codd em 1992. Refere-se a um conjunto de
ferramentas voltadas para acesso e análise ad-hocde dados, com o objetivo de
possibilitar que analistas, gerentes e executivos consigam transformar dados em
informações de forma rápida, consistente, amigável e flexível, em tempo hábil,
capazes de dar suporte às decisões gerenciais.
Além disso, do ponto de vista de Peterson (2001), o OLAP, é uma ferramenta
de software interativa de geração de relatórios, que apresenta, para os analistas,
diversas visualizações distintas de uma planilha.
A característica principal das ferramentas OLAP, conforme Primak (2008), é
permitir realizar diversas análises dinâmicas e multidimensionais dos dados, apoiando
o usuário final nas suas atividades. Elas possuem uma série de visões, como por
exemplo, as consultas ad-hoc, onde o próprio usuário consegue gerar consultas de
acordo com suas necessidades de cruzamento dos dados e de uma forma diferente
da usual, que o leva a obter as respostas desejadas. Considerada para Inmon (1999)
como consultas casuais únicas, onde os dados são tratados com parâmetros nunca
antes utilizados. Umas das técnicas possibilitadas pelo OLAP é o Drill Down e Drill
UP, que consiste em fazer uma exploração em diferentes níveis de detalhe das
informações. Com essa técnica, o usuário pode “subir ou descer na hierarquia” dentro
do detalhamento do dado conforme figura 5.
Figura 5 - Representação Drill Down e Drill UP
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Fonte:
BARBIERI,
Carlos.
B.
Business
intelligence: modelagem e tecnologia.
Rio de Janeiro: Axcel Books, 2001. p. 42.
6 - DATA WAREHOUSE COMO ESTRATÉGIA COMPETITIVA
A ideia básica de Inteligência Competitiva conforme Barbieri (2001) é obter
informações detalhadas sobre o mercado e os concorrentes. A Inteligência
Competitiva é também um Business Intelligence (BI) aplicado ao mundo fora da
fronteira empresarial, que tem o foco em informações e fatos. As empresas hoje
sentem cada vez ma is a necessidade de aperfeiçoar o processo de análise de dados
que possuem armazenados.
Este crescente número de informações pode ser interpretada como um
mal no universo empresarial e dificulta o processo de tomada de decisão, uma vez
que os gestores se sentem impotentes no processo de busca e recuperação dos
dados, que podem ser definido a como um conjunto de registros qualitativos ou
quantitativos que estão organizados e agrupados. Os dados em si não possuem um
significado nem relevância, porém, aplicados ao contexto correto são importantes, pois
é possível obter informação.
Há de se destacar que para Primak (2008), organizações de pequeno, médio
ou grande porte, precisam de ferramentas que as auxilie nas mais diferentes situações
para tomada de decisão, além de propiciar otimização do trabalho, redução de custos,
eliminação de tarefas duplicadas, e permitir previsões de crescimento da empresa e
dessa forma contribuir para a elaboração de estratégias. O que está em foco é a
necessidade do mercado e não o porte da empresa.
Enfatizam no entanto Leonard e Swap (2003), Inteligência Analítica é a
capacidade de analisar ideias e tomar decisões com base na análise feita. Mesmo
com ferramentas disponíveis que são consideradas decisivas, alguns autores
consideram até mais importante que a tecnologia, como afirmam Davenport e Prusak
(1998), são as pessoas que fazem com que a inteligência analítica funcione.
Isso porque, conforme Primak (2008), tomar uma decisão em uma organização
requer muito mais que saber utilizar um software. Por mais que uma organização
disponha de uma ferramenta com diversas funções, de nada adiantará se as pessoas
continuarem a tomar decisões ou simplesmente chegarem a conclusões baseadas em
suas experiências e no seu próprio conhecimento. Prossegue o autor afirmando que ,
para a implementação efetiva de uma solução de BI, a condição considerada por
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
grande parte dos analistas de mercado como essencial é a de existir um repositório
único de dados que seja sólido e confiável, ou seja, o DW. Isso porque com o DW é
possível obter uma visão única, além de poder tomar decisões com base em
informações precisas e consistentes em uma única base.
O mercado de Ensino Superior está ficando cada vez mais difícil e competitivo
e, hoje em dia, ter a informação correta no menor tempo possível, tomar decisões
eficazes, adequar-se às oscilações financeiras e antecipar-se às necessidades dos
seus clientes, é o grande diferencial para as empresas que querem se manter à frente
no mundo dos negócios.
7 - IMPLANTAÇÃO PRÁTICA DE UM DATA WAREHOUSE EM UMA
INSTITUIÇÃO DE ENSINO SUPERIOR DE BELO HORIZONTE
A implantação do Data Warehouse iniciou-se no mês de abril de 2013 com o
levantamento dos dados junto a Instituição de Ensino Superior (IES)
de Belo
Horizonte que possui quatro cursos superiores, concretizando os acessos aos dados
no mês de agosto de 2013.
Verifica-se que os tomadores de decisão, além dos coordenadores de cursos
desta Instituição de Ensino Superior não possuem informações históricas sobre o
desempenho dos cursos dentro da instituição, o que dificulta o planejamento
estratégco da mesma.
Constata-se que a tecnologia de Business Intelligence tem apresentado forte
adesão pelas organizações que desejam obter um suporte à tomada de decisão e,
cada vez mais, querem estas informações em tempo real, a qualquer hora e lugar.
A seguir, descreve-se os passos para criação, desenvolvimento, testes e
implantação de um Data Warehouse em uma Instituição de Ensino Superior (IES).
1º) PASSO
Com base no levantamento realizado em abril de 2013 foi proposto e aprovado
o modelo dimensional Estrela como metodologia de modelagem, formado por uma
tabela Fato no centro chamada acompanhamento_cursos, e por um conjunto de 6
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
tabelas de Dimensão, como aluno, curso, período, semestre e situação que estão
ligadas à tabela Fato conforme pode ser visto na figura 6.
Figura 6 - Esquema do modelo dimensional Estrela
Fonte: dados da pesquisa
Na tabela Fato acompanhamento_cursos, foram definidas as chaves das
dimensões que fazem parte da composição do seu layout (cod_aluno, cod_curso,
num_semestre_ano, cod_periodo, cod_situacao, cod_turno e f_qtd_aluno). A chave da
tabela Fato acompanhamento_cursos é uma composição de todas as chaves primárias
das tabelas de Dimensão que se relacionam com a tabela Fato, o que garante a
integridade referencial entre a tabela Fato acompanhamento_cursos e cada uma das
tabelas de Dimensão como apresentado por Peterson (2001, p.78).
As métricas foram definidas através da análise do levantamento realizado junto
aos coordenadores, onde foi identificado a necessidade de verificar a quantidade de
alunos matriculados, por curso, por sexo e por período.
Baseado nisso, verificou-se a necessidade de controlar os seguintes
indicadores
que
foram
utilizados
como
métricas
na
tabela
Fatoacompanhamento_cursos:Curso;Período;Turno;Aluno;Tipo de aluno;Situação do
aluno no curso;Quantidade de alunos.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
No modelo proposto, as tabelas de Dimensão definidas foram: aluno, curso,
periodo, semestre e situação.
Acrescenta-se que esta é a parte onde mais gasta tempo para fazer e definir
essa modelagem. A esse respeito Barbieri (2001) enfatiza que é uma parte crítica do
projeto, uma vez que alterações nas estruturas das tabelas principalmente as tabelas
Fato que comparadas às tabelas de Dimensão possuem um volume maior de dados,
pode representar problemas de manutenção no projeto.
2º) PASSO
Com o auxílio de um funcionário da IES, as informações foram exportadas do
sistema acadêmico da IES, através de relatórios interno do sistema acadêmico para
arquivos com valores separadores por vírgulas.(fig.7).
Figura 7 - Tela de arquivos do tipo Arquivos Separados por Vírgula
Fonte: dados da pesquisa
Na figura 8 é apresentada a planilha Excel com todos os dados disponibilizados
pela IES que possuíam informações concentradas em uma única coluna, como por
exemplo, o semestre, turno e período, estavam na mesma coluna.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Figura 8 - Tela de conteúdo dos dados disponibilizados pela IES
Fonte: dados da pesquisa
Estes arquivos, não apresentam um dicionário de dados para ajudar na
extração dos dados. Algumas colunas foram identificadas, conforme o conhecimento
do funcionário da IES, e várias colunas, as informações não aparentam ter nenhum
sentido, não foi possível decifrar o que cada coluna representava, conforme pode ser
visto na figura 8.
Apresenta- se na figura 9 todos os dados após o processo de limpeza dos
dados, como por exemplo, o semestre, turno e período, foram separados em colunas
distintas.
Figura 9 - Tela de conteúdo dos dados disponibilizados pela
IES após a limpeza dos dados.
Fonte: dados da pesquisa
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
A carga dos dados foi feita somente uma vez para as tabelas de Dimensão.
Como os dados que foram obtidos estavam no formato separado por virgulas,
utilizou-se o SSIS para uma simples leitura destes arquivos, definindo quais colunas
deveriam ser carregadas destes arquivos e para qual coluna das respectivas tabelas
deveriam ser destinadas, (fig. 10). Os dados, como em todo projeto de DW, não
sofrem alterações.
Figura 10 - Tela de rotina de leitura dos dados ferramenta SSIS
Fonte: dados da pesquisa
O processo de ETL foi bastante complexo e os problemas que ocorreram foram,
a falta de um dicionário de dados para identificação das colunas que seriam
carregadas. Algumas colunas foram identificadas, conforme o conhecimento do
funcionário da IES, e várias colunas, as informações não aparentam ter nenhum
sentido, não foi possível decifrar o que cada coluna representava.
3º) PASSO
A ferramenta OLAP escolhida foi a MicroStrategy, fundada em 1989 por
Michael J. Saylor. AMicroStrategy é uma empresa de consultoria focada em soluções
para suporte à decisão, desenvolvedora da ferramenta OLAP utilizada no projeto. Isto
por possuir uma interface similar ao Windows, tornou-se uma ferramenta de geração
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
de relatórios, análises e monitoramento dos negócios, altamente interativa, intuitiva e
de fácil utilização pelos usuários finais.
A figura 11 mostra a tela do administrador, onde é possível monitorar e
administrar todos os usuários.
Figura 11 - Tela do Administrador.
Fonte: dados da pesquisa
A estrutura hierárquica das pastas é apresentada na figura 12. A pasta
Relatórios Compartilhados, mostra os relatórios gerados e que são compartilhados
com os demais usuários com acesso ao respectivo DW.
Figura 12 - Tela de estrutura hierárquica da pasta Relatórios Compartilhados.
Fonte: dados da pesquisa
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Os relatórios de gráficos que atigiram o objetivo para o auxílio dos tomadores
de decisão, além dos coordenadores de cursos desta Instituição de Ensino Superior
para a utilização no planejamento estratégico com informações históricas sobre o
desempenho dos cursos dentro da instituição são apresentados na figura 13 e 14.
Figura 13 - Tela de relatório de gráficos (Alunos X Curso).
Fonte: dados da pesquisa
Figura 14 - Tela do relatório de gráficos (Situação de alunos por curso).
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Fonte: dados da pesquisa
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
8 - DISCUSSÃO SOBRE OS RESULTADOS DE IMPLANTAÇÃO DO DATA
WAREHOUSE
Os passos de criação, desenvolvimento, testes e implantação foram
demorados pelo pouco tempo disponível pelos pesquisadores, mas de muita
relevância.
Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta
SSIS, pois foi considerada adequada devido a sua facilidade de desenvolvimento das
rotinas de carga e também devido ao seu pipeline de transformação de dados,
considerado apto pela facilidade apresentada de transformar o dado em uma única
operação. Estas facilidades não são encontradas nas ferramentas tradicionais.
Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois
dispõe do recurso de geração de relatórios padronizados e dinâmicos, que podem ser
customizados pelos usuários em momento de execução, possibilitando que possuam
visão específica, graças ao processo de drillup e drilldown. Outra facilidade que foi
levada em consideração no momento da escolha foi a facilidade de adaptação dos
usuários quanto a sua utilização, uma vez que a ferramenta segue o padrão de
usabilidade bem similar ao utilizado pelo Windows.
Os esforços que foram empenhados neste trabalho foram recompensados, já
que foi possível desenvolver todas as etapas de construção de um DW, contribuindo
para a experiência acadêmica do discente, além de prover à instituição um diferencial
competitivo de mercado com uma visão gerencial privilegiada comparando com seus
concorrentes.
9 - CONSIDERAÇÕES FINAIS
O presente trabalho apresentou o processo implantação de um Data
Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio
em seu planejamento estratégico e definiu e conceituou o Data Warehouse.
Buscou-se reunir no estudo uma base teórica que permitisse mostrar o formato
do Data Warehouse como um repositório de dados para atender diferentes níveis
gerenciais para tomada de decisão.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
A realização da pesquisa aplicada para a implantação do Data Warehouse na
Instituição de Ensino Superior foi organizada em três etapas, estas denominadas
“passos”. Estas etapas foram realizadas tendo-se a base conceitual e teórica do
estudo como orientadora da implantação do Data Warehouse.
Verificou-se a pertinência teórica apresentada a um caso específico, o Data
Warehouse como ferramenta de auxílio em planejamento estratégico na Instituição de
Ensino Superior.
Como projeto futuro, sugere-se uma pesquisa junto a Instituição de Ensino
Superior dos valores efetivos dos ganhos adquiridos após a implementação e
utilização destes dados pela Instituição, da mesma forma sugere-se um estudo em
relação à ferramenta OLAP MicroStrategy Web utilizada, em relação a outras
ferramentas de software livre (open source).
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
REFERÊNCIAS
ANTUNES JUNIOR, Delson. Sistema de apoio a decisão baseado em Data
Warehouse para uma indústria química. 2009. Trabalho de Conclusão de Curso
(Bacharel) - Universidade do Planalto Catarinense, Lages, 2009. Disponível em: < >.
Acesso em: 22 nov. 2013
BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de
Janeiro: Axcel Books, 2001
DAVENPORT, Thomas H. e PRUSAK, Laurence.
ed, Rio de Janeiro: Campus, 1998
Conhecimento empresarial 14.
GOMES, Carlos Francisco Simões; RIBEIRO, Priscilla Cristina Cabral. Gestão da
cadeia de suprimentos integrada à tecnologia da informação. São Paulo: Pioneira
Thomson Learning, 2004.
INMON, W. H.; WELCH, J. D.; GLASSEY, K. L. Gerenciando Data Warehouse.
São Paulo: Makron Books, 1999.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: guia completo para
modelagem dimensional. 2 ed. Rio deJaneiro: Campus, 2002.
LEONARD, Dorothy; SWAP, Walter. Centelhas Incandescentes: estimulando a
criatividade em grupos. Porto Alegre: Bookman, 2003.
MICROSOFT. Entendendo as tecnologias de Integração Microsoft. [Redmond],
2005.
Disponível
em
<http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em:
3 out. 2013
MICROSTRATEGY.
Best
in
Business
Intelligence.
Disponível
<http://www.microstrategy.com.br/Company/> Acesso em: 03 out. 2013
em
PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro: Campus,
2001.
PRIMAK, Fábio Vinícius. Decisões com B.I Business Intelligence. Rio de Janeiro:
Ciência Moderna, 2008
RAMALHO, José Antônio. Microsoft SQL Server 2005: guia prático. Rio de Janeiro:
Campus, 2005.
REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicações.
Barueri: Manole, 2003.
ROCHA, Reydeval. Introdução ao Analysis Services 2005. Disponível em <
http://www.devmedia.com.br/introducao-ao-analysis-services-2005-parte-2/5730>
Acesso em: 08 abr. 2014.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
ROSINI, Alessandro Marco; PALMISANO, Ângelo. Administração de sistemas de
informação e a gestão do conhecimento. São Paulo: Pioneira Thomson Learning,
2003.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014
Download