Baixar este arquivo PDF - Portal de Periódicos Científicos da

Propaganda
1
Data Warehouse como Instrumento de Gestão Estratégica
Wasley Portes de Souza1
Bruno José de Oliveira2
Rodrigo Vitorino Moravia3
RESUMO:
O Projeto de Iniciação Científica desenvolvido visou apresentar como o Data Warehouse
pode auxiliar os gestores nas tomadas de decisões baseando-se em dados obtidos através
de fontes externas. O ponto inicial foi a criação de um Data Mart, para receber a base de
dados disponibilizada pelo INEP através do seu site. Foi desenvolvido um modelo
dimensional com uma base intermediária, rotinas de tratamento de extração, transformação
e limpeza dos dados, além da ferramenta OLAP Web, onde os usuários poderiam gerar
relatórios online conforme a necessidade. Esta proporciona para os gestores tomadores de
decisão a possibilidade de entender como os concorrentes estão frente a um mercado tão
concorrido como o de ensino superior no Brasil.
PALAVRAS-CHAVE: Data Warehouse, MicroStrategy, SSIS, OLAP, ETL.
INTRODUÇÃO
Devido à expansão e popularização da tecnologia em geral, a sociedade ficou
conhecida como: a sociedade da informação e, ao elencar características a ela pertinentes,
mencionam o fenômeno do caos informacional. Isto ocorre pois nunca havia se observado
um contexto no qual as informações surgem e são disseminadas de modo tão rápido entre
seus usuários, ainda que haja grandes distâncias entre eles.
É inegável que os indivíduos possam buscar e acessar informações dos mais
variados tipos em questão de segundos, porém, por existir tantas informações oriundas de
múltiplas fontes, os usuários se veem diante do desafio de manter-se constantemente
atualizados em meio a esse caos informacional, em uma sociedade cujo ritmo de vida é
especialmente acelerado. É possível dizer que a informação por si só não é um diferencial
competitivo para as organizações, pois depende da forma como é utilizada. É importante
1
Graduando do Curso de Tecnólogo em Banco de Dados pela Faculdade Batista de Minas Gerais.
[email protected]
2
Graduando do Curso de Tecnólogo em Banco de Dados pela Faculdade Batista de Minas Gerais.
[email protected]
3
Professor Especialista em Gestão da Informação pelo IEC – PUC Minas. Professor da Faculdade Batista de
Minas Gerais -. Analista de BI da PUC Minas. [email protected]
2
que exista uma ligação entre as informações disponíveis e o ramo de atuação da empresa,
criando assim, possibilidades de competição perante os concorrentes. Levando a ideia para
o lado empresarial, é possível concluir que uma empresa somente pode ser diferenciada em
relação aos seus concorrentes quando consegue obter algum tipo de diferença ou vantagem
que possa ser comparada e sustentada. Uma das formas de obter essa vantagem é através
do rastreamento de informações disponíveis que auxilie a empresa a alcançar um
percentual maior de mercado no seu ramo de atuação.
Quando se tem informações antes dos concorrentes, é possível inovar e surpreender
as expectativas dos clientes, desta forma, aumenta a probabilidade de fazer com que a
empresa se torne referência de mercado no segmento em questão, tendo assim um
diferencial de sucesso.
Com tantas informações e sabendo que estas mudam constantemente, um dos
problemas que as organizações enfrentam na era da informação é a forma de organizar
tantos dados para, enfim, transformá-los em informações úteis, relevantes e estratégicas
para o negócio. Dentre as possíveis opções de tecnologias para auxiliar o gerenciamento e
organização destas informações, “Data Warehouse”, também conhecido como DW, está na
listagem como um dos candidatos, por se tratar de uma cópia dos dados transacionais,
estruturado para relatórios de análise de nível gerencial.
Com um recurso de permitir que seus usuários unifiquem dados obtidos
externamente à organização com os dados internos da empresa, para a mesma base de
análises, o DW vem se destacando no mercado e sendo utilizado em diversas organizações.
Com o objetivo de automatizar e melhorar os processos relacionados à tomada de
decisão, o uso desta ferramenta nas organizações de pequeno, médio ou grande porte,
possibilita a realização de diversas análises e projeções, podendo estimar as previsões de
crescimento da empresa e contribuir para a elaboração de estratégias.
Através da elaboração deste trabalho será possível analisar o modo com que uma
instituição do ensino superior implantou um Data Mart (DM) com dados obtidos de uma fonte
de dados externa (Ministério da Educação – MEC) em seu DW.
O estudo em questão justifica-se em função de mostrar a importância desta
ferramenta, pois implantar o DM na instituição em questão auxiliou aos gestores na tomada
de decisão em relação à abertura de novos cursos, criação de unidades, migração de
determinados cursos para outras unidades e desativação de alguns cursos com baixa
procura.
3
DW COMO ESTRATÉGIA COMPETITIVA
Segundo Barbieri (2001), a ideia básica de Inteligência Competitiva é obter
informações detalhadas sobre o mercado e os concorrentes. A Inteligência Competitiva é
também entendida como um Business Intelligence (BI) aplicado ao mundo fora da fronteira
empresarial, que tem o foco em informações e fatos. As empresas hoje sentem cada vez
mais a necessidade de aperfeiçoar o processo de análise de dados que possuem
armazenados. Este crescente número de informações pode ser entendido como um mal no
universo empresarial e dificulta o processo de tomada de decisão, uma vez que os gestores
se sentem impotentes no processo de busca e recuperação dos dados, que podem ser
definidos como um conjunto de registros qualitativos ou quantitativos que estão organizados
e agrupados. Os dados em si não possuem um significado nem relevância, porém,
aplicados ao contexto correto são importantes, pois é possível obter informação.
Para Primak (2008), organizações de pequeno, médio ou grande porte, precisam de
ferramentas que as auxilie nas mais diferentes situações para tomada de decisão, além de
propiciar otimização do trabalho, redução de custos, eliminação de tarefas duplicadas, e
permitir previsões de crescimento da empresa e dessa forma contribuir para a elaboração
de estratégias. O que está em foco é a necessidade do mercado e não o porte da empresa.
Segundo Leonard e Swap (2003), Inteligência Analítica é a capacidade de analisar
ideias e tomar decisões com base na análise feita. Mesmo com ferramentas disponíveis que
são consideradas tão importantes, alguns escritores consideram até mais importante que a
tecnologia, como afirma Davenport e Prusak (1998), são as pessoas que fazem com que a
inteligência analítica funcione.
Isso porque, conforme Primak (2008), tomar uma decisão em uma organização
requer muito mais que saber utilizar um software. Por mais que uma organização disponha
de uma ferramenta com diversas funções, de nada adiantará se as pessoas continuarem a
tomar decisões ou simplesmente chegarem a conclusões baseadas em suas experiências e
no seu próprio conhecimento. Ainda conforme Primak (2008), para a implementação efetiva
de uma solução de BI, a condição considerada por grande parte dos analistas de mercado
como essencial é a de existir um repositório único de dados que seja sólido e confiável, ou
4
seja, o DW. Isso porque com o DW é possível obter uma visão única, além de poder tomar
decisões com base em informações precisas e consistentes em uma única base.
A cada dia o mercado de ensino superior está ficando cada vez mais difícil e
competitivo e, hoje em dia, ter a informação correta no menor tempo possível, tomar
decisões eficazes, adequar-se às oscilações financeiras e antecipar-se às necessidades dos
seus clientes, é o grande diferencial para as empresas que querem se manter à frente no
mundo dos negócios.
DATA WAREHOUSE
O termo DW foi criado por Willian H. Inmon, no início da década de 1990 e é definido
por uma série de autores conforme citado abaixo:
“É um repositório central para todos os tipos significativos de dados que vários
sistemas de negócios de uma empresa coletam.” (GOMES e RIBEIRO, 2004, p. 191)
“Pode ser definido como um banco de dados, destinado a sistemas de apoio à
decisão”. (BARBIERI, 2001, p. 49)
Um Data Warehouse é organizado em áreas funcionais e fornece uma
perspectiva histórica sobre operações corporativas. O Data Warehouse
também é uma origem de dados. Como seus dados já foram unificados,
homogeneizados e limpos, eles frequentemente são a melhor origem de
dados para análise de negócio. (PETERSON, 2000, p. 65)
É uma grande base de dados, ou seja, um repositório único de dados (os
quais foram consolidados e organizados) considerado pelos especialistas
da área da informática como a "peça" essencial para a execução prática de
um projeto de Business Intelligence. (PRIMAK, 2008, p. 5)
O DW é orientado por assunto, integrado, variante no tempo e não volátil (não
muda).
Para Barbieri (2001), o conceito de DW objetiva a definição de uma base de dados
preparada em vários níveis de granularidade. A ideia via DW é armazenar os dados em
vários graus de relacionamento e sumarização, de forma a facilitar e agilizar os processos
de tomada de decisão por diferentes níveis gerenciais.
O ambiente de um DW tem como objetivo produzir informações que deverão atender às
necessidades de seus usuários, afirmam Rosini e Palmisano (2003).
5
DATA MART
PRIMAK (2008, p.47) afirma que “Um Data Mart é um Data Warehouse reduzido que
fornece suporte à decisão de um pequeno grupo de pessoas.” Comparados a um Data
Warehouse, os Data Marts (DM) possuem algumas vantagens como, por exemplo, custo
mais baixo, escopo menor, além de menor tempo de implementação. Ele atende apenas
uma área ou assunto especifico de uma organização. Já o DW envolve toda a organização,
por isso o desenvolvimento de um DW requer mais tempo além do custo ser maior.
Os DMs têm se popularizado devido a alguns motivos como a redução drástica do
custo de implementação e manutenção dos sistemas de apoio à decisão; protótipos podem
ser elaborados em menor tempo; como o escopo é limitado, os esforços e o time de
usuários são mais centrados. A desvantagem do uso de Data Marts é o risco de ter o
mesmo dado replicado em outros DM da organização. Como os dados que estão
armazenados nos DM servirão de apoio à tomada de decisão, as mudanças devem ser
replicadas em todos os Data Marts para garantir a consistência dos dados. Em alguns
casos, é comum um projeto inicialmente de DW reduzir seu tamanho contraindo-se assim
em um DM específico. Ou mesmo dividir o DW em vários DM, onde o tempo de resposta
será mais rápido, além do acesso ser mais fácil para os usuários finais.
MODELAGEM DE DADOS PARA DATA WAREHOUSE
Conforme Barbieri (2001), o modelo dimensional é formado por tabelas Fato e
tabelas Dimensão. Esse modelo modifica alguns conceitos que estavam cristalizados nos
projetos tradicionais de Banco de Dados, como por exemplo, a ordem de distribuição de
campos por entre as tabelas, permitindo assim que a estrutura seja mais voltada para os
muitos pontos de entradas específicos (conhecidos como Dimensões) e menos para os
dados granulares em si (conhecidos como Fatos).
Esse é o conceito de modelo Dimensional, que possui as entradas de acesso (as
tabelas Dimensão) e as tabelas Fatos contendo os fatos que são relevantes. Dessa forma é
possível acessar as métricas desejadas, combinando atributos das diversas dimensões, de
uma forma objetiva e direta.
6
“A tabela de Fato é o coração do esquema em estrela”, afirma PETERSON (2001,
p.78). Corresponde à tabela central que armazena um conjunto de medidas numéricas, que
estão associadas a eventos de negócio e que serão analisadas pelas ferramentas OLAP.
Para BARBIERI (2001, p.81), “uma tabela Fato contém vários fatos, correspondentes a cada
uma de suas linhas.” Em cada fato pode ser armazenado uma ou mais medidas numéricas,
que representa os valores objetos da analise dimensional. Normalmente a tabela de Fatos
não possui um campo separado para uma chave primaria, ela é formada pela composição
de todas as chaves estrangeiras das tabelas Dimensão. Nas tabelas de Fatos, os registros
nunca são atualizados a menos que seja necessário corrigir um erro, ou fazer uma
alteração. Os registros da tabela de fatos nunca são excluídos exceto quando registros
antigos estão sendo arquivados.
Para BARBIERI (2001, p.81), “as tabelas Dimensão representam as entidades de
negócios e constituem as estruturas de entrada que servem para armazenar informações
como tempo, geografia, produto, cliente, etc.” As tabelas de Dimensão são quase sempre
muito pequenas, e armazenam um número significativamente menor de linhas do que as
tabelas Fato. Comparado à tabela Fatos que sempre tem mais registros sendo adicionados
a ela, as tabelas de Dimensão são relativamente estáveis. Algumas delas como a dimensão
de tempo raramente são alteradas após a sua criação. Outras dimensões como a dimensão
cliente, e empregado crescem lentamente. Em uma tabela de Dimensão, a chave primária
deve ser um campo único com um tipo de dados inteiro, afirma Peterson (2001). O autor
também afirma que em um esquema em estrela quase sempre há uma dimensão de tempo.
Para Barbieri (2001), a dimensão de Tempo é extremamente necessária em projetos de
DW/DM onde a evolução dos dados históricos é importante.
O Esquema Estrela, “é o formato mais eficiente para armazenar dados utilizados
para análise do negócio.” Afirma PETERSON (2001, p. 71). O Esquema Estrela recebe seu
nome, pela sua aparência e é composto por uma tabela central chamada de Tabela Fato
que possui chave composta, e um conjunto de tabelas menores, chamadas Tabela
Dimensão.
Conforme Barbieri (2001), o Esquema Estrela é uma abordagem de Ralph Kimball e
aponta para projetos de Data Marts (DM).
ETL
Conforme Primak (2008), os sistemas chamados de ETL (Extração, Transformação e
Limpeza) são fundamentais para preparar os dados que serão armazenados no DW.
7
Embora atualmente já existam produtos que facilitem esse trabalho, este ainda é um
processo trabalhoso, detalhado e complexo, e que requer expertise para ser executado de
forma adequada e correta.
A etapa de ETL é uma das mais críticas de um projeto de DW, pois envolve a fase de
movimentação dos dados.
Rezende (2005) afirma que os dados podem apresentar problemas advindos do
processo de coleta, estes problemas podem ser erros de digitação ou erro na leitura dos
dados pelos sensores.
O uso de técnicas de limpeza deve ser aplicado aos dados para garantir a qualidade.
A qualidade dos dados é um fator extremamente importante, pois, possivelmente o resultado
do processo de extração será utilizado em um processo de tomada de decisão.
No Projeto de Iniciação Científica em questão a ferramenta ETL utilizada foi o SSIS.
Conforme Ramalho (2005), o SSIS é uma plataforma utilizada para construir aplicações de
integração de dados, que inclui as tarefas conhecidas do pacote ETL (extração,
transformação e carregamento) para projetos em DW.
Além de conectar-se a diversas fontes de dados, com o SSIS é possível fazer a
extração dos dados e misturar os diversos formatos de dados em um único formato.
Uma característica importante do SSIS, é que ele já vem incluso como parte do SQL
Server 2008 que é utilizado na IES atualmente, além de seu parceiro. O servidor que
contém o banco de dados do DW é separado dos demais bancos que a IES utiliza para os
sistemas transacionais. Este servidor é exclusivo para armazenas todos dos DMs do DW da
IES.
Em alguns casos, faz-se necessário a limpeza dos dados, para garantir a
padronização dos dados. Como exemplo, formatos de datas. Em uma fonte de dados podese ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o formato da
data como 15 de novembro de 2011.
METADADOS
Para Primak (2008), em um DW, além do banco de dados, é gerada uma
documentação maior comparada à documentação de um banco de dados tradicional.
8
Conforme Peterson (2001), os metadados são importantes em cada ponto na
estrutura de dados corporativos. É feito um levantamento sobre os relatórios que devem ser
gerados, além das origens, localização atual e processos de extração, tratamento e carga
de dados.
Tudo isso acrescido das regras de negócios da empresa, das mudanças ocorridas ao
longo do tempo e da frequência de acesso aos dados, geram os metadados.
Considerados dados sobre dados, os metadados possuem as informações sobre os
dados que estão sendo utilizados e as disponibiliza para os usuários e para as ferramentas
de transformação de dados.
OLAP
O termo “OLAP” foi citado pela primeira vez em um artigo escrito por Edgar Frank
Codd em 1992. Refere-se a um conjunto de ferramentas voltadas para acesso e análise adhoc de dados, com o objetivo de possibilitar que analistas, gerentes e executivos consigam
transformar dados em informações de forma rápida, consistente, amigável e flexível, em
tempo hábil, capazes de dar suporte às decisões gerenciais.
De acordo com Peterson (2001), o OLAP (On-Line Analytical Processing), é uma
ferramenta de software interativa de geração de relatórios, que apresenta, para os analistas,
diversas visualizações distintas de uma planilha.
Conforme Primak (2008), a característica principal das ferramentas OLAP é permitir
realizar diversas análises dinâmicas e multidimensionais dos dados, apoiando o usuário final
nas suas atividades. Elas possuem uma série de visões, como por exemplo, as consultas
ad-hoc, onde o próprio usuário consegue gerar consultas de acordo com suas necessidades
de cruzamento dos dados e de uma forma diferente da usual, que o leva a obter as
respostas desejadas. Considerada para Bill Inmon como consultas casuais únicas, onde os
dados são tratados com parâmetros nunca antes utilizados. Umas das técnicas
possibilitadas pelo OLAP é o Drill Down e Drill UP, que consiste em fazer uma exploração
em diferentes níveis de detalhe das informações.
9
COLETA DOS DADOS
O INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) é
uma autarquia federal vinculada ao MEC, cuja missão é promover estudos, pesquisas e
avaliações sobre o Sistema Educacional Brasileiro, com o objetivo de subsidiar a formulação
e implementação de políticas públicas para a área educacional, bem como produzir
informações claras e confiáveis aos gestores, pesquisadores, educadores e público em
geral.
Anualmente, o INEP/MEC colhe informações de todas as instituições de ensino
superior do país, no processo chamado Censo do Ensino superior. Onde são geradas
informações da instituição (nome, telefone, endereço, entre outras), e dos Cursos Ofertados
(vagas, inscritos, matriculados, etc). O INEP compila estas informações e gera em arquivos
do tipo texto, que são os Microdados, e os disponibiliza em sua página na internet ou os
envia via mídia. Os microdados são todas as informações colhidas no censo codificadas,
menos as informações para identificação da instituição (nome, sigla, telefone, endereço).
Estes dados são tabulados, de forma semelhante como os dados do Censo da População
que é divulgado pelo IBGE.
A Figura 1, exibe a lista de arquivos disponibilizados pelo site do INEP.
Figura 1: Arquivos do tipo Texto
Fonte: Microdados do Censo da Educação Superior 2009
10
Estes arquivos contam com um dicionário de dados para ajudar na extração dos
dados. Através deste, as colunas foram identificadas conforme pode ser visto na Figura 2,
abaixo:
Figura 2: Dicionário de Dados
Fonte: Microdados do Censo da Educação superior 2009
Na Figura 3 é apresentada as colunas que não foram identificadas pelos usuários e
por não apresentarem nenhum sentido e não agregarem nenhum valor para a IES, foram
descartadas.
11
Figura 3: Colunas não identificadas pelos usuários e descartadas
Fonte: Microdados do Censo da Educação Superior 2008
Em um DW as informações são reunidas com relação a períodos particulares de
tempo. Cada dado vai refletir o seu próprio estado em diferentes momentos no tempo. Em
uma dimensão de tempo, a hierarquia pode ser agregada de diversas maneiras. O nível
mais baixo da hierarquia de tempo pode ser definido de diferentes formas, variando, por
exemplo, de ano, trimestre, mês e dia, conforme exemplificado na Figura 4.
Figura 4: Dimensão Tempo.
Fonte: BARBIERI (2011, p.94)
Com base no levantamento realizado foi proposto e aprovado o modelo dimensional
Estrela, formado por uma tabela Fato no centro chamada f_Instituicao_curso, e por um
conjunto de 7 tabelas de Dimensão: d_Instituicao, d_Municipio, d_Curso, d_Tempo
12
d_Organizacao_Academica, d_Categoria_Administrativa e d_Turno, que estão ligadas à
tabela Fato.
Na tabela Fato f_Instituicao_Curso, foram definidas as chaves das dimensões que
fazem
parte
da
composição
do
seu
layout
(cod_Ies,
cod_Municipio,
cod_Organizacao_Academica, ano, cod_Categoria_Administrativa, cod_Curso, cod_Turno).
A chave da tabela Fato f_Instituicao_Curso é uma composição de todas as chaves primárias
das tabelas Dimensão que se relacionam com a tabela Fato, o que garante a integridade
referencial entre a tabela Fato Instituicoes_Cursos e cada uma das tabelas Dimensão,
conforme PETERSON (2001, p.78).
Nas Tabelas Fatos, são armazenados os fatos que serão analisados, e nas Tabelas
Dimensão estão contido todas as perspectivas pelas quais os fatos serão analisados. No
projeto foi adotado esta metodologia de modelagem, conforme pode ser visto na Figura 5.
Figura 5: Esquema Estrela
Fonte: Fonte da pesquisa
As métricas foram definidas através da análise do levantamento realizado, onde foi
identificado a necessidade de controlar as instituições semestrais, os tipos de cursos
oferecidos e turnos, em qual categoria a instituição se enquadra e a qual município está
ligado, sendo que para este município, seria importante saber se o mesmo pertence a
alguma região metropolitana de interesse da IES.
13
Medidas que podem ser colocadas em uma tabela de fatos: o número total de itens
vendidos; a quantidade monetária da venda; o lucro sobre o item vendido. Para melhor
exemplificar as medidas que podem ser colocadas em uma tabela de fatos, foram utilizadas
as medidas Vendas, Comissão e Desconto, conforme Figura 6.
Figura 6: Medidas da tabela de fatos.
Fonte: http://www.devmedia.com.br/space.asp?id=161353
Baseado nisso, verificou-se a necessidade de controlar os seguintes indicadores que
foram utilizados como métricas na tabela Fato f_Instituicao_Curso:

Quantidade de Matrículas

Quantidade de Concluintes

Quantidade de Inscritos por Ano

Quantidade de Vagas por Turno

Quantidade de Ingressos por curso

Quantidade de Ingressos originados de processo seletivo.
No modelo proposto, as tabelas Dimensão definidas foram: d_Instituicao,
d_Municipio, d_Curso, d_Tempo d_Organizacao_Academica, d_Categoria_Administrativa e
d_Turno.
O grande desafio enfrentado entre a equipe de TI e os gestores, em relação às
tabelas Dimensão foi quanto ao grau de granularidade e os campos chave. Foi uma parte do
projeto onde mais tempo foi gasto para fazer e definir essa modelagem, pois, conforme
Barbieri (2001) é uma parte crítica do projeto, uma vez que alterações nas estruturas das
tabelas principalmente as tabelas Fato que comparadas às tabelas Dimensão possuem um
volume maior de dados, pode representar problemas de manutenção no projeto.
No Projeto de Iniciação Científica em questão os campos necessitaram de passar
por um processo de limpeza e transformação. A carga de dados da dimensão Municipio foi
14
realizada manualmente, onde, foram incluídos alguns indicadores para auxiliar identificação
das capitais de cada UF.
Caso um município faça parte da lista de capitais brasileiras, era assinalado o
número 1 como indicador, do contrário, era assinalado o número 0.
A carga dos dados foi feito somente um vez para as dimensões Tempo,
Organizacao_Academica, Categoria_Administrativa e Turno. As outras dimensões que
podem sofrer mudanças são carregadas semestralmente, como por exemplo, a inclusão de
novas instituições, novos cursos, mudanças de distritos que podem se tornar municípios e
até mesmo a criação de novos municípios de um semestre para outro. Somente após a
carga destas dimensões, é que se carrega a tabela fato, o que ocorre uma vez por
semestre.
Como os dados que foram obtidos pelo INEP estavam no formato texto, utilizou-se o
SSIS para uma simples leitura destes arquivos, definindo quais colunas deveriam ser
carregadas destes arquivos e para qual coluna das respectivas tabelas deveriam ser
destinadas. Os dados, como em todo projeto de DW, não sofrem alterações. Existem
inclusões semestrais, sempre após a chegada dos novos arquivos enviados pelo INEP.
A Figura 7 mostra como normalmente o SSIS é utilizado. Os dados de vários bancos
de dados, incluindo o SQL Server 2008, podem ser combinados com dados de outras
fontes.
Figura 7: Descrevendo o SSIS.
Fonte: http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120 (Figura Adaptada)
15
O processo de ETL foi bastante complexo sendo necessário transformar os dados
para compatibilização das bases. Nesse ponto, a existência de um dicionário de dados se
mostrou extremamente eficiente, facilitando bastante o processo.
Fundada em 1989 por Michael J. Saylor, a MicroStrategy é uma empresa de
consultoria focada em soluções para suporte à decisão, desenvolvedora da ferramenta
OLAP utilizada no projeto. Isto por possuir uma interface similar ao Windows, tornou-se uma
ferramenta de geração de relatórios, análises e monitoramento dos negócios, altamente
interativa, intuitiva e de fácil utilização pelos usuários finais.
A Figura 8 mostra a tela do administrador, onde é possível monitorar e administrar
todos os usuários.
Figura 8: Tela do Administrador.
Fonte: Fonte da pesquisa
A Figura 9 mostra a tela de login.
Figura 9: Tela de login.
Fonte: fonte da pesquisa
A Figura 10 mostra a estrutura hierárquica das pastas. A pasta Relatórios
Compartilhados, mostra os relatórios que são compartilhados com os demais usuários com
acesso ao respectivo DM.
16
Figura 10: Estrutura hierárquica das pastas.
Fonte: fonte da pesquisa
Exemplo de relatório desenvolvido é mostrado nas Figuras 11 e Figura 12 abaixo:
Figura 11: Relatório de gráficos.
Fonte: fonte da pesquisa
Figura 12: Relatório de gráficos.
Fonte: fonte da pesquisa
17
CONCLUSÃO
Este artigo apresentou a experiência vivida com a implantação de um Projeto de
Iniciação Científica, como o intuito da IES aproveitar os dados disponibilizados pelo INEP e
vislumbrar uma oportunidade de obter através destes, informações gerenciais que poderia
lhe ajudar no processo de tomada de decisão.
O projeto de criação, desenvolvimento, testes e implantação foram bastante
demorados pelo pouco tempo disponível pelos pesquisadores, mas de muita relevância.
Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta SSIS,
pois foi considerada adequada devido a sua facilidade de desenvolvimento das rotinas de
carga e também devido ao seu pipeline de transformação de dados, considerado apto pela
facilidade apresentada de transformar o dado em uma única operação. Estas facilidades não
são encontradas nas ferramentas tradicionais.
Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois dispõe do
recurso de geração de relatórios padronizados e dinâmicos, que podem ser customizados
pelos usuários em momento de execução, possibilitando que possuam visão específica,
graças ao processo de Drill Up e Drill Down. Outra facilidade que foi levada em
consideração no momento da escolha foi a facilidade de adaptação dos usuários quanto a
sua utilização, uma vez que a ferramenta segue o padrão de usabilidade bem similar ao
utilizado pelo Windows.
Após a análise dos dados fornecidos pela IES, foi possível concluir que com a
implantação do DW e a utilização de ferramentas adequadas para este segmento, é
possível obter ganhos significativos.
Os esforços que foram empenhados neste projeto foram recompensados, já que foi
possível desenvolver todas as etapas de construção de um DW, contribuindo para a
experiência acadêmica dos discentes, além de prover à instituição um diferencial
competitivo de mercado e possui uma visão gerencial privilegiada comparando com seus
concorrentes.
Como projetos futuros, é sugerido uma pesquisa junto a IES dos valores efetivos dos
ganhos adquiridos após a implementação e utilização destes dados pela empresa. Outro
tema sugerido é um estudo em relação à ferramenta OLAP MicroStrategy Web utilizada, em
relação a outras ferramentas de software livre (open source).
18
REFERÊNCIAS
BARBIERI, Carlos. BI – Business Intelligence: Modelagem e Tecnologia, 1ª Ed, Axcel
Books, 2001
DAVENPORT, Thomas H. e PRUSAK, Laurence. Conhecimento empresarial 14ª Ed, Rio
de Janeiro: Campus, 1998
GOMES, Carlos Francisco Simões e RIBEIRO, Priscilla Cristina Cabral. Gestão da Cadeia
de suprimentos Integrada à Tecnologia da Informação. São Paulo: Pioneira Thomson
Learning,
2004.
Disponível
em
<http://books.google.com.br/books?id=B06QoZ8jB8IC&pg=PA191&dq=data+warehouse+LIV
ROS+carlos&hl=ptBR&ei=CLdoTreVMOfu0gGpxYzeCw&sa=X&oi=book_result&ct=result&resnum=2&ved=0CE
AQ6AEwAQ#v=onepage&q&f=false> Acesso em: 21 set. 2011
LEONARD, Dorothy e SWAP, Walter. Centelhas Incandescentes: Estimulando a
Criatividade em Grupos. 2003.
Disponível
em
<http://books.google.com.br/books?id=IKKsxpDo50cC&pg=PA45&dq=Inteligencia+Analitica
&hl=ptBR&ei=lYK1Tsn5K6Tn0QGftdzRBw&sa=X&oi=book_result&ct=result&resnum=5&ved=0CE
AQ6AEwBA#v=onepage&q&f=false> Acesso em: 05 nov.2011
MEC. Estatísticas. Disponível em
<http://portal.mec.gov.br/index.php?option=com_content&view=article&id=208&Itemid=267>
Acesso em: 11 nov. 2011
MICROSOFT. Entendendo as tecnologias de Integração Microsoft. 2005. Disponível em
<http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em: 03
out. 2013
MicroStrategy.
Best
in
Business
Intelligence.
Disponível
<http://www.Microstrategy.com.br/Company/> Acesso em: 03 out. 2013
em
MicroStrategy.
Resource
Center.
Disponível
em
<https://resource.Microstrategy.com/ResourceCenter/transmit.aspx> Acesso em: 03 out.
2013
OLIVEIRA, Stanley Robson de Medeiros. Introdução à Modelagem Multidimensional.
Disponível em <http://cnptia.embrapa.br/~laurimar/bd/pdf/mod_multidimensional_1p.pdf>
Acesso em: 01 out. 2013
PCMAG.COM.
MicroStrategy
7.
Disponível
em
<http://translate.googleusercontent.com/translate_c?hl=ptBR&prev=/search%3Fq%3Dpc%2Bmagazine%2BMicrostrategy%26hl%3DptBR%26biw%3D1024%26bih%3D443%26prmd%3Dimvns&rurl=translate.google.com.br&sl=e
19
n&u=http://www.pcmag.com/article2/0,2817,2311873,00.asp&usg=ALkJrhiLaSUg4vuwD0cDs1PkDVegFjT1Q> Acesso em: 03 out. 2013
PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro, 2001. Disponível em
<http://books.google.com.br/books?id=pXG6Nzndz8C&pg=PA65&dq=data+warehouse+LIVROS&hl=ptBR&ei=JbVoTqedLM23tgfez8ixDQ&sa=X&oi=book_result&ct=result&resnum=3&ved=0CEU
Q6AEwAg#v=onepage&q&f=false>. Acesso em: 21 set. 2011
PRIMAK, Fábio Vinícius. – Decisões com B.I Business Intelligence 1ª Ed. Rio de Janeiro:
Editora Ciência Moderna Ltda, 2008
RAMALHO, José Antônio. Microsoft SQL Server 2005 Guia Prático. Rio de Janeiro:
Elsevier,
2005.
Disponível
em
<http://books.google.com.br/books?id=QjryQmO3wkC&pg=PA215&dq=Ferramenta+ETL+SSIS&hl=ptBR&ei=v7TBTtrvHIHZgAeyo4XFBw&sa=X&oi=book_result&ct=result&resnum=1&ved=0CD0
Q6AEwAA#v=onepage&q&f=false> Acesso em: 15 nov. 2011
REZENDE, Solange Oliveira. Sistemas Inteligentes: Fundamentos e aplicações. Barueri:
Manole,
2005.
Disponível
em
<http://books.google.com.br/books?id=UsJe_PlbnWcC&pg=PA308&dq=ferramenta+olap&hl
=ptBR&ei=3VqHTo6VCZS_gQe8gqX6Cg&sa=X&oi=book_result&ct=result&resnum=7&ved=0C
GQQ6AEwBg#v=onepage&q=olap&f=false> Acesso em: 01 out. 2011
ROCHA, Reydeval. Introdução ao Analysis Services 2005 – Parte 2. Disponível em
<http://www.devmedia.com.br/space.asp?id=161353> Acesso em: 30 out. 2011
ROSINI, Alessandro Marco e PALMISANO, Ângelo. Administração de Sistemas de
Informação e a Gestão do Conhecimento. São Paulo: Pioneira Thomson Learning, 2003.
Disponível
em
<http://books.google.com.br/books?id=_t7D1uqWuUAC&pg=PA38&dq=data+warehouse+est
rategia&hl=pt-BR&ei=X7doTpG3JcScgQeMmviDA&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCoQ6AEwAA#v=onepage&q&f=fals
e> Acesso em: 21 set. 2011
Download