1 Data Warehouse como Instrumento de Gestão Estratégica Wasley Portes de Souza1 Bruno José de Oliveira2 Rodrigo Vitorino Moravia3 RESUMO: O Projeto de Iniciação Científica desenvolvido visou apresentar como o Data Warehouse pode auxiliar os gestores nas tomadas de decisões baseando-se em dados obtidos através de fontes externas. O ponto inicial foi a criação de um Data Mart, para receber a base de dados disponibilizada pelo INEP através do seu site. Foi desenvolvido um modelo dimensional com uma base intermediária, rotinas de tratamento de extração, transformação e limpeza dos dados, além da ferramenta OLAP Web, onde os usuários poderiam gerar relatórios online conforme a necessidade. Esta proporciona para os gestores tomadores de decisão a possibilidade de entender como os concorrentes estão frente a um mercado tão concorrido como o de ensino superior no Brasil. PALAVRAS-CHAVE: Data Warehouse, MicroStrategy, SSIS, OLAP, ETL. INTRODUÇÃO Devido à expansão e popularização da tecnologia em geral, a sociedade ficou conhecida como: a sociedade da informação e, ao elencar características a ela pertinentes, mencionam o fenômeno do caos informacional. Isto ocorre pois nunca havia se observado um contexto no qual as informações surgem e são disseminadas de modo tão rápido entre seus usuários, ainda que haja grandes distâncias entre eles. É inegável que os indivíduos possam buscar e acessar informações dos mais variados tipos em questão de segundos, porém, por existir tantas informações oriundas de múltiplas fontes, os usuários se veem diante do desafio de manter-se constantemente atualizados em meio a esse caos informacional, em uma sociedade cujo ritmo de vida é especialmente acelerado. É possível dizer que a informação por si só não é um diferencial competitivo para as organizações, pois depende da forma como é utilizada. É importante 1 Graduando do Curso de Tecnólogo em Banco de Dados pela Faculdade Batista de Minas Gerais. [email protected] 2 Graduando do Curso de Tecnólogo em Banco de Dados pela Faculdade Batista de Minas Gerais. [email protected] 3 Professor Especialista em Gestão da Informação pelo IEC – PUC Minas. Professor da Faculdade Batista de Minas Gerais -. Analista de BI da PUC Minas. [email protected] 2 que exista uma ligação entre as informações disponíveis e o ramo de atuação da empresa, criando assim, possibilidades de competição perante os concorrentes. Levando a ideia para o lado empresarial, é possível concluir que uma empresa somente pode ser diferenciada em relação aos seus concorrentes quando consegue obter algum tipo de diferença ou vantagem que possa ser comparada e sustentada. Uma das formas de obter essa vantagem é através do rastreamento de informações disponíveis que auxilie a empresa a alcançar um percentual maior de mercado no seu ramo de atuação. Quando se tem informações antes dos concorrentes, é possível inovar e surpreender as expectativas dos clientes, desta forma, aumenta a probabilidade de fazer com que a empresa se torne referência de mercado no segmento em questão, tendo assim um diferencial de sucesso. Com tantas informações e sabendo que estas mudam constantemente, um dos problemas que as organizações enfrentam na era da informação é a forma de organizar tantos dados para, enfim, transformá-los em informações úteis, relevantes e estratégicas para o negócio. Dentre as possíveis opções de tecnologias para auxiliar o gerenciamento e organização destas informações, “Data Warehouse”, também conhecido como DW, está na listagem como um dos candidatos, por se tratar de uma cópia dos dados transacionais, estruturado para relatórios de análise de nível gerencial. Com um recurso de permitir que seus usuários unifiquem dados obtidos externamente à organização com os dados internos da empresa, para a mesma base de análises, o DW vem se destacando no mercado e sendo utilizado em diversas organizações. Com o objetivo de automatizar e melhorar os processos relacionados à tomada de decisão, o uso desta ferramenta nas organizações de pequeno, médio ou grande porte, possibilita a realização de diversas análises e projeções, podendo estimar as previsões de crescimento da empresa e contribuir para a elaboração de estratégias. Através da elaboração deste trabalho será possível analisar o modo com que uma instituição do ensino superior implantou um Data Mart (DM) com dados obtidos de uma fonte de dados externa (Ministério da Educação – MEC) em seu DW. O estudo em questão justifica-se em função de mostrar a importância desta ferramenta, pois implantar o DM na instituição em questão auxiliou aos gestores na tomada de decisão em relação à abertura de novos cursos, criação de unidades, migração de determinados cursos para outras unidades e desativação de alguns cursos com baixa procura. 3 DW COMO ESTRATÉGIA COMPETITIVA Segundo Barbieri (2001), a ideia básica de Inteligência Competitiva é obter informações detalhadas sobre o mercado e os concorrentes. A Inteligência Competitiva é também entendida como um Business Intelligence (BI) aplicado ao mundo fora da fronteira empresarial, que tem o foco em informações e fatos. As empresas hoje sentem cada vez mais a necessidade de aperfeiçoar o processo de análise de dados que possuem armazenados. Este crescente número de informações pode ser entendido como um mal no universo empresarial e dificulta o processo de tomada de decisão, uma vez que os gestores se sentem impotentes no processo de busca e recuperação dos dados, que podem ser definidos como um conjunto de registros qualitativos ou quantitativos que estão organizados e agrupados. Os dados em si não possuem um significado nem relevância, porém, aplicados ao contexto correto são importantes, pois é possível obter informação. Para Primak (2008), organizações de pequeno, médio ou grande porte, precisam de ferramentas que as auxilie nas mais diferentes situações para tomada de decisão, além de propiciar otimização do trabalho, redução de custos, eliminação de tarefas duplicadas, e permitir previsões de crescimento da empresa e dessa forma contribuir para a elaboração de estratégias. O que está em foco é a necessidade do mercado e não o porte da empresa. Segundo Leonard e Swap (2003), Inteligência Analítica é a capacidade de analisar ideias e tomar decisões com base na análise feita. Mesmo com ferramentas disponíveis que são consideradas tão importantes, alguns escritores consideram até mais importante que a tecnologia, como afirma Davenport e Prusak (1998), são as pessoas que fazem com que a inteligência analítica funcione. Isso porque, conforme Primak (2008), tomar uma decisão em uma organização requer muito mais que saber utilizar um software. Por mais que uma organização disponha de uma ferramenta com diversas funções, de nada adiantará se as pessoas continuarem a tomar decisões ou simplesmente chegarem a conclusões baseadas em suas experiências e no seu próprio conhecimento. Ainda conforme Primak (2008), para a implementação efetiva de uma solução de BI, a condição considerada por grande parte dos analistas de mercado como essencial é a de existir um repositório único de dados que seja sólido e confiável, ou 4 seja, o DW. Isso porque com o DW é possível obter uma visão única, além de poder tomar decisões com base em informações precisas e consistentes em uma única base. A cada dia o mercado de ensino superior está ficando cada vez mais difícil e competitivo e, hoje em dia, ter a informação correta no menor tempo possível, tomar decisões eficazes, adequar-se às oscilações financeiras e antecipar-se às necessidades dos seus clientes, é o grande diferencial para as empresas que querem se manter à frente no mundo dos negócios. DATA WAREHOUSE O termo DW foi criado por Willian H. Inmon, no início da década de 1990 e é definido por uma série de autores conforme citado abaixo: “É um repositório central para todos os tipos significativos de dados que vários sistemas de negócios de uma empresa coletam.” (GOMES e RIBEIRO, 2004, p. 191) “Pode ser definido como um banco de dados, destinado a sistemas de apoio à decisão”. (BARBIERI, 2001, p. 49) Um Data Warehouse é organizado em áreas funcionais e fornece uma perspectiva histórica sobre operações corporativas. O Data Warehouse também é uma origem de dados. Como seus dados já foram unificados, homogeneizados e limpos, eles frequentemente são a melhor origem de dados para análise de negócio. (PETERSON, 2000, p. 65) É uma grande base de dados, ou seja, um repositório único de dados (os quais foram consolidados e organizados) considerado pelos especialistas da área da informática como a "peça" essencial para a execução prática de um projeto de Business Intelligence. (PRIMAK, 2008, p. 5) O DW é orientado por assunto, integrado, variante no tempo e não volátil (não muda). Para Barbieri (2001), o conceito de DW objetiva a definição de uma base de dados preparada em vários níveis de granularidade. A ideia via DW é armazenar os dados em vários graus de relacionamento e sumarização, de forma a facilitar e agilizar os processos de tomada de decisão por diferentes níveis gerenciais. O ambiente de um DW tem como objetivo produzir informações que deverão atender às necessidades de seus usuários, afirmam Rosini e Palmisano (2003). 5 DATA MART PRIMAK (2008, p.47) afirma que “Um Data Mart é um Data Warehouse reduzido que fornece suporte à decisão de um pequeno grupo de pessoas.” Comparados a um Data Warehouse, os Data Marts (DM) possuem algumas vantagens como, por exemplo, custo mais baixo, escopo menor, além de menor tempo de implementação. Ele atende apenas uma área ou assunto especifico de uma organização. Já o DW envolve toda a organização, por isso o desenvolvimento de um DW requer mais tempo além do custo ser maior. Os DMs têm se popularizado devido a alguns motivos como a redução drástica do custo de implementação e manutenção dos sistemas de apoio à decisão; protótipos podem ser elaborados em menor tempo; como o escopo é limitado, os esforços e o time de usuários são mais centrados. A desvantagem do uso de Data Marts é o risco de ter o mesmo dado replicado em outros DM da organização. Como os dados que estão armazenados nos DM servirão de apoio à tomada de decisão, as mudanças devem ser replicadas em todos os Data Marts para garantir a consistência dos dados. Em alguns casos, é comum um projeto inicialmente de DW reduzir seu tamanho contraindo-se assim em um DM específico. Ou mesmo dividir o DW em vários DM, onde o tempo de resposta será mais rápido, além do acesso ser mais fácil para os usuários finais. MODELAGEM DE DADOS PARA DATA WAREHOUSE Conforme Barbieri (2001), o modelo dimensional é formado por tabelas Fato e tabelas Dimensão. Esse modelo modifica alguns conceitos que estavam cristalizados nos projetos tradicionais de Banco de Dados, como por exemplo, a ordem de distribuição de campos por entre as tabelas, permitindo assim que a estrutura seja mais voltada para os muitos pontos de entradas específicos (conhecidos como Dimensões) e menos para os dados granulares em si (conhecidos como Fatos). Esse é o conceito de modelo Dimensional, que possui as entradas de acesso (as tabelas Dimensão) e as tabelas Fatos contendo os fatos que são relevantes. Dessa forma é possível acessar as métricas desejadas, combinando atributos das diversas dimensões, de uma forma objetiva e direta. 6 “A tabela de Fato é o coração do esquema em estrela”, afirma PETERSON (2001, p.78). Corresponde à tabela central que armazena um conjunto de medidas numéricas, que estão associadas a eventos de negócio e que serão analisadas pelas ferramentas OLAP. Para BARBIERI (2001, p.81), “uma tabela Fato contém vários fatos, correspondentes a cada uma de suas linhas.” Em cada fato pode ser armazenado uma ou mais medidas numéricas, que representa os valores objetos da analise dimensional. Normalmente a tabela de Fatos não possui um campo separado para uma chave primaria, ela é formada pela composição de todas as chaves estrangeiras das tabelas Dimensão. Nas tabelas de Fatos, os registros nunca são atualizados a menos que seja necessário corrigir um erro, ou fazer uma alteração. Os registros da tabela de fatos nunca são excluídos exceto quando registros antigos estão sendo arquivados. Para BARBIERI (2001, p.81), “as tabelas Dimensão representam as entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente, etc.” As tabelas de Dimensão são quase sempre muito pequenas, e armazenam um número significativamente menor de linhas do que as tabelas Fato. Comparado à tabela Fatos que sempre tem mais registros sendo adicionados a ela, as tabelas de Dimensão são relativamente estáveis. Algumas delas como a dimensão de tempo raramente são alteradas após a sua criação. Outras dimensões como a dimensão cliente, e empregado crescem lentamente. Em uma tabela de Dimensão, a chave primária deve ser um campo único com um tipo de dados inteiro, afirma Peterson (2001). O autor também afirma que em um esquema em estrela quase sempre há uma dimensão de tempo. Para Barbieri (2001), a dimensão de Tempo é extremamente necessária em projetos de DW/DM onde a evolução dos dados históricos é importante. O Esquema Estrela, “é o formato mais eficiente para armazenar dados utilizados para análise do negócio.” Afirma PETERSON (2001, p. 71). O Esquema Estrela recebe seu nome, pela sua aparência e é composto por uma tabela central chamada de Tabela Fato que possui chave composta, e um conjunto de tabelas menores, chamadas Tabela Dimensão. Conforme Barbieri (2001), o Esquema Estrela é uma abordagem de Ralph Kimball e aponta para projetos de Data Marts (DM). ETL Conforme Primak (2008), os sistemas chamados de ETL (Extração, Transformação e Limpeza) são fundamentais para preparar os dados que serão armazenados no DW. 7 Embora atualmente já existam produtos que facilitem esse trabalho, este ainda é um processo trabalhoso, detalhado e complexo, e que requer expertise para ser executado de forma adequada e correta. A etapa de ETL é uma das mais críticas de um projeto de DW, pois envolve a fase de movimentação dos dados. Rezende (2005) afirma que os dados podem apresentar problemas advindos do processo de coleta, estes problemas podem ser erros de digitação ou erro na leitura dos dados pelos sensores. O uso de técnicas de limpeza deve ser aplicado aos dados para garantir a qualidade. A qualidade dos dados é um fator extremamente importante, pois, possivelmente o resultado do processo de extração será utilizado em um processo de tomada de decisão. No Projeto de Iniciação Científica em questão a ferramenta ETL utilizada foi o SSIS. Conforme Ramalho (2005), o SSIS é uma plataforma utilizada para construir aplicações de integração de dados, que inclui as tarefas conhecidas do pacote ETL (extração, transformação e carregamento) para projetos em DW. Além de conectar-se a diversas fontes de dados, com o SSIS é possível fazer a extração dos dados e misturar os diversos formatos de dados em um único formato. Uma característica importante do SSIS, é que ele já vem incluso como parte do SQL Server 2008 que é utilizado na IES atualmente, além de seu parceiro. O servidor que contém o banco de dados do DW é separado dos demais bancos que a IES utiliza para os sistemas transacionais. Este servidor é exclusivo para armazenas todos dos DMs do DW da IES. Em alguns casos, faz-se necessário a limpeza dos dados, para garantir a padronização dos dados. Como exemplo, formatos de datas. Em uma fonte de dados podese ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o formato da data como 15 de novembro de 2011. METADADOS Para Primak (2008), em um DW, além do banco de dados, é gerada uma documentação maior comparada à documentação de um banco de dados tradicional. 8 Conforme Peterson (2001), os metadados são importantes em cada ponto na estrutura de dados corporativos. É feito um levantamento sobre os relatórios que devem ser gerados, além das origens, localização atual e processos de extração, tratamento e carga de dados. Tudo isso acrescido das regras de negócios da empresa, das mudanças ocorridas ao longo do tempo e da frequência de acesso aos dados, geram os metadados. Considerados dados sobre dados, os metadados possuem as informações sobre os dados que estão sendo utilizados e as disponibiliza para os usuários e para as ferramentas de transformação de dados. OLAP O termo “OLAP” foi citado pela primeira vez em um artigo escrito por Edgar Frank Codd em 1992. Refere-se a um conjunto de ferramentas voltadas para acesso e análise adhoc de dados, com o objetivo de possibilitar que analistas, gerentes e executivos consigam transformar dados em informações de forma rápida, consistente, amigável e flexível, em tempo hábil, capazes de dar suporte às decisões gerenciais. De acordo com Peterson (2001), o OLAP (On-Line Analytical Processing), é uma ferramenta de software interativa de geração de relatórios, que apresenta, para os analistas, diversas visualizações distintas de uma planilha. Conforme Primak (2008), a característica principal das ferramentas OLAP é permitir realizar diversas análises dinâmicas e multidimensionais dos dados, apoiando o usuário final nas suas atividades. Elas possuem uma série de visões, como por exemplo, as consultas ad-hoc, onde o próprio usuário consegue gerar consultas de acordo com suas necessidades de cruzamento dos dados e de uma forma diferente da usual, que o leva a obter as respostas desejadas. Considerada para Bill Inmon como consultas casuais únicas, onde os dados são tratados com parâmetros nunca antes utilizados. Umas das técnicas possibilitadas pelo OLAP é o Drill Down e Drill UP, que consiste em fazer uma exploração em diferentes níveis de detalhe das informações. 9 COLETA DOS DADOS O INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) é uma autarquia federal vinculada ao MEC, cuja missão é promover estudos, pesquisas e avaliações sobre o Sistema Educacional Brasileiro, com o objetivo de subsidiar a formulação e implementação de políticas públicas para a área educacional, bem como produzir informações claras e confiáveis aos gestores, pesquisadores, educadores e público em geral. Anualmente, o INEP/MEC colhe informações de todas as instituições de ensino superior do país, no processo chamado Censo do Ensino superior. Onde são geradas informações da instituição (nome, telefone, endereço, entre outras), e dos Cursos Ofertados (vagas, inscritos, matriculados, etc). O INEP compila estas informações e gera em arquivos do tipo texto, que são os Microdados, e os disponibiliza em sua página na internet ou os envia via mídia. Os microdados são todas as informações colhidas no censo codificadas, menos as informações para identificação da instituição (nome, sigla, telefone, endereço). Estes dados são tabulados, de forma semelhante como os dados do Censo da População que é divulgado pelo IBGE. A Figura 1, exibe a lista de arquivos disponibilizados pelo site do INEP. Figura 1: Arquivos do tipo Texto Fonte: Microdados do Censo da Educação Superior 2009 10 Estes arquivos contam com um dicionário de dados para ajudar na extração dos dados. Através deste, as colunas foram identificadas conforme pode ser visto na Figura 2, abaixo: Figura 2: Dicionário de Dados Fonte: Microdados do Censo da Educação superior 2009 Na Figura 3 é apresentada as colunas que não foram identificadas pelos usuários e por não apresentarem nenhum sentido e não agregarem nenhum valor para a IES, foram descartadas. 11 Figura 3: Colunas não identificadas pelos usuários e descartadas Fonte: Microdados do Censo da Educação Superior 2008 Em um DW as informações são reunidas com relação a períodos particulares de tempo. Cada dado vai refletir o seu próprio estado em diferentes momentos no tempo. Em uma dimensão de tempo, a hierarquia pode ser agregada de diversas maneiras. O nível mais baixo da hierarquia de tempo pode ser definido de diferentes formas, variando, por exemplo, de ano, trimestre, mês e dia, conforme exemplificado na Figura 4. Figura 4: Dimensão Tempo. Fonte: BARBIERI (2011, p.94) Com base no levantamento realizado foi proposto e aprovado o modelo dimensional Estrela, formado por uma tabela Fato no centro chamada f_Instituicao_curso, e por um conjunto de 7 tabelas de Dimensão: d_Instituicao, d_Municipio, d_Curso, d_Tempo 12 d_Organizacao_Academica, d_Categoria_Administrativa e d_Turno, que estão ligadas à tabela Fato. Na tabela Fato f_Instituicao_Curso, foram definidas as chaves das dimensões que fazem parte da composição do seu layout (cod_Ies, cod_Municipio, cod_Organizacao_Academica, ano, cod_Categoria_Administrativa, cod_Curso, cod_Turno). A chave da tabela Fato f_Instituicao_Curso é uma composição de todas as chaves primárias das tabelas Dimensão que se relacionam com a tabela Fato, o que garante a integridade referencial entre a tabela Fato Instituicoes_Cursos e cada uma das tabelas Dimensão, conforme PETERSON (2001, p.78). Nas Tabelas Fatos, são armazenados os fatos que serão analisados, e nas Tabelas Dimensão estão contido todas as perspectivas pelas quais os fatos serão analisados. No projeto foi adotado esta metodologia de modelagem, conforme pode ser visto na Figura 5. Figura 5: Esquema Estrela Fonte: Fonte da pesquisa As métricas foram definidas através da análise do levantamento realizado, onde foi identificado a necessidade de controlar as instituições semestrais, os tipos de cursos oferecidos e turnos, em qual categoria a instituição se enquadra e a qual município está ligado, sendo que para este município, seria importante saber se o mesmo pertence a alguma região metropolitana de interesse da IES. 13 Medidas que podem ser colocadas em uma tabela de fatos: o número total de itens vendidos; a quantidade monetária da venda; o lucro sobre o item vendido. Para melhor exemplificar as medidas que podem ser colocadas em uma tabela de fatos, foram utilizadas as medidas Vendas, Comissão e Desconto, conforme Figura 6. Figura 6: Medidas da tabela de fatos. Fonte: http://www.devmedia.com.br/space.asp?id=161353 Baseado nisso, verificou-se a necessidade de controlar os seguintes indicadores que foram utilizados como métricas na tabela Fato f_Instituicao_Curso: Quantidade de Matrículas Quantidade de Concluintes Quantidade de Inscritos por Ano Quantidade de Vagas por Turno Quantidade de Ingressos por curso Quantidade de Ingressos originados de processo seletivo. No modelo proposto, as tabelas Dimensão definidas foram: d_Instituicao, d_Municipio, d_Curso, d_Tempo d_Organizacao_Academica, d_Categoria_Administrativa e d_Turno. O grande desafio enfrentado entre a equipe de TI e os gestores, em relação às tabelas Dimensão foi quanto ao grau de granularidade e os campos chave. Foi uma parte do projeto onde mais tempo foi gasto para fazer e definir essa modelagem, pois, conforme Barbieri (2001) é uma parte crítica do projeto, uma vez que alterações nas estruturas das tabelas principalmente as tabelas Fato que comparadas às tabelas Dimensão possuem um volume maior de dados, pode representar problemas de manutenção no projeto. No Projeto de Iniciação Científica em questão os campos necessitaram de passar por um processo de limpeza e transformação. A carga de dados da dimensão Municipio foi 14 realizada manualmente, onde, foram incluídos alguns indicadores para auxiliar identificação das capitais de cada UF. Caso um município faça parte da lista de capitais brasileiras, era assinalado o número 1 como indicador, do contrário, era assinalado o número 0. A carga dos dados foi feito somente um vez para as dimensões Tempo, Organizacao_Academica, Categoria_Administrativa e Turno. As outras dimensões que podem sofrer mudanças são carregadas semestralmente, como por exemplo, a inclusão de novas instituições, novos cursos, mudanças de distritos que podem se tornar municípios e até mesmo a criação de novos municípios de um semestre para outro. Somente após a carga destas dimensões, é que se carrega a tabela fato, o que ocorre uma vez por semestre. Como os dados que foram obtidos pelo INEP estavam no formato texto, utilizou-se o SSIS para uma simples leitura destes arquivos, definindo quais colunas deveriam ser carregadas destes arquivos e para qual coluna das respectivas tabelas deveriam ser destinadas. Os dados, como em todo projeto de DW, não sofrem alterações. Existem inclusões semestrais, sempre após a chegada dos novos arquivos enviados pelo INEP. A Figura 7 mostra como normalmente o SSIS é utilizado. Os dados de vários bancos de dados, incluindo o SQL Server 2008, podem ser combinados com dados de outras fontes. Figura 7: Descrevendo o SSIS. Fonte: http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120 (Figura Adaptada) 15 O processo de ETL foi bastante complexo sendo necessário transformar os dados para compatibilização das bases. Nesse ponto, a existência de um dicionário de dados se mostrou extremamente eficiente, facilitando bastante o processo. Fundada em 1989 por Michael J. Saylor, a MicroStrategy é uma empresa de consultoria focada em soluções para suporte à decisão, desenvolvedora da ferramenta OLAP utilizada no projeto. Isto por possuir uma interface similar ao Windows, tornou-se uma ferramenta de geração de relatórios, análises e monitoramento dos negócios, altamente interativa, intuitiva e de fácil utilização pelos usuários finais. A Figura 8 mostra a tela do administrador, onde é possível monitorar e administrar todos os usuários. Figura 8: Tela do Administrador. Fonte: Fonte da pesquisa A Figura 9 mostra a tela de login. Figura 9: Tela de login. Fonte: fonte da pesquisa A Figura 10 mostra a estrutura hierárquica das pastas. A pasta Relatórios Compartilhados, mostra os relatórios que são compartilhados com os demais usuários com acesso ao respectivo DM. 16 Figura 10: Estrutura hierárquica das pastas. Fonte: fonte da pesquisa Exemplo de relatório desenvolvido é mostrado nas Figuras 11 e Figura 12 abaixo: Figura 11: Relatório de gráficos. Fonte: fonte da pesquisa Figura 12: Relatório de gráficos. Fonte: fonte da pesquisa 17 CONCLUSÃO Este artigo apresentou a experiência vivida com a implantação de um Projeto de Iniciação Científica, como o intuito da IES aproveitar os dados disponibilizados pelo INEP e vislumbrar uma oportunidade de obter através destes, informações gerenciais que poderia lhe ajudar no processo de tomada de decisão. O projeto de criação, desenvolvimento, testes e implantação foram bastante demorados pelo pouco tempo disponível pelos pesquisadores, mas de muita relevância. Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta SSIS, pois foi considerada adequada devido a sua facilidade de desenvolvimento das rotinas de carga e também devido ao seu pipeline de transformação de dados, considerado apto pela facilidade apresentada de transformar o dado em uma única operação. Estas facilidades não são encontradas nas ferramentas tradicionais. Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois dispõe do recurso de geração de relatórios padronizados e dinâmicos, que podem ser customizados pelos usuários em momento de execução, possibilitando que possuam visão específica, graças ao processo de Drill Up e Drill Down. Outra facilidade que foi levada em consideração no momento da escolha foi a facilidade de adaptação dos usuários quanto a sua utilização, uma vez que a ferramenta segue o padrão de usabilidade bem similar ao utilizado pelo Windows. Após a análise dos dados fornecidos pela IES, foi possível concluir que com a implantação do DW e a utilização de ferramentas adequadas para este segmento, é possível obter ganhos significativos. Os esforços que foram empenhados neste projeto foram recompensados, já que foi possível desenvolver todas as etapas de construção de um DW, contribuindo para a experiência acadêmica dos discentes, além de prover à instituição um diferencial competitivo de mercado e possui uma visão gerencial privilegiada comparando com seus concorrentes. Como projetos futuros, é sugerido uma pesquisa junto a IES dos valores efetivos dos ganhos adquiridos após a implementação e utilização destes dados pela empresa. Outro tema sugerido é um estudo em relação à ferramenta OLAP MicroStrategy Web utilizada, em relação a outras ferramentas de software livre (open source). 18 REFERÊNCIAS BARBIERI, Carlos. BI – Business Intelligence: Modelagem e Tecnologia, 1ª Ed, Axcel Books, 2001 DAVENPORT, Thomas H. e PRUSAK, Laurence. Conhecimento empresarial 14ª Ed, Rio de Janeiro: Campus, 1998 GOMES, Carlos Francisco Simões e RIBEIRO, Priscilla Cristina Cabral. Gestão da Cadeia de suprimentos Integrada à Tecnologia da Informação. São Paulo: Pioneira Thomson Learning, 2004. Disponível em <http://books.google.com.br/books?id=B06QoZ8jB8IC&pg=PA191&dq=data+warehouse+LIV ROS+carlos&hl=ptBR&ei=CLdoTreVMOfu0gGpxYzeCw&sa=X&oi=book_result&ct=result&resnum=2&ved=0CE AQ6AEwAQ#v=onepage&q&f=false> Acesso em: 21 set. 2011 LEONARD, Dorothy e SWAP, Walter. Centelhas Incandescentes: Estimulando a Criatividade em Grupos. 2003. Disponível em <http://books.google.com.br/books?id=IKKsxpDo50cC&pg=PA45&dq=Inteligencia+Analitica &hl=ptBR&ei=lYK1Tsn5K6Tn0QGftdzRBw&sa=X&oi=book_result&ct=result&resnum=5&ved=0CE AQ6AEwBA#v=onepage&q&f=false> Acesso em: 05 nov.2011 MEC. Estatísticas. Disponível em <http://portal.mec.gov.br/index.php?option=com_content&view=article&id=208&Itemid=267> Acesso em: 11 nov. 2011 MICROSOFT. Entendendo as tecnologias de Integração Microsoft. 2005. Disponível em <http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em: 03 out. 2013 MicroStrategy. Best in Business Intelligence. Disponível <http://www.Microstrategy.com.br/Company/> Acesso em: 03 out. 2013 em MicroStrategy. Resource Center. Disponível em <https://resource.Microstrategy.com/ResourceCenter/transmit.aspx> Acesso em: 03 out. 2013 OLIVEIRA, Stanley Robson de Medeiros. Introdução à Modelagem Multidimensional. Disponível em <http://cnptia.embrapa.br/~laurimar/bd/pdf/mod_multidimensional_1p.pdf> Acesso em: 01 out. 2013 PCMAG.COM. MicroStrategy 7. Disponível em <http://translate.googleusercontent.com/translate_c?hl=ptBR&prev=/search%3Fq%3Dpc%2Bmagazine%2BMicrostrategy%26hl%3DptBR%26biw%3D1024%26bih%3D443%26prmd%3Dimvns&rurl=translate.google.com.br&sl=e 19 n&u=http://www.pcmag.com/article2/0,2817,2311873,00.asp&usg=ALkJrhiLaSUg4vuwD0cDs1PkDVegFjT1Q> Acesso em: 03 out. 2013 PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro, 2001. Disponível em <http://books.google.com.br/books?id=pXG6Nzndz8C&pg=PA65&dq=data+warehouse+LIVROS&hl=ptBR&ei=JbVoTqedLM23tgfez8ixDQ&sa=X&oi=book_result&ct=result&resnum=3&ved=0CEU Q6AEwAg#v=onepage&q&f=false>. Acesso em: 21 set. 2011 PRIMAK, Fábio Vinícius. – Decisões com B.I Business Intelligence 1ª Ed. Rio de Janeiro: Editora Ciência Moderna Ltda, 2008 RAMALHO, José Antônio. Microsoft SQL Server 2005 Guia Prático. Rio de Janeiro: Elsevier, 2005. Disponível em <http://books.google.com.br/books?id=QjryQmO3wkC&pg=PA215&dq=Ferramenta+ETL+SSIS&hl=ptBR&ei=v7TBTtrvHIHZgAeyo4XFBw&sa=X&oi=book_result&ct=result&resnum=1&ved=0CD0 Q6AEwAA#v=onepage&q&f=false> Acesso em: 15 nov. 2011 REZENDE, Solange Oliveira. Sistemas Inteligentes: Fundamentos e aplicações. Barueri: Manole, 2005. Disponível em <http://books.google.com.br/books?id=UsJe_PlbnWcC&pg=PA308&dq=ferramenta+olap&hl =ptBR&ei=3VqHTo6VCZS_gQe8gqX6Cg&sa=X&oi=book_result&ct=result&resnum=7&ved=0C GQQ6AEwBg#v=onepage&q=olap&f=false> Acesso em: 01 out. 2011 ROCHA, Reydeval. Introdução ao Analysis Services 2005 – Parte 2. Disponível em <http://www.devmedia.com.br/space.asp?id=161353> Acesso em: 30 out. 2011 ROSINI, Alessandro Marco e PALMISANO, Ângelo. Administração de Sistemas de Informação e a Gestão do Conhecimento. São Paulo: Pioneira Thomson Learning, 2003. Disponível em <http://books.google.com.br/books?id=_t7D1uqWuUAC&pg=PA38&dq=data+warehouse+est rategia&hl=pt-BR&ei=X7doTpG3JcScgQeMmviDA&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCoQ6AEwAA#v=onepage&q&f=fals e> Acesso em: 21 set. 2011