Implantação de um Data Warehouse para Acompanhamento de Desempenho dos Cursos em uma Instituição de Ensino Superior Deploying a Data Warehouse for Performance Monitoring Course in an Institution of Higher Education Implementación de un Data Warehouse para la Supervisióndel Rendimiento de los Cursos en una Institución de EducaciónSuperior Edgar Luiz de Lima Júnior1 Fabrício Pires Vasconcellos2 Rodrigo Vitorino Moravia3 Resumo: Este artigo tem como objetivo apresentar a implantação um Data Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico. Foi desenvolvido um modelo dimensional com uma base intermediária, rotinas de tratamento de extração, transformação e limpeza dos dados extraído do Excel, além da ferramenta Web, onde os usuários podem gerar relatórios on-line conforme a necessidade. Palavras-chave: Data Warehouse (DW). Extração, Transformação e Carga (ETL). On-Line Analytical Processing (OLAP). Abstract: This article aims to present a Data Warehouse deployment in an Institution of Higher Education in Belo Horizonte to aid in their strategic planning. A dimensional model was developed with an intermediate base handlers extraction, processing and cleaning of extracted data from Excel, plus web tool where users can generate on-line reports as needed. Keywords: Data Warehouse (DW). Extract, Transform, Load (ETL). On-Line Analytical Processing (OLAP). Resumen: Este artículo tiene como objetivo presentar undespliegue de Data Warehouseen una Institución de Educación Superior en Belo Horizonte para ayudaren suplanificación estratégica. Un modelo tridimensional se hadesarrolladocon una extracción manejadores de bases intermedias, elprocesamiento y lalimpieza de losdatos extraídos de Excel, además de laherramienta web donde losusuariospuedengenerar informes on-line, segúnseanecesario. Palabras clave: Data Warehouse (DW). Extracción, Transformación y Carga (ETL). On-Line Analytical Processing (OLAP). 1 - INTRODUÇÃO Constitui-se tema deste artigo a implantação de um Data Warehouse em uma Instituição de Ensino Superior no qual os diretores e coordenadores não possuem informações históricas sobre o desempenho dos cursos. Devido à expansão e popularização da tecnologia em geral, a sociedade ficou conhecida como a sociedade da informação e, ao elencar características a ela pertinentes, mencionam o fenômeno do caos informacional. Nunca havia se observado um contexto no qual as informações surgem e são disseminadas de modo 1 Graduando do curso Bacharelado em Sistemas de Informação pela Faculdade Infórium de Tecnologia. [email protected] 2 Mestre em Sistemas de Informação e Gestão do conhecimento pela Fundação Mineira de Educação e Cultura. Professor da Faculdade Infórium de Tecnologia. [email protected] 3 Especialista em Gestão da Informação pelo Instituto de Educação Continuada da Pontifícia Universidade Católica de Minas Gerais. Professor da Faculdade Infórium de Tecnologia. [email protected] Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 tão rápido entre seus usuários, ainda que haja grandes distâncias entre eles. Os indivíduos podem buscar e acessar informações dos mais variados tipos, porém, por existir tantas informações oriundas de múltiplas fontes, os usuários se veem diante do desafio de se manter atualizados em meio a esse caos informacional, em uma sociedade cujo ritmo de vida é acelerado. Quando se tem informações antes dos concorrentes, é possível inovar e surpreender as expectativas dos clientes, desta forma, aumenta a probabilidade de fazer com que a empresa se torne referência de mercado no segmento em questão, tendo assim um diferencial de sucesso (BARBIERI, 2001). A informação por si só não é um diferencial competitivo para as organizações, depende da forma como é utilizada. Uma empresa pode ser diferenciada em relação aos seus concorrentes quando consegue obter algum tipo de diferença ou vantagem que possa ser comparada e sustentada. Uma das formas de obter essa vantagem é através do rastreamento de informações disponíveis que auxilie a empresa a alcançar um percentual maior de mercado no seu ramo de atuação. Com tantas informações e observando-se que estas mudam constantemente, um dos problemas que as organizações enfrentam na era da informação é a forma de organizar tantos dados para, enfim, transformá-los em informações úteis, relevantes e estratégicas para o negócio. Dentre as possíveis opções de tecnologias para auxiliar o gerenciamento e organização destas informações, o Data Warehouse, também conhecido como DW, está na listagem como um dos candidatos, por se tratar de uma cópia dos dados transacionais, estruturado para relatórios de análise de nível gerencial. Com um recurso de permitir que seus usuários unifiquem dados obtidos externamente à organização com os dados internos da empresa, para a mesma base de análises, o Data Warehouse vem se destacando no mercado e sendo utilizado em diversas organizações. O Data Warehouse visa automatizar e melhorar os processos relacionados à tomada de decisão, o uso desta ferramenta nas organizações de pequeno, médio ou grande porte, possibilita a realização de diversas análises e projeções, podendo estimar as previsões de crescimento da empresa e contribuir para a elaboração de estratégias (PRIMAK, 2008). Assim, delimitou-se o tema deste artigo a criação de um Data Warehouse para o acompanhamento de desempenho de cursos em uma instituição de ensino superior. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 A pergunta norteadora deste estudo é no sentido de investigar como a implantação de um Data Warehouse pode influenciar uma Instituição de Ensino Superior no seu planejamento estratégico. O objetivo geral é apresentar como se realizou a implantação de um Data Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico. São objetivos específicos: definir e conceituar Data Warehouse; implantar uma solução para o auxílio ao planejamento estratégico da Instituição de Ensino Superior. A relevância deste estudo trabalho consiste em mostrar como o Data Warehouse na instituição auxiliará os tomadores de decisão, além dos coordenadores de cursos com informações históricas sobre o desempenho dos cursos dentro da instituição, facilitará o planejamento estratégico da mesma. A pesquisa bibliográfica, fontes secundárias, tem como base em autores tais como Barbieri, (2001); Primak (2008), e pesquisa documental é baseado na Microstrategy e Microsoft. Para compreensão deste tema dividiu-se este artigo em nove seções. A seção 1, esta introdução, e indicativa do estudo; a seção 2 apresenta o Data Warehouse; a seção 3 aborda a modelagem de dados para Data Warehouse; a seção 4 trata extração, transformação e carga dos dados; a seção 5 apresenta a On-Line Analytical Processing; a seção 6 aborda o Data Warehouse como estratégia competitiva; a seção 7 apresenta a implantação prática de um Data Warehouse em uma instituição de ensino superior de Belo Horizonte; a seção 8 elabora a discussão referente a implantação do Data Warehouse; a seção 9, tece as conclusões do artigo. 2 - DATA WAREHOUSE O termo Data Warehouse (DW) foi criado por Willian H. Inmon, no início da década de 1990 e é definido por uma série de autores conforme quadro 1: O conceito de DW objetiva a definição de uma base de dados preparada em vários níveis de granularidade. A ideia via DW é armazenar os dados em vários graus de relacionamento e sumarização, de forma a facilitar e agilizar os processos de tomada de decisão por diferentes níveis gerenciais. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Quadro 1 - Definições de Data Warehouse. Autor: Definição: Peterson, (2001, p. “Um Data Warehouse é organizado em áreas funcionais e fornece uma 65) perspectiva histórica sobre operações corporativas.O Data Warehouse também é uma origem de dados. Como seus dados já foram unificados, homogeneizados e limpos, eles frequentemente são a melhor origem de dados para análise de negócio.“ Barbieri, (2001, p. 49) “Pode ser definido como um banco de dados, destinado a sistemas de apoio à decisão. “ Gomes e Ribeiro, “[...] é um repositório central para todos os tipos significativos de dados que (2004, p. 191) vários sistemas de negócios de uma empresa coletam.“ Primak, (2008, p. 5) “[...] é uma grande base de dados, ou seja, um repositório único de dados (os quais foram consolidados e organizados) considerado pelos especialistas da área da informática como a "peça" essencial para a execução prática de um projeto de Business Intelligence.“ Fonte: elaboração do autor O ambiente de um DW tem como objetivo produzir informações que deverão atender às necessidades de seus usuários. (ROSINI:PALMISANO, 2003). Observase que o DW é definido pelos autores como um repositório de dados estratégicos para o auxílio da tomada de decisão. 3 - MODELAGEM DE DADOS PARA DATA WAREHOUSE O DW é orientado por assunto, integrado, variante no tempo e não volátil, para modelagem de dados quando utiliza-se o modelo dimensional. O modelo dimensional, conforme Barbieri (2001), é formado por tabelas Fato e tabelas de Dimensão. Esse modelo modifica alguns conceitos que estavam cristalizados nos projetos tradicionais de Banco de Dados, como por exemplo, a ordem de distribuição de campos por entre as tabelas, permitindo assim que a estrutura seja mais voltada para os muitos pontos de entradas específicos, conhecidos como Dimensão, e menos para os dados granulares em si, conhecidos como Fatos. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Na figura 1, está representado no modelo dimensional um sistema de vendas a varejo. Neste modelo tem-se uma tabela Fato chamada Vendas, que tem como métrica os campos quantidade vendida e o valor em reais. Outra tabela Fato chamada Estoque que tem como métrica a quantidade em estoque. E ainda seis tabelas de Dimensão: Tempo, Produto, Loja, Promoção, Atendente e Nota Fiscal. Figura 1 - Exemplo de um modelo Dimensional. Fonte: BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books, 2001 Esse é o conceito de modelo Dimensional, que possui as entradas de acesso, as tabelas de Dimensão, e as tabelas Fatos contendo os fatos que são relevantes. Dessa forma é possível acessar as métricas desejadas, combinando atributos das diversas dimensões, de uma forma objetiva e direta (BARBIERI, 2001). O Esquema Estrela ”[...] é o formato mais eficiente para armazenar dados utilizados para análise do negócio.” (PETERSON, 2001, p. 71) O Esquema Estrela recebe este nome, pela sua aparência e é composto por uma tabela Fato central e um conjunto de tabelas de Dimensão. Nas Tabelas Fatos, são armazenados os fatos que serão analisados, e nas tabelas de Dimensão estão contidas todas as perspectivas pelas quais os fatos serão analisados. Para Peterson (2001, p.78) “a tabela de Fato é o coração do esquema em estrela”, o autor acrescenta, que corresponde à tabela central que armazena um conjunto de medidas numéricas, que estão associadas a eventos de negócio. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Nesse sentido Barbieri (2001, p.81), assinala que “[...] uma tabela Fato contém vários fatos, correspondentes a cada uma de suas linhas.” Em cada fato pode ser armazenado uma ou mais medidas numéricas, que representa os valores objetos da análise dimensional. A tabela de Fatos não possui um campo separado para uma chave primária, ela é formada pela composição de todas as chaves estrangeiras das tabelas Dimensão. Nas tabelas de Fatos, os registros nunca são atualizados a menos que seja necessário corrigir um erro, ou fazer uma alteração. Os registros da tabela de fatos nunca são excluídos exceto quando registros antigos estão sendo arquivados. Exemplificando os valores de medidas que podem ser colocadas em uma tabela de Fato: o número total de itens vendidos; a quantidade monetária da venda; o lucro sobre o item vendido (BARBIERI, 2001). Na figura 2 foram utilizadas como valores de medidas: Vendas, Comissão e Desconto. Figura 2 - Valores de medidas da tabela de fatos . Fonte: ROCHA, Reydeval. Introdução ao Analysis Services 2005. Disponível em < http://www.devmedia.com.br/introduca o-ao-analysis-services-2005-parte2/5730> Acesso em: 08 abr. 2014 As tabelas Dimensão, para Barbieri (2001, p.81), representam as entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente, etc.” As tabelas de Dimensão são quase sempre muito pequenas, e armazenam um número significativamente menor de linhas do que as tabelas Fato. Comparado à tabela Fatos que sempre tem mais registros sendo adicionados a ela, as tabelas de Dimensão são relativamente Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 estáveis. Algumas delas como a dimensão de tempo raramente são alteradas após a sua criação. Em uma tabela de Dimensão, a chave primária deve ser um campo único com um tipo de dados inteiro, afirma Peterson (2001). O autor também enfatiza que em um esquema em estrela quase sempre há uma dimensão de tempo. A dimensão de Tempo, para Barbieri (2001), é necessária em projetos de DW onde a evolução dos dados históricos é fundamental. Em um DW, segundo Barbieri (2001, p. 94), as informações são reunidas com relação a períodos particulares de tempo. Cada dado vai refletir o seu próprio estado em diferentes momentos no tempo. Em uma dimensão de tempo, a hierarquia pode ser agregada de diversas maneiras. O nível mais baixo da hierarquia de tempo pode ser definido de diferentes formas, variando, por exemplo, de ano, trimestre, mês e dia, conforme exemplificado na figura 3. Figura 3 - Dimensão Tempo. Fonte: BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books, 2001 4 - EXTRAÇÃO, TRANSFORMAÇÃO E CARGA A etapa de Extração, Transformação e Carga, do inglês Extract, Transform, Load (ETL) é uma das mais críticas de um projeto de DW, pois envolve a fase de movimentação dos dados. Os sistemas chamados de ETL, conforme Primak (2008), são fundamentais para preparar os dados que serão armazenados no DW. Embora atualmente já Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 existam produtos que facilitem esse trabalho, este ainda é um processo trabalhoso, detalhado e complexo, e que requer expertise para ser executado de forma adequada e correta. Os dados, afirma Rezende (2003), podem apresentar problemas advindos do processo de coleta, estes problemas podem ser erros de digitação ou erro na leitura dos dados pelos sensores. O uso de técnicas de limpeza deve ser aplicado aos dados para garantir a qualidade. A qualidade dos dados é um fator essencial, pois, possivelmente o resultado do processo de extração será utilizado em um processo de tomada de decisão. O Structured Query Language (SQL) Server Integration Services (SSIS), de acordo com Ramalho (2005), é uma plataforma utilizada para construir aplicações de integração de dados, que inclui as tarefas conhecidas do pacote ETL para projetos em DW. Além de conectar-se a diversas fontes de dados, com o SSIS é possível fazer a extração dos dados e misturar os diversos formatos de dados em um único formato. A figura 4 mostra como normalmente o SSIS é utilizado. Os dados de vários bancos de dados, incluindo o SQL Server 2008, podem ser combinados com dados de outras fontes (RAMALHO, 2005). Figura 4 - Descrevendo o Server Integration Services (SSIS) Fonte: Adaptado de: MICROSOFT. Entendendo as tecnologias de Integração Microsoft. [Redmond], 2005. Disponível em <http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XS LTsection128121120120> Acesso em: 3 out. 2013 Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Em alguns casos, faz-se necessário a limpeza dos dados, para garantir a padronização dos dados. Como exemplo, formatos de datas. Em uma fonte de dados pode-se ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o formato da data como 2 de maio de 2014 (RAMALHO, 2005). Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 5 - ON-LINE ANALYTICAL PROCESSING (OLAP) O termo On-Line Analytical Processing (OLAP) foi citado pela primeira vez em um artigo escrito por Edgar Frank Codd em 1992. Refere-se a um conjunto de ferramentas voltadas para acesso e análise ad-hocde dados, com o objetivo de possibilitar que analistas, gerentes e executivos consigam transformar dados em informações de forma rápida, consistente, amigável e flexível, em tempo hábil, capazes de dar suporte às decisões gerenciais. Além disso, do ponto de vista de Peterson (2001), o OLAP, é uma ferramenta de software interativa de geração de relatórios, que apresenta, para os analistas, diversas visualizações distintas de uma planilha. A característica principal das ferramentas OLAP, conforme Primak (2008), é permitir realizar diversas análises dinâmicas e multidimensionais dos dados, apoiando o usuário final nas suas atividades. Elas possuem uma série de visões, como por exemplo, as consultas ad-hoc, onde o próprio usuário consegue gerar consultas de acordo com suas necessidades de cruzamento dos dados e de uma forma diferente da usual, que o leva a obter as respostas desejadas. Considerada para Inmon (1999) como consultas casuais únicas, onde os dados são tratados com parâmetros nunca antes utilizados. Umas das técnicas possibilitadas pelo OLAP é o Drill Down e Drill UP, que consiste em fazer uma exploração em diferentes níveis de detalhe das informações. Com essa técnica, o usuário pode “subir ou descer na hierarquia” dentro do detalhamento do dado conforme figura 5. Figura 5 - Representação Drill Down e Drill UP Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Fonte: BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books, 2001. p. 42. 6 - DATA WAREHOUSE COMO ESTRATÉGIA COMPETITIVA A ideia básica de Inteligência Competitiva conforme Barbieri (2001) é obter informações detalhadas sobre o mercado e os concorrentes. A Inteligência Competitiva é também um Business Intelligence (BI) aplicado ao mundo fora da fronteira empresarial, que tem o foco em informações e fatos. As empresas hoje sentem cada vez ma is a necessidade de aperfeiçoar o processo de análise de dados que possuem armazenados. Este crescente número de informações pode ser interpretada como um mal no universo empresarial e dificulta o processo de tomada de decisão, uma vez que os gestores se sentem impotentes no processo de busca e recuperação dos dados, que podem ser definido a como um conjunto de registros qualitativos ou quantitativos que estão organizados e agrupados. Os dados em si não possuem um significado nem relevância, porém, aplicados ao contexto correto são importantes, pois é possível obter informação. Há de se destacar que para Primak (2008), organizações de pequeno, médio ou grande porte, precisam de ferramentas que as auxilie nas mais diferentes situações para tomada de decisão, além de propiciar otimização do trabalho, redução de custos, eliminação de tarefas duplicadas, e permitir previsões de crescimento da empresa e dessa forma contribuir para a elaboração de estratégias. O que está em foco é a necessidade do mercado e não o porte da empresa. Enfatizam no entanto Leonard e Swap (2003), Inteligência Analítica é a capacidade de analisar ideias e tomar decisões com base na análise feita. Mesmo com ferramentas disponíveis que são consideradas decisivas, alguns autores consideram até mais importante que a tecnologia, como afirmam Davenport e Prusak (1998), são as pessoas que fazem com que a inteligência analítica funcione. Isso porque, conforme Primak (2008), tomar uma decisão em uma organização requer muito mais que saber utilizar um software. Por mais que uma organização disponha de uma ferramenta com diversas funções, de nada adiantará se as pessoas continuarem a tomar decisões ou simplesmente chegarem a conclusões baseadas em suas experiências e no seu próprio conhecimento. Prossegue o autor afirmando que , para a implementação efetiva de uma solução de BI, a condição considerada por Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 grande parte dos analistas de mercado como essencial é a de existir um repositório único de dados que seja sólido e confiável, ou seja, o DW. Isso porque com o DW é possível obter uma visão única, além de poder tomar decisões com base em informações precisas e consistentes em uma única base. O mercado de Ensino Superior está ficando cada vez mais difícil e competitivo e, hoje em dia, ter a informação correta no menor tempo possível, tomar decisões eficazes, adequar-se às oscilações financeiras e antecipar-se às necessidades dos seus clientes, é o grande diferencial para as empresas que querem se manter à frente no mundo dos negócios. 7 - IMPLANTAÇÃO PRÁTICA DE UM DATA WAREHOUSE EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR DE BELO HORIZONTE A implantação do Data Warehouse iniciou-se no mês de abril de 2013 com o levantamento dos dados junto a Instituição de Ensino Superior (IES) de Belo Horizonte que possui quatro cursos superiores, concretizando os acessos aos dados no mês de agosto de 2013. Verifica-se que os tomadores de decisão, além dos coordenadores de cursos desta Instituição de Ensino Superior não possuem informações históricas sobre o desempenho dos cursos dentro da instituição, o que dificulta o planejamento estratégco da mesma. Constata-se que a tecnologia de Business Intelligence tem apresentado forte adesão pelas organizações que desejam obter um suporte à tomada de decisão e, cada vez mais, querem estas informações em tempo real, a qualquer hora e lugar. A seguir, descreve-se os passos para criação, desenvolvimento, testes e implantação de um Data Warehouse em uma Instituição de Ensino Superior (IES). 1º) PASSO Com base no levantamento realizado em abril de 2013 foi proposto e aprovado o modelo dimensional Estrela como metodologia de modelagem, formado por uma tabela Fato no centro chamada acompanhamento_cursos, e por um conjunto de 6 Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 tabelas de Dimensão, como aluno, curso, período, semestre e situação que estão ligadas à tabela Fato conforme pode ser visto na figura 6. Figura 6 - Esquema do modelo dimensional Estrela Fonte: dados da pesquisa Na tabela Fato acompanhamento_cursos, foram definidas as chaves das dimensões que fazem parte da composição do seu layout (cod_aluno, cod_curso, num_semestre_ano, cod_periodo, cod_situacao, cod_turno e f_qtd_aluno). A chave da tabela Fato acompanhamento_cursos é uma composição de todas as chaves primárias das tabelas de Dimensão que se relacionam com a tabela Fato, o que garante a integridade referencial entre a tabela Fato acompanhamento_cursos e cada uma das tabelas de Dimensão como apresentado por Peterson (2001, p.78). As métricas foram definidas através da análise do levantamento realizado junto aos coordenadores, onde foi identificado a necessidade de verificar a quantidade de alunos matriculados, por curso, por sexo e por período. Baseado nisso, verificou-se a necessidade de controlar os seguintes indicadores que foram utilizados como métricas na tabela Fatoacompanhamento_cursos:Curso;Período;Turno;Aluno;Tipo de aluno;Situação do aluno no curso;Quantidade de alunos. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 No modelo proposto, as tabelas de Dimensão definidas foram: aluno, curso, periodo, semestre e situação. Acrescenta-se que esta é a parte onde mais gasta tempo para fazer e definir essa modelagem. A esse respeito Barbieri (2001) enfatiza que é uma parte crítica do projeto, uma vez que alterações nas estruturas das tabelas principalmente as tabelas Fato que comparadas às tabelas de Dimensão possuem um volume maior de dados, pode representar problemas de manutenção no projeto. 2º) PASSO Com o auxílio de um funcionário da IES, as informações foram exportadas do sistema acadêmico da IES, através de relatórios interno do sistema acadêmico para arquivos com valores separadores por vírgulas.(fig.7). Figura 7 - Tela de arquivos do tipo Arquivos Separados por Vírgula Fonte: dados da pesquisa Na figura 8 é apresentada a planilha Excel com todos os dados disponibilizados pela IES que possuíam informações concentradas em uma única coluna, como por exemplo, o semestre, turno e período, estavam na mesma coluna. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Figura 8 - Tela de conteúdo dos dados disponibilizados pela IES Fonte: dados da pesquisa Estes arquivos, não apresentam um dicionário de dados para ajudar na extração dos dados. Algumas colunas foram identificadas, conforme o conhecimento do funcionário da IES, e várias colunas, as informações não aparentam ter nenhum sentido, não foi possível decifrar o que cada coluna representava, conforme pode ser visto na figura 8. Apresenta- se na figura 9 todos os dados após o processo de limpeza dos dados, como por exemplo, o semestre, turno e período, foram separados em colunas distintas. Figura 9 - Tela de conteúdo dos dados disponibilizados pela IES após a limpeza dos dados. Fonte: dados da pesquisa Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 A carga dos dados foi feita somente uma vez para as tabelas de Dimensão. Como os dados que foram obtidos estavam no formato separado por virgulas, utilizou-se o SSIS para uma simples leitura destes arquivos, definindo quais colunas deveriam ser carregadas destes arquivos e para qual coluna das respectivas tabelas deveriam ser destinadas, (fig. 10). Os dados, como em todo projeto de DW, não sofrem alterações. Figura 10 - Tela de rotina de leitura dos dados ferramenta SSIS Fonte: dados da pesquisa O processo de ETL foi bastante complexo e os problemas que ocorreram foram, a falta de um dicionário de dados para identificação das colunas que seriam carregadas. Algumas colunas foram identificadas, conforme o conhecimento do funcionário da IES, e várias colunas, as informações não aparentam ter nenhum sentido, não foi possível decifrar o que cada coluna representava. 3º) PASSO A ferramenta OLAP escolhida foi a MicroStrategy, fundada em 1989 por Michael J. Saylor. AMicroStrategy é uma empresa de consultoria focada em soluções para suporte à decisão, desenvolvedora da ferramenta OLAP utilizada no projeto. Isto por possuir uma interface similar ao Windows, tornou-se uma ferramenta de geração Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 de relatórios, análises e monitoramento dos negócios, altamente interativa, intuitiva e de fácil utilização pelos usuários finais. A figura 11 mostra a tela do administrador, onde é possível monitorar e administrar todos os usuários. Figura 11 - Tela do Administrador. Fonte: dados da pesquisa A estrutura hierárquica das pastas é apresentada na figura 12. A pasta Relatórios Compartilhados, mostra os relatórios gerados e que são compartilhados com os demais usuários com acesso ao respectivo DW. Figura 12 - Tela de estrutura hierárquica da pasta Relatórios Compartilhados. Fonte: dados da pesquisa Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Os relatórios de gráficos que atigiram o objetivo para o auxílio dos tomadores de decisão, além dos coordenadores de cursos desta Instituição de Ensino Superior para a utilização no planejamento estratégico com informações históricas sobre o desempenho dos cursos dentro da instituição são apresentados na figura 13 e 14. Figura 13 - Tela de relatório de gráficos (Alunos X Curso). Fonte: dados da pesquisa Figura 14 - Tela do relatório de gráficos (Situação de alunos por curso). Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Fonte: dados da pesquisa Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 8 - DISCUSSÃO SOBRE OS RESULTADOS DE IMPLANTAÇÃO DO DATA WAREHOUSE Os passos de criação, desenvolvimento, testes e implantação foram demorados pelo pouco tempo disponível pelos pesquisadores, mas de muita relevância. Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta SSIS, pois foi considerada adequada devido a sua facilidade de desenvolvimento das rotinas de carga e também devido ao seu pipeline de transformação de dados, considerado apto pela facilidade apresentada de transformar o dado em uma única operação. Estas facilidades não são encontradas nas ferramentas tradicionais. Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois dispõe do recurso de geração de relatórios padronizados e dinâmicos, que podem ser customizados pelos usuários em momento de execução, possibilitando que possuam visão específica, graças ao processo de drillup e drilldown. Outra facilidade que foi levada em consideração no momento da escolha foi a facilidade de adaptação dos usuários quanto a sua utilização, uma vez que a ferramenta segue o padrão de usabilidade bem similar ao utilizado pelo Windows. Os esforços que foram empenhados neste trabalho foram recompensados, já que foi possível desenvolver todas as etapas de construção de um DW, contribuindo para a experiência acadêmica do discente, além de prover à instituição um diferencial competitivo de mercado com uma visão gerencial privilegiada comparando com seus concorrentes. 9 - CONSIDERAÇÕES FINAIS O presente trabalho apresentou o processo implantação de um Data Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico e definiu e conceituou o Data Warehouse. Buscou-se reunir no estudo uma base teórica que permitisse mostrar o formato do Data Warehouse como um repositório de dados para atender diferentes níveis gerenciais para tomada de decisão. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 A realização da pesquisa aplicada para a implantação do Data Warehouse na Instituição de Ensino Superior foi organizada em três etapas, estas denominadas “passos”. Estas etapas foram realizadas tendo-se a base conceitual e teórica do estudo como orientadora da implantação do Data Warehouse. Verificou-se a pertinência teórica apresentada a um caso específico, o Data Warehouse como ferramenta de auxílio em planejamento estratégico na Instituição de Ensino Superior. Como projeto futuro, sugere-se uma pesquisa junto a Instituição de Ensino Superior dos valores efetivos dos ganhos adquiridos após a implementação e utilização destes dados pela Instituição, da mesma forma sugere-se um estudo em relação à ferramenta OLAP MicroStrategy Web utilizada, em relação a outras ferramentas de software livre (open source). Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 REFERÊNCIAS ANTUNES JUNIOR, Delson. Sistema de apoio a decisão baseado em Data Warehouse para uma indústria química. 2009. Trabalho de Conclusão de Curso (Bacharel) - Universidade do Planalto Catarinense, Lages, 2009. Disponível em: < >. Acesso em: 22 nov. 2013 BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books, 2001 DAVENPORT, Thomas H. e PRUSAK, Laurence. ed, Rio de Janeiro: Campus, 1998 Conhecimento empresarial 14. GOMES, Carlos Francisco Simões; RIBEIRO, Priscilla Cristina Cabral. Gestão da cadeia de suprimentos integrada à tecnologia da informação. São Paulo: Pioneira Thomson Learning, 2004. INMON, W. H.; WELCH, J. D.; GLASSEY, K. L. Gerenciando Data Warehouse. São Paulo: Makron Books, 1999. KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: guia completo para modelagem dimensional. 2 ed. Rio deJaneiro: Campus, 2002. LEONARD, Dorothy; SWAP, Walter. Centelhas Incandescentes: estimulando a criatividade em grupos. Porto Alegre: Bookman, 2003. MICROSOFT. Entendendo as tecnologias de Integração Microsoft. [Redmond], 2005. Disponível em <http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em: 3 out. 2013 MICROSTRATEGY. Best in Business Intelligence. Disponível <http://www.microstrategy.com.br/Company/> Acesso em: 03 out. 2013 em PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro: Campus, 2001. PRIMAK, Fábio Vinícius. Decisões com B.I Business Intelligence. Rio de Janeiro: Ciência Moderna, 2008 RAMALHO, José Antônio. Microsoft SQL Server 2005: guia prático. Rio de Janeiro: Campus, 2005. REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicações. Barueri: Manole, 2003. ROCHA, Reydeval. Introdução ao Analysis Services 2005. Disponível em < http://www.devmedia.com.br/introducao-ao-analysis-services-2005-parte-2/5730> Acesso em: 08 abr. 2014. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 ROSINI, Alessandro Marco; PALMISANO, Ângelo. Administração de sistemas de informação e a gestão do conhecimento. São Paulo: Pioneira Thomson Learning, 2003. Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014