Uma análise dos dados acadêmicos das Faculdades de Tecnologia do Centro Paula Souza utilizando a tecnologia de Data Warehouse. Silvia Batista da Silva1, Ms.Maria das Graças J. M. Tomazela1, Dr.Aldo Pontes1 1 Faculdade de Tecnologia de Indaiatuba (FATEC-ID) – Indaiatuba, SP – Brasil [email protected], [email protected], [email protected] Abstract. This article bring a study about Data Warehouse technology and was based adapting the regular disciplines of an Brazilian University of Technology known as FATEC (Faculdades de Tecnologia do Centro Paula Souza), where the objective was provide information to the institution strategic decisions. After the kickoff a deep bibliographic research was done followed by a Data Mart model development and according to the institution demand, an interface was created to make easier the model application by ETL process and progressive analysis. To verify the outcomes the model was implemented and capable to identify strategy information to the institution. Resumo. Este artigo apresenta um estudo sobre a tecnologia de Data Warehouse, realizando uma pesquisa sobre aproveitamento das disciplinas dos cursos das Faculdades de Tecnologia do Centro Paula Souza, tendo como objetivo disponibilizar informações para apoio à tomada de decisões na Instituição. Para desenvolver este trabalho foram realizadas pesquisas bibliográficas como referencial teórico, em seguida foidesenvolvido um modelo de Data Mart de acordo com as informações que eram necessárias para a Instituição, foi tambémcriada uma interface para manipulação do modelo de Data Mart e realizado o processo de ETL e a análise.Foi possível verificar que o modelo implementado é capaz de identificar informações estratégicas para a instituição. 1. Introdução O Ensino Tecnológico vem se destacando cada vez mais no cenário brasileiro, prova disso é que tem-se expandido e conquistado reconhecimento no meio educacional, mas nem sempre foi assim, no estado de São Paulo, um dos maiores do país, as primeiras iniciativas da educação tecnológica enfrentaram, desde o seu surgimento, várias dificuldades para conseguir conquistar esse reconhecimento, pois não era considerado por muitos como graduação. Nesse contexto, o Centro Estadual de Ensino Tecnológico Paula Souza (doravante Centro Paula Souza) destaca-se por ser um dos pioneiros do ensino tecnológico. O Centro Paula Souza é uma instituição pública gratuita de ensino superior de responsabilidade do Governo do Estado de São Paulo, e que tem por finalidade a articulação, a realização e o desenvolvimento da educação tecnológica, nos 2º e 3º graus, dentre uma das responsabilidades da Instituição estão as Faculdades Tecnológicas (Fatecs), atualmente as Fatecs possuem mais de sessenta e cinco mil alunos matriculados em seus cursos nos quais são investidos, anualmente, mais de um bilhão e setecentos milhões de reais pelo Governo do Estado de São Paulo. Com esse crescimento acelerado e alto investimento feito pelo Governo do Estado de São Paulo nessa Instituição, as Fatecs precisam se atentar cada vez mais para as tomadas de decisões. Dessa forma, temos como objetivo propor ao Centro Paula Souza a utilização da tecnologia de Data Warehouse (DW), resultando em um Data Mart (DM) para viabilizar a análise do aproveitamento das disciplinas dos cursos e, dessa forma, contribuir para a tomada de decisão na Instituição. Com a tecnologia de Data Warehouse será possível identificar de maneira rápida e eficaz o cenário da Instituição no que diz respeito ao aproveitamento nas disciplinas dos cursos e, dessa forma facilitar a tomada de ações corretivas e preventivas, visando à otimização da produtividade dos cursos bem como a redução das dificuldades encontradas em seus processos organizacionais, contribuindo para o desenvolvimento da educação e da sociedade em geral. A seção 2 do presente artigo apresenta os principais conceitos da tecnologia de Data Warehouse, e indica alguns exemplos de trabalhos relacionados na área de educação. Na seção 3 descrevemos a metodologia de desenvolvimento. A seção 4 descreve a versão piloto implantada e alguns dos principais resultados obtidos com a aplicação dos recursos de Data Warehouse. Conclusões e perspectivas de trabalhos futuros são fornecidas na seção 5. 2. Data Warehouses e Trabalhos Relacionados De acordo com Machado (2010), Data Warehouse tem como objetivo disponibilizar informações para apoio à tomada de decisões, como um armazém de dados, no qual os dados são organizados de acordo com a sua importância e foco da organização. Os dados são orientados por assuntos, variáveis no tempo, não voláteis e integrados. Ou seja, os dados são organizados de acordo com o que é de importância para a organização, representam um valor em um determinado momento de tempo como no momento em que são capturados, e em outro momento pode trazer outro resultado. Os dados depois de carregados para um Data Warehouse só poderão ser consultados, portanto, não poderão mais ser alterados, mantendo um histórico que possibilita a análise de acordo com o tempo. A tecnologia de Data Warehousingconsiste no processo de extração dos dados de fontes de sistemas transacionais também conhecidos como Sistemas OLTP, na organização e integração desses dados de forma consistente. Sendo assim a extração, organização e integração dos dados também conhecido como Processo ETL devem ser realizadas garantindo a alta qualidade e confiabilidade das informações, assim como a granularidade adequada. A granularidaderefere-se ao nível de sumarização dos elementos e de detalhe disponíveis nos dados, é considerada o mais importante aspecto do projeto de um Data Warehouse, dessa forma esáa diretamente relacionadaàperformance dos dados. A tecnologia de Data Warehouse utiliza-se também da Modelagem Multidimensional. A Modelagem Multidimensional é simples, expressiva e fácil de entender, desenvolvida de acordo com a necessidade da organização, então é possível manuseá-la de acordo com o que foi estipulado pelos mesmos, utilizando operações OLAP (OnLineAnalisingProcessing) que possibilitam a exploração dos dados de um Data Warehouse, são aplicações nas quais os usuários finais têm acesso e conseguem extrair os dados de suas bases de dados e construir relatórios de acordo com as suas necessidades. Os elementos básicos de um modelo multidimensional são três: Fatos, Dimensões e Medidas (variáveis), conforme descrito a seguir. Fatos: Na visão de Machado (2010, p.97), “fato é tudo aquilo que pode ser representado por um valor aditivo, ou melhor, sem academicismos, por meio de valores numéricos”, esses valores são conhecidos como métricas ou medidas.Os elementos que participam de um fato, seja qual for, são, no mínimo, quatro conforme ilustramos na Figura 1, esses elementos são também conhecidos como Dimensões. Figura 1 – Elementos do Fato Dimensões: De acordo com Machado (2010, p.111), “dimensões são elementos, as entidades que participam de algum fato, o “por” dos dados”, damos um exemplo baseando-se em nosso trabalho, mostramos abaixo que uma análise sobre aproveitamento de cursos envolve no mínimo quatro elementos participantes desse fato, sendo que a dimensão tempo é de suma importância em todo modelo de dados de um Data Warehouse. Na Figura 2 ilustramos um modelo de dimensão no qual podemos analisar o aproveitamento das disciplinas: Figura 2 – Dimensão Aproveitamento Curso Medidas: De acordo com Machado (2010) a principal utilização de um Data Mart é a consulta de dados históricos que estão normalmente sumarizados por períodos de tempo, e geralmente o que se deseja ver são valores numéricos e sua evolução em um espaço de tempo, com cálculos de transformação desses dados. Esses valores numéricos são denominadosmedidas ou métricas. Diferente da modelagem tradicional a modelagem multidimensional tem um estilo extremamente assimétrico, que facilita sua leitura e interpretação, os modelos de dados que estruturam a modelagem multidimensional são: Modelo Estrela e Modelo Snowflake. (MACHADO, 2010). Modelo Estrela: De acordo com Machado (2010, p.92), “o modelo estrela é a estrutura básica de um modelo de dados multidimensional”, composta por uma grande entidade central denominada fato e suas entidades menores denominadas dimensões, que ficam ao redor dessa entidade central, formando uma estrela. Aindasegundo Machado (2010, p.92), “os relacionamentos entre a entidade fato e as dimensões são simples ligações entre as duas entidades em um relacionamento de um para muitos no sentido da dimensão para o fato”. A Figura 3 demonstra o modelo estrela. Figura 3 – Modelo Estrela Modelo Snowflake: O modelo de dados Snowflake também conhecido como Floco de Neve é similar ao modelo estrela em seu design, com uma tabela central denominada fato e suas dimensões. De acordo com Machado (2010, p.93), “o modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros”, no qual podemos definir relacionamentos muitos para um entre os membros de uma dimensão, formando assim uma hierarquia por meio desses relacionamentos entre entidades dimensões. (MACHADO, 2010). A Figura 4 mostra o modelo Snowflake. Figura 4 – Modelo Snowflake Existem vários projetos propostos na área de educação que utilizam Data Warehouse. Por exemplo, o trabalho de Domenico (2001) propôs a criação de um modelo de Data Mart na Universidade do Oeste de Santa Catarina – UNOESC. O modelo resultou na tabela Matrícula como fato e suas dimensões: Aluno, Curso, Disciplina e Tempo. Na pesquisa realizada o autor ressalta que o modelo criado tanto aponta informações já intuitivas aos dirigentes, como deduções que levaram os dirigentes acadêmicos à reflexão, chegando à conclusão que o processo de gestão é um processo puramente humano, por mais informatizado que seja. Porém, a vantagem do Data Mart em uma Instituição de Ensino Superior é propiciar aos gestores acadêmicos uma significativa economia de tempo e esforço no processo de decisão, proporcionando uma maior probabilidade de acertos e precisão. Outro trabalho citado é o de Clemes (2001) que implementa um modelo de Data Warehouse na Universidade Federal de Santa Catarina. O autor integra os seguintes Data Marts: Recursos Humanos, Financeiro, Graduação que traz informações sobre os alunos e curso, Pós-graduação que traz informações sobre os professores, aulas que ministram, projetos envolvidos, entre outras informações. A eficácia da solução foi comprovada quando após o desenvolvimento do protótipo que integrou em um só ambiente essas informações de diversas fontes a Instituição adquiriu vantagem não só na economia de tempo e esforço no processo de tomada de decisão, más também na facilidade em responder a auditorias e comprovar os indicadores da instituição. Já Debatin (2002), auxilia os executivos de uma organização escolar na tomada de decisões estratégicas, para tanto implementou um sistema de informação executiva, com base em um Data Warehouse, que permite obter informações sobre as receitas e despesas de cada curso, dados estatísticos como percentuais de aprovação, reprovação, desistências, transferências e outros. Para a elaboração deste trabalho foi utilizado a técnica de cubo de decisão. O trabalho de Ferreira Junior et all (2006), propõe o desenvolvimento e implantação da tecnologia de Data Warehouse nos Institutos Superiores da Rede Estadual de Ensino – FAETEC, que atende cerca de 439 mil alunos por ano. O projeto piloto deu-se no ISTCC-RJ – Instituto Superior de Tecnologia em Ciência da Computação do Rio de Janeiro, pertencente à Rede FAETEC, para isso foi criado um Data Mart baseado na implementação bottom-up, o estudo foi realizado sobre os Alunos para analisar questões sociais como motivos que levaram a escolha do instituto ou tempo de deslocamento entre residência e instituto entre outras variáveis. Fujiwara (2006) apresenta a tecnologia de Data Warehouse como Instrumento de Avaliação Acadêmica, analisando a relação entre vagas e matrículas, conceitos de cada curso nas avaliações externas e informações das avaliações feitas pelos discentes sobre cada disciplina, tendo desenvolvido um estudo de caso com o CESPE, a Secretaria de Planejamento (SPL) e o Departamento de Ciências da Computação (CIC) da Universidade de Brasília, proporcionando que a alta e média administração poderão obter informações com muita agilidade e poderão direcionar seus recursos para atividade certamente mais nobres, como otimização de processos internos ou qualquer outra atividade que melhore indicativos de produtividade ou os resultados diretos da empresa. Diamantino (2012) apresenta um projeto no qual implementa a tecnologia de Data Warehouse com a utilização de ferramentas de Business Intelligence para medir o aproveitamento das capacidades do aluno. O autor defende a idéia de que o aproveitamento das capacidades do aluno é importante para criar um cidadão motivado e capaz de assumir o seu papel na sociedade. Para o trabalho ele utilizou os dados das avaliações dos alunos do Agrupamento Afonso de Paiva. Com a informação produzida, é orientada a formulação de metas educativas por objetivo para os alunos, estimulando o aluno a atingir patamares de sucesso que de outra forma seriam mais difíceis de alcançar e também contribuindo no diagnóstico das medidas educativas implementadas. No artigo de Todesco; Martins e Souza (s.d) é apresentado uma proposta para contribuir na Avaliação Institucional provendo acesso a algumas informações analíticas vinculadas ao desempenho dos professores dentro da Universidade do Vale do Itajaí tendo como eixo a relação com a gestão do ensino e o fornecimento de elementos para a tomada de decisão. Depois dessa breve revisão da literatura podemos identificar que embora existam várias trabalhos ainda verifica-se certa carência na área da Educação com a tecnologia de Data Warehouse, pela expansão da área e complexidade que ela abrange, se a tecnologia fosse mais aplicada poderia contribuir para o desenvolvimento da educação de forma geral. 3. Materiais e métodos Esta seção tem por objetivo apresentar uma visão geral do projeto de implantação da tecnologia de Data Warehouse nas Faculdades de Tecnologia doCentro Paula Souza (doravante Fatecs). Para a elaboração deste estudo, utilizamos a ferramenta da Microsoft SQL Server 2008, por se tratar de uma das ferramentas mais citadas em artigos de especialistas da área e também por existir um convênio entre a Microsoft e o Centro Paula Souza. Com a ferramenta SQL Server 2008 foi possível criarmos o Banco de Dados do nosso modelo de Data Mart. A principio iniciamos a implementação do Data Mart utilizando dados históricos na área acadêmica das Fatec Botucatu, Fatec Indaiatuba, Fatec Sorocaba e Fatec Tatuí, como projeto piloto. Esses dados foram obtidos, por meio de um requerimento ao Centro Paula Souza e autorização das Instituições separadamente. Os dados são dos anos: 2010, 2011, 2012 e 2013, salvos em planilhas eletrônicas, foram fornecidos por Semestre, sendo primeiro e segundo semestre, de um determinado ano e, para cada semestre de cada ano, os totais de matriculados, aprovados, reprovados, trancados, cancelados e desistentes no semestre. Esses dados foram disponibilizados pelo Sistema Acadêmico das Fatecs(SIGA) que armazena informações de toda a área acadêmica. Esse sistema foi implantado a partir de ano de 2010 e ainda não está totalmente integrado, pois, até a presente data, nem todas as unidades o utilizam, mas paulatinamente todas as Fatecs passarão a integrar o sistema. Como os dados foram armazenados em planilhas, foi necessário definir uma modelagem multidimensional, para depois criar as tabelas e assim carregá-los para o Data Mart. Como os dados são referentes ao aproveitamento das disciplinas dos cursos das Fatecs, foi estabelecida a Tabela Aproveitamento como fato, contando com as seguintes dimensões: Disciplinas, Cursos, Instituição e Tempo (ano e semestre). A partir dessa definição, foi estabelecido o nível de granularidade da tabela fato, com base no propósito dessa tabela, que é a do aproveitamento das disciplinas dos cursos, a tabela fato contém as seguintes informações: Número de matriculados, Número de aprovados, Número de reprovados, Número de trancados, Número de cancelados, Número de Desistentes e os campos que fazem a ligação com as tabelas dimensões: Código da Disciplina, Código do Curso, Código da Instituição, Código do Tempo (ano e semestre). Conforme ilustra a Figura 5. Figura 5 - Modelagem Multidimensional Depois da criação das Tabelas Dimensões e da Tabela Fato, concretizando o modelo multidimensional, o próximo passo foi o processo de extração, transformação e carga dos dados (ETL) para o Data Mart. Como os dados estavam em planilhas eletrônicas e precisavam ser carregados para o Data Mart, utilizamos a ferramenta SQL Server 2008 Integration Services (SSIS) para realizar o processo de ETL. Para migrar os dados criamos um Projeto no Integration Services (SSIS), criando um pacote para integração dos dados entre a Microsoft Office Excel e Ambiente Temporário, responsável por extrair dados das planilhas em Excel, realizar sua transformação, e dar carga para o Ambiente Temporário. Depois de migrar os dados das planilhas em Excel para o Ambiente Temporário, o próximo passo foi popular as Tabelas de Dimensões e a Tabela Fato. Para isso criamos outro pacote no Integration Services (SSIS) para integração dos dados que estavam no Ambiente Temporário para as Dimensões e o Fato. Para popular as Tabelas Dimensões e a Tabela Fato, fizemos a conexão com a Fonte de Dados (Ambiente Temporário) e o Data Mart, para cada dimensão utilizaamos essa conexão para pegar os dados da Fonte de Dados e migrarmos para o destino. Depois de criar todas as conexões entre a Fonte de Dados Ambiente Temporário e as Dimensões Instituição, Curso, Disciplina e Tempo, o próximo passo foi popular a Tabela Fato Aproveitamento, quando criamos um componente de Fonte de Dados e um componente para o destino Fato Aproveitamento, conforme ilustra a Figura 6. Figura 6 - Carga dos Dados para o Fato Aproveitamento Com o Data Mart devidamente populado, depois da integração dos dados por meio do processo ETL, criamos, pela Ferramenta OLAP, o Cubo de Dados proporcionando a análise dos dados pelo modelo multidimensional. Como utilizamos o SQL Server 2008 e a Ferramenta Integration Services 2008 da SQL Server, para a análise dos dados utilizamos também uma Ferramenta OLAP Analysis Services da Microsoft SQL Server 2008. Para criação do Cubo de Dados de fizemos uma conexão com o modelo de Data Mart desenvolvido pelo Integration Services (SSIS), selecionando as Tabelas Dimensões e a Tabela Fato Aproveitamento, conforme ilustra a Figura 7. Figura 7 - Tabelas Dimensões e a Tabela Fato Aproveitamento para Cubo de Dados Depois de criado a conexão com as Dimensões e a Tabela Fato Aproveitamento, foi necessária a criação das Dimensões definindo quais os dados seriam exibidos em cada Dimensão e somente após a definição das Dimensões com os respectivos dados que seriam exibidos, criamos o nosso Cubo de Dados para a visualização dos dados em modelo multidimensional.No Cubo de Dados é necessário identificarmos primeiro a Tabela Fato Aproveitamento, pois, como já criamos as Dimensões e a Tabela Fato Aproveitamento está integrada com as Dimensões o Cubo de Dados trabalhará com as informações que estão na Tabela Fato Aproveitamento.Depois de selecionarmos o Fato Aproveitamento, selecionamos todas as Medidas que compõem o Fato e após as Dimensões que compõem o Fato Aproveitamento. Depois de selecionadas as Medidas e as Dimensões do Cubo de Dados, executamos nosso Cubo de Dados para concluir sua criação e implementação. Com o Cubo de Dados devidamente construído, podemos visualizar sua estrutura multidimensional utilizando o navegador do Cubo, com as respectivas dimensões e medidas do Fato Aproveitamento. Na Figura 8 ilustramos o Cubo de Dados criado e processado, no qual já podemos arrastar os dados que queremos demonstrar e assim proporcionar contexto de análise. Na ilustração abaixo selecionamos a sigla de uma determinada Instituição, o Curso e as Disciplinas que formam aquele curso, para podermos analisar o total de matriculados, de aprovados, reprovados nas respectivas disciplinas. Figura 8 – Visualização do Cubo de Dados Para facilitar ainda mais a visualização dos dados para a Instituição criamos um indicador chave de desempenho (KPI) que tem como objetivo medir o nível de desempenho para metas definidas pela Instituição. Para o nosso Cubo de Dados criamos um KPI, para que a Instituição possa identificar o desempenho das disciplinas. O KPI criado é para identificar as aprovações das disciplinas, ou seja, quando a disciplina tem um número de aprovações maior do que 90% aparecerá o sinal verde, as que tiveram um aproveitamento entre 60% e 90% aparecerá o sinal amarelo e as que tiveram o número de aprovações menor do que 60% aparecerá o sinal vermelho, o que significa que a Instituição deve se atentar naquela disciplina e tomar uma ação corretiva ou identificar possíveis fatores que estão contribuindo para um alto índice de reprovações, desistências, cancelamentos ou trancamentos na disciplina. Criamos esse KPI somente para demonstrar que pela tecnologia de Data Warehouse é possível criarmos indicadores que apontem como está o desempenho dos cursos, os KPIs são determinados pela instituição, de acordo com as suas metas e objetivos, nesse primeiro momento como não havíamos discutido as necessidades de análise com a Instituição, criamos somente um KPI para fazermos uma demonstração. O KPI é criado pelo Analysis Services na aba de KPIs. Depois de criado o KPI, processamos nosso Cubo de Dados novamente. Os resultados desse processo serão mostrados na próxima seção. 4. Análise dos Resultados Nesta seção mencionamos como o usuário poderá visualizar os dados e fazer a análise das informações, visto que o foco do trabalho não é apontar resultados, mas sim mostrar como a tecnologia de Data Warehouse pode contribuir para a Instituição na identificação do aproveitamento das disciplinas e para isso fizemos algumas demonstrações de resultados já identificados nesse primeiro momento. A ferramenta do Analysis Services pode ser visualizada pelo Microsoft Office Excel 2007, para facilitar a análise dos dados integramos nosso pacote do Analysis Services com a Microsoft Office Excel, criando uma conexão com o Analysis Services e exibindo os dados por meio de Planilha Dinâmica, ou seja, conforme são incrementados dados no Data Mart a planilha é atualizada automaticamente. A partir da tabela dinâmica, podemos definir os tipos de consultas que queremos realizar, fazendo a definição dos dados no rótulo de linha, rótulo de coluna e os totais para filtrar os dados contidos na Tabela Fato Aproveitamento.Fazemos a seguir uma demonstração de alguns tipos de análises que podemos realizar utilizando o Cubo de Dados pelo Excel. Mostramos abaixo o KPI criado, no qual selecionamos um determinado Curso, o ano de 2012 primeiro e segundo semestres e selecionamos o KPI para verificar a porcentagem de aprovações para cada disciplina conforme ilustra a Figura 9, no qual podemos observar que para o Curso demonstrado mostrando somente um determinado conjunto de disciplinas as porcentagens variam, porém, para algumas disciplinas a Instituição precisa se atentar, pois, o índice de aprovações está abaixo do esperado, os que aparecem com status em vermelho, ou seja, para essas disciplinas a Instituição deve criar ações visando a uma melhora na produtividade. As causas que levam a esse Status podem ser diversas e cabe aos gestores analisarem as causas e tomar as decisões corretivas e preventivas que forem necessárias. Vale ressaltar que nesse exemplo definimos uma porcentagem de 90% para um bom aproveitamento, somente para uma simulação. Futuramente serão definidos KPI pela Instituição de acordo com as metas de desempenho definidas por seus gestores. Figura 9 - Visualizando dados por KPI Pela planilha dinâmica também podemos selecionar os dados de todos os cursos com suas respectivas disciplinas, por ano e semestre e os totais de matriculados, aprovados, reprovados, cancelados, desistentes e trancados, dando uma visão mais ampla para que a Instituição possa fazer uma análise geral do histórico dos dados. Selecionamos, por exemplo, do Cubo de Dados uma determinada Disciplina dos anos de 2010, 2011 e 2012, no qual identificamos que para essa disciplina o número de reprovados e trancados se destaca em relação ao número de matriculados, o que indica que a Instituição deve se atentar a disciplina, revendo o conteúdo ofertado para aquela disciplina, o perfil do aluno, o método de ensino, enfim, criando ações que possam melhorar o aproveitamento da disciplina. Depois de selecionar esses dados no Cubo de Dados também podemos criar gráficos, o que possibilita uma análise ainda melhor, conforme ilustra a Figura 10. Figura 10 - Gráfico para ilustrar totais de uma disciplina e curso Por esse gráfico é possível identificarmos que a disciplina Algoritmos, no ano de 2010 teve no primeiro semestre um número de 39 matriculados, sendo 23% de aprovações e 77% de reprovações, no segundo semestre de 2010 o número de matriculados foi o mesmo, porém, o número de aprovações aumentou para 33% e o número de reprovações diminuiu para 23% mas nesse semestre teve um aumento no número de cancelamentos para 13% e trancamentos para 31%. No ano de 2011 o número de matriculados aumentou em 2 e foi para 41 se comparando com 2010 que teve 39 matriculados, no primeiro semestre de 2011 o número de aprovados foi de 29% e novamente ocorreu um aumento no número de reprovações para 58% e uma diminuição nos números de cancelamentos para 3% e trancamentos para 10%. E no segundo semestre de 2011 o número de matriculados caiu para 34, sendo 35% de aprovações, 62% de reprovações e 3% de trancamentos. Em 2012 o número de matriculados foi para 7 no primeiro semestre e somente 1 matriculado no segundo semestre, ou seja, tendo uma grande redução, mostrando um fator de atenção, nas análises dos próximos semestres. Por fim, para facilitar ainda mais a manipulação e visualização dos dados para a Instituição criamos pelo Visual Studio 2010 uma interface para o Data Mart tornando o processo de ETL e a análise dos dados mais dinâmica e fácil para o usuário. A interface está dividida de acordo com os pacotes do Integration Services (SSIS) e o Analysis Services. A interface tem um menu com as opções Ambiente Temporário (carregar dados), Data Mart (carregar Dimensões e Fato), Resultados (conectada com o Excel) e a opção de sair do sistema. 5. Conclusões Com o crescimento do Ensino Tecnológico e o seu destaque cada vez maior no cenário brasileiro, conquistando o reconhecimento no meio educacional, o Centro Paula Souza se destaca por ser um dos pioneiros do ensino tecnológico, uma instituição pública gratuita de ensino superior de responsabilidade do Governo do Estado de São Paulo, no qual somente as Fatecs possuem mais de sessenta e cinco mil alunos matriculados em seus cursos nos quais são investidos, anualmente, mais de um bilhão e setecentos milhões de reais pelo Governo do Estado de São Paulo. Com esse crescimento acelerado e alto investimento feito pelo Governo do Estado de São Paulo nessa Instituição, as Fatecs precisam se atentar cada vez mais para as tomadas de decisões. A tecnologia de Data Warehouse vem nesse sentido, de agregar algo a mais para a organização, uma vez que bem planejada e alinhada com objetivos traçados pela organização, é uma tecnologia que poderá contribuir na análise dos dados, sendo assim a organização poderá se beneficiar e terá base paraa tomada de decisão. Neste estudo fizemos um levantamento sobre a Instituição Centro Paula Souza, a tecnologia de Data Warehouse, mostramos também trabalhos no qual foi utilizada a tecnologia de Data Warehouse aplicada na área de Educação demonstrando sua contribuição para muitas áreas da Educação. Por meio desse conteúdo teórico tivemos base para criar nosso Data Mart, focando no departamento acadêmico, definindo um modelo para contribuir com a Instituição na identificação do aproveitamento das disciplinas dos cursos das Fatecs do Centro Paula Souza. Foram utilizadas neste trabalho as ferramenta do SQL Server 2008, a partir do qualrealizamos o processo ETL,importando dados do Excel para um Ambiente Temporário e do Ambiente Temporário para o Data Mart, pelo Processo ETL integramos todos os dados e carregamos para o Data Mart. Após o carregamento dos dados para o Data Mart, utilizamos a ferramenta OLAP também do SQL Server 2008 e o Microsoft Office Excel para facilitar o processo de análise dos dados fornecendo apoio interativo e possibilitando a tomada de decisão para a Instituição, criamos KPI, oferecendo perspectivas de diversas formas por meio de planilhas dinâmicas. Criamos uma interface por meio do Visual Studio 2010 para facilitar o processo ETL e a análise dos resultados pelo usuário final, tornando o processo mais fácil e dinâmico visto que, para o usuário final que muitas vezes não obtém o conhecimento técnico das ferramentas pode ser mais difícil sua manipulação. Bibliografia CLEMES, Márcio. Data Warehouse como suporte ao sistema de informações gerenciais em uma instituição de Ensino Superior: Estudo de Caso na UFSC. 117p. Dissertação (Mestrado em Engenharia de Produção) – Programa de Pós-Graduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis, 2001. DATE, C. J. Introdução a sistemas de banco de dados/ C. J. Date; tradução de Daniel Vieira; revisão técnica Sergio Lifschitz. Rio de Janeiro: Elsevier, 2003. DEBATIN, Paulo Cesar. Sistema de Informações para Executivo Aplicado na Área Escolar, utilizando Data Warehouse. 69p. Trabalho de Bacharelado em Ciências da Computação, Universidade Regional de Blumenau, Blumenau, 2002. DIAMANTINO, Júlio António Lourenço. Sistema de Acompanhamento do Progresso do aluno. 108p. Dissertação (Mestrado em Desenvolvimento de Software e Sistemas Interativos), Escola Superior de Tecnologia - Instituto Politécnico de Castelo Branco, 2012. DOMENICO, J. A. D. Definição de um ambiente data warehouse em uma instituição de ensino superior. 137p. Dissertação (Mestrado em Engenharia de Produção) – Programa de PósGraduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis, 2001. FERREIRA JUNIOR, Geraldo, et.all. Data Warehouse e Mineração de Dados nos Institutos Superiores da Faetec. Instituto Superior de Tecnologia em Ciência da Computação - FAETEC, 2006. 12 p. FUJIWARA, Daniel Kenji. Data Warehouse como instrumento de Suporte à Avaliação Acadêmica. 98p., Universidade de Brasília – Instituto de Ciências Exatas Departamento de Ciência da Computação, Brasília, 2006. INMON, William H. Como Construir o Data Warehouse. Campus, Rio de Janeiro, 1997. LIMA, Silvia Elena,; SANTOS FILHO, Salvador.; SANTOS FILHO, Clovis Roberto. Os (des) caminhos da educação Profissional e Tecnológica no estado de São Paulo. São Paulo: Sinteps, 2008. 208 p. MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de DATA WAREHOUSE. 5 ed. rev. e atual..São Paulo:Érica, 2010, 314 p. MACHADO NETO, Alfredo José. Globalização e gestão universitária: um estudo das instituições municipais de ensino superior do Estado de São Paulo. Franca: FACEF, 2002. 205 p. MANNINO, Michael V., Projeto Desenvolvimento de Aplicações & Administração de Banco de Dados/ Michael V. Mannino; tradução Beth Honorato...[et all.]; revisão técnica Antonio Fernandes Nunes Guardado, Sidney da Silva Viana, São Paulo: McGraw-Hill, 2008 . TODESCO, J. L.; MARTINS, L. C.; SOUZA, N. Os Sistemas de Apoio à Decisão a serviço do processo de Avaliação Institucional: Estudo de Caso da UNIVALI. 8p., Universidade do Vale do Itajaí, Santa Catarina. TURBAN, Efraim, et.all. Business Intelligence: Um enfoque gerencial para a inteligência do negócio/ tradução Fabiano Bruno Gonçalves; revisão técnica . Instituto Superior de Tecnologia em Ângela FreitagBrodbeck, Porto Alegre: Bookman, 2009. TURBAN, E.; RAINER, R. K.; POTTER, R. E. Administração de Tecnologia da Informação: Teoria e Prática. Tradução Daniel Vieira. Rio de Janeiro: Campus, 2005. 618 p.