this PDF file - Fatec-ID

Propaganda
Uma análise dos dados acadêmicos das Faculdades de
Tecnologia do Centro Paula Souza utilizando a tecnologia de
Data Warehouse.
Silvia Batista da Silva1, Ms.Maria das Graças J. M. Tomazela1, Dr.Aldo Pontes1
1
Faculdade de Tecnologia de Indaiatuba (FATEC-ID) – Indaiatuba, SP – Brasil
[email protected], [email protected],
[email protected]
Abstract. This article bring a study about Data Warehouse technology and
was based adapting the regular disciplines of an Brazilian University of
Technology known as FATEC (Faculdades de Tecnologia do Centro Paula
Souza), where the objective was provide information to the institution strategic
decisions. After the kickoff a deep bibliographic research was done followed
by a Data Mart model development and according to the institution demand,
an interface was created to make easier the model application by ETL process
and progressive analysis. To verify the outcomes the model was implemented
and capable to identify strategy information to the institution.
Resumo. Este artigo apresenta um estudo sobre a tecnologia de Data
Warehouse, realizando uma pesquisa sobre aproveitamento das disciplinas
dos cursos das Faculdades de Tecnologia do Centro Paula Souza, tendo como
objetivo disponibilizar informações para apoio à tomada de decisões na
Instituição. Para desenvolver este trabalho foram realizadas pesquisas
bibliográficas como referencial teórico, em seguida foidesenvolvido um
modelo de Data Mart de acordo com as informações que eram necessárias
para a Instituição, foi tambémcriada uma interface para manipulação do
modelo de Data Mart e realizado o processo de ETL e a análise.Foi possível
verificar que o modelo implementado é capaz de identificar informações
estratégicas para a instituição.
1. Introdução
O Ensino Tecnológico vem se destacando cada vez mais no cenário brasileiro, prova
disso é que tem-se expandido e conquistado reconhecimento no meio educacional, mas
nem sempre foi assim, no estado de São Paulo, um dos maiores do país, as primeiras
iniciativas da educação tecnológica enfrentaram, desde o seu surgimento, várias
dificuldades para conseguir conquistar esse reconhecimento, pois não era considerado
por muitos como graduação. Nesse contexto, o Centro Estadual de Ensino Tecnológico
Paula Souza (doravante Centro Paula Souza) destaca-se por ser um dos pioneiros do
ensino tecnológico.
O Centro Paula Souza é uma instituição pública gratuita de ensino superior de
responsabilidade do Governo do Estado de São Paulo, e que tem por finalidade a
articulação, a realização e o desenvolvimento da educação tecnológica, nos 2º e 3º
graus, dentre uma das responsabilidades da Instituição estão as Faculdades
Tecnológicas (Fatecs), atualmente as Fatecs possuem mais de sessenta e cinco mil
alunos matriculados em seus cursos nos quais são investidos, anualmente, mais de um
bilhão e setecentos milhões de reais pelo Governo do Estado de São Paulo.
Com esse crescimento acelerado e alto investimento feito pelo Governo do
Estado de São Paulo nessa Instituição, as Fatecs precisam se atentar cada vez mais para
as tomadas de decisões.
Dessa forma, temos como objetivo propor ao Centro Paula Souza a utilização da
tecnologia de Data Warehouse (DW), resultando em um Data Mart (DM) para
viabilizar a análise do aproveitamento das disciplinas dos cursos e, dessa forma,
contribuir para a tomada de decisão na Instituição. Com a tecnologia de Data
Warehouse será possível identificar de maneira rápida e eficaz o cenário da Instituição
no que diz respeito ao aproveitamento nas disciplinas dos cursos e, dessa forma facilitar
a tomada de ações corretivas e preventivas, visando à otimização da produtividade dos
cursos bem como a redução das dificuldades encontradas em seus processos
organizacionais, contribuindo para o desenvolvimento da educação e da sociedade em
geral.
A seção 2 do presente artigo apresenta os principais conceitos da tecnologia de
Data Warehouse, e indica alguns exemplos de trabalhos relacionados na área de
educação. Na seção 3 descrevemos a metodologia de desenvolvimento. A seção 4
descreve a versão piloto implantada e alguns dos principais resultados obtidos com a
aplicação dos recursos de Data Warehouse. Conclusões e perspectivas de trabalhos
futuros são fornecidas na seção 5.
2. Data Warehouses e Trabalhos Relacionados
De acordo com Machado (2010), Data Warehouse tem como objetivo disponibilizar
informações para apoio à tomada de decisões, como um armazém de dados, no qual os
dados são organizados de acordo com a sua importância e foco da organização. Os
dados são orientados por assuntos, variáveis no tempo, não voláteis e integrados. Ou seja,
os dados são organizados de acordo com o que é de importância para a organização,
representam um valor em um determinado momento de tempo como no momento em que
são capturados, e em outro momento pode trazer outro resultado. Os dados depois de
carregados para um Data Warehouse só poderão ser consultados, portanto, não poderão
mais ser alterados, mantendo um histórico que possibilita a análise de acordo com o tempo.
A tecnologia de Data Warehousingconsiste no processo de extração dos dados de
fontes de sistemas transacionais também conhecidos como Sistemas OLTP, na organização
e integração desses dados de forma consistente. Sendo assim a extração, organização e
integração dos dados também conhecido como Processo ETL devem ser realizadas
garantindo a alta qualidade e confiabilidade das informações, assim como a granularidade
adequada. A granularidaderefere-se ao nível de sumarização dos elementos e de detalhe
disponíveis nos dados, é considerada o mais importante aspecto do projeto de um Data
Warehouse, dessa forma esáa diretamente relacionadaàperformance dos dados. A
tecnologia de Data Warehouse utiliza-se também da Modelagem Multidimensional.
A Modelagem Multidimensional é simples, expressiva e fácil de entender,
desenvolvida de acordo com a necessidade da organização, então é possível manuseá-la
de acordo com o que foi estipulado pelos mesmos, utilizando operações OLAP
(OnLineAnalisingProcessing) que possibilitam a exploração dos dados de um Data
Warehouse, são aplicações nas quais os usuários finais têm acesso e conseguem extrair
os dados de suas bases de dados e construir relatórios de acordo com as suas
necessidades. Os elementos básicos de um modelo multidimensional são três: Fatos,
Dimensões e Medidas (variáveis), conforme descrito a seguir.
Fatos: Na visão de Machado (2010, p.97), “fato é tudo aquilo que pode ser
representado por um valor aditivo, ou melhor, sem academicismos, por meio de valores
numéricos”, esses valores são conhecidos como métricas ou medidas.Os elementos que
participam de um fato, seja qual for, são, no mínimo, quatro conforme ilustramos na Figura
1, esses elementos são também conhecidos como Dimensões.
Figura 1 – Elementos do Fato
Dimensões: De acordo com Machado (2010, p.111), “dimensões são elementos,
as entidades que participam de algum fato, o “por” dos dados”, damos um exemplo
baseando-se em nosso trabalho, mostramos abaixo que uma análise sobre
aproveitamento de cursos envolve no mínimo quatro elementos participantes desse fato,
sendo que a dimensão tempo é de suma importância em todo modelo de dados de um
Data Warehouse. Na Figura 2 ilustramos um modelo de dimensão no qual podemos
analisar o aproveitamento das disciplinas:
Figura 2 – Dimensão Aproveitamento Curso
Medidas: De acordo com Machado (2010) a principal utilização de um Data Mart
é a consulta de dados históricos que estão normalmente sumarizados por períodos de tempo,
e geralmente o que se deseja ver são valores numéricos e sua evolução em um espaço de
tempo, com cálculos de transformação desses dados. Esses valores numéricos são
denominadosmedidas ou métricas.
Diferente da modelagem tradicional a modelagem multidimensional tem um
estilo extremamente assimétrico, que facilita sua leitura e interpretação, os modelos de
dados que estruturam a modelagem multidimensional são: Modelo Estrela e Modelo
Snowflake. (MACHADO, 2010).
Modelo Estrela: De acordo com Machado (2010, p.92), “o modelo estrela é a
estrutura básica de um modelo de dados multidimensional”, composta por uma grande
entidade central denominada fato e suas entidades menores denominadas dimensões, que
ficam ao redor dessa entidade central, formando uma estrela. Aindasegundo Machado
(2010, p.92), “os relacionamentos entre a entidade fato e as dimensões são simples ligações
entre as duas entidades em um relacionamento de um para muitos no sentido da dimensão
para o fato”. A Figura 3 demonstra o modelo estrela.
Figura 3 – Modelo Estrela
Modelo Snowflake: O modelo de dados Snowflake também conhecido como
Floco de Neve é similar ao modelo estrela em seu design, com uma tabela central
denominada fato e suas dimensões. De acordo com Machado (2010, p.93), “o modelo
Snowflake é o resultado da decomposição de uma ou mais dimensões que possuem
hierarquias entre seus membros”, no qual podemos definir relacionamentos muitos para um
entre os membros de uma dimensão, formando assim uma hierarquia por meio desses
relacionamentos entre entidades dimensões. (MACHADO, 2010). A Figura 4 mostra o
modelo Snowflake.
Figura 4 – Modelo Snowflake
Existem vários projetos propostos na área de educação que utilizam Data
Warehouse. Por exemplo, o trabalho de Domenico (2001) propôs a criação de um
modelo de Data Mart na Universidade do Oeste de Santa Catarina – UNOESC. O
modelo resultou na tabela Matrícula como fato e suas dimensões: Aluno, Curso,
Disciplina e Tempo. Na pesquisa realizada o autor ressalta que o modelo criado tanto
aponta informações já intuitivas aos dirigentes, como deduções que levaram os
dirigentes acadêmicos à reflexão, chegando à conclusão que o processo de gestão é um
processo puramente humano, por mais informatizado que seja. Porém, a vantagem do
Data Mart em uma Instituição de Ensino Superior é propiciar aos gestores acadêmicos
uma significativa economia de tempo e esforço no processo de decisão, proporcionando
uma maior probabilidade de acertos e precisão.
Outro trabalho citado é o de Clemes (2001) que implementa um modelo de Data
Warehouse na Universidade Federal de Santa Catarina. O autor integra os seguintes
Data Marts: Recursos Humanos, Financeiro, Graduação que traz informações sobre os
alunos e curso, Pós-graduação que traz informações sobre os professores, aulas que
ministram, projetos envolvidos, entre outras informações. A eficácia da solução foi
comprovada quando após o desenvolvimento do protótipo que integrou em um só
ambiente essas informações de diversas fontes a Instituição adquiriu vantagem não só
na economia de tempo e esforço no processo de tomada de decisão, más também na
facilidade em responder a auditorias e comprovar os indicadores da instituição.
Já Debatin (2002), auxilia os executivos de uma organização escolar na tomada
de decisões estratégicas, para tanto implementou um sistema de informação executiva,
com base em um Data Warehouse, que permite obter informações sobre as receitas e
despesas de cada curso, dados estatísticos como percentuais de aprovação, reprovação,
desistências, transferências e outros. Para a elaboração deste trabalho foi utilizado a
técnica de cubo de decisão.
O trabalho de Ferreira Junior et all (2006), propõe o desenvolvimento e
implantação da tecnologia de Data Warehouse nos Institutos Superiores da Rede
Estadual de Ensino – FAETEC, que atende cerca de 439 mil alunos por ano. O projeto
piloto deu-se no ISTCC-RJ – Instituto Superior de Tecnologia em Ciência da
Computação do Rio de Janeiro, pertencente à Rede FAETEC, para isso foi criado um
Data Mart baseado na implementação bottom-up, o estudo foi realizado sobre os
Alunos para analisar questões sociais como motivos que levaram a escolha do instituto
ou tempo de deslocamento entre residência e instituto entre outras variáveis.
Fujiwara (2006) apresenta a tecnologia de Data Warehouse como Instrumento
de Avaliação Acadêmica, analisando a relação entre vagas e matrículas, conceitos de
cada curso nas avaliações externas e informações das avaliações feitas pelos discentes
sobre cada disciplina, tendo desenvolvido um estudo de caso com o CESPE, a
Secretaria de Planejamento (SPL) e o Departamento de Ciências da Computação (CIC)
da Universidade de Brasília, proporcionando que a alta e média administração poderão
obter informações com muita agilidade e poderão direcionar seus recursos para
atividade certamente mais nobres, como otimização de processos internos ou qualquer
outra atividade que melhore indicativos de produtividade ou os resultados diretos da
empresa.
Diamantino (2012) apresenta um projeto no qual implementa a tecnologia de
Data Warehouse com a utilização de ferramentas de Business Intelligence para medir o
aproveitamento das capacidades do aluno. O autor defende a idéia de que o
aproveitamento das capacidades do aluno é importante para criar um cidadão motivado
e capaz de assumir o seu papel na sociedade. Para o trabalho ele utilizou os dados das
avaliações dos alunos do Agrupamento Afonso de Paiva. Com a informação produzida,
é orientada a formulação de metas educativas por objetivo para os alunos, estimulando o
aluno a atingir patamares de sucesso que de outra forma seriam mais difíceis de alcançar
e também contribuindo no diagnóstico das medidas educativas implementadas.
No artigo de Todesco; Martins e Souza (s.d) é apresentado uma proposta para
contribuir na Avaliação Institucional provendo acesso a algumas informações analíticas
vinculadas ao desempenho dos professores dentro da Universidade do Vale do Itajaí
tendo como eixo a relação com a gestão do ensino e o fornecimento de elementos para a
tomada de decisão.
Depois dessa breve revisão da literatura podemos identificar que embora existam
várias trabalhos ainda verifica-se certa carência na área da Educação com a tecnologia
de Data Warehouse, pela expansão da área e complexidade que ela abrange, se a
tecnologia fosse mais aplicada poderia contribuir para o desenvolvimento da educação
de forma geral.
3. Materiais e métodos
Esta seção tem por objetivo apresentar uma visão geral do projeto de implantação da
tecnologia de Data Warehouse nas Faculdades de Tecnologia doCentro Paula Souza
(doravante Fatecs).
Para a elaboração deste estudo, utilizamos a ferramenta da Microsoft SQL
Server 2008, por se tratar de uma das ferramentas mais citadas em artigos de
especialistas da área e também por existir um convênio entre a Microsoft e o Centro
Paula Souza. Com a ferramenta SQL Server 2008 foi possível criarmos o Banco de
Dados do nosso modelo de Data Mart.
A principio iniciamos a implementação do Data Mart utilizando dados
históricos na área acadêmica das Fatec Botucatu, Fatec Indaiatuba, Fatec Sorocaba e
Fatec Tatuí, como projeto piloto. Esses dados foram obtidos, por meio de um
requerimento ao Centro Paula Souza e autorização das Instituições separadamente. Os
dados são dos anos: 2010, 2011, 2012 e 2013, salvos em planilhas eletrônicas, foram
fornecidos por Semestre, sendo primeiro e segundo semestre, de um determinado ano e,
para cada semestre de cada ano, os totais de matriculados, aprovados, reprovados,
trancados, cancelados e desistentes no semestre. Esses dados foram disponibilizados
pelo Sistema Acadêmico das Fatecs(SIGA) que armazena informações de toda a área
acadêmica. Esse sistema foi implantado a partir de ano de 2010 e ainda não está
totalmente integrado, pois, até a presente data, nem todas as unidades o utilizam, mas
paulatinamente todas as Fatecs passarão a integrar o sistema.
Como os dados foram armazenados em planilhas, foi necessário definir uma
modelagem multidimensional, para depois criar as tabelas e assim carregá-los para o
Data Mart. Como os dados são referentes ao aproveitamento das disciplinas dos cursos
das Fatecs, foi estabelecida a Tabela Aproveitamento como fato, contando com as
seguintes dimensões: Disciplinas, Cursos, Instituição e Tempo (ano e semestre). A
partir dessa definição, foi estabelecido o nível de granularidade da tabela fato, com base
no propósito dessa tabela, que é a do aproveitamento das disciplinas dos cursos, a tabela
fato contém as seguintes informações: Número de matriculados, Número de aprovados,
Número de reprovados, Número de trancados, Número de cancelados, Número de
Desistentes e os campos que fazem a ligação com as tabelas dimensões: Código da
Disciplina, Código do Curso, Código da Instituição, Código do Tempo (ano e semestre).
Conforme ilustra a Figura 5.
Figura 5 - Modelagem Multidimensional
Depois da criação das Tabelas Dimensões e da Tabela Fato, concretizando o
modelo multidimensional, o próximo passo foi o processo de extração, transformação e
carga dos dados (ETL) para o Data Mart. Como os dados estavam em planilhas
eletrônicas e precisavam ser carregados para o Data Mart, utilizamos a ferramenta SQL
Server 2008 Integration Services (SSIS) para realizar o processo de ETL.
Para migrar os dados criamos um Projeto no Integration Services (SSIS), criando
um pacote para integração dos dados entre a Microsoft Office Excel e Ambiente
Temporário, responsável por extrair dados das planilhas em Excel, realizar sua
transformação, e dar carga para o Ambiente Temporário.
Depois de migrar os dados das planilhas em Excel para o Ambiente Temporário,
o próximo passo foi popular as Tabelas de Dimensões e a Tabela Fato. Para isso
criamos outro pacote no Integration Services (SSIS) para integração dos dados que
estavam no Ambiente Temporário para as Dimensões e o Fato. Para popular as Tabelas
Dimensões e a Tabela Fato, fizemos a conexão com a Fonte de Dados (Ambiente
Temporário) e o Data Mart, para cada dimensão utilizaamos essa conexão para pegar os
dados da Fonte de Dados e migrarmos para o destino.
Depois de criar todas as conexões entre a Fonte de Dados Ambiente Temporário
e as Dimensões Instituição, Curso, Disciplina e Tempo, o próximo passo foi popular a
Tabela Fato Aproveitamento, quando criamos um componente de Fonte de Dados e um
componente para o destino Fato Aproveitamento, conforme ilustra a Figura 6.
Figura 6 - Carga dos Dados para o Fato Aproveitamento
Com o Data Mart devidamente populado, depois da integração dos dados por
meio do processo ETL, criamos, pela Ferramenta OLAP, o Cubo de Dados
proporcionando a análise dos dados pelo modelo multidimensional. Como utilizamos o
SQL Server 2008 e a Ferramenta Integration Services 2008 da SQL Server, para a
análise dos dados utilizamos também uma Ferramenta OLAP Analysis Services da
Microsoft SQL Server 2008. Para criação do Cubo de Dados de fizemos uma conexão
com o modelo de Data Mart desenvolvido pelo Integration Services (SSIS),
selecionando as Tabelas Dimensões e a Tabela Fato Aproveitamento, conforme ilustra a
Figura 7.
Figura 7 - Tabelas Dimensões e a Tabela Fato Aproveitamento para Cubo de Dados
Depois de criado a conexão com as Dimensões e a Tabela Fato Aproveitamento,
foi necessária a criação das Dimensões definindo quais os dados seriam exibidos em
cada Dimensão e somente após a definição das Dimensões com os respectivos dados
que seriam exibidos, criamos o nosso Cubo de Dados para a visualização dos dados em
modelo multidimensional.No Cubo de Dados é necessário identificarmos primeiro a
Tabela Fato Aproveitamento, pois, como já criamos as Dimensões e a Tabela Fato
Aproveitamento está integrada com as Dimensões o Cubo de Dados trabalhará com as
informações que estão na Tabela Fato Aproveitamento.Depois de selecionarmos o Fato
Aproveitamento, selecionamos todas as Medidas que compõem o Fato e após as
Dimensões que compõem o Fato Aproveitamento.
Depois de selecionadas as Medidas e as Dimensões do Cubo de Dados,
executamos nosso Cubo de Dados para concluir sua criação e implementação. Com o
Cubo de Dados devidamente construído, podemos visualizar sua estrutura
multidimensional utilizando o navegador do Cubo, com as respectivas dimensões e
medidas do Fato Aproveitamento. Na Figura 8 ilustramos o Cubo de Dados criado e
processado, no qual já podemos arrastar os dados que queremos demonstrar e assim
proporcionar contexto de análise. Na ilustração abaixo selecionamos a sigla de uma
determinada Instituição, o Curso e as Disciplinas que formam aquele curso, para
podermos analisar o total de matriculados, de aprovados, reprovados nas respectivas
disciplinas.
Figura 8 – Visualização do Cubo de Dados
Para facilitar ainda mais a visualização dos dados para a Instituição criamos um
indicador chave de desempenho (KPI) que tem como objetivo medir o nível de
desempenho para metas definidas pela Instituição. Para o nosso Cubo de Dados criamos
um KPI, para que a Instituição possa identificar o desempenho das disciplinas. O KPI
criado é para identificar as aprovações das disciplinas, ou seja, quando a disciplina tem
um número de aprovações maior do que 90% aparecerá o sinal verde, as que tiveram um
aproveitamento entre 60% e 90% aparecerá o sinal amarelo e as que tiveram o número
de aprovações menor do que 60% aparecerá o sinal vermelho, o que significa que a
Instituição deve se atentar naquela disciplina e tomar uma ação corretiva ou identificar
possíveis fatores que estão contribuindo para um alto índice de reprovações,
desistências, cancelamentos ou trancamentos na disciplina.
Criamos esse KPI somente para demonstrar que pela tecnologia de Data
Warehouse é possível criarmos indicadores que apontem como está o desempenho dos
cursos, os KPIs são determinados pela instituição, de acordo com as suas metas e
objetivos, nesse primeiro momento como não havíamos discutido as necessidades de
análise com a Instituição, criamos somente um KPI para fazermos uma demonstração. O
KPI é criado pelo Analysis Services na aba de KPIs. Depois de criado o KPI,
processamos nosso Cubo de Dados novamente. Os resultados desse processo serão
mostrados na próxima seção.
4. Análise dos Resultados
Nesta seção mencionamos como o usuário poderá visualizar os dados e fazer a análise
das informações, visto que o foco do trabalho não é apontar resultados, mas sim mostrar
como a tecnologia de Data Warehouse pode contribuir para a Instituição na
identificação do aproveitamento das disciplinas e para isso fizemos algumas
demonstrações de resultados já identificados nesse primeiro momento.
A ferramenta do Analysis Services pode ser visualizada pelo Microsoft Office
Excel 2007, para facilitar a análise dos dados integramos nosso pacote do Analysis
Services com a Microsoft Office Excel, criando uma conexão com o Analysis Services e
exibindo os dados por meio de Planilha Dinâmica, ou seja, conforme são incrementados
dados no Data Mart a planilha é atualizada automaticamente. A partir da tabela
dinâmica, podemos definir os tipos de consultas que queremos realizar, fazendo a
definição dos dados no rótulo de linha, rótulo de coluna e os totais para filtrar os dados
contidos na Tabela Fato Aproveitamento.Fazemos a seguir uma demonstração de alguns
tipos de análises que podemos realizar utilizando o Cubo de Dados pelo Excel.
Mostramos abaixo o KPI criado, no qual selecionamos um determinado Curso, o
ano de 2012 primeiro e segundo semestres e selecionamos o KPI para verificar a
porcentagem de aprovações para cada disciplina conforme ilustra a Figura 9, no qual
podemos observar que para o Curso demonstrado mostrando somente um determinado
conjunto de disciplinas as porcentagens variam, porém, para algumas disciplinas a
Instituição precisa se atentar, pois, o índice de aprovações está abaixo do esperado, os
que aparecem com status em vermelho, ou seja, para essas disciplinas a Instituição deve
criar ações visando a uma melhora na produtividade. As causas que levam a esse Status
podem ser diversas e cabe aos gestores analisarem as causas e tomar as decisões
corretivas e preventivas que forem necessárias. Vale ressaltar que nesse exemplo
definimos uma porcentagem de 90% para um bom aproveitamento, somente para uma
simulação. Futuramente serão definidos KPI pela Instituição de acordo com as metas de
desempenho definidas por seus gestores.
Figura 9 - Visualizando dados por KPI
Pela planilha dinâmica também podemos selecionar os dados de todos os cursos
com suas respectivas disciplinas, por ano e semestre e os totais de matriculados,
aprovados, reprovados, cancelados, desistentes e trancados, dando uma visão mais
ampla para que a Instituição possa fazer uma análise geral do histórico dos dados.
Selecionamos, por exemplo, do Cubo de Dados uma determinada Disciplina dos
anos de 2010, 2011 e 2012, no qual identificamos que para essa disciplina o número de
reprovados e trancados se destaca em relação ao número de matriculados, o que indica
que a Instituição deve se atentar a disciplina, revendo o conteúdo ofertado para aquela
disciplina, o perfil do aluno, o método de ensino, enfim, criando ações que possam
melhorar o aproveitamento da disciplina. Depois de selecionar esses dados no Cubo de
Dados também podemos criar gráficos, o que possibilita uma análise ainda melhor,
conforme ilustra a Figura 10.
Figura 10 - Gráfico para ilustrar totais de uma disciplina e curso
Por esse gráfico é possível identificarmos que a disciplina Algoritmos, no ano de
2010 teve no primeiro semestre um número de 39 matriculados, sendo 23% de
aprovações e 77% de reprovações, no segundo semestre de 2010 o número de
matriculados foi o mesmo, porém, o número de aprovações aumentou para 33% e o
número de reprovações diminuiu para 23% mas nesse semestre teve um aumento no
número de cancelamentos para 13% e trancamentos para 31%.
No ano de 2011 o número de matriculados aumentou em 2 e foi para 41 se
comparando com 2010 que teve 39 matriculados, no primeiro semestre de 2011 o
número de aprovados foi de 29% e novamente ocorreu um aumento no número de
reprovações para 58% e uma diminuição nos números de cancelamentos para 3% e
trancamentos para 10%. E no segundo semestre de 2011 o número de matriculados caiu
para 34, sendo 35% de aprovações, 62% de reprovações e 3% de trancamentos.
Em 2012 o número de matriculados foi para 7 no primeiro semestre e somente 1
matriculado no segundo semestre, ou seja, tendo uma grande redução, mostrando um
fator de atenção, nas análises dos próximos semestres.
Por fim, para facilitar ainda mais a manipulação e visualização dos dados para a
Instituição criamos pelo Visual Studio 2010 uma interface para o Data Mart tornando o
processo de ETL e a análise dos dados mais dinâmica e fácil para o usuário. A interface
está dividida de acordo com os pacotes do Integration Services (SSIS) e o Analysis
Services. A interface tem um menu com as opções Ambiente Temporário (carregar
dados), Data Mart (carregar Dimensões e Fato), Resultados (conectada com o Excel) e
a opção de sair do sistema.
5. Conclusões
Com o crescimento do Ensino Tecnológico e o seu destaque cada vez maior no
cenário brasileiro, conquistando o reconhecimento no meio educacional, o Centro Paula
Souza se destaca por ser um dos pioneiros do ensino tecnológico, uma instituição
pública gratuita de ensino superior de responsabilidade do Governo do Estado de São
Paulo, no qual somente as Fatecs possuem mais de sessenta e cinco mil alunos
matriculados em seus cursos nos quais são investidos, anualmente, mais de um bilhão e
setecentos milhões de reais pelo Governo do Estado de São Paulo. Com esse
crescimento acelerado e alto investimento feito pelo Governo do Estado de São Paulo
nessa Instituição, as Fatecs precisam se atentar cada vez mais para as tomadas de
decisões. A tecnologia de Data Warehouse vem nesse sentido, de agregar algo a mais
para a organização, uma vez que bem planejada e alinhada com objetivos traçados pela
organização, é uma tecnologia que poderá contribuir na análise dos dados, sendo assim
a organização poderá se beneficiar e terá base paraa tomada de decisão.
Neste estudo fizemos um levantamento sobre a Instituição Centro Paula Souza, a
tecnologia de Data Warehouse, mostramos também trabalhos no qual foi utilizada a
tecnologia de Data Warehouse aplicada na área de Educação demonstrando sua
contribuição para muitas áreas da Educação. Por meio desse conteúdo teórico tivemos
base para criar nosso Data Mart, focando no departamento acadêmico, definindo um
modelo para contribuir com a Instituição na identificação do aproveitamento das
disciplinas dos cursos das Fatecs do Centro Paula Souza.
Foram utilizadas neste trabalho as ferramenta do SQL Server 2008, a partir do
qualrealizamos o processo ETL,importando dados do Excel para um Ambiente
Temporário e do Ambiente Temporário para o Data Mart, pelo Processo ETL
integramos todos os dados e carregamos para o Data Mart. Após o carregamento dos
dados para o Data Mart, utilizamos a ferramenta OLAP também do SQL Server 2008 e
o Microsoft Office Excel para facilitar o processo de análise dos dados fornecendo apoio
interativo e possibilitando a tomada de decisão para a Instituição, criamos KPI,
oferecendo perspectivas de diversas formas por meio de planilhas dinâmicas. Criamos
uma interface por meio do Visual Studio 2010 para facilitar o processo ETL e a análise
dos resultados pelo usuário final, tornando o processo mais fácil e dinâmico visto que,
para o usuário final que muitas vezes não obtém o conhecimento técnico das
ferramentas pode ser mais difícil sua manipulação.
Bibliografia
CLEMES, Márcio. Data Warehouse como suporte ao sistema de informações gerenciais em
uma instituição de Ensino Superior: Estudo de Caso na UFSC. 117p. Dissertação (Mestrado em
Engenharia de Produção) – Programa de Pós-Graduação em Engenharia de Produção,
Universidade Federal de Santa Catarina, Florianópolis, 2001.
DATE, C. J. Introdução a sistemas de banco de dados/ C. J. Date; tradução de Daniel Vieira;
revisão técnica Sergio Lifschitz. Rio de Janeiro: Elsevier, 2003.
DEBATIN, Paulo Cesar. Sistema de Informações para Executivo Aplicado na Área Escolar,
utilizando Data Warehouse. 69p. Trabalho de Bacharelado em Ciências da Computação,
Universidade Regional de Blumenau, Blumenau, 2002.
DIAMANTINO, Júlio António Lourenço. Sistema de Acompanhamento do Progresso do aluno.
108p. Dissertação (Mestrado em Desenvolvimento de Software e Sistemas Interativos), Escola
Superior de Tecnologia - Instituto Politécnico de Castelo Branco, 2012.
DOMENICO, J. A. D. Definição de um ambiente data warehouse em uma instituição de ensino
superior. 137p. Dissertação (Mestrado em Engenharia de Produção) – Programa de PósGraduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis,
2001.
FERREIRA JUNIOR, Geraldo, et.all. Data Warehouse e Mineração de Dados nos Institutos
Superiores da Faetec. Instituto Superior de Tecnologia em Ciência da Computação - FAETEC,
2006. 12 p.
FUJIWARA, Daniel Kenji. Data Warehouse como instrumento de Suporte à Avaliação
Acadêmica. 98p., Universidade de Brasília – Instituto de Ciências Exatas Departamento de
Ciência da Computação, Brasília, 2006.
INMON, William H. Como Construir o Data Warehouse. Campus, Rio de Janeiro, 1997.
LIMA, Silvia Elena,; SANTOS FILHO, Salvador.; SANTOS FILHO, Clovis Roberto. Os (des)
caminhos da educação Profissional e Tecnológica no estado de São Paulo. São Paulo: Sinteps,
2008. 208 p.
MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de DATA WAREHOUSE. 5 ed. rev.
e atual..São Paulo:Érica, 2010, 314 p.
MACHADO NETO, Alfredo José. Globalização e gestão universitária: um estudo das
instituições municipais de ensino superior do Estado de São Paulo. Franca: FACEF, 2002. 205
p.
MANNINO, Michael V., Projeto Desenvolvimento de Aplicações & Administração de Banco
de Dados/ Michael V. Mannino; tradução Beth Honorato...[et all.]; revisão técnica Antonio
Fernandes Nunes Guardado, Sidney da Silva Viana, São Paulo: McGraw-Hill, 2008 .
TODESCO, J. L.; MARTINS, L. C.; SOUZA, N. Os Sistemas de Apoio à Decisão a serviço do
processo de Avaliação Institucional: Estudo de Caso da UNIVALI. 8p., Universidade do Vale
do Itajaí, Santa Catarina.
TURBAN, Efraim, et.all. Business Intelligence: Um enfoque gerencial para a inteligência do
negócio/ tradução Fabiano Bruno Gonçalves; revisão técnica . Instituto Superior de Tecnologia
em Ângela FreitagBrodbeck, Porto Alegre: Bookman, 2009.
TURBAN, E.; RAINER, R. K.; POTTER, R. E. Administração de Tecnologia da Informação:
Teoria e Prática. Tradução Daniel Vieira. Rio de Janeiro: Campus, 2005. 618 p.
Download