UM MODELO DE MINERAÇÃO DE DADOS NA

Propaganda
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA FLUMINENSE
CAMPUS CAMPOS-CENTRO
PÓS-GRADUAÇÃO LATO SENSU EM ANÁLISE E GESTÃO DE SISTEMAS DE
INFORMAÇÃO
DALYANA DOS SANTOS FERNANDES
DEISE VIANA DOS SANTOS
UM MODELO DE MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO
INSTITUCIONAL DE CURSOS – UM ESTUDO DE CASO NO IFFLUMINENSE
CAMPOS DOS GOYTACAZES
2016
DALYANA DOS SANTOS FERNANDES
DEISE VIANA DOS SANTOS
UM MODELO DE MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO
INSTITUCIONAL DE CURSOS – UM ESTUDO DE CASO NO IFFLUMINENSE
Monografia apresentada ao Instituto Federal de
Educação, Ciência e Tecnologia Fluminense,
Campus Campos-Centro, como requisito parcial para
conclusão do curso de Pós-graduação Lato Sensu em
Análise e Gestão de Sistemas de Informação.
Orientadora: Drạ Simone Vasconcelos Silva
CAMPOS DOS GOYTACAZES
2016
Dedicamos a Deus e a todos que nos ajudaram
nessa etapa de nossas vidas.
AGRADECIMENTOS
Primeiramente agradecemos a Deus pela força dada em todos os dias.
Às nossas famílias, pelo apoio e confiança nas horas mais difíceis.
À orientadora Simone, que contribuiu para a concretização deste trabalho.
À todas às pessoas que de alguma forma fizeram este sonho se tornar uma realidade.
A tecnologia da informação tem sido até agora
uma produtora de dados, em vez de
informação, e muito menos uma produtora de
novas e diferentes questões e estratégias.
Peter Druker
RESUMO
Tendo em vista o crescimento das bases de dados nas últimas décadas, tornou-se difícil para
os diversos profissionais identificarem as informações úteis nesses grandes volumes de dados.
Em busca de se analisar e extrair melhores informações e conhecimentos dos conjuntos de
dados surgiu uma área de pesquisa denominada KDD (Knowledge Discovery in Databases),
ou seja, Descoberta de Conhecimento em Bases de Dados. O processo KDD envolve várias
atividades que são divididas em cinco etapas principais: seleção de dados, pré-processamento,
transformação, mineração de dados (data mining) e interpretação/avaliação. Como parte do
KDD, a mineração de dados tem contribuído na busca de conhecimento implícito que possa
dar suporte à tomada de decisão. Este trabalho tem como objetivo propor um modelo
(utilizando a notação BPMN – Business Process Modeling Notation) para utilização da
mineração de dados para extração de conhecimento em bases de dados resultantes do processo
de Autoavaliação Institucional dos cursos técnicos e de graduação do IFFluminense na base
referente ao ciclo de 2012/2013. Com o modelo proposto, espera-se auxiliar na detecção de
conhecimentos úteis para gestão dos cursos.
Palavras-chave: Mineração de dados, Descoberta de conhecimento, Autoavaliação
Institucional.
ABSTRACT
Given the growth of databases in recent decades, it has become difficult for many
professionals to identify the useful information in these large volumes of data. Seeking to
analyze and extract the best information and knowledge of the data sets came a research area
called KDD (Knowledge Discovery in Databases), or Knowledge Discovery in Databases.
The KDD process involves several activities which are divided into five main steps: selection
of data, pre-processing, processing, data mining (data mining) and interpretation / evaluation.
As part of KDD, data mining has contributed to the implicit knowledge of search that can
support decision-making. This paper aims to propose a model (using the BPMN notation Business Process Modeling Notation) for use of data mining for extraction of knowledge in
databases resulting from the Institutional Self-assessment process of technical courses and
IFFluminense graduation in reference base the 2012/2013 cycle. With the proposed model, it
is expected to aid in the detection of useful knowledge for management courses.
Keywords: Data mining, knowledge discovery, Institutional Self Assessment.
LISTA DE ABREVIATURAS E SIGLAS
ABPMP - Association of Business Process Management Professionals
API - Application Programming Interface
ARFF - Attribute-Relation File Format
BPM - Business Process Modeling
BPMN - Business Process Model and Notation
BPMS - Business Process Management System
CBOK - Common Body of Knowledge
CONAES - Comissão Nacional de Avaliação da Educação Superior
CPA - Comissão Própria de Avaliação
DM - Data Mining
EDM - Educational Data Mining
IA - Inteligência Artificial
IFFLUMINENSE – Instituto Federal de Educação, Ciência e Tecnologia Fluminense
INEP - Instituto Nacional de Estudos e Pesquisas
MEC – Ministério da Educação e Cultura
KDD - Knowledge Discovery in Database
SINAES- Sistema Nacional de Avaliação da Educação Superior
WEKA - Waikato Environment for Knowledge Analysis
LISTA DE FIGURAS
Figura 1 – Artigos por Região do Brasil............................................................................ 14
Figura 2 – Etapas do processo de KDD............................................................................. 17
Figura 3 – Associações entre registros de dados e classes............................................
20
Figura 4 – Algoritmo Apriori............................................................................................
22
Figura 5 – Fluxograma de execução do Algoritmo Apriori.......................................... 22
Figura 6 - Exemplo de execução do algoritmo Apriori.....................................................
23
Figura 7 – Tela inicial do software Weka..........................................................................
24
Figura 8 – Regras de Associação com Apriori no Projeto Memore..................................
26
Figura 9 – Elementos básicos do BPMN........................................................................... 30
Figura 10 - Tela inicial do software Bizagi.......................................................................
31
Figura 11 – Metodologia de Avaliação Institucional do IFFluminense............................
34
Figura 12 – Modelo BPMN das etapas do KDD aplicado à Autoavaliação do IFFluminense 39
SUMÁRIO
1 INTRODUÇÃO........................................................................................................
11
1.1 Objetivos................................................................................................................... 13
1.2 Justificativa..............................................................................................................
13
1.3 Metodologia.............................................................................................................. 14
1.4 Estrutura dos capítulos...........................................................................................
2
MINERAÇÃO
DE
DADOS
15
(DATA 16
MINING).............................................................
2.1 KDD (Knowledge Discovery in Database).............................................................
16
2.2 Técnicas e algoritmos..............................................................................................
19
2.2.1 Associação.............................................................................................................. 20
2.3 Software Weka..........................................................................................................
23
2.4 Mineração de dados educacionais.......................................................................... 24
3 BPM (BUSINESS PROCESS MANAGEMENT) .........................................................
27
3.1 BPMN (Business Process Model and Notation).....................................................
28
4 TRABALHOS RELACIONADOS..............................................................................
32
5 APLICAÇÃO DA MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO DO
IFFLUMINENSE.....................................................................................…..................
33
5.1 Autoavaliação Institucional no IFFluminense......................................................
33
5.2 KDD aplicado a Autoavaliação..............................................................................
36
6 CONSIDERAÇÕES FINAIS.......................................................................................
40
REFERÊNCIAS..............................................................................................................
41
Apêndice I – Arquivo Docente.arff................................................................................
48
Apêndice II – Arquivo Discente.arff..............................................................................
49
11
1 INTRODUÇÃO
Um processo de Avaliação Institucional educacional, desenvolvido por membros
internos e externos de uma comunidade acadêmica, visa promover a qualidade das instituições
em todos os seus níveis e de acordo com sua missão. Tem como objetivo central a realização
autônoma do projeto institucional de modo a garantir a qualidade acadêmica no ensino, na
pesquisa, na extensão, na gestão e no cumprimento de sua pertinência e responsabilidade
social.
A Avaliação Institucional divide-se em duas modalidades (INEP, 2004a):
•
Autoavaliação – É a avaliação interna que é coordenada pela Comissão Própria de
Avaliação (CPA) de cada instituição e orientada pelas diretrizes e pelo roteiro da
Autoavaliação Institucional da Comissão Nacional de Avaliação da Educação Superior
(CONAES);
•
Avaliação externa – Realizada por comissões designadas pelo Instituto Nacional de
Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), a avaliação externa tem
como referência os padrões de qualidade para a educação superior expressos nos
instrumentos de avaliação e os relatórios das Autoavaliações. O processo de avaliação
externa independente de sua abordagem e se orienta por uma visão multidimensional
que busque integrar suas naturezas formativas e de regulação numa perspectiva de
globalidade.
A avaliação interna deve ser relacionada com a avaliação externa, e dessa forma
produzir conhecimento global para discussões sobre os aspectos da qualidade sobrepondo as
interfaces entre os pontos positivos e negativos, com vistas à maximização da qualidade do
ensino (SILVA et al., 2010).
O processo de Autoavaliação Institucional gera uma enorme quantidade de dados
devido ao número de questões dos questionários utilizados e principalmente devido ao grande
número de respondentes. Portanto, a mineração de dados pode ser um método eficiente para
extração de conhecimentos dessas bases de dados.
Segundo Vianna et al. (2010), “a mineração de dados pode facilitar o entendimento de
grande número de dados agrupados”.
12
Em vista do crescimento das bases de dados nas últimas décadas, tornou-se difícil para
as pessoas identificarem o vasto volume de informações nesses grandes volumes de dados,
surgindo a problemática de existirem muitos dados, porém pouco conhecimento.
Sobre uma visão geral de mineração de dados, alguns autores explanam que:
Mineração de dados (MD) consiste em uma linha de pesquisa e aplicação em banco
de dados que visa criar estratégias específicas para extrair informações importantes,
ocultas e previamente desconhecidas a partir de bases de dados na forma de regras e
padrões. Dentre os diferentes tipos de informação que podem ser minerados,
destacam-se: as regras de associação, modelos de classificação, padrões sequenciais
e agrupamentos (clusters) de dados (HAN; KAMBER, 2011).
Em busca de analisar e extrair melhores informações e conhecimentos dos conjuntos
de dados surgiu uma área de pesquisa denominada KDD (Knowledge Discovery in
Databases), ou seja, Descoberta de Conhecimento em Bases de Dados, que “permite a
extração de conhecimento previamente desconhecido e potencialmente útil de um banco de
dados”. Data Mining “é uma tecnologia que emergiu da intersecção de três áreas: estatística
clássica, inteligência artificial e aprendizado de máquina” e é parte do KDD (CORRÊA;
SFERRA, 2004).
O surgimento das técnicas que permitem a automatização e análise, além de técnicas
que procuram transformar grandes bases de dados em conhecimento, é o objetivo do KDD
(FAYYAD, et al., 1996).
A análise de grandes bases de dados de diversos segmentos, inclusive da área
educacional trouxe à tona uma linha de pesquisa denominada Mineração de Dados
Educacionais (EDM) que tem como principal objetivo "o desenvolvimento de métodos para
exploração dos tipos de dados únicos provenientes dos ambientes educacionais e, utilizar
esses métodos para entender melhor os alunos e as características de como eles aprendem”
(BAKER; YACEF, 2009).
Toda instituição possui um propósito, onde é necessário entender e estabelecer o
conjunto de atividades necessárias para cumprir esta meta que são chamados de processo de
negócio. O BPM - Modelagem de Processos de Negócio (Bussiness Process Model) melhora
esses processos de negócio, proporcionando a análise e o redesenho dos mesmos e com a
BPMN -
Notação de Modelagem de Processos de Negócio (Business Process Model
Notation) que seja compreensível por todos usuários de negócio criando assim uma ligação
padronizada entre o processo de negócio e sua implementação (SZILAGYI, 2010).
13
Neste trabalho foi realizada uma análise do processo de Autoavaliação Institucional
dos cursos do IFFluminense e proposto um modelo BPMN para utilização da mineração de
dados na extração de conhecimentos nas bases de dados resultantes deste processo. Foi
proposta a técnica de Associação junto ao algoritmo Apriori com apoio da ferramenta Weka.
1.1 Objetivos
O objetivo principal deste trabalho é propor um modelo para utilização da mineração
de dados na extração de conhecimentos nas bases de dados resultantes do processo de
Autoavaliação Institucional dos cursos técnicos e de graduação do IFFluminense na visão dos
docentes e discentes. Este objetivo pode ser dividido nos seguintes objetivos específicos:
•
Analisar o processo de Autoavaliação Institucional do IFFluminense e a base de dados
gerada para detectar conhecimentos que possam ser úteis na gestão dos cursos, além
de apoiar os coordenadores dos mesmos;
•
A partir da análise acima, propor um modelo (baseado nos conceitos de BPM –
Business Process Model) de utilização da mineração de dados aplicada ao processo de
Autoavaliação Institucional, no que diz respeito aos cursos do instituto.
1.2 Justificativa
O processo de Autoavaliação Institucional do IFFluminense trata a base de dados de
cada avaliação através de métodos estatísticos.
A atual Diretoria de Avaliação Institucional do instituto acredita que uma abordagem
relacionada à extração de conhecimentos da base de dados seria necessária e bastante útil para
melhor aproveitamento das informações, possibilitando um melhor suporte a decisão para os
gestores institucionais.
Outro fator importante diz respeito ao pequeno número de instituições que utilizam
e/ou publicam trabalhos que abordem a extração de conhecimento, como Data Mining e
KDD, para o processo de Autoavaliação conforme visto nos trabalhos relacionados (Capítulo
4). Pode-se observar também que no último seminário (Seminários Regionais sobre
Autoavaliação Institucional e Comissões Próprias de Avaliação (CPA - 2013)) realizado pelo
INEP, nenhum dos artigos citou a utilização de mineração de dados para o processo de
Autoavaliação Institucional.
14
Este seminário possui um anais com um total de 123 artigos divididos por região do
país (INEP, 2013), conforme mostra a Figura 1.
Figura 1 – Artigos por Região do Brasil
1.3 Metodologia
A metodologia utilizada neste trabalho divide-se em:
•
Levantamento de referências bibliográficas sendo livros, artigos e revistas acadêmicas
relacionados à mineração de dados (data mining), KDD e software Weka;
•
Estudo do software de mineração de dados (Weka);
•
Análise dos arquivos contendo os resultados da Autoavaliação Institucional dos cursos
do IFFluminense referente à base de dados do ciclo de 2012/2013 do IFFluminense;
•
Análise da Técnica de Associação e do algoritmo Apriori;
•
Elaboração do modelo, utilizando os conceitos de BPM com a notação BPMN, de
Mineração de Dados aplicado ao processo de Autoavaliação Institucional do
IFFluminense.
15
1.4 Estrutura dos capítulos
Este trabalho está estruturado em 6 capítulos.
•
O Capítulo 1 introduz o tema do trabalho, apresentando uma descrição do problema
tratado, os objetivos pretendidos, a justificativa e a metodologia proposta para a sua
elaboração;
•
O Capítulo 2 refere-se à mineração de dados, abordando temas como conceitos
iniciais, Descoberta de Conhecimento em Banco de Dados (KDD), técnicas e
algoritmos da Mineração de Dados detalhando suas etapas;
•
O Capítulo 3 refere-se ao Business Process Management (BPM), apresentando
conceitos iniciais, além de detalhar a notação BPMN e o software Bizagi;
•
O Capítulo 4 apresenta os trabalhos relacionados ao tema Autoavaliação Institucional
com mineração de dados;
•
O Capítulo 5 refere-se à mineração de dados na Autoavaliação do IFFluminense com a
execução de cada etapa em detalhes, permitindo que se compreenda como o estudo de
caso foi realizado;
•
O Capítulo 6 refere-se por fim as considerações finais que podem ser feitas a partir do
estudo realizado. Este capítulo também apresenta as limitações identificadas e as
sugestões para trabalhos futuros.
Este trabalho é composto também por Apêndice 1 e 2 contém arquivo de
modelo de discente e de docente para uso no Weka.
16
2 MINERAÇÃO DE DADOS (DATA MINING)
A mineração de dados (Data Mining) pode facilitar o entendimento de grande número
de dados agrupados como no caso deste trabalho. Ela surgiu há mais de uma década como
uma alternativa promissora para análise desse grande número de dados agrupados conjugando
técnicas de várias áreas como estatística e banco de dados.
Data Mining “descende fundamentalmente de três linhagens: estatística clássica,
inteligência artificial (IA) e o aprendizado de máquina (casamento entre a estatística e a IA)”
(PAMPA, 2003).
A mineração de dados é a análise inteligente e automática de dados para descobrir
padrões ou regularidades em grandes conjuntos de dados, através de técnicas que envolvem
métodos matemáticos, algoritmos baseados em conceitos biológicos, linguísticos e heurísticos
(COUTINHO, 2003).
Segundo Castanheira (2008), a mineração de dados caracteriza-se pela existência de
um algoritmo que diante da tarefa proposta será eficiente em extrair conhecimento implícito e
útil de um banco de dados. Pode-se dizer que mineração de dados é a fase que transforma
dados puros em informações úteis dentro do processo de KDD, onde se necessita definir a
técnica e o algoritmo a ser utilizado em função da tarefa proposta.
2.1 KDD (Knowledge Discovery in Databases)
A mineração de dados é uma etapa do processo KDD, porém vários autores referem-se
a mineração de dados e KDD de forma distinta.
Data mining, ou mineração de dados, “é uma técnica que faz parte de uma das etapas
da descoberta de conhecimento em banco de dados (KDD), capaz de revelar,
automaticamente, o conhecimento que está implícito em grandes quantidades de informações
armazenadas nos bancos de dados de uma organização” (CARDOSO; MACHADO, 2008).
Já para Vianna et al. (2010), o Knowledge Discovery in Databases (KDD) é um
“processo composto pela seleção de dados, pré-processamento, transformação dos dados e
estabelecimento de padrões úteis na extração de conhecimento, ou seja, tradução de dados
brutos em informações relevantes”.
Galvão e Marin (2009) afirmam que “o processo de KDD utiliza métodos estatísticos e
técnicas de inteligência artificial”.
17
Apesar do termo mineração de dados, ser apenas uma etapa do processo de KDD é
comumente utilizado para referenciar todo o processo de KDD. O processo de KDD e suas
etapas podem ser observadas na Figura 2.
Figura 2 – Etapas do processo de KDD
Fonte: Adaptada de FAYYAD et al., 1996.
Estas etapas correspondem ao processo que os dados percorrem até se transformar em
conhecimento útil que têm objetivos específicos para cada tipo de base, porém as finalidades
são as mesmas.
A seguir serão detalhadas todas as etapas do processo de KDD com enfoque nas suas
características e finalidades:
•
Seleção: Nesta etapa, o propósito é identificar os dados significantes a serem
trabalhados e que podem ser encontrados em vários formatos. Fase na qual é mapeado
e identificado, o conjunto de informações a serem utilizadas (GOLDSCHIMIDT;
PASSOS, 2005). As variáveis selecionadas para a mineração de dados são
denominadas variáveis ativas, uma vez que são usadas para distinguir segmentos, fazer
predições ou desenvolver outras operações específicas de mineração de dados (DINIZ;
LOUZADA NETO, 2000);
•
Pré-processamento e Limpeza: Nessa fase ocorre o tratamento dos dados, ou seja, são
realizadas tarefas envolvendo a limpeza de dados, objetivando a inconsistência,
redundância e ausência entre os mesmos. A qualidade é crucial para obter dados
confiáveis, uma vez que dados limpos e compreensíveis são requisitos básicos para o
sucesso da mineração (DINIZ; LOUZADA NETO, 2000). Assim sendo, os dados são
selecionados e analisados para serem transformados;
18
•
Transformação: Nesta etapa, os dados são transformados para um formato adequado,
para que possa ser trabalhado da forma apropriada para mineração. Segundo Melo
(2010), além de localizar características úteis para representar os dados, essa etapa é
também responsável pela escolha dos melhores atributos presentes no conjunto de
dados. No caso deste trabalho em que o software utilizado será o Weka, os dados
precisam ser convertidos para o formato ARFF (Attribute-Relation File Format);
•
Data Mining: A etapa de Mineração de Dados compreende a busca efetiva por
conhecimentos úteis no contexto de aplicação no KDD, sendo a principal etapa deste
processo (GOLDSCHIMIDT; PASSOS, 2005). Nesta etapa há a aplicação de
algoritmos sobre os dados em busca de conhecimento implícito e útil além de definir
as técnicas e os algoritmos a serem aplicados na questão proposta;
• Interpretação/Avaliação: Os resultados do processo de descoberta do conhecimento
podem ser mostrados de diversas formas. Esta fase envolve todos os participantes que
avaliam de forma criteriosa os resultados proporcionando uma interpretação para o
modelo, de onde se extrai o conhecimento.
Martinhago (2005) determina tarefa como um problema de descoberta de
conhecimento a ser solucionado. O autor ainda afirma que, no KDD existem diversas tarefas
que dependem principalmente do domínio de aplicação e do interesse do usuário. Cada uma
delas tem a finalidade de extrair um tipo diferente de conhecimento da base de dados e
podendo requerer um algoritmo diferente em cada tarefa.
A etapa de Mineração de Dados no KDD possui tarefas básicas, que são classificadas
nas categorias descritivas e preditivas, que são: Clusterização, Classificação e Associação.
As descritivas procuram padrões interpretáveis pelos humanos que descrevem os
dados antes de realizar a previsão, sendo útil ao suporte a decisão. Já as preditivas envolvem o
uso dos atributos de um conjunto de dados para prever o valor futuro da variável meta, sendo
útil à tomada de decisões (Rezende, 2005).
De acordo com Gutierrez e Bertrand (2005) descrevem clusterização, como a tarefa
que objetiva reunir objetos em grupos, de modo que, os objetos de um grupo devem ser os
mais semelhantes entre si e os menos semelhantes a objetos de outros grupos.
A clusterização procura “grupos de padrões como padrões pertencentes a um mesmo
grupo e que são mais similares uns aos outros e dissimilares a padrões em outros grupos”
(SILVA NETO et al. 2010). Os algoritmos mais utilizados na tarefa de clusterização são os KMeans, K-Modes, K-Protopypes, K-Medoids e K-ohonem (CARDOSO; MACHADO, 2008).
19
Conforme Rezende (2005), a tarefa de classificação é uma função de aprendizado que
mapeia dados de entrada, ou conjunto de dados de entrada em um número finito de categorias.
Nela cada exemplo pertence a uma classe, entre um conjunto predefinido de classes. Alguns
exemplos de algoritmos de classificação são: CBA (Classification-Based Association) (LIU;
HSU; MA, 1998), CMAR (Classification based on Multiple Association Rules) (LI; HAN;
PEI, 2001) e uma nova abordagem chamada de CARM (Classification Association Rule
Mining) (WANG; XIN; COENEN, 2008).
De acordo com Galvão e Marin (2009), a tarefa de associação consiste em identificar e
descrever associações entre variáveis no mesmo item ou associações entre itens diferentes que
ocorram simultaneamente, de forma frequente em uma base de dados. É também comum a
procura de associações entre itens durante um intervalo temporal. Portanto, os algoritmos
Apriori e GSP (Generalized Sequential Patterns - Padrão Sequencial Geral), dentre outros,
implementam a tarefa de descoberta de associações.
2.2 Técnicas e Algoritmos
Segundo Goldschmidt; Passos; Bezerra (2015), as técnicas e os algoritmos, que serão
utilizados em um problema em questão, serão definidos na etapa de Mineração de Dados
(Data Mining).
Diversas técnicas de Data Mining vêm sendo utilizadas com sucesso no mundo inteiro
e estão presentes em importantes instituições (nacionais e internacionais) tais como: Nasa,
Wal-Mart, FedEx, UPS, Amazon, Caixa Econômica Federal, Banco do Brasil, Vale do Rio
Doce, Petrobras, Dataprev, entre muitas outras (GOLDSCHMIDT; PASSOS; BEZERRA,
2015).
Essas técnicas são usadas de forma articulada para estudar os dados e achar tendências
e padrões nos mesmos.
Segundo Tan et al. (2009), as técnicas de mineração de dados “são organizadas para
agir sobre grandes bancos de dados, com o intuito de descobrir padrões úteis e recentes que
poderiam, de outra forma, permanecer ignorados”.
De acordo com Araújo e Tarapanoff (2006), com o auxílio de modelos matemáticos e
ferramentas de mineração de dados, pode-se obter conhecimento de bases de dados com a
ajuda de algoritmos que permitem a clusterização, classificação ou regras de associação.
Este trabalho irá abordar a técnica de associação e a mesma será detalhada na seção a
seguir.
20
2.2.1. Associação
Segundo Camilo e Silva (2009), a Associação (Association) consiste em identificar
quais atributos estão relacionados. Apresentam a forma: SE atributo X ENTÃO atributo Y. É
uma das tarefas mais conhecidas devido aos bons resultados obtidos, principalmente nas
análises da “Cesta de Compras" (Market Basket), onde identificamos quais produtos são
levados juntos pelos consumidores. Alguns exemplos como determinar os casos onde um
novo medicamento pode apresentar efeitos colaterais e identificar os usuários de planos que
respondem bem a oferta de novos serviços.
A técnica de mineração por Associação é um processo que tenta expor as
características e as tendências, ou seja, tenta determinar o relacionamento entre um conjunto
de itens. A vantagem em relação às outras técnicas é simplicidade no uso (CHAGAS; CHAN
e CORSI, 2010).
Essa técnica utiliza dois fatores importantes: fator de suporte e fator de confiança. O
fator de suporte indica a ocorrência relativa da regra de associação observada dentro de um
conjunto de dados. O fator de confiança é o grau com o qual a regra é verdadeira entre os
registros individuais (DINIZ; LOUZADA-NETO, 2000).
Uma regra de associação caracteriza o quanto a presença de um conjunto de itens nos
registros de uma base de dados implica na presença de algum outro conjunto distinto de itens
nos mesmos registros (AGRAWAL; SRIKANT, 1994).
De Amo (2004) afirma que uma regra de associação é um padrão da forma X Y, onde
X e Y são conjuntos de valores.
Desse modo, o objetivo das regras de associação é encontrar tendências que possam
ser usadas para entender e explorar padrões de comportamento dos dados, conforme mostra a
Figura 3.
Figura 3 – Associações entre registros de dados e classes
Fonte: Goldschmidt, Passos e Bezerra (2015).
21
Goldschmidt, Passos e Bezerra (2015) relataram que as regras de associação consistem
em identificar associações entre variáveis simultaneamente. Com isso, de forma frequente em
banco de dados é também comum a procura de associações entre itens durante um intervalo
temporal, em que o modelo matemático mais utilizado é o algoritmo Apriori.
O algoritmo Apriori é um clássico de Mineração de Regras de Associação
(AGRAWAL; SRIKANT, 1994).
Goldschmidt, Passos e Bezerra (2015) apontam as etapas de funcionamento do
Apriori, como encontrar todos os conjuntos de itens frequentes que satisfazem à condição de
suporte mínimo e a partir desses conjuntos gerar as regras de associação que satisfazem a
condição de confiança mínima.
O Apriori permite que se escolha dentre outras informações, o número de regras que
serão mostradas e o grau de confiabilidade mínima para a formação das regras. O algoritmo
inicia o processo de busca pelas associações identificando todas as regras que satisfazem o
fator de suporte mínimo (GOLDSCHMIDT, PASSOS E BEZERRA, 2015).
Segundo Souza (2009), o algoritmo Apriori tem o objetivo de diminuir o espaço de
busca, ou seja, para evitar que todos os 2n subconjuntos sejam avaliados em relação as
seguintes propriedades:
• Todo subconjunto de um conjunto frequente é frequente;
• Todo conjunto que contém um subconjunto não frequente também não é frequente.
Souza (2009) descreve também, as etapas que o Apriori executa:
• Calcular o suporte de todos os conjuntos de tamanho 1 e eliminar aqueles que não
possuem o suporte mínimo;
• Formar todos os possíveis conjuntos de tamanho 2 a partir daqueles de tamanho 1 e
eliminar os novos conjuntos que não possuem o suporte mínimo;
• Repetir o procedimento anterior até que, no k-ésimo passo, nenhum novo conjunto
de tamanho k, obtido a partir dos conjuntos de tamanho k-1, tenha suporte mínimo.
22
A Figura 4 mostra o algoritmo do Apriori:
Figura 4 – Algoritmo Apriori
Fonte: Agrawal e Srikant (1994).
De acordo com Bolina (2013) o fluxograma da Figura 5 busca ilustrar os passos que
descrevem a execução do algoritmo Apriori:
Figura 5 – Fluxograma de execução do Algoritmo Apriori
Fonte: Bolina (2013).
No exemplo da Figura 6, a seguir, está sendo utilizada uma pequena base de dados
para ilustrar com facilidade como o algoritmo Apriori chegaria ao menor conjunto de itens,
que descreva uma regra qualquer.
Inicialmente, o algoritmo separa todos os elementos que compõem a base de dados. A
seguir, é feito a busca, formando-se o conjunto inicial C1.
É contado o número de vezes que cada elemento é instanciado e eliminada a linha do
elemento que foi instanciado somente uma vez.
23
No próximo passo, são formados possíveis pares de elementos no conjunto C2.
Novamente é feito a busca, a contagem e eliminação.
Então, é retirado um único triplo, o conjunto C3 {2 3 5}, que é instanciado mais de
uma vez, sendo este uma regra para a base.
A partir daí, pode-se concluir que, {1,2,3} {1,2,5} e {1,3,5} não são regras para a base
de dados exemplo, pois não pertencem ao conjunto C3.
Figura 6 - Exemplo de execução do algoritmo Apriori
Fonte: Pichiliani (2013)
2.3 Software Weka
Segundo Melo (2010), o software livre Waikato Enviroment for Knowledge Analysis
(WEKA), formado por um conjunto de implementações de algoritmos de diversas técnicas de
Mineração de Dados está implementado na linguagem Java, que tem como principal
característica sua portabilidade; desta forma é possível utilizá-la em diferentes sistemas
operacionais, além de aproveitar os principais benefícios da orientação a objetos.
A Weka foi desenvolvida na linguagem Java pelo curso de Ciência da Computação da
Universidade de Waikato na Nova Zelândia. É uma ferramenta de apoio às etapas da
descoberta de conhecimento em bases de dados, seu código é flexível e aberto, ou seja, de
domínio público (GOLDSCHMIDT e PASSOS 2005; OLIVEIRA e GARCIA, 2004).
24
Melo (2010) também afirma que o Weka pode ser utilizado de três diferentes formas:
interface gráfica conhecida como Weka Explorer fornece as diversas ferramentas para seus
usuários através de janelas e seus elementos, a linha de comando é um meio utilizado para dar
mais agilidade a processos repetitivos e acesso direto a funcionalidades que teriam mais
passos a serem executados, caso fossem acessados via interface gráfica e acesso através de
sua API é utilizada por desenvolvedores de software por fornecer um meio prático para o uso
das funcionalidades implementadas no Weka.
A Figura 7 mostra a tela inicial do Weka.
Figura 7 – Tela inicial do software Weka
Além disso, a ferramenta oferece recursos para a execução de tarefas relacionadas ao
pré-processamento de dados como, por exemplo, a seleção e a transformação de atributos.
A base de dados no formato texto é utilizada preferencialmente na ferramenta Weka.
2.4 Mineração de Dados Educacionais
Segundo Goldschmidt, Passos e Bezerra (2015), a “Mineração de Dados Educacionais
(expressão traduzida do inglês Educational Data Mining – EDM) é uma modalidade de mine
ração em que os dados pertencem a contextos educacionais”. Costa et al. (2012) definem
EDM como uma área emergente que procura desenvolver, adaptar e aplicar métodos de KDD
de forma a identificar modelos de conhecimento a partir de grandes bases contendo
informações relacionadas com a Educação (COSTA, et al, 2012, p.4 apud GOLDSCHMIDT;
PASSOS; BEZERRA, 2015).
25
De acordo com Romero e Ventura (2010) apud Goldschmidt, Passos e Bezerra (2015),
“as aplicações de EDM procuram abordar diversas questões na área de Educação para
descobrir novos conhecimentos que permitam melhor compreender os estudantes e o processo
de ensino e aprendizagem”, buscando aprimorar a qualidade de diversos aspectos da área e
beneficiar os estudantes, como por exemplo, direcionando-os em relação aos estudos.
A EDM é similar a Mineração de Dados, distinguindo-se em alguns aspectos em
relação às aplicações de outros domínios. O objetivo desta varia de pesquisa aplicada, como o
aprimoramento do processo de ensino aprendizagem e o perfil de estudo de cada estudante a
pesquisa pura, visando à busca de uma compreensão mais profunda sobre o fenômeno
educacional.
Segundo Costa et al. (2012), “No Brasil, a EDM tem dado seus primeiros passos com
produções interessantes, a partir de algumas iniciativas de pesquisa”. Dentre tais iniciativas,
podemos citar os projetos Memore (Proc. CNPq 550310/2011-0) e o programa USA-UCA
(PROEXT 2014 – MEC/SESu SIGProj: 141410.648.164063.17032013).
Goldschmidt, Passos e Bezerra (2015) relataram que, o projeto Memore teve como
objetivo desenvolver um ambiente computacional homônimo que, a partir de dados sobre o
uso de laptops de baixo custo na Educação, pudesse apoiar docentes e gestores educacionais
no aprimoramento do processo de aprendizagem e de políticas públicas de distribuição de
dispositivos didáticos (laptops e tablets) nas escolas brasileiras. Já o programa USA-UCA
surgiu em continuidade ao projeto Memore e se apresenta como um conjunto integrado de
ações para sistematizar o acompanhamento de informações sobre como os dispositivos
didáticos têm sido utilizados nas escolas.
A seguir, são apresentados alguns exemplos de Regras de Associação geradas pelo
algoritmo Apriori, aplicados em um banco de dados único, denominado central de análise, do
projeto Memore. Como suporte e confiança mínimos foram utilizados os valores 3% e 70%,
respectivamente.
A regra R1 indica que em todos os casos que os alunos trabalharam sozinhos, e
utilizaram o Chromium como uma de suas ferramentas, eles conseguiram completar todas as
suas atividades.
A regra R2 revela que todas as atividades de lazer foram desenvolvidas
individualmente pelos alunos.
A regra R5 mostra que em 88% de todas as vezes que os alunos utilizaram os laptops
para desenvolver atividades de Matemática, tais atividades foram concluídas.
26
Segundo a regra R9, em 96% das utilizações em casa, os alunos conseguiram concluir
suas atividades.
Já as regras R10 e R11 sugerem um surpreendente indicativo de equilíbrio entre os tipos
de atividades realizadas em casa: 46% foram atividades de lazer e 43% atividades escolares.
Segue abaixo a Figura 8 que mostra as regras citadas.
Figura 8 – Regras de Associação com Apriori no Projeto Memore
Fonte: Goldschmidt, Passos e Bezerra (2015).
27
3 BPM (BUSINESS PROCESS MANAGEMENT)
Para que se entenda como o BPM (Business Process Management), que traduzido para
o português significa Gerenciamento de Processos de Negócios, funciona e como ele é
integrado é necessário apresentar alguns conceitos relacionados.
O termo processo é definido pelo Common Body of Knowledge (CBOK) da ABPMP
(Association of Business Process Management Professionals) como “agregação de atividades
e comportamentos executados por humanos ou máquinas para alcançar um ou mais
resultados” já processo de negócio como “um trabalho que entrega valor para os clientes ou
apoia/gerencia outros processos”. Neste contexto, BPM “é uma disciplina gerencial que
integra estratégias e objetivos de uma organização com expectativas e necessidades de
clientes, por meio do foco em processos ponta a ponta. BPM engloba estratégias, objetivos,
cultura, estruturas organizacionais, papéis, políticas, métodos e tecnologias para analisar,
desenhar, implementar, gerenciar desempenho, transformar e estabelecer a governança de
processos” (ABPMP, 2014).
Já Rummler e Brache (1994) conceituam BPM como “um conjunto de técnicas para
garantir que os processos sejam continuamente monitorados e melhorados”.
Para Filho e Moura (2007) BPM é o “desenvolvimento e manutenção de uma
arquitetura de processos de negócios, que se utiliza de técnicas, metodologias e
gerenciamento humano para garantir que os processos sejam continuamente melhorados e
monitorados”.
Conforme ABPMP (2014), dentre os conceitos fundamentais de BPM, destacam-se
dois:
•
BPM trata o que, onde, quando, por que, como e por quem o trabalho é realizado;
•
A tecnologia desempenha papel de apoio e não de liderança na implementação de
BPM.
Segundo Britto (2012), “apesar de ser tão abrangente, BPM também serve para trazer
inovação, controle, qualidade na informação dentro das organizações, liberdade para pensar e
maior agilidade na tomada de decisão”. Um dos maiores benefícios que a BPM traz para a
organização é a qualidade da informação para tomada de decisão, pois a decisão estratégica é
embasada na capacidade real dos processos, gerando qualidade e confiança na informação.
BPM pode ser aplicado a organizações de qualquer porte, com ou sem fins lucrativos,
públicas ou privadas, com o objetivo de direcionar os recursos organizacionais, requerendo a
participação de toda a organização (ABPMP, 2014).
28
Para Valle e Oliveira (2012), a gestão por processos, têm como objetivo fazer a
ligação de tudo o que se faz na organização. Por meio dela, é possível unir as estratégias e
competências da organização às atividades desenvolvidas diariamente.
Segundo Garcia (2015), o governo federal tem estimulado suas instituições a focarem
a gestão de seus processos, o que inclui as IES (Instituições de Ensino Superior) públicas,
através do Programa Nacional de Gestão Pública e Desburocratização – GesPública. Esse
programa propõe o Modelo de Excelência em Gestão Pública – MEGP, tendo como
fundamentos a orientação por processos e informações.
De acordo com Britto (2012), o BPM é composto de nove áreas específicas de
conhecimento, sendo todas inter-relacionadas e evolutivamente complementares:
•
Gerenciamento de Processos
•
Modelagem de Processos
•
Análise de Processos
•
Desenho de Processos
•
Gerenciamento de Desempenho
•
Transformação de Processos
•
Organização de Processos
•
Gerenciamento de Processos Corporativos
•
Tecnologias de Gerenciamento de Processos
Neste trabalho, será abordado a Modelagem de Processos utilizando a notação BPMN
(Business Process Model Notation), que será detalhada a seguir.
3.1 BPMN – (Business Process Model and Notation)
A ABPMP (2014) define modelagem de processos de negócio como um: “conjunto de
atividades envolvidas na criação de representações de processos de negócio existentes ou
propostos”. Esta representação deve ser completa e precisa sobre seu funcionamento. Para
isso são utilizados os modelos. Um modelo implica a representação de um determinado estado
do negócio (atual ou futuro) e dos respectivos recursos envolvidos, tais como pessoas,
informação, instalações, automatização, finanças e insumos, portanto, requer mais dados
29
acerca do processo e dos fatores que afetam seu comportamento, pois busca representar o seu
funcionamento.
BPMN – Notação de Modelagem de Processos de Negócio (Business Process Model
and Notation), é um padrão criado pela Business Process Management Initiative (BPMI),
disponibilizada para os usuários em maio de 2004 e adotada oficialmente pela Object
Management Group (OMG), grupo que estabelece padrões para sistemas de informação, em
2006 (ABPMP, 2014).
Braconi e Oliveira (2011), enfatizam que a BPMN visa oferecer uma notação que
mesmo tendo padrões bem definidos, seja clara e facilite a compreensão do trabalho por todos
os envolvidos nos processos, desde responsáveis técnicos a gestores.
Essa notação apresenta um conjunto robusto de símbolos para modelagem de
diferentes aspectos de processos de negócio, que descrevem relacionamentos claramente
definidos, como fluxos de atividades e ordem de precedência. Possui como principais
características: ícones organizados em conjuntos descritivos e analíticos para atender as
diferentes necessidades de utilização; permite a indicação de eventos de início, intermediário
e fim; fluxo de atividades e mensagens; comunicação intranegócio e colaboração internegócio
(ABPMP, 2014).
A notação BPMN proporciona às empresas a capacidade de compreender os seus
processos de negócios em uma notação gráfica e dá as organizações a capacidade de
transmitir estes processos de uma forma padrão. Além disso, gera a documentação e execução
de processos (BPMN, 2016).
Segundo a ABPMP (2014), as principais vantagens da notação BPMN são:
•
Uso e entendimento difundido em muitas organizações;
•
Versatilidade para modelar as diversas situações de um processo;
•
Facilita a modelagem de processos que serão automatizados, pois o mesmo
diagrama gerado pelo negócio pode ser complementado com definições de
tecnologia para automação em um BPMS (Business Process Management
Suite), reduzindo perda de informação na migração que poderia ocorrer entre
diagramas com notações diferentes.
Os elementos básicos da notação BPMN, segundo Valle e Oliveira (2011) são:
30
•
Atividade: representa o trabalho que será executado em um processo de
negócio;
•
Evento: é algo que ocorre durante um processo de negócio e afetam o fluxo do
mesmo. Normalmente têm algo que os dispara ou um resultado, que são
representados como marcadores no centro do elemento. São três os tipos de
eventos, baseados em como eles afetam o fluxo: os de início, os intermediários
e os de fim;
•
Gateway: é um elemento de modelagem utilizado para controlar como a
sequência do fluxo interage dentro de um processo ao convergir e divergir.
Serve para separar e juntar o fluxo, ou seja, controlá-lo;
•
Conector: mostra a ordem em que as atividades serão executadas no processo.
A Figura 9 ilustra os elementos básicos da notação BPMN:
Figura 9 – Elementos básicos do BPMN
Fonte: Adaptado de Valle e Oliveira (2011)
De acordo com a ABPMP (2014), na definição de BPM como uma disciplina
gerencial está implícito que, as organizações bem-sucedidas em sua implementação “terão a
capacidade de” gerenciar seus processos de forma eficiente e eficaz. Para isso, a organização
tem de possuir métodos otimizados, pessoas preparadas e tecnologias apropriadas para apoiar
BPM, como tecnologias especializadas, que oferecem funcionalidades para prover suporte a:
•
Planejamento de processos de negócio;
•
Modelagem, análise e desenho de processos de negócio;
•
Execução de processos de negócio;
•
Monitoramento de processos de negócio e acompanhamento de desempenho;
•
Gerenciamento e controle de mudanças em processos de negócio.
31
O Business Process Management System (BPMS) ou Suíte BPM e ferramentas, são
tecnologias indispensáveis na modelagem, análise e desenho de processos de negócio.
Para geração do modelo em notação BPMN (Capítulo 5) foi utilizado o Software
Bizagi Modeler, que compõe a Suíte de Gestão de Processos de Negócios da Bizagi.
O Bizagi Modeler é reconhecido pelos membros da comunidade (usuários finais,
estudantes e parceiros) como o ambiente de modelagem BPMN, que permite a especialistas
em negócios desenhar, documentar e evoluir seu modelo de processo com total confiança.
Neste software destacam-se o intuitivo sistema de arrastar-e-soltar, atualizações livres de
código e ferramentas para geração automática de documentos (BIZAGI, 2016).
A Figura 10 ilustra a tela inicial do software Bizagi:
Figura 10 – Tela inicial do software Bizagi
32
4 TRABALHOS RELACIONADOS
Alguns trabalhos relacionam a área de mineração de dados com o processo de
Autoavaliação Institucional. Dentre eles destacam-se os seguintes trabalhos:
•
Ladeira, Machado e Gomes (2013) verificaram em seu artigo que a formação de padrões
pelos atributos permitiu, à luz dos especialistas, a mensuração da qualidade das atividades
de trabalho de conclusão de curso, demonstrando que o DM representa opção válida aos
processos de análise e avaliação no ambiente acadêmico;
•
Silva et al (2010), verificaram em seu artigo, quais dos itens na percepção do discente a
respeito do desempenho didático de docentes, mais influenciam na nota geral do professor
no âmbito de uma universidade particular, como também identificaram o perfil docente
em relação à titulação e ao regime de trabalho. Para isto foi avaliada a influência de alguns
itens por meio da aplicação do processo de descoberta de conhecimento em banco de
dados com a aplicação do método de classificação, por meio do algoritmo
linearregression, onde percebeu-se que o item que mais influencia na equação de
regressão para estimar a nota geral foi o relacionamento do professor com o aluno;
•
Oliveira et al (2012) destacaram em seu artigo que através da análise dos resultados da
avaliação institucional (dos discentes quanto aos cursos superiores do IFS - Instituto
Federal de Sergipe) com a mineração de dados foi possível descobrir a relevância dos
atributos (questões) envolvidos no processo de Autoavaliação bem como pode detectar as
fragilidades e potencialidades da IES – Institutos Superiores de Educação e fornecer aos
gestores subsídios para tomada de decisão;
•
Herdt (2001) relata em sua tese que foram utilizadas, para análise da avaliação
institucional de uma universidade, uma ferramenta estatística e as técnicas de mineração
de dados: clusterização e associação que ao serem aplicadas foram úteis para a descoberta
de conhecimento identificando variáveis que podem ser trabalhadas por influenciarem na
qualidade dos serviços prestados pela instituição.
33
5 APLICAÇÃO DA MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO DO
IFFLUMINENSE
5.1 Autoavaliação Institucional no IFFluminense
Para Voos (2004), a Avaliação Institucional é uma atividade organizadora, sistemática,
e orientadora da reflexão das ações de uma instituição de ensino, como também, uma opção
política de (re) significação e (re) conceitualização de suas práticas.
No âmbito do Ministério da Educação (MEC) a Avaliação Institucional é um dos
instrumentos complementares do Sistema Nacional de Avaliação da Educação Superior
(SINAES) e está ligada à melhoria da qualidade da educação superior, à orientação da
expansão de sua oferta, ao aumento permanente da sua eficácia institucional e efetividade
acadêmica e social, ao aprofundamento dos compromissos e responsabilidades sociais das
instituições de educação superior, por meio da valorização de sua missão pública, da
promoção dos valores democráticos, do respeito à diferença e à diversidade, da afirmação da
autonomia e da identidade institucional (SINAES, 2011).
A Lei nº 10.861/04, artigo 3º, estabelece dez dimensões a serem consideradas no
processo de Avaliação Institucional, descritas abaixo (INEP, 2004b):
•
A missão e o Plano de Desenvolvimento Institucional (PDI);
•
A política para o ensino, a pesquisa, a pós-graduação, a extensão e as respectivas
normas de operacionalização;
•
A responsabilidade social;
•
A comunicação com a sociedade;
•
As políticas de pessoal, de carreiras do corpo docente e técnico-administrativo;
•
Organização e gestão da instituição;
•
Infraestrutura;
•
Planejamento e avaliação;
•
Políticas de atendimento aos estudantes;
•
Sustentabilidade financeira.
Para que Autoavaliação Institucional alcance bons resultados é imprescindível que as
seguintes condições sejam atendidas em sua totalidade (INEP, 2004a):
34
•
Existência de uma equipe de coordenação;
•
Participação de integrantes de todos os segmentos da IES;
•
Compromisso explícito dos gestores da IES;
•
Informações, coleta e dados sejam confiáveis;
•
Uso efetivo dos resultados da avaliação.
A atual diretoria de Avaliação Institucional auxilia na identificação e construção da
identidade institucional do IFFluminense, contribuindo para a descentralização e o
aperfeiçoamento da gestão acadêmica e administrativa, por meio de ações que articulem a
avaliação institucional ao planejamento estratégico. A partir disto, pode-se conceber a
avaliação institucional como um processo sistemático de busca de subsídios para melhoria e
aperfeiçoamento da qualidade da instituição face seus fins acadêmicos, científicos e sociais
(IFFluminense, 2016).
A metodologia da Autoavaliação Institucional do IFFluminense referente ao ciclo de
2012/2013 está de acordo com a Figura 11.
Figura 11 – Metodologia de Avaliação Institucional do IFFluminense
Fonte: IFFluminense (2013).
35
A Tabela 1 mostra os indicadores e variáveis para o processo de Autoavaliação
Institucional dos cursos do IFFluminense.
Tabela 1 – Indicadores e Variáveis para Autoavaliação Institucional dos cursos do
IFFluminense - Fonte: IFFluminense (2013).
Indicadores
Critérios (Variáveis)
Participantes
DO
DI
Projeto Pedagógico do Curso (PPC)
Integralização curricular
Carga horária do currículo
Atribuições da coordenação
Eventos apoiados e produzidos
x
x
x
x
x
x
Assiduidade
Disponibilidade
Comunicação docente/coordenação
Comunicação discente/coordenação
Resolução e encaminhamento das questões
Disponibilização de informações
x
x
x
Assiduidade
Disponibilidade
Comunicação coordenação/docente
Participação dos docentes no curso
Comunicação docentes/discentes
Pontualidade
Apresentação do plano de ensino
Planejamento da aula e cumprimento do conteúdo
Domínio do conteúdo
Clareza nos critérios de avaliação
Trabalhos/avaliações adequados ao conteúdo
Incentivo às atividades de pesquisa e extensão
x
x
x
x
x
Satisfação de atuar no curso
Motivação, Integração, Relacionamento com colegas do
curso, Relacionamento com alunos do curso, Infraestrutura do
curso, Disciplinas lecionadas, Carga horária, Número de
disciplinas
x
Infraestrutura e laboratórios do
curso
Sala da coordenação
Espaço físico dos laboratórios x número de alunos
Estado de conservação dos laboratórios Equipamentos x
número de alunos
Modernidade dos equipamentos
Funcionamento dos equipamentos
Uso de materiais adequados e atualizados
Climatização
Disponibilidade de recursos materiais
Recursos audiovisuais
x
x
x
x
x
x
x
x
x
x
Discente
Pontualidade das turmas, Assiduidade das turmas,
Comunicação turma/professor, Rendimento das turmas,
Participação das turmas nas aulas, Nível de interesse das
turmas
x
Planejamento (Sobre o curso)
Coordenação
Docentes
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
36
Conforme a tabela acima, participam da Autoavaliação os discentes (DI) e docentes
(DO) dos cursos do IFFluminense. Cada indicador e suas variáveis foram avaliados de acordo
com as seguintes alternativas: Muito Bom, Bom, Regular, Ruim, Péssimo, Não sei responder.
5.2 KDD aplicado a Autoavaliação
O KDD aplicado ao processo de Autoavaliação do IFFluminense segue de acordo com as
seguintes etapas:
•
Seleção de Dados: Nessa etapa foi obtida a base de dados da Autoavaliação
Institucional do Instituto Federal Fluminense do ciclo de 2012/2013, estando a mesma
com a extensão *.xls, que deverá ser, posteriormente, convertida para o formato *.arff
(Attribute-Relation File Format) do software Weka. Assim a base de dados escolhida para
participação neste processo se refere a avaliação dos discentes e docentes para os cursos
técnicos e de graduação do IFFluminense, contendo os atributos relacionados as variáveis da
Tabela 1;
•
Pré-processamento: Devem ser retirados da base de dados, informações ausentes,
errôneas, inconsistentes e nulas;
•
Transformação: No caso deste trabalho, sugere-se a utilização do software Weka, onde
os dados devem ser convertidos para o formato *.arff. No banco de dados da
Autoavaliação, cada atributo ou campo foi preenchido com os valores da
Autoavaliação como: Muito Bom, Bom, Regular, Ruim, Péssimo, Não sei responder.
No formato *.arff sugere-se que os atributos sejam transformados para a sigla
correspondente: Muito Bom=MB; Bom=B; Regular=M, Ruim=R, Péssimo=P e Não
sei responder =N. Os campos nulos ou em branco serão eliminados na fase de préprocessamento. O arquivo *.arff de acordo com a base de dados do relatório do
IFFluminense possui a seguinte estrutura para avaliação docente: Nome da Tabela
(@relation
Docente),
Nome
dos
campos
e
valores
possíveis
(@atributte
PlanPPC{MB,B,M,R,P,N}). Para criação do nome do campo utilizou-se a seguinte
regra: As 4 primeiras letras do nome do indicador (Tabela 1) seguido das iniciais do
nome da variável (Tabela 1). Por exemplo, sendo Planejamento (Sobre o curso) o
indicador, e o critério/variável Projeto Pedagógico do Curso, o nome do campo criado
foi PlanPPC. E as opções de resposta do questionário são apresentadas entre chaves
em forma de sigla. A conversão completa dos dois arquivos de respostas dos docentes
e discentes encontra-se no Apêndice 1 e 2;
37
•
Mineração de dados (Data mining): Na fase de mineração de dados, dentro do
processo de KDD, necessita-se definir a técnica e o algoritmo a ser utilizado em
função da tarefa proposta. Uma vez escolhido o algoritmo a ser utilizado, deve-se
implementá-lo e adaptá-lo ao problema proposto. Para finalizar essa etapa deve-se
executar o algoritmo a fim de obter resultados que serão analisados na fase de
interpretação e avaliação do resultado. Foi escolhida a técnica de associação e o
algoritmo Apriori por terem sido utilizados em projetos atuais no Brasil na área de
Mineração de Dados Educacionais, foi escolhido o software Weka pela mesma razão
(de acordo com o trabalho dos autores Goldschmidt, Passos E Bezerra (2015). E
também, a partir do estudo dos trabalhos relacionados (Capítulo 4), com base no que
os autores citados afirmaram pode-se verificar que a utilização da regra de Associação
junto ao algoritmo Apriori pode gerar conhecimentos úteis. E a escolha pelo Weka
também se deve a apresentação de particularidades como: facilidade de download e de
instalação, usabilidade e quantidade de algoritmos e por ser um software livre. A
ferramenta WEKA e a sua documentação encontram-se no site do software;
•
Interpretação/Avaliação: Esta fase será feita posteriormente, pois só quando os
resultados forem obtidos através do software Weka e o algoritmo Apriori e as relações geradas
deste, serão avaliados e interpretados. É necessário organizar a base na ferramenta Weka
para que o algoritmo não traga dados inconsistentes, como por exemplo, uma relação
que afirme que o docente está satisfeito com o curso sendo que ele afirmou que a
infraestrutura do curso é péssima. O indicador de satisfação será considerado alto
quando todas as variáveis pertencentes a ele forem avaliadas como muito bom ou
bom.
As etapas, descritas acima, do KDD aplicado ao processo de Autoavaliação podem ser
melhor compreendidas através de um modelo capaz de ilustrar de forma visual todo o
processo necessário para extração de conhecimento das bases de dados.
Este modelo foi elaborado utilizando a notação BPMN, conforme mostra a Figura 12.
Através deste modelo pode-se relacionar as atividades do processo com a etapas do
KDD, onde:
•
Seleção de Dados: Inicia-se o BPMN com esta etapa que refere-se as atividades de:
analisar
a
base
de
dados
da
Autoavaliação
Institucional,
extrair
os
indicadores/variáveis de cursos e criar dois arquivos: curso_discente e curso_docente.
Realiza-se a análise dos dados da Autoavaliação Institucional onde são extraídos os
38
indicadores/variáveis no caso deste trabalho, de cursos, e após cria-se dois arquivos,
relacionado os cursos com os respondentes discentes e docentes ficando com os nomes
de arquivos: curso_discente e curso_docente;
•
Pré-processamento: refere-se as atividades de verificar os dados armazenados e
eliminar os dados inconsistentes e nulos. Nesta etapa, verifica-se os dados e se caso
for necessária a limpeza será executada a atividade de eliminação de dados nulos e
inconsistentes, porém caso não precise realizar a limpeza, executa-se a atividade da
etapa de transformação de conversão de formato de arquivo que será detalhada a
seguir;
•
Transformação: esta etapa refere-se as atividades de converter o formato dos
arquivos .xls para .arff e abrir a base de dados em .arff no Weka. Após a limpeza, é
necessário converter os dados da planilha em .xls para arff para que se possa abrir a
base de dados no Weka e posteriormente assim realizar a mineração e interpretação
dos dados;
•
Mineração: esta etapa refere -se a atividade de: executar o software utilizando a
técnica de Associação através do algoritmo Apriori, ou seja, com o arquivo já no
formato .arff, ele será executado no software utilizando a técnica de associação com o
Apriori com o intuito de ter um resultado válido;
•
Interpretação/Avaliação: refere-se as atividades de: analisar os resultados das regras de
associação e gerar o conhecimento para tomada de decisão. Nesta etapa, ao analisar os
resultados das regras de associação verifica-se se os resultados são válidos, se são
válidos a próxima atividade a ser executada será a geração de conhecimento para a
tomada de decisão, caso os resultados não sejam válidos, é necessário retornar a
atividade da etapa de mineração que é executar novamente o software utilizando a
técnica de associação com o algoritmo Apriori.
39
40
6 CONSIDERAÇÕES FINAIS
Pretende-se com a mineração de dados, obter a melhoria do resultado do processo de
Autoavaliação Institucional dos cursos, fornecendo informações relevantes para gestão dos
cursos seja pelos coordenadores dos mesmos ou para o MEC (Ministério da Educação) no que
diz respeito aos cursos de graduação.
Para que as informações sejam relevantes para gestão, espera-se que o modelo
proposto seja capaz de gerar através das regras de Associação, padrões como os
exemplificados abaixo:
•
Discente que cursou o ensino médio todo em escola pública => considerou a
infraestrutura do curso como muito boa;
•
Docente que possui regime de trabalho de dedicação exclusiva => considerou a
integralização curricular boa;
•
Discente que participa das atividades de pesquisa e extensão => considerou a
infraestrutura do curso e dos laboratórios como muito boa;
•
Docente que utiliza laboratório em suas aulas => considerou a modernização dos
equipamentos como muito bom;
•
Discente que utiliza constantemente os laboratórios => considerou o funcionamento
dos equipamentos como bom.
Com a conclusão deste trabalho, pode-se identificar alguns estudos futuros a serem
realizados a partir do tema, tais como:
•
Implantar o modelo proposto para gerar conhecimento útil através da base de
Autoavaliação dos cursos;
•
Comparar os resultados obtidos com a mineração de dados em relação aos resultados
obtidos através dos métodos estatísticos em relação a Autoavaliação dos cursos;
•
Alterar o modelo proposto e aplicar nas demais áreas da Autoavaliação, tais como:
infraestrutura dos campus e serviços institucionais e dos Campus.
41
REFERÊNCIAS
ABPMP (Association of Business Process Management Professionals) Brasil. BPM CBOK
Versão 3.0: Guia para o Gerenciamento de Processos de Negócio Corpo Comum de
Conhecimento. 2. ed. São Paulo, SP. ABPMP, 2014.
AGRAWAL, R.; SRIKANT, R. Fast algorithms for mining association rules. 20th VLDB
Conference, p. 478-499, 1994.
ARAÚJO, J.R.H.; TARAPANOFF, K. Precisão no processo de busca e recuperação da
informação: uso da mineração de textos. Ciência da informação, v. 35, n. 3, p. 236-247, 2006.
Disponível em: <http://www.scielo.br/pdf/ci/v35n3/v35n3a23.pdf>. Acesso em: out. 2015.
BAKER, R.S.J.D., YACEF, K. The State of Educational Data Mining in 2009: A Review and
Future Visions. Journal of Educational Data Mining, 1 (1): 3-17. 2009.
BIZAGI, Software Bizagi. Disponível em: <http://www.bizagi.com/pt/produtos>. Acesso em:
abr. de 2016.
BOLINA, A.C. Avaliação do framework Mapreduce para paralelização do algoritmo Apriori.
BRACONI, J; OLIVEIRA, S.B. Business Process Modeling Notation (BPMN). In: VALLE,
R; OLIVEIRA, S.B. Análise e Modelagem de Processos de Negócio: Foco na Notação
BPMN. 1.ed. São Paulo: Atlas, 2011.
BRITTO, G.C. BPM Para Todos - Uma Visão Geral Abrangente, Objetiva e Esclarecedora
sobre Gerenciamento de Processos de Negócio /– 1. ed. – Rio de Janeiro: Gart Capote, 2012.
Disponível
em:
<
http://docplayer.com.br/1509386-Bpm-para-todos-uma-visao-geral-
abrangente-objetiva-e-esclarecedora-sobre-gerenciamento-de-processos-de-negociobpm.html>. Acesso em: abr.2016.
BUSINESS PROCESS MODELING NOTATION (BPMN). Available specification: business
process modeling notation, v 2.1. Site do BPMN. Disponível em: <http://www.bpmn.org >.
Acesso em: abr.2016.
42
CAMILO, C.O; SILVA, J.C. Mineração de Dados: Conceitos, Tarefas, Métodos e
Ferramentas.
Relatório
Técnico
-
Agosto,
2009.
Disponível
em:
<http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf>.
Acesso em fev. 2016.
CARDOSO, O. N. P.; MACHADO, R. T. M. Gestão do conhecimento usando data mining:
estudo de caso na Universidade Federal de Lavras. Rev. Adm. Pública, v. 42, n. 3, p. 495-528,
2008. Disponível em: <http://dx.doi.org/10.1590/S0034-76122008000300004 >. Acesso em:
out. 2015.
CASTANHEIRA, L.G. Aplicação de Técnicas de Mineração de Dados em Problemas de
Classificação de Padrões. Dissertação. Departamento de Engenharia Elétrica - UFMG, 2008.
Disponível
em:
<http://www.bibliotecadigital.ufmg.br/dspace/handle/1843/BUOS-
8CDFQK>. Acesso em: nov. 2015.
CHAGAS, D.J; CHAN, C.S; CORSI, A.C. Análise do banco de atendimentos da Defesa Civil
do Estado de São Paulo. Anu. Inst. Geocienc. 2010, vol.33, n.1, pp. 35-43. Disponível
em:http://ppegeo.igc.usp.br/scielo.php?script=sci_arttext&pid=S010197592010000100003&l
ng=pt&nrm=iso. Acesso em: mar.2016.
CORRÊA, A.M.C.J; SFERRA, H. H. Conceitos e Aplicações de Data Mining. Revista de
Ciência
&
Tecnologia,
v.
11,
n.
22
–
p.
19-34,
2004.
Disponível
em:
<http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf>. Acesso em: nov. 2015.
COSTA, E. et al. Mineração de Dados educacionais: Conceitos, Técnicas, Ferramentas e
Aplicações.
Disponível
em:
<http://www.br-
ie.org/pub/index.php/pie/article/view/2341/2096>. Acesso em: mar. 2016.
COUTINHO,
F.
Data
Mining.
2003.
Disponível
em:
<http://www.dwbrasil.com.br/html/dmining.html>. Acesso em: set. 2015.
DE AMO, Sandra. Técnicas de mineração de dados. Jornada de Atualização em Informática,
2004. Disponível em: <www.deamo.prof.ufu.br/arquivos/JAI-cap5.pdf>. Acesso em: jan.
2016.
43
DINIZ, C. A. R.; LOUZADA NETO, F. Data mining: uma introdução. São Paulo: ABE,
123p, 2000.
FAYYAD, et al. Advances in Knowledge Discovery and Data Mining. AAAI/MITPress,
1996. Disponível em: <http://dl.acm.org/citation.cfm?id=545174>. Acesso em: out. 2015.
FILHO, J.B.A.P; MOURA, H.P. Gestão de processos de negócio: uma adaptação da
metodologia de Rummler-Brache baseada numa aplicação real. 2007. Dissertação
(Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal
de
Pernambuco,
Recife:
PE,
2007.
Disponível
em:
<
http://repositorio.ufpe.br:8080/xmlui/handle/123456789/1367> Acesso em: abr. 2016.
GALVÃO, N. D.; MARIN, H. F. Técnica de mineração de dados: uma revisão da literatura.
Acta
Paul
Enferm,
v.
22,
n.
5,
p.
86-90,
2009.
Disponível
em:
<http://dx.doi.org/10.1590/S0103-21002009000500014.> Acesso em: ago. 2015.
GARCIA, M. J. Adoção de BPM pelas IES brasileiras: características e oportunidades de
melhoria. 2015. 95 p. Dissertação. Faculdade de Economia, Administração e Contabilidade
de Ribeirão Preto, Universidade de São Paulo. Ribeirão Preto. Disponível em:
<www.teses.usp.br/teses/...15122015.../publico/MarcosJGarcia_Corrigida.pdf>Acesso
em:
mar. 2016.
GOLDSCHMIDT, R.; PASSOS, E. Data mining: um guia prático, conceitos, técnicas,
ferramentas, orientações e aplicações. 1. ed. Rio de Janeiro, RJ: Elsevier, 2005.
GOLDSCHMIDT, R.; PASSOS, E; BEZERRA, E. Data Mining: conceitos, técnicas,
algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro, RJ: Elsevier, 2015.
GUTIERREZ, M; BERTRAND, H. Estudos em Negócios IV. Rio de Janeiro, RJ: Mauad,
2005.
HAN, J.; KAMBER, M. Data Mining concepts and techniques. 2011. Disponível em:
<http://web.engr.illinois.edu/~hanj/bk3/bk3_slidesindex.htm>. Acesso em: ago. 2015.
44
HERDT, R.M. Utilização de técnicas de mineração de dados na análise das informações de
uma
universidade.
Florianópolis:
SC,
2001.
Disponível
em:
<http://repositorio.ufsc.br/xmlui/handle/123456789/81941>. Acesso em mar. 2016.
IFFLUMINENSE, Introdução sobre diretoria de avaliação institucional. Site da Instituição.
<http://portal1.iff.edu.br/reitoria/diretorias-sistemicas/diretoria-de-avaliacaoinstitucional>.Acesso em: fev. 2016.
IFFLUMINENSE. Relatório de Autoavaliação Institucional 2012/2013 - Campus CamposCentro.
Campos
dos
Goytacazes,
RJ:
2013.
Disponível
em:
<http://200.143.198.110:8080/iff/campus/reitoria/diretoria-de-planejamento-estrategico-e
avaliacao-institucional/autoavaliacao-institucional-2012-2013/AvaliacaoInstitucionalCampos-Centro.pdf >. Acesso em: fev. 2016.
INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS (INEP). Orientações Gerais para o
Roteiro da Autoavaliação das Instituições. Brasília, DF: INEP, 2004a. Disponível em:
<http://download.inep.gov.br/download/superior/sinaes/orientacoes_sinaes.pdf>. Acesso em:
ago. 2015.
_______________– Diretrizes para a Avaliação das Instituições de Ensino Superior. Brasília,
DF:
INEP,
2004b.
Disponível
em:
<
www.est.edu.br/downloads/pdfs/legislacao_cpa_17655.pdf >. Acesso em: fev. 2016.
____________. Seminários Regionais sobre Autoavaliação Institucional e Comissões
Próprias de Avaliação (CPA – 2013). Diretoria de Avaliação da Educação Superior (DAES).
Brasília,
DF:
2013.
Disponível
em:
<http://download.inep.gov.br/educacao_superior/avaliacao_institucional/seminarios_regionais
/anais/2015/anais_dos_seminarios_regionais_2013.pdf>
LADEIRA, R.C; MACHADO, S.H.M; E GOMES, G.R.R. Avaliação da percepção de
discentes e da avaliação de docentes em relação ao trabalho de conclusão de curso utilizando
ferramentas de data mining – estudo de caso. Revista Eletrônica Produção & Engenharia, v.
4,
n.
2,
p.
412-426,
Jan./Jun.2013.
Disponível
em:
<
45
http://www.revistaproducaoengenharia.org/arearestrita/arquivos_internos/artigos/19-281%2020formatado20em206-8-13.pdf>. Acesso em fev.2016.
LAROSE, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. John
Wiley and Sons, Inc, 2005.
LI, W; HAN, J; PEI, J. C: Accurate and efficient classification based on multiple classassociation rules, 2001.
LIU, B; HSU,W; MA, Y. Integrating classification and association rule mining. AAAI
Workshop of Knowledge Discovery in Databases, 1998.
MALTA, R.A.S. BPM – Business Process Management: Metodologia estratégica na gestão
de
negócios.
Caruaru,
PE,
2010.
Tese.
Disponível
em:
<
http://repositorio.favip.edu.br:8080/bitstream/123456789/1146/1/2007101594++Rafaella+Alv
es+Santos+Malta+-+ADMS0701.pdf.>. Acesso em: abr.2016.
MARTINHAGO, S. Descoberta de Conhecimento sobre o Processo Seletivo da UFPR.
Dissertação
de
Mestrado.
Curitiba:
PR,
2005.
Disponível
em:
<http://acervodigital.ufpr.br/handle/1884/2350>. Acesso em: abr.2016.
MELO, M.D. Introdução a mineração de dados utilizando o Weka. CONNEPIAL 2010
Disponível
em:
<http://connepi.ifal.edu.br/ocs/index.php/connepi/CONNEPI2010/paper/view/258/207>.
Acesso em: fev.2016.
OLIVEIRA, A.G., GARCIA, D.F. Mineração da base de dados de um processo seletivo
universitário. Artigo. Curso de Ciência da Computação. Universitário de Formiga
(UNIFOR/MG)
–
Formiga:
MG,
2004.
Disponível
http://www.dcc.ufla.br/infocomp/index.php/INFOCOMP/article/view/73/58>.
em:
Acesso
<
em:
mar. 2016.
OLIVEIRA, L.R, et al. A contribuição de Mineração de Dados no processo de Autoavaliação
dos cursos superiores do Instituto Federal de Sergipe. VII CONNEPI - Palmas: TO, 2012.
46
Disponível em: <http://propi.ifto.edu.br/ocs/index.php/connepi/vii/paper/viewFile/4662/989>.
Acesso em: mar.2016.
PAMPA, N. R. Técnicas e Ferramentas automáticas e inteligentes para a extração de
conhecimento em bases de dados. Dissertação de tese de mestrado. DSIF, FEEC, UNICAMP,
2003. Disponível em: <http://unicamp.sibi.usp.br/handle/SBURI/12445>. Acesso em: nov.
2015.
PICHILIANI,
M.
Visualizando
algoritmos.
2013.
Disponível
em:
<http://pichiliani.com.br/wp-content/uploads/2013/04/Apriori.jpg> Acesso em: mar.2016.
REZENDE, S. O. Sistemas Inteligentes – Fundamentos e Aplicações. Barueri, SP: Manole,
2005.
ROMERO, C.; VENTURA, S. Educational Data Mining: A Review of the State of the Art.
IEEE Trans. On Systems, Man and Cybernetics – Part C: Aplications and Reviews. V. 40, n.
6, 2010.
RUMMLER, G.A.; BRACHE, A.P. Improving Performance. São Paulo: Makron Books,
1994, 435p.
SILVA NETO et al. Técnicas de mineração visual de dados aplicadas aos dados de
instrumentação da barragem de Itaipu. Gest. Prod., São Carlos, v. 17, n. 4, p. 721-734, 2010.
Disponível em: <http://dx.doi.org/10.1590/S0104-530X2010000400007>. Acesso em: nov.
2015.
SILVA, R. M. et al. Percepção dos discentes em relação aos docentes através da aplicação de
técnicas e métodos de mineração de dados. COBENGE, 2010 Disponível em:
<http://www.abenge.org.br/CobengeAnteriores/2010/artigos/549.doc>.
Acesso
em:
nov.
2015.
SHOLOM M. W.; NITIM, I. Predict Data Mining. San Francisco, CA, USA: Morgan
Kaufmann Publishers, 1999.
47
SOBRINHO, J. D. Avaliação da educação superior. Petrópolis: Vozes, 2000.
SOUZA, M.U.R.S. Mineração de Dados aplicada à celeridade processual do tribunal de
contas do estado do Pernambuco (TCE-PE). Dissertação (mestrado) Universidade Federal de
Pernambuco.
Recife:
PE,
2009.
Disponível
em:
<
repositorio.ufpe.br:8080/xmlui/handle/123456789/2315 >. Acesso em: fev. 2016.
SZILAGYI, D.C. Modelagem de Processos de Negócio - um Comparativo entre BPMN e
UML.
Dissertação
(mestrado).
São
Paulo,
2010.
Disponível
em:
<http://www.sapientia.pucsp.br/tde_busca/arquivo.php?codArquivo=12252>. Acesso em: abr.
2016.
TAN, P. et al. Introdução ao Datamining: Mineração de Dados. Rio de Janeiro: Ciência
Moderna, 2009.
VALLE, R; OLIVEIRA, S.B; org. Análise e Modelagem de Processos de Negócio: Foco na
Notação BPMN. (Business Process Modeling Notation) 1.ed. São Paulo: Atlas, 2011.
VIANNA, R. C. X. et al. Mineração de dados e características da mortalidade infantil. Cad.
Saúde Pública, Rio de Janeiro, v. 26, n. 3, p. 535-542, mar. 2010.
VOOS, J. B. A. O processo de avaliação institucional e a adaptação estratégica na
Universidade da Região de Joinville – UNIVILLE. 216f. Tese (Doutorado em Engenharia de
Produção) Programa de Pós-Graduação em Engenharia de Produção e Sistemas. Universidade
Federal de Santa Catarina: Florianópolis, 2004.
WANG, Y. J; XIN, Q; COENEN, F. Mining efficiently significant classification association
rules. In: STUDIES IN COMPUTATIONAL INTELLIGENCE, p. 443U˝ 467.SpringerVerlag, 2008.
WEKA. Disponível em: < www.cs.waikato.ac.nz/ml/weka>. Acesso em: jul. 2015.
48
Apêndice I – Arquivo Docente.arff
@relation Docente
@atributte PlanPCC {MB,B,M,R,P,N}
@atributte PlanIC {MB,B,M,R,P,N}
@atributte PlanCHC {MB,B,M,R,P,N}
@atributte PlanAC {MB,B,M,R,P,N}
@atributte CoordA {MB,B,M,R,P,N}
@atributte CoordD {MB,B,M,R,P,N}
@atributte CoordCDD {MB,B,M,R,P,N}
@atributte CoordRE {MB,B,M,R,P,N}
@atributte DocA {MB,B,M,R,P,N}
@atributte DocD {MB,B,M,R,P,N}
@atributte DocCCD {MB,B,M,R,P,N}
@atributte DocPDC {MB,B,M,R,P,N}
@atributte DocCDD {MB,B,M,R,P,N}
@atributte SatMov {MB,B,M,R,P,N}
@atributte SatInt {MB,B,M,R,P,N}
@atributte SatRCC {MB,B,M,R,P,N}
@atributte SatRAC{MB,B,M,R,P,N}
@atributte SatIC{MB,B,M,R,P,N}
@atributte SatDL{MB,B,M,R,P,N}
@atributte SatCH{MB,B,M,R,P,N}
@atributte SatND{MB,B,M,R,P,N}
@atributte InfraLabCurSC {MB,B,M,R,P,N}
@atributte InfraLabCurEFNA{MB,B,M,R,P,N}
@atributte InfraLabCurENA {MB,B,M,R,P,N}
@atributte InfraLabCurME {MB,B,M,R,P,N}
@atributte InfraLabCurFE {MB,B,M,R,P,N}
@atributte InfraLabCurUMA {MB,B,M,R,P,N}
@atributte InfraLabCurC {MB,B,M,R,P,N}
@atributte InfraLabCurDRM {MB,B,M,R,P,N}
@atributte InfraLabCurRA {MB,B,M,R,P,N}
@atribute DiscPT {MB,B,M,R,P,N}
@atribute DiscAT {MB,B,M,R,P,N}
@atribute DiscCTP {MB,B,M,R,P,N}
@atribute DiscRT{MB,B,M,R,P,N}
@atribute DiscPTA {MB,B,M,R,P,N}
@atribute DiscNIT {MB,B,M,R,P,N}
@data
...
49
Apêndice II – Arquivo Discente.arff
@relation Discente
@atributte PlanIC {MB,B,M,R,P,N}
@atributte PlanCHC {MB,B,M,R,P,N}
@atributte PlanEAP {MB,B,M,R,P,N}
@atributte CoordA {MB,B,M,R,P,N}
@atributte CoordD {MB,B,M,R,P,N}
@atributte CoordCDisc {MB,B,M,R,P,N}
@atributte CoordRE {MB,B,M,R,P,N}
@atributte CoordDI {MB,B,M,R,P,N}
@atributte DocA {MB,B,M,R,P,N}
@atributte DocCDD {MB,B,M,R,P,N}
@atributte DocP {MB,B,M,R,P,N}
@atributte DocAPE {MB,B,M,R,P,N}
@atributte DocPACC {MB,B,M,R,P,N}
@atributte DocCCA {MB,B,M,R,P,N}
@atributte DocTAC {MB,B,M,R,P,N}
@atributte DocIAPE {MB,B,M,R,P,N}
@atributte InfraLabCurEFNA{MB,B,M,R,P,N}
@atributte InfraLabCurENA {MB,B,M,R,P,N}
@atributte InfraLabCurME {MB,B,M,R,P,N}
@atributte InfraLabCurFE {MB,B,M,R,P,N}
@atributte InfraLabCurUMA {MB,B,M,R,P,N}
@atributte InfraLabCurC {MB,B,M,R,P,N}
@atributte InfraLabCurDRM {MB,B,M,R,P,N}
@atributte InfraLabCurRA {MB,B,M,R,P,N}
@data
...
Download