INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA FLUMINENSE CAMPUS CAMPOS-CENTRO PÓS-GRADUAÇÃO LATO SENSU EM ANÁLISE E GESTÃO DE SISTEMAS DE INFORMAÇÃO DALYANA DOS SANTOS FERNANDES DEISE VIANA DOS SANTOS UM MODELO DE MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO INSTITUCIONAL DE CURSOS – UM ESTUDO DE CASO NO IFFLUMINENSE CAMPOS DOS GOYTACAZES 2016 DALYANA DOS SANTOS FERNANDES DEISE VIANA DOS SANTOS UM MODELO DE MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO INSTITUCIONAL DE CURSOS – UM ESTUDO DE CASO NO IFFLUMINENSE Monografia apresentada ao Instituto Federal de Educação, Ciência e Tecnologia Fluminense, Campus Campos-Centro, como requisito parcial para conclusão do curso de Pós-graduação Lato Sensu em Análise e Gestão de Sistemas de Informação. Orientadora: Drạ Simone Vasconcelos Silva CAMPOS DOS GOYTACAZES 2016 Dedicamos a Deus e a todos que nos ajudaram nessa etapa de nossas vidas. AGRADECIMENTOS Primeiramente agradecemos a Deus pela força dada em todos os dias. Às nossas famílias, pelo apoio e confiança nas horas mais difíceis. À orientadora Simone, que contribuiu para a concretização deste trabalho. À todas às pessoas que de alguma forma fizeram este sonho se tornar uma realidade. A tecnologia da informação tem sido até agora uma produtora de dados, em vez de informação, e muito menos uma produtora de novas e diferentes questões e estratégias. Peter Druker RESUMO Tendo em vista o crescimento das bases de dados nas últimas décadas, tornou-se difícil para os diversos profissionais identificarem as informações úteis nesses grandes volumes de dados. Em busca de se analisar e extrair melhores informações e conhecimentos dos conjuntos de dados surgiu uma área de pesquisa denominada KDD (Knowledge Discovery in Databases), ou seja, Descoberta de Conhecimento em Bases de Dados. O processo KDD envolve várias atividades que são divididas em cinco etapas principais: seleção de dados, pré-processamento, transformação, mineração de dados (data mining) e interpretação/avaliação. Como parte do KDD, a mineração de dados tem contribuído na busca de conhecimento implícito que possa dar suporte à tomada de decisão. Este trabalho tem como objetivo propor um modelo (utilizando a notação BPMN – Business Process Modeling Notation) para utilização da mineração de dados para extração de conhecimento em bases de dados resultantes do processo de Autoavaliação Institucional dos cursos técnicos e de graduação do IFFluminense na base referente ao ciclo de 2012/2013. Com o modelo proposto, espera-se auxiliar na detecção de conhecimentos úteis para gestão dos cursos. Palavras-chave: Mineração de dados, Descoberta de conhecimento, Autoavaliação Institucional. ABSTRACT Given the growth of databases in recent decades, it has become difficult for many professionals to identify the useful information in these large volumes of data. Seeking to analyze and extract the best information and knowledge of the data sets came a research area called KDD (Knowledge Discovery in Databases), or Knowledge Discovery in Databases. The KDD process involves several activities which are divided into five main steps: selection of data, pre-processing, processing, data mining (data mining) and interpretation / evaluation. As part of KDD, data mining has contributed to the implicit knowledge of search that can support decision-making. This paper aims to propose a model (using the BPMN notation Business Process Modeling Notation) for use of data mining for extraction of knowledge in databases resulting from the Institutional Self-assessment process of technical courses and IFFluminense graduation in reference base the 2012/2013 cycle. With the proposed model, it is expected to aid in the detection of useful knowledge for management courses. Keywords: Data mining, knowledge discovery, Institutional Self Assessment. LISTA DE ABREVIATURAS E SIGLAS ABPMP - Association of Business Process Management Professionals API - Application Programming Interface ARFF - Attribute-Relation File Format BPM - Business Process Modeling BPMN - Business Process Model and Notation BPMS - Business Process Management System CBOK - Common Body of Knowledge CONAES - Comissão Nacional de Avaliação da Educação Superior CPA - Comissão Própria de Avaliação DM - Data Mining EDM - Educational Data Mining IA - Inteligência Artificial IFFLUMINENSE – Instituto Federal de Educação, Ciência e Tecnologia Fluminense INEP - Instituto Nacional de Estudos e Pesquisas MEC – Ministério da Educação e Cultura KDD - Knowledge Discovery in Database SINAES- Sistema Nacional de Avaliação da Educação Superior WEKA - Waikato Environment for Knowledge Analysis LISTA DE FIGURAS Figura 1 – Artigos por Região do Brasil............................................................................ 14 Figura 2 – Etapas do processo de KDD............................................................................. 17 Figura 3 – Associações entre registros de dados e classes............................................ 20 Figura 4 – Algoritmo Apriori............................................................................................ 22 Figura 5 – Fluxograma de execução do Algoritmo Apriori.......................................... 22 Figura 6 - Exemplo de execução do algoritmo Apriori..................................................... 23 Figura 7 – Tela inicial do software Weka.......................................................................... 24 Figura 8 – Regras de Associação com Apriori no Projeto Memore.................................. 26 Figura 9 – Elementos básicos do BPMN........................................................................... 30 Figura 10 - Tela inicial do software Bizagi....................................................................... 31 Figura 11 – Metodologia de Avaliação Institucional do IFFluminense............................ 34 Figura 12 – Modelo BPMN das etapas do KDD aplicado à Autoavaliação do IFFluminense 39 SUMÁRIO 1 INTRODUÇÃO........................................................................................................ 11 1.1 Objetivos................................................................................................................... 13 1.2 Justificativa.............................................................................................................. 13 1.3 Metodologia.............................................................................................................. 14 1.4 Estrutura dos capítulos........................................................................................... 2 MINERAÇÃO DE DADOS 15 (DATA 16 MINING)............................................................. 2.1 KDD (Knowledge Discovery in Database)............................................................. 16 2.2 Técnicas e algoritmos.............................................................................................. 19 2.2.1 Associação.............................................................................................................. 20 2.3 Software Weka.......................................................................................................... 23 2.4 Mineração de dados educacionais.......................................................................... 24 3 BPM (BUSINESS PROCESS MANAGEMENT) ......................................................... 27 3.1 BPMN (Business Process Model and Notation)..................................................... 28 4 TRABALHOS RELACIONADOS.............................................................................. 32 5 APLICAÇÃO DA MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO DO IFFLUMINENSE.....................................................................................….................. 33 5.1 Autoavaliação Institucional no IFFluminense...................................................... 33 5.2 KDD aplicado a Autoavaliação.............................................................................. 36 6 CONSIDERAÇÕES FINAIS....................................................................................... 40 REFERÊNCIAS.............................................................................................................. 41 Apêndice I – Arquivo Docente.arff................................................................................ 48 Apêndice II – Arquivo Discente.arff.............................................................................. 49 11 1 INTRODUÇÃO Um processo de Avaliação Institucional educacional, desenvolvido por membros internos e externos de uma comunidade acadêmica, visa promover a qualidade das instituições em todos os seus níveis e de acordo com sua missão. Tem como objetivo central a realização autônoma do projeto institucional de modo a garantir a qualidade acadêmica no ensino, na pesquisa, na extensão, na gestão e no cumprimento de sua pertinência e responsabilidade social. A Avaliação Institucional divide-se em duas modalidades (INEP, 2004a): • Autoavaliação – É a avaliação interna que é coordenada pela Comissão Própria de Avaliação (CPA) de cada instituição e orientada pelas diretrizes e pelo roteiro da Autoavaliação Institucional da Comissão Nacional de Avaliação da Educação Superior (CONAES); • Avaliação externa – Realizada por comissões designadas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), a avaliação externa tem como referência os padrões de qualidade para a educação superior expressos nos instrumentos de avaliação e os relatórios das Autoavaliações. O processo de avaliação externa independente de sua abordagem e se orienta por uma visão multidimensional que busque integrar suas naturezas formativas e de regulação numa perspectiva de globalidade. A avaliação interna deve ser relacionada com a avaliação externa, e dessa forma produzir conhecimento global para discussões sobre os aspectos da qualidade sobrepondo as interfaces entre os pontos positivos e negativos, com vistas à maximização da qualidade do ensino (SILVA et al., 2010). O processo de Autoavaliação Institucional gera uma enorme quantidade de dados devido ao número de questões dos questionários utilizados e principalmente devido ao grande número de respondentes. Portanto, a mineração de dados pode ser um método eficiente para extração de conhecimentos dessas bases de dados. Segundo Vianna et al. (2010), “a mineração de dados pode facilitar o entendimento de grande número de dados agrupados”. 12 Em vista do crescimento das bases de dados nas últimas décadas, tornou-se difícil para as pessoas identificarem o vasto volume de informações nesses grandes volumes de dados, surgindo a problemática de existirem muitos dados, porém pouco conhecimento. Sobre uma visão geral de mineração de dados, alguns autores explanam que: Mineração de dados (MD) consiste em uma linha de pesquisa e aplicação em banco de dados que visa criar estratégias específicas para extrair informações importantes, ocultas e previamente desconhecidas a partir de bases de dados na forma de regras e padrões. Dentre os diferentes tipos de informação que podem ser minerados, destacam-se: as regras de associação, modelos de classificação, padrões sequenciais e agrupamentos (clusters) de dados (HAN; KAMBER, 2011). Em busca de analisar e extrair melhores informações e conhecimentos dos conjuntos de dados surgiu uma área de pesquisa denominada KDD (Knowledge Discovery in Databases), ou seja, Descoberta de Conhecimento em Bases de Dados, que “permite a extração de conhecimento previamente desconhecido e potencialmente útil de um banco de dados”. Data Mining “é uma tecnologia que emergiu da intersecção de três áreas: estatística clássica, inteligência artificial e aprendizado de máquina” e é parte do KDD (CORRÊA; SFERRA, 2004). O surgimento das técnicas que permitem a automatização e análise, além de técnicas que procuram transformar grandes bases de dados em conhecimento, é o objetivo do KDD (FAYYAD, et al., 1996). A análise de grandes bases de dados de diversos segmentos, inclusive da área educacional trouxe à tona uma linha de pesquisa denominada Mineração de Dados Educacionais (EDM) que tem como principal objetivo "o desenvolvimento de métodos para exploração dos tipos de dados únicos provenientes dos ambientes educacionais e, utilizar esses métodos para entender melhor os alunos e as características de como eles aprendem” (BAKER; YACEF, 2009). Toda instituição possui um propósito, onde é necessário entender e estabelecer o conjunto de atividades necessárias para cumprir esta meta que são chamados de processo de negócio. O BPM - Modelagem de Processos de Negócio (Bussiness Process Model) melhora esses processos de negócio, proporcionando a análise e o redesenho dos mesmos e com a BPMN - Notação de Modelagem de Processos de Negócio (Business Process Model Notation) que seja compreensível por todos usuários de negócio criando assim uma ligação padronizada entre o processo de negócio e sua implementação (SZILAGYI, 2010). 13 Neste trabalho foi realizada uma análise do processo de Autoavaliação Institucional dos cursos do IFFluminense e proposto um modelo BPMN para utilização da mineração de dados na extração de conhecimentos nas bases de dados resultantes deste processo. Foi proposta a técnica de Associação junto ao algoritmo Apriori com apoio da ferramenta Weka. 1.1 Objetivos O objetivo principal deste trabalho é propor um modelo para utilização da mineração de dados na extração de conhecimentos nas bases de dados resultantes do processo de Autoavaliação Institucional dos cursos técnicos e de graduação do IFFluminense na visão dos docentes e discentes. Este objetivo pode ser dividido nos seguintes objetivos específicos: • Analisar o processo de Autoavaliação Institucional do IFFluminense e a base de dados gerada para detectar conhecimentos que possam ser úteis na gestão dos cursos, além de apoiar os coordenadores dos mesmos; • A partir da análise acima, propor um modelo (baseado nos conceitos de BPM – Business Process Model) de utilização da mineração de dados aplicada ao processo de Autoavaliação Institucional, no que diz respeito aos cursos do instituto. 1.2 Justificativa O processo de Autoavaliação Institucional do IFFluminense trata a base de dados de cada avaliação através de métodos estatísticos. A atual Diretoria de Avaliação Institucional do instituto acredita que uma abordagem relacionada à extração de conhecimentos da base de dados seria necessária e bastante útil para melhor aproveitamento das informações, possibilitando um melhor suporte a decisão para os gestores institucionais. Outro fator importante diz respeito ao pequeno número de instituições que utilizam e/ou publicam trabalhos que abordem a extração de conhecimento, como Data Mining e KDD, para o processo de Autoavaliação conforme visto nos trabalhos relacionados (Capítulo 4). Pode-se observar também que no último seminário (Seminários Regionais sobre Autoavaliação Institucional e Comissões Próprias de Avaliação (CPA - 2013)) realizado pelo INEP, nenhum dos artigos citou a utilização de mineração de dados para o processo de Autoavaliação Institucional. 14 Este seminário possui um anais com um total de 123 artigos divididos por região do país (INEP, 2013), conforme mostra a Figura 1. Figura 1 – Artigos por Região do Brasil 1.3 Metodologia A metodologia utilizada neste trabalho divide-se em: • Levantamento de referências bibliográficas sendo livros, artigos e revistas acadêmicas relacionados à mineração de dados (data mining), KDD e software Weka; • Estudo do software de mineração de dados (Weka); • Análise dos arquivos contendo os resultados da Autoavaliação Institucional dos cursos do IFFluminense referente à base de dados do ciclo de 2012/2013 do IFFluminense; • Análise da Técnica de Associação e do algoritmo Apriori; • Elaboração do modelo, utilizando os conceitos de BPM com a notação BPMN, de Mineração de Dados aplicado ao processo de Autoavaliação Institucional do IFFluminense. 15 1.4 Estrutura dos capítulos Este trabalho está estruturado em 6 capítulos. • O Capítulo 1 introduz o tema do trabalho, apresentando uma descrição do problema tratado, os objetivos pretendidos, a justificativa e a metodologia proposta para a sua elaboração; • O Capítulo 2 refere-se à mineração de dados, abordando temas como conceitos iniciais, Descoberta de Conhecimento em Banco de Dados (KDD), técnicas e algoritmos da Mineração de Dados detalhando suas etapas; • O Capítulo 3 refere-se ao Business Process Management (BPM), apresentando conceitos iniciais, além de detalhar a notação BPMN e o software Bizagi; • O Capítulo 4 apresenta os trabalhos relacionados ao tema Autoavaliação Institucional com mineração de dados; • O Capítulo 5 refere-se à mineração de dados na Autoavaliação do IFFluminense com a execução de cada etapa em detalhes, permitindo que se compreenda como o estudo de caso foi realizado; • O Capítulo 6 refere-se por fim as considerações finais que podem ser feitas a partir do estudo realizado. Este capítulo também apresenta as limitações identificadas e as sugestões para trabalhos futuros. Este trabalho é composto também por Apêndice 1 e 2 contém arquivo de modelo de discente e de docente para uso no Weka. 16 2 MINERAÇÃO DE DADOS (DATA MINING) A mineração de dados (Data Mining) pode facilitar o entendimento de grande número de dados agrupados como no caso deste trabalho. Ela surgiu há mais de uma década como uma alternativa promissora para análise desse grande número de dados agrupados conjugando técnicas de várias áreas como estatística e banco de dados. Data Mining “descende fundamentalmente de três linhagens: estatística clássica, inteligência artificial (IA) e o aprendizado de máquina (casamento entre a estatística e a IA)” (PAMPA, 2003). A mineração de dados é a análise inteligente e automática de dados para descobrir padrões ou regularidades em grandes conjuntos de dados, através de técnicas que envolvem métodos matemáticos, algoritmos baseados em conceitos biológicos, linguísticos e heurísticos (COUTINHO, 2003). Segundo Castanheira (2008), a mineração de dados caracteriza-se pela existência de um algoritmo que diante da tarefa proposta será eficiente em extrair conhecimento implícito e útil de um banco de dados. Pode-se dizer que mineração de dados é a fase que transforma dados puros em informações úteis dentro do processo de KDD, onde se necessita definir a técnica e o algoritmo a ser utilizado em função da tarefa proposta. 2.1 KDD (Knowledge Discovery in Databases) A mineração de dados é uma etapa do processo KDD, porém vários autores referem-se a mineração de dados e KDD de forma distinta. Data mining, ou mineração de dados, “é uma técnica que faz parte de uma das etapas da descoberta de conhecimento em banco de dados (KDD), capaz de revelar, automaticamente, o conhecimento que está implícito em grandes quantidades de informações armazenadas nos bancos de dados de uma organização” (CARDOSO; MACHADO, 2008). Já para Vianna et al. (2010), o Knowledge Discovery in Databases (KDD) é um “processo composto pela seleção de dados, pré-processamento, transformação dos dados e estabelecimento de padrões úteis na extração de conhecimento, ou seja, tradução de dados brutos em informações relevantes”. Galvão e Marin (2009) afirmam que “o processo de KDD utiliza métodos estatísticos e técnicas de inteligência artificial”. 17 Apesar do termo mineração de dados, ser apenas uma etapa do processo de KDD é comumente utilizado para referenciar todo o processo de KDD. O processo de KDD e suas etapas podem ser observadas na Figura 2. Figura 2 – Etapas do processo de KDD Fonte: Adaptada de FAYYAD et al., 1996. Estas etapas correspondem ao processo que os dados percorrem até se transformar em conhecimento útil que têm objetivos específicos para cada tipo de base, porém as finalidades são as mesmas. A seguir serão detalhadas todas as etapas do processo de KDD com enfoque nas suas características e finalidades: • Seleção: Nesta etapa, o propósito é identificar os dados significantes a serem trabalhados e que podem ser encontrados em vários formatos. Fase na qual é mapeado e identificado, o conjunto de informações a serem utilizadas (GOLDSCHIMIDT; PASSOS, 2005). As variáveis selecionadas para a mineração de dados são denominadas variáveis ativas, uma vez que são usadas para distinguir segmentos, fazer predições ou desenvolver outras operações específicas de mineração de dados (DINIZ; LOUZADA NETO, 2000); • Pré-processamento e Limpeza: Nessa fase ocorre o tratamento dos dados, ou seja, são realizadas tarefas envolvendo a limpeza de dados, objetivando a inconsistência, redundância e ausência entre os mesmos. A qualidade é crucial para obter dados confiáveis, uma vez que dados limpos e compreensíveis são requisitos básicos para o sucesso da mineração (DINIZ; LOUZADA NETO, 2000). Assim sendo, os dados são selecionados e analisados para serem transformados; 18 • Transformação: Nesta etapa, os dados são transformados para um formato adequado, para que possa ser trabalhado da forma apropriada para mineração. Segundo Melo (2010), além de localizar características úteis para representar os dados, essa etapa é também responsável pela escolha dos melhores atributos presentes no conjunto de dados. No caso deste trabalho em que o software utilizado será o Weka, os dados precisam ser convertidos para o formato ARFF (Attribute-Relation File Format); • Data Mining: A etapa de Mineração de Dados compreende a busca efetiva por conhecimentos úteis no contexto de aplicação no KDD, sendo a principal etapa deste processo (GOLDSCHIMIDT; PASSOS, 2005). Nesta etapa há a aplicação de algoritmos sobre os dados em busca de conhecimento implícito e útil além de definir as técnicas e os algoritmos a serem aplicados na questão proposta; • Interpretação/Avaliação: Os resultados do processo de descoberta do conhecimento podem ser mostrados de diversas formas. Esta fase envolve todos os participantes que avaliam de forma criteriosa os resultados proporcionando uma interpretação para o modelo, de onde se extrai o conhecimento. Martinhago (2005) determina tarefa como um problema de descoberta de conhecimento a ser solucionado. O autor ainda afirma que, no KDD existem diversas tarefas que dependem principalmente do domínio de aplicação e do interesse do usuário. Cada uma delas tem a finalidade de extrair um tipo diferente de conhecimento da base de dados e podendo requerer um algoritmo diferente em cada tarefa. A etapa de Mineração de Dados no KDD possui tarefas básicas, que são classificadas nas categorias descritivas e preditivas, que são: Clusterização, Classificação e Associação. As descritivas procuram padrões interpretáveis pelos humanos que descrevem os dados antes de realizar a previsão, sendo útil ao suporte a decisão. Já as preditivas envolvem o uso dos atributos de um conjunto de dados para prever o valor futuro da variável meta, sendo útil à tomada de decisões (Rezende, 2005). De acordo com Gutierrez e Bertrand (2005) descrevem clusterização, como a tarefa que objetiva reunir objetos em grupos, de modo que, os objetos de um grupo devem ser os mais semelhantes entre si e os menos semelhantes a objetos de outros grupos. A clusterização procura “grupos de padrões como padrões pertencentes a um mesmo grupo e que são mais similares uns aos outros e dissimilares a padrões em outros grupos” (SILVA NETO et al. 2010). Os algoritmos mais utilizados na tarefa de clusterização são os KMeans, K-Modes, K-Protopypes, K-Medoids e K-ohonem (CARDOSO; MACHADO, 2008). 19 Conforme Rezende (2005), a tarefa de classificação é uma função de aprendizado que mapeia dados de entrada, ou conjunto de dados de entrada em um número finito de categorias. Nela cada exemplo pertence a uma classe, entre um conjunto predefinido de classes. Alguns exemplos de algoritmos de classificação são: CBA (Classification-Based Association) (LIU; HSU; MA, 1998), CMAR (Classification based on Multiple Association Rules) (LI; HAN; PEI, 2001) e uma nova abordagem chamada de CARM (Classification Association Rule Mining) (WANG; XIN; COENEN, 2008). De acordo com Galvão e Marin (2009), a tarefa de associação consiste em identificar e descrever associações entre variáveis no mesmo item ou associações entre itens diferentes que ocorram simultaneamente, de forma frequente em uma base de dados. É também comum a procura de associações entre itens durante um intervalo temporal. Portanto, os algoritmos Apriori e GSP (Generalized Sequential Patterns - Padrão Sequencial Geral), dentre outros, implementam a tarefa de descoberta de associações. 2.2 Técnicas e Algoritmos Segundo Goldschmidt; Passos; Bezerra (2015), as técnicas e os algoritmos, que serão utilizados em um problema em questão, serão definidos na etapa de Mineração de Dados (Data Mining). Diversas técnicas de Data Mining vêm sendo utilizadas com sucesso no mundo inteiro e estão presentes em importantes instituições (nacionais e internacionais) tais como: Nasa, Wal-Mart, FedEx, UPS, Amazon, Caixa Econômica Federal, Banco do Brasil, Vale do Rio Doce, Petrobras, Dataprev, entre muitas outras (GOLDSCHMIDT; PASSOS; BEZERRA, 2015). Essas técnicas são usadas de forma articulada para estudar os dados e achar tendências e padrões nos mesmos. Segundo Tan et al. (2009), as técnicas de mineração de dados “são organizadas para agir sobre grandes bancos de dados, com o intuito de descobrir padrões úteis e recentes que poderiam, de outra forma, permanecer ignorados”. De acordo com Araújo e Tarapanoff (2006), com o auxílio de modelos matemáticos e ferramentas de mineração de dados, pode-se obter conhecimento de bases de dados com a ajuda de algoritmos que permitem a clusterização, classificação ou regras de associação. Este trabalho irá abordar a técnica de associação e a mesma será detalhada na seção a seguir. 20 2.2.1. Associação Segundo Camilo e Silva (2009), a Associação (Association) consiste em identificar quais atributos estão relacionados. Apresentam a forma: SE atributo X ENTÃO atributo Y. É uma das tarefas mais conhecidas devido aos bons resultados obtidos, principalmente nas análises da “Cesta de Compras" (Market Basket), onde identificamos quais produtos são levados juntos pelos consumidores. Alguns exemplos como determinar os casos onde um novo medicamento pode apresentar efeitos colaterais e identificar os usuários de planos que respondem bem a oferta de novos serviços. A técnica de mineração por Associação é um processo que tenta expor as características e as tendências, ou seja, tenta determinar o relacionamento entre um conjunto de itens. A vantagem em relação às outras técnicas é simplicidade no uso (CHAGAS; CHAN e CORSI, 2010). Essa técnica utiliza dois fatores importantes: fator de suporte e fator de confiança. O fator de suporte indica a ocorrência relativa da regra de associação observada dentro de um conjunto de dados. O fator de confiança é o grau com o qual a regra é verdadeira entre os registros individuais (DINIZ; LOUZADA-NETO, 2000). Uma regra de associação caracteriza o quanto a presença de um conjunto de itens nos registros de uma base de dados implica na presença de algum outro conjunto distinto de itens nos mesmos registros (AGRAWAL; SRIKANT, 1994). De Amo (2004) afirma que uma regra de associação é um padrão da forma X Y, onde X e Y são conjuntos de valores. Desse modo, o objetivo das regras de associação é encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados, conforme mostra a Figura 3. Figura 3 – Associações entre registros de dados e classes Fonte: Goldschmidt, Passos e Bezerra (2015). 21 Goldschmidt, Passos e Bezerra (2015) relataram que as regras de associação consistem em identificar associações entre variáveis simultaneamente. Com isso, de forma frequente em banco de dados é também comum a procura de associações entre itens durante um intervalo temporal, em que o modelo matemático mais utilizado é o algoritmo Apriori. O algoritmo Apriori é um clássico de Mineração de Regras de Associação (AGRAWAL; SRIKANT, 1994). Goldschmidt, Passos e Bezerra (2015) apontam as etapas de funcionamento do Apriori, como encontrar todos os conjuntos de itens frequentes que satisfazem à condição de suporte mínimo e a partir desses conjuntos gerar as regras de associação que satisfazem a condição de confiança mínima. O Apriori permite que se escolha dentre outras informações, o número de regras que serão mostradas e o grau de confiabilidade mínima para a formação das regras. O algoritmo inicia o processo de busca pelas associações identificando todas as regras que satisfazem o fator de suporte mínimo (GOLDSCHMIDT, PASSOS E BEZERRA, 2015). Segundo Souza (2009), o algoritmo Apriori tem o objetivo de diminuir o espaço de busca, ou seja, para evitar que todos os 2n subconjuntos sejam avaliados em relação as seguintes propriedades: • Todo subconjunto de um conjunto frequente é frequente; • Todo conjunto que contém um subconjunto não frequente também não é frequente. Souza (2009) descreve também, as etapas que o Apriori executa: • Calcular o suporte de todos os conjuntos de tamanho 1 e eliminar aqueles que não possuem o suporte mínimo; • Formar todos os possíveis conjuntos de tamanho 2 a partir daqueles de tamanho 1 e eliminar os novos conjuntos que não possuem o suporte mínimo; • Repetir o procedimento anterior até que, no k-ésimo passo, nenhum novo conjunto de tamanho k, obtido a partir dos conjuntos de tamanho k-1, tenha suporte mínimo. 22 A Figura 4 mostra o algoritmo do Apriori: Figura 4 – Algoritmo Apriori Fonte: Agrawal e Srikant (1994). De acordo com Bolina (2013) o fluxograma da Figura 5 busca ilustrar os passos que descrevem a execução do algoritmo Apriori: Figura 5 – Fluxograma de execução do Algoritmo Apriori Fonte: Bolina (2013). No exemplo da Figura 6, a seguir, está sendo utilizada uma pequena base de dados para ilustrar com facilidade como o algoritmo Apriori chegaria ao menor conjunto de itens, que descreva uma regra qualquer. Inicialmente, o algoritmo separa todos os elementos que compõem a base de dados. A seguir, é feito a busca, formando-se o conjunto inicial C1. É contado o número de vezes que cada elemento é instanciado e eliminada a linha do elemento que foi instanciado somente uma vez. 23 No próximo passo, são formados possíveis pares de elementos no conjunto C2. Novamente é feito a busca, a contagem e eliminação. Então, é retirado um único triplo, o conjunto C3 {2 3 5}, que é instanciado mais de uma vez, sendo este uma regra para a base. A partir daí, pode-se concluir que, {1,2,3} {1,2,5} e {1,3,5} não são regras para a base de dados exemplo, pois não pertencem ao conjunto C3. Figura 6 - Exemplo de execução do algoritmo Apriori Fonte: Pichiliani (2013) 2.3 Software Weka Segundo Melo (2010), o software livre Waikato Enviroment for Knowledge Analysis (WEKA), formado por um conjunto de implementações de algoritmos de diversas técnicas de Mineração de Dados está implementado na linguagem Java, que tem como principal característica sua portabilidade; desta forma é possível utilizá-la em diferentes sistemas operacionais, além de aproveitar os principais benefícios da orientação a objetos. A Weka foi desenvolvida na linguagem Java pelo curso de Ciência da Computação da Universidade de Waikato na Nova Zelândia. É uma ferramenta de apoio às etapas da descoberta de conhecimento em bases de dados, seu código é flexível e aberto, ou seja, de domínio público (GOLDSCHMIDT e PASSOS 2005; OLIVEIRA e GARCIA, 2004). 24 Melo (2010) também afirma que o Weka pode ser utilizado de três diferentes formas: interface gráfica conhecida como Weka Explorer fornece as diversas ferramentas para seus usuários através de janelas e seus elementos, a linha de comando é um meio utilizado para dar mais agilidade a processos repetitivos e acesso direto a funcionalidades que teriam mais passos a serem executados, caso fossem acessados via interface gráfica e acesso através de sua API é utilizada por desenvolvedores de software por fornecer um meio prático para o uso das funcionalidades implementadas no Weka. A Figura 7 mostra a tela inicial do Weka. Figura 7 – Tela inicial do software Weka Além disso, a ferramenta oferece recursos para a execução de tarefas relacionadas ao pré-processamento de dados como, por exemplo, a seleção e a transformação de atributos. A base de dados no formato texto é utilizada preferencialmente na ferramenta Weka. 2.4 Mineração de Dados Educacionais Segundo Goldschmidt, Passos e Bezerra (2015), a “Mineração de Dados Educacionais (expressão traduzida do inglês Educational Data Mining – EDM) é uma modalidade de mine ração em que os dados pertencem a contextos educacionais”. Costa et al. (2012) definem EDM como uma área emergente que procura desenvolver, adaptar e aplicar métodos de KDD de forma a identificar modelos de conhecimento a partir de grandes bases contendo informações relacionadas com a Educação (COSTA, et al, 2012, p.4 apud GOLDSCHMIDT; PASSOS; BEZERRA, 2015). 25 De acordo com Romero e Ventura (2010) apud Goldschmidt, Passos e Bezerra (2015), “as aplicações de EDM procuram abordar diversas questões na área de Educação para descobrir novos conhecimentos que permitam melhor compreender os estudantes e o processo de ensino e aprendizagem”, buscando aprimorar a qualidade de diversos aspectos da área e beneficiar os estudantes, como por exemplo, direcionando-os em relação aos estudos. A EDM é similar a Mineração de Dados, distinguindo-se em alguns aspectos em relação às aplicações de outros domínios. O objetivo desta varia de pesquisa aplicada, como o aprimoramento do processo de ensino aprendizagem e o perfil de estudo de cada estudante a pesquisa pura, visando à busca de uma compreensão mais profunda sobre o fenômeno educacional. Segundo Costa et al. (2012), “No Brasil, a EDM tem dado seus primeiros passos com produções interessantes, a partir de algumas iniciativas de pesquisa”. Dentre tais iniciativas, podemos citar os projetos Memore (Proc. CNPq 550310/2011-0) e o programa USA-UCA (PROEXT 2014 – MEC/SESu SIGProj: 141410.648.164063.17032013). Goldschmidt, Passos e Bezerra (2015) relataram que, o projeto Memore teve como objetivo desenvolver um ambiente computacional homônimo que, a partir de dados sobre o uso de laptops de baixo custo na Educação, pudesse apoiar docentes e gestores educacionais no aprimoramento do processo de aprendizagem e de políticas públicas de distribuição de dispositivos didáticos (laptops e tablets) nas escolas brasileiras. Já o programa USA-UCA surgiu em continuidade ao projeto Memore e se apresenta como um conjunto integrado de ações para sistematizar o acompanhamento de informações sobre como os dispositivos didáticos têm sido utilizados nas escolas. A seguir, são apresentados alguns exemplos de Regras de Associação geradas pelo algoritmo Apriori, aplicados em um banco de dados único, denominado central de análise, do projeto Memore. Como suporte e confiança mínimos foram utilizados os valores 3% e 70%, respectivamente. A regra R1 indica que em todos os casos que os alunos trabalharam sozinhos, e utilizaram o Chromium como uma de suas ferramentas, eles conseguiram completar todas as suas atividades. A regra R2 revela que todas as atividades de lazer foram desenvolvidas individualmente pelos alunos. A regra R5 mostra que em 88% de todas as vezes que os alunos utilizaram os laptops para desenvolver atividades de Matemática, tais atividades foram concluídas. 26 Segundo a regra R9, em 96% das utilizações em casa, os alunos conseguiram concluir suas atividades. Já as regras R10 e R11 sugerem um surpreendente indicativo de equilíbrio entre os tipos de atividades realizadas em casa: 46% foram atividades de lazer e 43% atividades escolares. Segue abaixo a Figura 8 que mostra as regras citadas. Figura 8 – Regras de Associação com Apriori no Projeto Memore Fonte: Goldschmidt, Passos e Bezerra (2015). 27 3 BPM (BUSINESS PROCESS MANAGEMENT) Para que se entenda como o BPM (Business Process Management), que traduzido para o português significa Gerenciamento de Processos de Negócios, funciona e como ele é integrado é necessário apresentar alguns conceitos relacionados. O termo processo é definido pelo Common Body of Knowledge (CBOK) da ABPMP (Association of Business Process Management Professionals) como “agregação de atividades e comportamentos executados por humanos ou máquinas para alcançar um ou mais resultados” já processo de negócio como “um trabalho que entrega valor para os clientes ou apoia/gerencia outros processos”. Neste contexto, BPM “é uma disciplina gerencial que integra estratégias e objetivos de uma organização com expectativas e necessidades de clientes, por meio do foco em processos ponta a ponta. BPM engloba estratégias, objetivos, cultura, estruturas organizacionais, papéis, políticas, métodos e tecnologias para analisar, desenhar, implementar, gerenciar desempenho, transformar e estabelecer a governança de processos” (ABPMP, 2014). Já Rummler e Brache (1994) conceituam BPM como “um conjunto de técnicas para garantir que os processos sejam continuamente monitorados e melhorados”. Para Filho e Moura (2007) BPM é o “desenvolvimento e manutenção de uma arquitetura de processos de negócios, que se utiliza de técnicas, metodologias e gerenciamento humano para garantir que os processos sejam continuamente melhorados e monitorados”. Conforme ABPMP (2014), dentre os conceitos fundamentais de BPM, destacam-se dois: • BPM trata o que, onde, quando, por que, como e por quem o trabalho é realizado; • A tecnologia desempenha papel de apoio e não de liderança na implementação de BPM. Segundo Britto (2012), “apesar de ser tão abrangente, BPM também serve para trazer inovação, controle, qualidade na informação dentro das organizações, liberdade para pensar e maior agilidade na tomada de decisão”. Um dos maiores benefícios que a BPM traz para a organização é a qualidade da informação para tomada de decisão, pois a decisão estratégica é embasada na capacidade real dos processos, gerando qualidade e confiança na informação. BPM pode ser aplicado a organizações de qualquer porte, com ou sem fins lucrativos, públicas ou privadas, com o objetivo de direcionar os recursos organizacionais, requerendo a participação de toda a organização (ABPMP, 2014). 28 Para Valle e Oliveira (2012), a gestão por processos, têm como objetivo fazer a ligação de tudo o que se faz na organização. Por meio dela, é possível unir as estratégias e competências da organização às atividades desenvolvidas diariamente. Segundo Garcia (2015), o governo federal tem estimulado suas instituições a focarem a gestão de seus processos, o que inclui as IES (Instituições de Ensino Superior) públicas, através do Programa Nacional de Gestão Pública e Desburocratização – GesPública. Esse programa propõe o Modelo de Excelência em Gestão Pública – MEGP, tendo como fundamentos a orientação por processos e informações. De acordo com Britto (2012), o BPM é composto de nove áreas específicas de conhecimento, sendo todas inter-relacionadas e evolutivamente complementares: • Gerenciamento de Processos • Modelagem de Processos • Análise de Processos • Desenho de Processos • Gerenciamento de Desempenho • Transformação de Processos • Organização de Processos • Gerenciamento de Processos Corporativos • Tecnologias de Gerenciamento de Processos Neste trabalho, será abordado a Modelagem de Processos utilizando a notação BPMN (Business Process Model Notation), que será detalhada a seguir. 3.1 BPMN – (Business Process Model and Notation) A ABPMP (2014) define modelagem de processos de negócio como um: “conjunto de atividades envolvidas na criação de representações de processos de negócio existentes ou propostos”. Esta representação deve ser completa e precisa sobre seu funcionamento. Para isso são utilizados os modelos. Um modelo implica a representação de um determinado estado do negócio (atual ou futuro) e dos respectivos recursos envolvidos, tais como pessoas, informação, instalações, automatização, finanças e insumos, portanto, requer mais dados 29 acerca do processo e dos fatores que afetam seu comportamento, pois busca representar o seu funcionamento. BPMN – Notação de Modelagem de Processos de Negócio (Business Process Model and Notation), é um padrão criado pela Business Process Management Initiative (BPMI), disponibilizada para os usuários em maio de 2004 e adotada oficialmente pela Object Management Group (OMG), grupo que estabelece padrões para sistemas de informação, em 2006 (ABPMP, 2014). Braconi e Oliveira (2011), enfatizam que a BPMN visa oferecer uma notação que mesmo tendo padrões bem definidos, seja clara e facilite a compreensão do trabalho por todos os envolvidos nos processos, desde responsáveis técnicos a gestores. Essa notação apresenta um conjunto robusto de símbolos para modelagem de diferentes aspectos de processos de negócio, que descrevem relacionamentos claramente definidos, como fluxos de atividades e ordem de precedência. Possui como principais características: ícones organizados em conjuntos descritivos e analíticos para atender as diferentes necessidades de utilização; permite a indicação de eventos de início, intermediário e fim; fluxo de atividades e mensagens; comunicação intranegócio e colaboração internegócio (ABPMP, 2014). A notação BPMN proporciona às empresas a capacidade de compreender os seus processos de negócios em uma notação gráfica e dá as organizações a capacidade de transmitir estes processos de uma forma padrão. Além disso, gera a documentação e execução de processos (BPMN, 2016). Segundo a ABPMP (2014), as principais vantagens da notação BPMN são: • Uso e entendimento difundido em muitas organizações; • Versatilidade para modelar as diversas situações de um processo; • Facilita a modelagem de processos que serão automatizados, pois o mesmo diagrama gerado pelo negócio pode ser complementado com definições de tecnologia para automação em um BPMS (Business Process Management Suite), reduzindo perda de informação na migração que poderia ocorrer entre diagramas com notações diferentes. Os elementos básicos da notação BPMN, segundo Valle e Oliveira (2011) são: 30 • Atividade: representa o trabalho que será executado em um processo de negócio; • Evento: é algo que ocorre durante um processo de negócio e afetam o fluxo do mesmo. Normalmente têm algo que os dispara ou um resultado, que são representados como marcadores no centro do elemento. São três os tipos de eventos, baseados em como eles afetam o fluxo: os de início, os intermediários e os de fim; • Gateway: é um elemento de modelagem utilizado para controlar como a sequência do fluxo interage dentro de um processo ao convergir e divergir. Serve para separar e juntar o fluxo, ou seja, controlá-lo; • Conector: mostra a ordem em que as atividades serão executadas no processo. A Figura 9 ilustra os elementos básicos da notação BPMN: Figura 9 – Elementos básicos do BPMN Fonte: Adaptado de Valle e Oliveira (2011) De acordo com a ABPMP (2014), na definição de BPM como uma disciplina gerencial está implícito que, as organizações bem-sucedidas em sua implementação “terão a capacidade de” gerenciar seus processos de forma eficiente e eficaz. Para isso, a organização tem de possuir métodos otimizados, pessoas preparadas e tecnologias apropriadas para apoiar BPM, como tecnologias especializadas, que oferecem funcionalidades para prover suporte a: • Planejamento de processos de negócio; • Modelagem, análise e desenho de processos de negócio; • Execução de processos de negócio; • Monitoramento de processos de negócio e acompanhamento de desempenho; • Gerenciamento e controle de mudanças em processos de negócio. 31 O Business Process Management System (BPMS) ou Suíte BPM e ferramentas, são tecnologias indispensáveis na modelagem, análise e desenho de processos de negócio. Para geração do modelo em notação BPMN (Capítulo 5) foi utilizado o Software Bizagi Modeler, que compõe a Suíte de Gestão de Processos de Negócios da Bizagi. O Bizagi Modeler é reconhecido pelos membros da comunidade (usuários finais, estudantes e parceiros) como o ambiente de modelagem BPMN, que permite a especialistas em negócios desenhar, documentar e evoluir seu modelo de processo com total confiança. Neste software destacam-se o intuitivo sistema de arrastar-e-soltar, atualizações livres de código e ferramentas para geração automática de documentos (BIZAGI, 2016). A Figura 10 ilustra a tela inicial do software Bizagi: Figura 10 – Tela inicial do software Bizagi 32 4 TRABALHOS RELACIONADOS Alguns trabalhos relacionam a área de mineração de dados com o processo de Autoavaliação Institucional. Dentre eles destacam-se os seguintes trabalhos: • Ladeira, Machado e Gomes (2013) verificaram em seu artigo que a formação de padrões pelos atributos permitiu, à luz dos especialistas, a mensuração da qualidade das atividades de trabalho de conclusão de curso, demonstrando que o DM representa opção válida aos processos de análise e avaliação no ambiente acadêmico; • Silva et al (2010), verificaram em seu artigo, quais dos itens na percepção do discente a respeito do desempenho didático de docentes, mais influenciam na nota geral do professor no âmbito de uma universidade particular, como também identificaram o perfil docente em relação à titulação e ao regime de trabalho. Para isto foi avaliada a influência de alguns itens por meio da aplicação do processo de descoberta de conhecimento em banco de dados com a aplicação do método de classificação, por meio do algoritmo linearregression, onde percebeu-se que o item que mais influencia na equação de regressão para estimar a nota geral foi o relacionamento do professor com o aluno; • Oliveira et al (2012) destacaram em seu artigo que através da análise dos resultados da avaliação institucional (dos discentes quanto aos cursos superiores do IFS - Instituto Federal de Sergipe) com a mineração de dados foi possível descobrir a relevância dos atributos (questões) envolvidos no processo de Autoavaliação bem como pode detectar as fragilidades e potencialidades da IES – Institutos Superiores de Educação e fornecer aos gestores subsídios para tomada de decisão; • Herdt (2001) relata em sua tese que foram utilizadas, para análise da avaliação institucional de uma universidade, uma ferramenta estatística e as técnicas de mineração de dados: clusterização e associação que ao serem aplicadas foram úteis para a descoberta de conhecimento identificando variáveis que podem ser trabalhadas por influenciarem na qualidade dos serviços prestados pela instituição. 33 5 APLICAÇÃO DA MINERAÇÃO DE DADOS NA AUTOAVALIAÇÃO DO IFFLUMINENSE 5.1 Autoavaliação Institucional no IFFluminense Para Voos (2004), a Avaliação Institucional é uma atividade organizadora, sistemática, e orientadora da reflexão das ações de uma instituição de ensino, como também, uma opção política de (re) significação e (re) conceitualização de suas práticas. No âmbito do Ministério da Educação (MEC) a Avaliação Institucional é um dos instrumentos complementares do Sistema Nacional de Avaliação da Educação Superior (SINAES) e está ligada à melhoria da qualidade da educação superior, à orientação da expansão de sua oferta, ao aumento permanente da sua eficácia institucional e efetividade acadêmica e social, ao aprofundamento dos compromissos e responsabilidades sociais das instituições de educação superior, por meio da valorização de sua missão pública, da promoção dos valores democráticos, do respeito à diferença e à diversidade, da afirmação da autonomia e da identidade institucional (SINAES, 2011). A Lei nº 10.861/04, artigo 3º, estabelece dez dimensões a serem consideradas no processo de Avaliação Institucional, descritas abaixo (INEP, 2004b): • A missão e o Plano de Desenvolvimento Institucional (PDI); • A política para o ensino, a pesquisa, a pós-graduação, a extensão e as respectivas normas de operacionalização; • A responsabilidade social; • A comunicação com a sociedade; • As políticas de pessoal, de carreiras do corpo docente e técnico-administrativo; • Organização e gestão da instituição; • Infraestrutura; • Planejamento e avaliação; • Políticas de atendimento aos estudantes; • Sustentabilidade financeira. Para que Autoavaliação Institucional alcance bons resultados é imprescindível que as seguintes condições sejam atendidas em sua totalidade (INEP, 2004a): 34 • Existência de uma equipe de coordenação; • Participação de integrantes de todos os segmentos da IES; • Compromisso explícito dos gestores da IES; • Informações, coleta e dados sejam confiáveis; • Uso efetivo dos resultados da avaliação. A atual diretoria de Avaliação Institucional auxilia na identificação e construção da identidade institucional do IFFluminense, contribuindo para a descentralização e o aperfeiçoamento da gestão acadêmica e administrativa, por meio de ações que articulem a avaliação institucional ao planejamento estratégico. A partir disto, pode-se conceber a avaliação institucional como um processo sistemático de busca de subsídios para melhoria e aperfeiçoamento da qualidade da instituição face seus fins acadêmicos, científicos e sociais (IFFluminense, 2016). A metodologia da Autoavaliação Institucional do IFFluminense referente ao ciclo de 2012/2013 está de acordo com a Figura 11. Figura 11 – Metodologia de Avaliação Institucional do IFFluminense Fonte: IFFluminense (2013). 35 A Tabela 1 mostra os indicadores e variáveis para o processo de Autoavaliação Institucional dos cursos do IFFluminense. Tabela 1 – Indicadores e Variáveis para Autoavaliação Institucional dos cursos do IFFluminense - Fonte: IFFluminense (2013). Indicadores Critérios (Variáveis) Participantes DO DI Projeto Pedagógico do Curso (PPC) Integralização curricular Carga horária do currículo Atribuições da coordenação Eventos apoiados e produzidos x x x x x x Assiduidade Disponibilidade Comunicação docente/coordenação Comunicação discente/coordenação Resolução e encaminhamento das questões Disponibilização de informações x x x Assiduidade Disponibilidade Comunicação coordenação/docente Participação dos docentes no curso Comunicação docentes/discentes Pontualidade Apresentação do plano de ensino Planejamento da aula e cumprimento do conteúdo Domínio do conteúdo Clareza nos critérios de avaliação Trabalhos/avaliações adequados ao conteúdo Incentivo às atividades de pesquisa e extensão x x x x x Satisfação de atuar no curso Motivação, Integração, Relacionamento com colegas do curso, Relacionamento com alunos do curso, Infraestrutura do curso, Disciplinas lecionadas, Carga horária, Número de disciplinas x Infraestrutura e laboratórios do curso Sala da coordenação Espaço físico dos laboratórios x número de alunos Estado de conservação dos laboratórios Equipamentos x número de alunos Modernidade dos equipamentos Funcionamento dos equipamentos Uso de materiais adequados e atualizados Climatização Disponibilidade de recursos materiais Recursos audiovisuais x x x x x x x x x x Discente Pontualidade das turmas, Assiduidade das turmas, Comunicação turma/professor, Rendimento das turmas, Participação das turmas nas aulas, Nível de interesse das turmas x Planejamento (Sobre o curso) Coordenação Docentes x x x x x x x x x x x x x x x x x x x x x x x x 36 Conforme a tabela acima, participam da Autoavaliação os discentes (DI) e docentes (DO) dos cursos do IFFluminense. Cada indicador e suas variáveis foram avaliados de acordo com as seguintes alternativas: Muito Bom, Bom, Regular, Ruim, Péssimo, Não sei responder. 5.2 KDD aplicado a Autoavaliação O KDD aplicado ao processo de Autoavaliação do IFFluminense segue de acordo com as seguintes etapas: • Seleção de Dados: Nessa etapa foi obtida a base de dados da Autoavaliação Institucional do Instituto Federal Fluminense do ciclo de 2012/2013, estando a mesma com a extensão *.xls, que deverá ser, posteriormente, convertida para o formato *.arff (Attribute-Relation File Format) do software Weka. Assim a base de dados escolhida para participação neste processo se refere a avaliação dos discentes e docentes para os cursos técnicos e de graduação do IFFluminense, contendo os atributos relacionados as variáveis da Tabela 1; • Pré-processamento: Devem ser retirados da base de dados, informações ausentes, errôneas, inconsistentes e nulas; • Transformação: No caso deste trabalho, sugere-se a utilização do software Weka, onde os dados devem ser convertidos para o formato *.arff. No banco de dados da Autoavaliação, cada atributo ou campo foi preenchido com os valores da Autoavaliação como: Muito Bom, Bom, Regular, Ruim, Péssimo, Não sei responder. No formato *.arff sugere-se que os atributos sejam transformados para a sigla correspondente: Muito Bom=MB; Bom=B; Regular=M, Ruim=R, Péssimo=P e Não sei responder =N. Os campos nulos ou em branco serão eliminados na fase de préprocessamento. O arquivo *.arff de acordo com a base de dados do relatório do IFFluminense possui a seguinte estrutura para avaliação docente: Nome da Tabela (@relation Docente), Nome dos campos e valores possíveis (@atributte PlanPPC{MB,B,M,R,P,N}). Para criação do nome do campo utilizou-se a seguinte regra: As 4 primeiras letras do nome do indicador (Tabela 1) seguido das iniciais do nome da variável (Tabela 1). Por exemplo, sendo Planejamento (Sobre o curso) o indicador, e o critério/variável Projeto Pedagógico do Curso, o nome do campo criado foi PlanPPC. E as opções de resposta do questionário são apresentadas entre chaves em forma de sigla. A conversão completa dos dois arquivos de respostas dos docentes e discentes encontra-se no Apêndice 1 e 2; 37 • Mineração de dados (Data mining): Na fase de mineração de dados, dentro do processo de KDD, necessita-se definir a técnica e o algoritmo a ser utilizado em função da tarefa proposta. Uma vez escolhido o algoritmo a ser utilizado, deve-se implementá-lo e adaptá-lo ao problema proposto. Para finalizar essa etapa deve-se executar o algoritmo a fim de obter resultados que serão analisados na fase de interpretação e avaliação do resultado. Foi escolhida a técnica de associação e o algoritmo Apriori por terem sido utilizados em projetos atuais no Brasil na área de Mineração de Dados Educacionais, foi escolhido o software Weka pela mesma razão (de acordo com o trabalho dos autores Goldschmidt, Passos E Bezerra (2015). E também, a partir do estudo dos trabalhos relacionados (Capítulo 4), com base no que os autores citados afirmaram pode-se verificar que a utilização da regra de Associação junto ao algoritmo Apriori pode gerar conhecimentos úteis. E a escolha pelo Weka também se deve a apresentação de particularidades como: facilidade de download e de instalação, usabilidade e quantidade de algoritmos e por ser um software livre. A ferramenta WEKA e a sua documentação encontram-se no site do software; • Interpretação/Avaliação: Esta fase será feita posteriormente, pois só quando os resultados forem obtidos através do software Weka e o algoritmo Apriori e as relações geradas deste, serão avaliados e interpretados. É necessário organizar a base na ferramenta Weka para que o algoritmo não traga dados inconsistentes, como por exemplo, uma relação que afirme que o docente está satisfeito com o curso sendo que ele afirmou que a infraestrutura do curso é péssima. O indicador de satisfação será considerado alto quando todas as variáveis pertencentes a ele forem avaliadas como muito bom ou bom. As etapas, descritas acima, do KDD aplicado ao processo de Autoavaliação podem ser melhor compreendidas através de um modelo capaz de ilustrar de forma visual todo o processo necessário para extração de conhecimento das bases de dados. Este modelo foi elaborado utilizando a notação BPMN, conforme mostra a Figura 12. Através deste modelo pode-se relacionar as atividades do processo com a etapas do KDD, onde: • Seleção de Dados: Inicia-se o BPMN com esta etapa que refere-se as atividades de: analisar a base de dados da Autoavaliação Institucional, extrair os indicadores/variáveis de cursos e criar dois arquivos: curso_discente e curso_docente. Realiza-se a análise dos dados da Autoavaliação Institucional onde são extraídos os 38 indicadores/variáveis no caso deste trabalho, de cursos, e após cria-se dois arquivos, relacionado os cursos com os respondentes discentes e docentes ficando com os nomes de arquivos: curso_discente e curso_docente; • Pré-processamento: refere-se as atividades de verificar os dados armazenados e eliminar os dados inconsistentes e nulos. Nesta etapa, verifica-se os dados e se caso for necessária a limpeza será executada a atividade de eliminação de dados nulos e inconsistentes, porém caso não precise realizar a limpeza, executa-se a atividade da etapa de transformação de conversão de formato de arquivo que será detalhada a seguir; • Transformação: esta etapa refere-se as atividades de converter o formato dos arquivos .xls para .arff e abrir a base de dados em .arff no Weka. Após a limpeza, é necessário converter os dados da planilha em .xls para arff para que se possa abrir a base de dados no Weka e posteriormente assim realizar a mineração e interpretação dos dados; • Mineração: esta etapa refere -se a atividade de: executar o software utilizando a técnica de Associação através do algoritmo Apriori, ou seja, com o arquivo já no formato .arff, ele será executado no software utilizando a técnica de associação com o Apriori com o intuito de ter um resultado válido; • Interpretação/Avaliação: refere-se as atividades de: analisar os resultados das regras de associação e gerar o conhecimento para tomada de decisão. Nesta etapa, ao analisar os resultados das regras de associação verifica-se se os resultados são válidos, se são válidos a próxima atividade a ser executada será a geração de conhecimento para a tomada de decisão, caso os resultados não sejam válidos, é necessário retornar a atividade da etapa de mineração que é executar novamente o software utilizando a técnica de associação com o algoritmo Apriori. 39 40 6 CONSIDERAÇÕES FINAIS Pretende-se com a mineração de dados, obter a melhoria do resultado do processo de Autoavaliação Institucional dos cursos, fornecendo informações relevantes para gestão dos cursos seja pelos coordenadores dos mesmos ou para o MEC (Ministério da Educação) no que diz respeito aos cursos de graduação. Para que as informações sejam relevantes para gestão, espera-se que o modelo proposto seja capaz de gerar através das regras de Associação, padrões como os exemplificados abaixo: • Discente que cursou o ensino médio todo em escola pública => considerou a infraestrutura do curso como muito boa; • Docente que possui regime de trabalho de dedicação exclusiva => considerou a integralização curricular boa; • Discente que participa das atividades de pesquisa e extensão => considerou a infraestrutura do curso e dos laboratórios como muito boa; • Docente que utiliza laboratório em suas aulas => considerou a modernização dos equipamentos como muito bom; • Discente que utiliza constantemente os laboratórios => considerou o funcionamento dos equipamentos como bom. Com a conclusão deste trabalho, pode-se identificar alguns estudos futuros a serem realizados a partir do tema, tais como: • Implantar o modelo proposto para gerar conhecimento útil através da base de Autoavaliação dos cursos; • Comparar os resultados obtidos com a mineração de dados em relação aos resultados obtidos através dos métodos estatísticos em relação a Autoavaliação dos cursos; • Alterar o modelo proposto e aplicar nas demais áreas da Autoavaliação, tais como: infraestrutura dos campus e serviços institucionais e dos Campus. 41 REFERÊNCIAS ABPMP (Association of Business Process Management Professionals) Brasil. BPM CBOK Versão 3.0: Guia para o Gerenciamento de Processos de Negócio Corpo Comum de Conhecimento. 2. ed. São Paulo, SP. ABPMP, 2014. AGRAWAL, R.; SRIKANT, R. Fast algorithms for mining association rules. 20th VLDB Conference, p. 478-499, 1994. ARAÚJO, J.R.H.; TARAPANOFF, K. Precisão no processo de busca e recuperação da informação: uso da mineração de textos. Ciência da informação, v. 35, n. 3, p. 236-247, 2006. Disponível em: <http://www.scielo.br/pdf/ci/v35n3/v35n3a23.pdf>. Acesso em: out. 2015. BAKER, R.S.J.D., YACEF, K. The State of Educational Data Mining in 2009: A Review and Future Visions. Journal of Educational Data Mining, 1 (1): 3-17. 2009. BIZAGI, Software Bizagi. Disponível em: <http://www.bizagi.com/pt/produtos>. Acesso em: abr. de 2016. BOLINA, A.C. Avaliação do framework Mapreduce para paralelização do algoritmo Apriori. BRACONI, J; OLIVEIRA, S.B. Business Process Modeling Notation (BPMN). In: VALLE, R; OLIVEIRA, S.B. Análise e Modelagem de Processos de Negócio: Foco na Notação BPMN. 1.ed. São Paulo: Atlas, 2011. BRITTO, G.C. BPM Para Todos - Uma Visão Geral Abrangente, Objetiva e Esclarecedora sobre Gerenciamento de Processos de Negócio /– 1. ed. – Rio de Janeiro: Gart Capote, 2012. Disponível em: < http://docplayer.com.br/1509386-Bpm-para-todos-uma-visao-geral- abrangente-objetiva-e-esclarecedora-sobre-gerenciamento-de-processos-de-negociobpm.html>. Acesso em: abr.2016. BUSINESS PROCESS MODELING NOTATION (BPMN). Available specification: business process modeling notation, v 2.1. Site do BPMN. Disponível em: <http://www.bpmn.org >. Acesso em: abr.2016. 42 CAMILO, C.O; SILVA, J.C. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. Relatório Técnico - Agosto, 2009. Disponível em: <http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf>. Acesso em fev. 2016. CARDOSO, O. N. P.; MACHADO, R. T. M. Gestão do conhecimento usando data mining: estudo de caso na Universidade Federal de Lavras. Rev. Adm. Pública, v. 42, n. 3, p. 495-528, 2008. Disponível em: <http://dx.doi.org/10.1590/S0034-76122008000300004 >. Acesso em: out. 2015. CASTANHEIRA, L.G. Aplicação de Técnicas de Mineração de Dados em Problemas de Classificação de Padrões. Dissertação. Departamento de Engenharia Elétrica - UFMG, 2008. Disponível em: <http://www.bibliotecadigital.ufmg.br/dspace/handle/1843/BUOS- 8CDFQK>. Acesso em: nov. 2015. CHAGAS, D.J; CHAN, C.S; CORSI, A.C. Análise do banco de atendimentos da Defesa Civil do Estado de São Paulo. Anu. Inst. Geocienc. 2010, vol.33, n.1, pp. 35-43. Disponível em:http://ppegeo.igc.usp.br/scielo.php?script=sci_arttext&pid=S010197592010000100003&l ng=pt&nrm=iso. Acesso em: mar.2016. CORRÊA, A.M.C.J; SFERRA, H. H. Conceitos e Aplicações de Data Mining. Revista de Ciência & Tecnologia, v. 11, n. 22 – p. 19-34, 2004. Disponível em: <http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf>. Acesso em: nov. 2015. COSTA, E. et al. Mineração de Dados educacionais: Conceitos, Técnicas, Ferramentas e Aplicações. Disponível em: <http://www.br- ie.org/pub/index.php/pie/article/view/2341/2096>. Acesso em: mar. 2016. COUTINHO, F. Data Mining. 2003. Disponível em: <http://www.dwbrasil.com.br/html/dmining.html>. Acesso em: set. 2015. DE AMO, Sandra. Técnicas de mineração de dados. Jornada de Atualização em Informática, 2004. Disponível em: <www.deamo.prof.ufu.br/arquivos/JAI-cap5.pdf>. Acesso em: jan. 2016. 43 DINIZ, C. A. R.; LOUZADA NETO, F. Data mining: uma introdução. São Paulo: ABE, 123p, 2000. FAYYAD, et al. Advances in Knowledge Discovery and Data Mining. AAAI/MITPress, 1996. Disponível em: <http://dl.acm.org/citation.cfm?id=545174>. Acesso em: out. 2015. FILHO, J.B.A.P; MOURA, H.P. Gestão de processos de negócio: uma adaptação da metodologia de Rummler-Brache baseada numa aplicação real. 2007. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife: PE, 2007. Disponível em: < http://repositorio.ufpe.br:8080/xmlui/handle/123456789/1367> Acesso em: abr. 2016. GALVÃO, N. D.; MARIN, H. F. Técnica de mineração de dados: uma revisão da literatura. Acta Paul Enferm, v. 22, n. 5, p. 86-90, 2009. Disponível em: <http://dx.doi.org/10.1590/S0103-21002009000500014.> Acesso em: ago. 2015. GARCIA, M. J. Adoção de BPM pelas IES brasileiras: características e oportunidades de melhoria. 2015. 95 p. Dissertação. Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto, Universidade de São Paulo. Ribeirão Preto. Disponível em: <www.teses.usp.br/teses/...15122015.../publico/MarcosJGarcia_Corrigida.pdf>Acesso em: mar. 2016. GOLDSCHMIDT, R.; PASSOS, E. Data mining: um guia prático, conceitos, técnicas, ferramentas, orientações e aplicações. 1. ed. Rio de Janeiro, RJ: Elsevier, 2005. GOLDSCHMIDT, R.; PASSOS, E; BEZERRA, E. Data Mining: conceitos, técnicas, algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro, RJ: Elsevier, 2015. GUTIERREZ, M; BERTRAND, H. Estudos em Negócios IV. Rio de Janeiro, RJ: Mauad, 2005. HAN, J.; KAMBER, M. Data Mining concepts and techniques. 2011. Disponível em: <http://web.engr.illinois.edu/~hanj/bk3/bk3_slidesindex.htm>. Acesso em: ago. 2015. 44 HERDT, R.M. Utilização de técnicas de mineração de dados na análise das informações de uma universidade. Florianópolis: SC, 2001. Disponível em: <http://repositorio.ufsc.br/xmlui/handle/123456789/81941>. Acesso em mar. 2016. IFFLUMINENSE, Introdução sobre diretoria de avaliação institucional. Site da Instituição. <http://portal1.iff.edu.br/reitoria/diretorias-sistemicas/diretoria-de-avaliacaoinstitucional>.Acesso em: fev. 2016. IFFLUMINENSE. Relatório de Autoavaliação Institucional 2012/2013 - Campus CamposCentro. Campos dos Goytacazes, RJ: 2013. Disponível em: <http://200.143.198.110:8080/iff/campus/reitoria/diretoria-de-planejamento-estrategico-e avaliacao-institucional/autoavaliacao-institucional-2012-2013/AvaliacaoInstitucionalCampos-Centro.pdf >. Acesso em: fev. 2016. INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS (INEP). Orientações Gerais para o Roteiro da Autoavaliação das Instituições. Brasília, DF: INEP, 2004a. Disponível em: <http://download.inep.gov.br/download/superior/sinaes/orientacoes_sinaes.pdf>. Acesso em: ago. 2015. _______________– Diretrizes para a Avaliação das Instituições de Ensino Superior. Brasília, DF: INEP, 2004b. Disponível em: < www.est.edu.br/downloads/pdfs/legislacao_cpa_17655.pdf >. Acesso em: fev. 2016. ____________. Seminários Regionais sobre Autoavaliação Institucional e Comissões Próprias de Avaliação (CPA – 2013). Diretoria de Avaliação da Educação Superior (DAES). Brasília, DF: 2013. Disponível em: <http://download.inep.gov.br/educacao_superior/avaliacao_institucional/seminarios_regionais /anais/2015/anais_dos_seminarios_regionais_2013.pdf> LADEIRA, R.C; MACHADO, S.H.M; E GOMES, G.R.R. Avaliação da percepção de discentes e da avaliação de docentes em relação ao trabalho de conclusão de curso utilizando ferramentas de data mining – estudo de caso. Revista Eletrônica Produção & Engenharia, v. 4, n. 2, p. 412-426, Jan./Jun.2013. Disponível em: < 45 http://www.revistaproducaoengenharia.org/arearestrita/arquivos_internos/artigos/19-281%2020formatado20em206-8-13.pdf>. Acesso em fev.2016. LAROSE, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley and Sons, Inc, 2005. LI, W; HAN, J; PEI, J. C: Accurate and efficient classification based on multiple classassociation rules, 2001. LIU, B; HSU,W; MA, Y. Integrating classification and association rule mining. AAAI Workshop of Knowledge Discovery in Databases, 1998. MALTA, R.A.S. BPM – Business Process Management: Metodologia estratégica na gestão de negócios. Caruaru, PE, 2010. Tese. Disponível em: < http://repositorio.favip.edu.br:8080/bitstream/123456789/1146/1/2007101594++Rafaella+Alv es+Santos+Malta+-+ADMS0701.pdf.>. Acesso em: abr.2016. MARTINHAGO, S. Descoberta de Conhecimento sobre o Processo Seletivo da UFPR. Dissertação de Mestrado. Curitiba: PR, 2005. Disponível em: <http://acervodigital.ufpr.br/handle/1884/2350>. Acesso em: abr.2016. MELO, M.D. Introdução a mineração de dados utilizando o Weka. CONNEPIAL 2010 Disponível em: <http://connepi.ifal.edu.br/ocs/index.php/connepi/CONNEPI2010/paper/view/258/207>. Acesso em: fev.2016. OLIVEIRA, A.G., GARCIA, D.F. Mineração da base de dados de um processo seletivo universitário. Artigo. Curso de Ciência da Computação. Universitário de Formiga (UNIFOR/MG) – Formiga: MG, 2004. Disponível http://www.dcc.ufla.br/infocomp/index.php/INFOCOMP/article/view/73/58>. em: Acesso < em: mar. 2016. OLIVEIRA, L.R, et al. A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe. VII CONNEPI - Palmas: TO, 2012. 46 Disponível em: <http://propi.ifto.edu.br/ocs/index.php/connepi/vii/paper/viewFile/4662/989>. Acesso em: mar.2016. PAMPA, N. R. Técnicas e Ferramentas automáticas e inteligentes para a extração de conhecimento em bases de dados. Dissertação de tese de mestrado. DSIF, FEEC, UNICAMP, 2003. Disponível em: <http://unicamp.sibi.usp.br/handle/SBURI/12445>. Acesso em: nov. 2015. PICHILIANI, M. Visualizando algoritmos. 2013. Disponível em: <http://pichiliani.com.br/wp-content/uploads/2013/04/Apriori.jpg> Acesso em: mar.2016. REZENDE, S. O. Sistemas Inteligentes – Fundamentos e Aplicações. Barueri, SP: Manole, 2005. ROMERO, C.; VENTURA, S. Educational Data Mining: A Review of the State of the Art. IEEE Trans. On Systems, Man and Cybernetics – Part C: Aplications and Reviews. V. 40, n. 6, 2010. RUMMLER, G.A.; BRACHE, A.P. Improving Performance. São Paulo: Makron Books, 1994, 435p. SILVA NETO et al. Técnicas de mineração visual de dados aplicadas aos dados de instrumentação da barragem de Itaipu. Gest. Prod., São Carlos, v. 17, n. 4, p. 721-734, 2010. Disponível em: <http://dx.doi.org/10.1590/S0104-530X2010000400007>. Acesso em: nov. 2015. SILVA, R. M. et al. Percepção dos discentes em relação aos docentes através da aplicação de técnicas e métodos de mineração de dados. COBENGE, 2010 Disponível em: <http://www.abenge.org.br/CobengeAnteriores/2010/artigos/549.doc>. Acesso em: nov. 2015. SHOLOM M. W.; NITIM, I. Predict Data Mining. San Francisco, CA, USA: Morgan Kaufmann Publishers, 1999. 47 SOBRINHO, J. D. Avaliação da educação superior. Petrópolis: Vozes, 2000. SOUZA, M.U.R.S. Mineração de Dados aplicada à celeridade processual do tribunal de contas do estado do Pernambuco (TCE-PE). Dissertação (mestrado) Universidade Federal de Pernambuco. Recife: PE, 2009. Disponível em: < repositorio.ufpe.br:8080/xmlui/handle/123456789/2315 >. Acesso em: fev. 2016. SZILAGYI, D.C. Modelagem de Processos de Negócio - um Comparativo entre BPMN e UML. Dissertação (mestrado). São Paulo, 2010. Disponível em: <http://www.sapientia.pucsp.br/tde_busca/arquivo.php?codArquivo=12252>. Acesso em: abr. 2016. TAN, P. et al. Introdução ao Datamining: Mineração de Dados. Rio de Janeiro: Ciência Moderna, 2009. VALLE, R; OLIVEIRA, S.B; org. Análise e Modelagem de Processos de Negócio: Foco na Notação BPMN. (Business Process Modeling Notation) 1.ed. São Paulo: Atlas, 2011. VIANNA, R. C. X. et al. Mineração de dados e características da mortalidade infantil. Cad. Saúde Pública, Rio de Janeiro, v. 26, n. 3, p. 535-542, mar. 2010. VOOS, J. B. A. O processo de avaliação institucional e a adaptação estratégica na Universidade da Região de Joinville – UNIVILLE. 216f. Tese (Doutorado em Engenharia de Produção) Programa de Pós-Graduação em Engenharia de Produção e Sistemas. Universidade Federal de Santa Catarina: Florianópolis, 2004. WANG, Y. J; XIN, Q; COENEN, F. Mining efficiently significant classification association rules. In: STUDIES IN COMPUTATIONAL INTELLIGENCE, p. 443U˝ 467.SpringerVerlag, 2008. WEKA. Disponível em: < www.cs.waikato.ac.nz/ml/weka>. Acesso em: jul. 2015. 48 Apêndice I – Arquivo Docente.arff @relation Docente @atributte PlanPCC {MB,B,M,R,P,N} @atributte PlanIC {MB,B,M,R,P,N} @atributte PlanCHC {MB,B,M,R,P,N} @atributte PlanAC {MB,B,M,R,P,N} @atributte CoordA {MB,B,M,R,P,N} @atributte CoordD {MB,B,M,R,P,N} @atributte CoordCDD {MB,B,M,R,P,N} @atributte CoordRE {MB,B,M,R,P,N} @atributte DocA {MB,B,M,R,P,N} @atributte DocD {MB,B,M,R,P,N} @atributte DocCCD {MB,B,M,R,P,N} @atributte DocPDC {MB,B,M,R,P,N} @atributte DocCDD {MB,B,M,R,P,N} @atributte SatMov {MB,B,M,R,P,N} @atributte SatInt {MB,B,M,R,P,N} @atributte SatRCC {MB,B,M,R,P,N} @atributte SatRAC{MB,B,M,R,P,N} @atributte SatIC{MB,B,M,R,P,N} @atributte SatDL{MB,B,M,R,P,N} @atributte SatCH{MB,B,M,R,P,N} @atributte SatND{MB,B,M,R,P,N} @atributte InfraLabCurSC {MB,B,M,R,P,N} @atributte InfraLabCurEFNA{MB,B,M,R,P,N} @atributte InfraLabCurENA {MB,B,M,R,P,N} @atributte InfraLabCurME {MB,B,M,R,P,N} @atributte InfraLabCurFE {MB,B,M,R,P,N} @atributte InfraLabCurUMA {MB,B,M,R,P,N} @atributte InfraLabCurC {MB,B,M,R,P,N} @atributte InfraLabCurDRM {MB,B,M,R,P,N} @atributte InfraLabCurRA {MB,B,M,R,P,N} @atribute DiscPT {MB,B,M,R,P,N} @atribute DiscAT {MB,B,M,R,P,N} @atribute DiscCTP {MB,B,M,R,P,N} @atribute DiscRT{MB,B,M,R,P,N} @atribute DiscPTA {MB,B,M,R,P,N} @atribute DiscNIT {MB,B,M,R,P,N} @data ... 49 Apêndice II – Arquivo Discente.arff @relation Discente @atributte PlanIC {MB,B,M,R,P,N} @atributte PlanCHC {MB,B,M,R,P,N} @atributte PlanEAP {MB,B,M,R,P,N} @atributte CoordA {MB,B,M,R,P,N} @atributte CoordD {MB,B,M,R,P,N} @atributte CoordCDisc {MB,B,M,R,P,N} @atributte CoordRE {MB,B,M,R,P,N} @atributte CoordDI {MB,B,M,R,P,N} @atributte DocA {MB,B,M,R,P,N} @atributte DocCDD {MB,B,M,R,P,N} @atributte DocP {MB,B,M,R,P,N} @atributte DocAPE {MB,B,M,R,P,N} @atributte DocPACC {MB,B,M,R,P,N} @atributte DocCCA {MB,B,M,R,P,N} @atributte DocTAC {MB,B,M,R,P,N} @atributte DocIAPE {MB,B,M,R,P,N} @atributte InfraLabCurEFNA{MB,B,M,R,P,N} @atributte InfraLabCurENA {MB,B,M,R,P,N} @atributte InfraLabCurME {MB,B,M,R,P,N} @atributte InfraLabCurFE {MB,B,M,R,P,N} @atributte InfraLabCurUMA {MB,B,M,R,P,N} @atributte InfraLabCurC {MB,B,M,R,P,N} @atributte InfraLabCurDRM {MB,B,M,R,P,N} @atributte InfraLabCurRA {MB,B,M,R,P,N} @data ...