VII Simpósio Brasileiro de Sistemas de Informação Aplicação da Mineração de Processos como uma prática para a Gestão do Conhecimento Rosemary Francisco, Eduardo A. Portela Santos Engenharia de Produção e Sistemas – PPGEPS Pontifícia Universidade Católica do Paraná (PUCPR) – Curitiba, PR – Brazil [email protected], [email protected] Abstract. Many information systems that support business processes record events associated with the execution of the real workflow of the process. In many of these events, it is possible identify patterns and many of the situations encountered in day-by-day organizations, that could be reused for the discovery of knowledge. The challenge, however, is how to extract information from these events and provide knowledge discovery to the organizations. In this context, this paper proposes a method able to extract this information using techniques of process mining in a process of anomaly management. Resumo. Muitos dos sistemas de informação que apóiam os processos de negócios registram os eventos associados à execução do fluxo real do processo. Em muitos destes registros, é possível identificar padrões e muitas das situações encontradas no dia-a-dia das organizações, e que poderiam ser reutilizadas para a descoberta do conhecimento. O desafio, no entanto, reside em como extrair informações destes registros com o objetivo de alimentar as organizações e proporcionar a descoberta do conhecimento. Neste contexto, o presente artigo propõe um método capaz de extrair estas informações utilizando técnicas de mineração de processos em um processo de gerenciamento de anomalias. 1. Introdução Com a constante e recente necessidade das organizações disponibilizarem processos cada vez mais eficientes e com menor custo, a utilização de sistemas de informação para suportar a execução de processos de negócio aumentou consideravelmente. Nestes tipos de sistemas, é possível encontrar os dados que representam a execução real das atividades destes processos. Por meio destes dados é possível identificar a forma como os processos foram estruturados, como estes estão relacionados e de que maneira as pessoas estão envolvidas, permitindo desta forma, a criação do conhecimento organizacional e, por conseguinte, um controle gerencial maior. No entanto, para que estes dados sejam devidamente identificados e possam ser reutilizados pela organização, é necessário, em um primeiro momento, transformá-los em informações. Nonaka e Takeuchi (1997) afirmam que para controlar eficazmente a criação e a exploração do conhecimento, uma empresa deve mapear e acompanhar todos os recursos de conhecimento existentes. Estes dados de processos que estão armazenados nos sistemas de informação representam este tipo de recurso de 477 VII Simpósio Brasileiro de Sistemas de Informação conhecimento existente, mas que em grande parte das organizações, ainda não foi explorado. A descoberta do conhecimento pode ser definida como um mecanismo de extração automática de conhecimento a partir de fontes de informação. Ao utilizar este mecanismo, o resultado pode tanto já estar estruturado na forma de conhecimento representado e estruturado como em formato reconhecível pelo tomador de decisão a partir de seu conhecimento sobre o domínio. No caso específico dos dados de processos, antes da etapa de extração do conhecimento, será necessária uma etapa preliminar para a transformação dos dados em informação. Nesta etapa os dados serão devidamente identificados, analisados e estruturados a fim de resultar em informações que possam contribuir para a descoberta do conhecimento. Com base neste cenário, a aplicação da mineração de processos – Process Mining – permitirá a extração dos dados dos processos inseridos num ambiente tecnológico e, por meio destes dados, possibilitar a descoberta de informações acerca do fluxo de atividades real do processo – WorkFlow – e da rede social que envolve todo o processo. O conhecimento do WorkFlow e dos envolvidos em um processo de negócio permitirá garantir a informação necessária no tempo e formato adequados a fim de auxiliar na geração de idéias, solução de problemas e tomada de decisões. Além disso, o conhecimento descoberto poderá ser divulgado e disseminado a todos os colaboradores, que poderão analisar com detalhes o WorkFlow do processo e discutir melhorias com base na estratégia da empresa. O presente artigo propõe um modelo capaz de aplicar a mineração de processos como uma prática para a geração do conhecimento dos processos de negócios de uma organização por meio dos logs de eventos. Para fins de validação, o modelo foi aplicado em um Sistema de Gerenciamento de Anomalias (SGA) que tem por objetivo cadastrar, verificar e prover soluções para desvios nos processos de desenvolvimento de produtos, num Sistema de Gestão da Qualidade de uma empresa do setor metal mecânico instalada em Joinville- SC. O artigo foi estruturado da seguinte forma: na seção 2 é discutido os principais conceitos de gestão do conhecimento. A seção 3 descreve as principais características da mineração de processos. A seção 4 apresenta o modelo proposto e sua aplicação no SGA e, por fim na seção 5, são apresentadas as considerações finais. 2. Gestão do Conhecimento Binney (2001) afirma que o conhecimento é um ativo da empresa a ser utilizado em situações competitivas. Ao gerar e gerenciar o conhecimento, uma organização poderá analisar com detalhes suas operações e reavaliar a forma como os processos estão estruturados. Neste cenário, a gestão do conhecimento proporciona a capacitação da organização para aperfeiçoar seus resultados ou operações por intermédio de um modelo, técnicas e tecnologia de informação, como suporte para a prática coletiva de checagem e compartilhamento do conhecimento da empresa (Abranson, 1999). A gestão do conhecimento pode ser interpretada como um processo sistêmico de identificação, captura, classificação, estocagem, disseminação e criação de conhecimento útil para as organizações alcançarem seus objetivos estratégicos e buscarem a inovação 478 VII Simpósio Brasileiro de Sistemas de Informação para obtenção de vantagem competitiva (Ferraresi e Santos, 2006). Está ligada à capacidade das empresas em utilizarem e combinarem as várias fontes e tipos de conhecimento organizacional para desenvolverem competências específicas e capacidade inovadora, que se traduzem, permanentemente, em novos produtos, processos, sistemas gerenciais e liderança de mercado (Terra, 1999). Neste contexto o presente trabalho propõe utilizar a mineração de processos como uma forma de gestão baseada em fatos que pode ser categorizada como parte das práticas: Sistemática de solução de problemas e Aprendizado com base em sua própria experiência e história sugeridos por Garvin (1993). A possibilidade de acesso e uso das informações oportunas e dos conhecimentos organizacionais personalizados por todos na organização, facilitados pelos recursos emergentes da tecnologia da informação, seria equivalente a disseminação das melhores práticas da organização. Dessa forma os resultados de análises, cenários, combinações e comparações entre informações oriundas da base de dados única, seriam também equivalentes ao conhecimento, pois agregam valor as atividades organizacionais (Tarapanoff e Rezende, 2006). 3. Mineração de Processos As técnicas de mineração de processos permitem extrair informações de processos de negócio por meio de logs de eventos (Harrington et al., 1997). Informações como atividades do processo, responsáveis pela execução das atividades, data em que as atividades foram realizadas e eventos que desencadearam uma atividade, são alguns exemplos de informações que podem ser extraídas por meio da técnica. O objetivo da mineração é, através da coleta de dados em tempo de execução, inverter o processo e apoiar a concepção e análise do Workflow utilizado. A idéia básica da mineração de processos é diagnosticar o conhecimento do processo de negócio por meio dos logs de eventos (Aaslt e Medeiros, 2004). No contexto deste trabalho, a mineração de processos é utilizada para descobrir como o processo está estruturado e como os atributos de dados influenciam nos pontos de decisão do fluxo de trabalho do processo. No entanto, para que a técnica possa ser utilizada, é necessário que o log de eventos esteja no formato padrão suportado pelas ferramentas que possibilitam a execução da técnica, neste caso, o formato MXML. O MXML é uma especificação textual genérica em um arquivo XML que possibilita o registro e armazenamento de informações do log de eventos (Aaslt et al., 2003). O padrão MXML será utilizado para possibilitar a descoberta do conhecimento do processo SGA por meio da ferramenta ProM Framework – ferramenta que utiliza as técnicas de mineração de processos. 4. Modelo de Extração da Informação com a técnica de Mineração de Processos para Geração do Conhecimento A figura 1 ilustra a visão geral do modelo. A primeira etapa do modelo é a Identificação dos dados do Processo. Nesta etapa foram verificadas as características do sistema de informação que suporta o SGA bem como onde são armazenados os dados que são manipulados por este sistema. Após a localização do repositório dos dados foi necessário realizar um filtro para a coleta dos dados referente ao log de eventos, visto que o repositório armazena todos os dados que foram gerados durante a execução das 479 VII Simpósio Brasileiro de Sistemas de Informação instâncias do processo. A aplicação deste filtro permitiu que somente os dados que se referem ao log de eventos, fossem utilizados. Os dados resultantes do filtro, dados que representam o log de eventos da amostra selecionada, foram então convertidos para o formato MXML, na segunda etapa do modelo. Esta conversão foi necessária para que a técnica de mineração de processos pudesse ser aplicada por meio da ferramenta ProM Framework. Para a conversão dos dados, foi desenvolvido um algoritmo que permitiu a leitura dos dados filtrados no banco de dados do SGA e a conversão destes dados para o formato MXML. O algoritmo foi desenvolvido com a tecnologia Java. Após a conversão dos dados para MXML, utilizou-se as técnicas de mineração de processos disponíveis no ProM Framework para descoberta do fluxo do processo e rede social do SGA. Estes procedimentos fazem parte da terceira etapa do modelo. Por fim, na quarta etapa, é feita a análise do processo, com base nas informações do fluxo do processo e rede social descoberta pela mineração de processos a fim de permitir a geração do conhecimento organizacional acerca do processo em estudo. A geração do conhecimento ocorre quando as informações são comparadas, combinadas e analisadas por pessoas, principalmente quando utilizadas nos processos decisórios. Figura 1. Modelo da Extração do Conhecimento. 5.1 Aplicando o modelo no SGA Para realizar a primeira etapa do modelo no SGA foi necessário acesso ao banco de dados do sistema de informação que suporta o processo. O banco de dados do sistema de informação é gerenciado pelo sistema gerenciador de banco de dados (SGBD): Microsoft SQL Server. Após o acesso ao SGDB e ao banco de dados do SGA, foi feita uma análise nas tabelas que armazenam os dados para filtrar os dados que representam o log de eventos. Após a identificação dos dados, foi criada uma consulta com o filtro necessário para retornar somente os dados que representam o log de eventos da execução do fluxo do processo. Depois da identificação dos dados do log de eventos do SGA, foi necessário o desenvolvimento de um algoritmo para a conversão dos dados armazenados no banco de dados, para o formato MXML, segunda etapa do modelo. Este algoritmo foi desenvolvido utilizando a tecnologia Java e o principal objetivo deste era a leitura dos dados retornados pela consulta e conversão destes para o formato MXML. É necessária a conversão dos dados para este formato, pois este é o formato aceito pelas ferramentas que utilizam as técnicas de mineração de processos. A figura 2 ilustra parte do arquivo MXML gerado pelo algoritmo com base na consulta realizado no banco de dados. 480 VII Simpósio Brasileiro de Sistemas de Informação Figura 2. Log de Eventos do SGA no formato MXML. Na terceira etapa do modelo, utilizou-se o ProM Framework para a aplicação da mineração de processos e descoberta do fluxo de trabalho e rede social do SGA. Para a descoberta do fluxo do processo do SGA, foi utilizado um algoritmo de mineração chamado Algoritmo Alpha. Ao utilizar o Algoritmo Alpha é importante que a estrutura dos logs de eventos reflita claramente o comportamento do Workflow do processo de negócio (Aalst et al, 2004). O algoritmo analisa as ocorrências de atividades e eventos e descreve o modelo do fluxo de trabalho correspondente aos logs de eventos registrados. O algoritmo utiliza a notação formal Redes de Petri – RdP – para a demonstração do modelo. A figura 3 ilustra o modelo em RdP gerado pelo Algoritmo Alpha. Figura 3. WorkFlow do Processo descoberto. Analisando o modelo em RdP apresentado na figura 3, o processo é iniciado por meio do evento: Ocorrência de Anomalia que inicializa a atividade: Identificação de Anomalia. Após a identificação e registro da anomalia, são validadas as informações que foram preenchidas no registro. Esta atividade é realizada pela liderança da área destinatária do registro. Se o líder encontrar alguma inconsistência no registro, o registro é retornado ao emissor da anomalia para correção das informações, esta situação é caracterizada pela ocorrência do evento: Registro incorreto. Se o registro da anomalia estiver adequado, o evento: Anomalia Registrada será disparado e o registro é encaminhado para a atividade: Elaboração do Plano de Ação. Nesta atividade, é realizado o diagnóstico das causas geradoras da anomalia bem como o preenchimento do plano de ação para eliminação destas causas. Após o preenchimento do plano de ação, a liderança do setor valida o plano e libera-o para execução. Porém, caso exista alguma inconsistência no plano de ação, o líder devolve o plano de ação para ser alterado; esta situação é caracterizada pela ocorrência do evento: Plano de Ação Insuficiente. A atividade de validação pela liderança acontece novamente após a execução do plano de 481 VII Simpósio Brasileiro de Sistemas de Informação ação. Nesse caso, a liderança avalia os resultados adquiridos após a execução da ação e decide se as ações foram efetivas ou não para resolver todos os problemas encontrados. Caso os resultados identificados não foram efetivos, o relatório de anomalia retorna para a área de responsabilidade para revisão do plano de ação. Caso contrário, a data de término das ações implementadas é registrada e as atividades são finalizadas. De acordo com Rozinat e Aalst (2005), a criação de um modelo de fluxo de trabalho é uma atividade complexa e que demanda tempo. Portanto ao utilizar a mineração de processos para a descoberta do modelo, este tempo poderá ser direcionado para atividades de análise e tomada de decisão em relação às melhorias do processo. Além disso, como a mineração de processos utiliza o log de eventos para a descoberta do modelo do fluxo de trabalho, este modelo representa a situação real da execução do processo. Um modelo é uma forma de estruturar o conhecimento organizacional com o objetivo de entender o funcionamento holístico de uma empresa ou um processo do negócio (Bubenko et al., 1998). Após a descoberta do modelo do fluxo de trabalho utilizou-se os algoritmos: Organizational Miner e Social Network Miner do ProM para a descoberta dos envolvidos no fluxo de trabalho. Estes dois algoritmos realizam a descoberta de aspectos sociais a respeito da organização do processo minerado e permitem responder as seguintes questões (Aaslt et al., 2005): 1.Quantas pessoas estão envolvidas no processo; 2.Qual é a estrutura de comunicação e as dependências entre as pessoas; 3.Quantas transferências ocorrem de um papel funcional para outro papel; 4.Quem são as pessoas importantes no fluxo de comunicação; (o fluxo mais freqüente) 5.Quem subcontrata o trabalho de quem; 6.Quem trabalha com as mesmas tarefas. Para responder a primeira questão, utilizou-se o recurso: Summary do ProM. Este recurso faz um resumo das informações mineradas com base no log de eventos do processo. As informações disponibilizadas por este recurso são: quantidade e código das instâncias do processo que foram executadas; origem dos dados do processo; descrição das atividades e eventos do processo, bem como a quantidade de ocorrência destas; quais foram os eventos que iniciaram a execução do processo e quais foram os eventos que encerraram a execução e, por fim, quais são as pessoas envolvidas no processo. As questões que tratam das dependências e relação entre os envolvidos, questões dois a quatro, podem ser respondidas utilizando o algoritmo Social Network Miner. A figura 4 mostra parte da rede social descoberta. Com base nos logs de eventos, o algoritmo Social Network Miner irá identificar todas as redes de relacionamento entre todos os envolvidos na execução das instâncias do processo para a amostra selecionada. Esta visualização permitirá identificar quem são as pessoas mais importantes no fluxo do processo e como é a transferência de responsabilidades e informações entre os envolvidos. Analisando a figura 4 é possível destacar três principais envolvidos na execução das instâncias dos processos: Joao, Fabiano e Laurival. O envolvimento destes está tanto no recebimento de responsabilidades / informações quanto no envio destas. Isto significa que em grande parte das execuções dos processos estes envolvidos atuam como líderes e são responsáveis pelas validações que ocorrem no processo. 482 VII Simpósio Brasileiro de Sistemas de Informação Figura 4. Rede Social Descoberta. Por fim, a questão cinco que trata das pessoas que trabalham nas mesmas atividades, pode ser respondida utilizando o algoritmo Organizational Miner. Este algoritmo irá identificar a relação entre os envolvidos e as atividades do processo, possibilitando desta forma, visualizar por quem as atividades são executadas. A figura 5 ilustra parte da visualização da relação entre os envolvidos e as atividades. Para esta visualização, foi necessário reduzir a amostra, pois com os 142 envolvidos o resultado ficou muito poluído. A amostra utilizada para esta visão baseou-se nos vinte primeiros registros. Analisando a figura 5 confirma-se a atuação de Joao e Laurival como responsáveis pelas validações do processo do SGA, conforme as considerações da figura 4. Figura 5. Visão descoberta da relação entre os envolvidos e as atividades. 5. Conclusões Embora a técnica de mineração de processos esteja consolidada, a sua utilização como uma prática de geração de conhecimento ainda é pouco comum. A pesquisa bibliográfica realizada demonstra que no meio acadêmico a técnica de mineração de processos está bem disseminada e se tornou bastante comum para a validação de processos de negócio, porém ainda é pouco utilizada como um meio para permitir a geração do conhecimento. A técnica, no entanto, aplicada em conjunto com o modelo elaborado neste trabalho, mostrou-se adequada para a transformação de dados, provenientes de um log de eventos de um processo, em informações úteis para a geração do conhecimento organizacional e, indica que pode ser utilizada com mais frequência. A utilização da técnica permitiria reduzir a complexidade no levantamento de informações a respeito do fluxo de trabalho dos processos e possibilitaria maior tempo e agilidade para as tomadas de decisão em relação a melhoria contínua dos processos implementados. Dessa forma, a aplicação da mineração de processos como uma prática da gestão conhecimento 483 VII Simpósio Brasileiro de Sistemas de Informação possibilitará oferecer um melhor entendimento e uma representação uniforme do processo perante a organização. References Aalst, W.M.P., Weijters, A.J.M.M., Maruster, L. “Workflow Mining: Discovering Process Models from Event Logs”, IEEE Transactions on Knowledge and Data Engineering, 16(9):1128–1142, 2004. Aalst, W.M.P.; Medeiros, A.K.A. de. “Process Mining and Security: Detecting Anomalous Process Executions and Checking Process Conformance”. In N. Busi, R. Gorrieri, and F. Martinelli, editors, Second International Workshop on Security Issues with Petri Nets and other Computational Models (WISP 2004), pages 69-84. STAR, Servizio Tipografico Area della Ricerca, CNR Pisa, Italy, 2004 Abranson, G. “On The KM Midway. Consultants clamor for companies attention and KM dollars. But Who’s offering what?” The Ernst & Young Center for Business Innovation. May, 1999. Binney, Derek. “The knowledge management spectrum - understanding the KM landscape”. Journal of Knowledge Management. Volume 5 . Number 1 . 2001 . pp. 33-42 Bubenko JR., J. A.; Stirna, J.; Brash, D. EKD. “User Guide”. Dpt of computer and systems sciences. Stockholm: Royal Institute of Technology. 1998. Davenport, T. H. “Reengenharia de processos”. Rio de Janeiro: Campus, 1994. Ferraresi, Alex A.; Santos, S. A. “Inteligência empresarial e gestão do conhecimento como praticas de suporte para a decisão estratégica”. SLADE Brasil 2006 – Encontro Luso-Brasileiro de Estratégia – Camboriú, Santa Catarina. Camboriú, 2006. Garvin, D. “Building a learning organization”. Harvard Business Review, Vol. 71 Issue 4, p. 78 -91. Jul/Aug 1993. Harrington, H. J., Esseling, E.K.C., Nimwegen, H.V. “Business Process Improvement: documentation, analysis, design and management of business process improvement”, New York: McGraHill, 1997. Nonaka, Ikujiro; Takeuchi, Hirotaka. “Criação de conhecimento na empresa : como as empresas japonesas geram a dinâmica da inovação”. Rio de Janeiro: 1997. Rozinat, A; Aalst, W.M.P. “Conformance Testing: Measuring the Alignment Between Event Logs and Process Models”. BETA Working Paper Series, WP 144, Eindhoven University of Technology, Eindhoven, 2005. Tarapanoff, Kira; Rezende, Denis Alcides et al. “Inteligência, informação e conhecimento em corporações”. Brasília: IBICT, UNESC, 2006. Terra, J. C. C. “Gestão do Conhecimento: Aspectos Conceituais e Estudo Exploratório Sobre as Práticas de Empresas Brasileiras”. São Paulo, 1999. Tese (Doutorado em Engenharia da Produção), Universidade de São Paulo. 484