STÉFANI PIRES
Mineração de Dados – Trimestre 2009.1
Prof. Marcus Sampaio
02/12/2008 Mineração de Dados
02/12/2008 Mineração de Dados
O que é Mineração de Processos?
Que logs são esses?
Motivação
Objetivos
Log exemplo
Tipos de conhecimento
Perspectiva de processo/ organização /
caso
Algoritmo α
Definições / Passos / Limitações
Técnica Heurística
ProM Framework
2
02/12/2008 Mineração de Dados
1. O que é Miner. de
Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Extrair conhecimento de
logs de eventos gravados
por um sistema de
informação.
3
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Sistemas de informação empresariais
armazenam eventos relevantes de
alguma forma estruturada.
Ex. de sistemas:
ERP (Enterprise Resource Planning)
CRM (Customer Relationship
Management)
Registram interações com os consumidores
B2B (Business to Business)
Registram todas as transações: Ex:
preenchimento de formulários, alterações de
documentos
Registram trocas de mensagem entre partes;
WFM (Workflow Management)
Registram o inicio e conclusão de atividades
4
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Os sistemas possuem modelos de
processos (implícitos ou explícitos).
Oferecem liberdade em sua utilização
Modelos de referência descrevem como as
pessoas DEVEM trabalhar!
Ex: Um sistemas de informação
hospitalar com diretrizes clínicas que
descrevem o tratamento de uma
doença específica.
5
É uma técnica de MONITORAMENTO
de sistemas de informação.
Relacionado a tendências de gestão
(BPR (Business Process Reengineering), BI
(Business Intelligence), KM (Knowledge Management)
)
O objetivo é entender o que realmente
está acontecendo.
Process Discovery e Delta Analysis
6
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Delta Analysis – pode também ser
usado para comparar diferentes
departamentos/organizações que usam
o mesmo sistema ERP.
Padrões interessantes podem ser
encontrados em diferentes níveis:
Componentes de software
Processos de negócio
Organizações
7
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
8
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
9
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de
conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Perspectiva de Processo
Perspectiva de Organização
Perspectiva de Caso
10
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
COMO?
Foco no controle de fluxo
Expresso em uma Rede de Petri
11
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Exemplo Lógico
Atividade A é sempre sequida por B;
Atividade C e D podem ser executadas
em paralelo;
Exemplo de Performance
O tempo médio de processamento da
atividade A é 35 minutos;
Atividade A é executada para 80% dos
casos;
12
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
QUEM?
Foco no executor da atividade
Construir Rede Social – transferência
de trabalho entre pessoas
13
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Estrutura Organizacional
Diagrama “Atividade-Função-Pessoa”
14
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Exemplo Lógico
John e Mary trabalham no mesmo time
de desenvolvimento;
Pete é o admininstrador do
departamento X;
Exemplo de Performance
John trabalha em média com 30 casos
por dia;
Mary e Pete trabalham juntos em 50%
dos casos;
15
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
O QUE?
Foco nas propriedades de um caso
Tenta estabelecer relações entre as
propriedades de um caso
Requer campos adicionais com
características dos casos.
16
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Exemplo Lógico
Casos de mais de 5.000 euros são
manipulados por John;
Atividade A é executada apenas para
clientes particulares;
Exemplo de Performance
80% dos casos de mais de 5.000 euros
são concluídos em dois dias;
A média de tempo de conclusão de casos
tratados por John e Mary é de duas
semanas;
17
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Objetivo: Inferir a estrutura do
processo;
Entrada: Log do sistema
Saída: Uma rede de Petri (P, T, F),
onde:
P = conjunto de estados
T = conjunto de transições
F = conjunto de ligações (arcos)
18
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Entrada:
19
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Definições:
Seja T um conjunto de atividades:
W = {ABCD, ACBD, AED}
Para encontrar o modelo de processos,
devem ser procuradas relações de
dependência/causa no log de eventos
20
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
.
Ex:
A>B, A>C, A>E, B>C, C>D, E>D, …
AB, AC, AE, BD, CD,
ED
B || C, C || B
21
Passos (8):
Tw = {A, B, C, D, E}
Ti=
{A}
To = {D}
22
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Passos (8):
23
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Passos (8):
24
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Como funciona:
25
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
26
Problemas lógicos (não abordadas aqui)
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
(atividades invisíveis, duplicadas, …)
Não sabe lidar com:
Ruídos
Atividades de baixa frequência
Sequência de baixa frequência
Exceções
Uma Solução: Técnicas heurísticas de
mineração
27
Utiliza a frequência como métrica para
indicar grau de certeza que A B
Seja W um log de eventos em T, e a,b
T
Observe que o valor da relação está
sempre entre -1 e 1
Um valor alto indica maior confiança na
28
existencia da relação AB
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Ex:
A >B aparece em 5 sequências e B>A em
nenhuma:
AB = 5/6 = 0.833
A >B aparece em 50 sequências e B>A
em nenhuma:
AB = 50/51 = 0.980
A >B aparece em 50 sequências e B>A
aparece 1 vez (ruído):
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
AB = 49/52 = 0.94
Como definir um limiar?
29
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Não é preciso um limiar, basta
escolher o melhor candidato!!!
Ex: 27 eventos do log de ex. anterior +
3 ruídos: ABCED, AECBD, AD )
30
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
Grafo de dependência, com a
confiança de cada relação.
Técnica incompleta.
31
02/12/2008 Mineração de Dados
1. O que é Miner. de Pro.?
2. Que logs são esses?
3. Motivação
4. Objetivos
5. Log exemplo
6. Tipos de conhecimento
6.1. P. de processo
6.2. P. de organização
6.3. P. de casos
7. Algoritmo α
7.1. Definições
7.2. Passos
7.3. Como funciona
7.4. Limitações
8. Técnica heurística
9. ProM Framework
www.processmining.org
Grátis e Open Source
32
Prefeitura:
02/12/2008 Mineração de Dados
Descobrir os caminhos de execução mais
frequentes
Minerar processos e comparar com os
modelos implantados
Empresa:
Objetivo: reduzir o período de teste dos
scanners produzidos
Perguntas:
Como os testes então realmente sendo
executados?
Os testes estão seguindo o modelo de
referência?
Em que partes do processo de teste gasta-se
mais tempo?
33
STÉFANI PIRES
02/12/2008 Mineração de Dados