Análise de dados de Movimento: você já pensou que está

Propaganda
Análise de dados de Movimento:
você já pensou que está sendo
monitoriado ?
Vania Bogorny
[email protected]
Roteiro
n 
Tipos de Dados de Movimento?
n 
Para que servem Dados de Movimento?
n 
Quais as principais diferenças entre os Dados de
Movimento de Diferentes fontes?
n 
Pesquisa em Trajetórias
q 
Bancos de Dados e Tipos de Consultas em
Trajetórias
q 
Mineração de Trajetórias
q 
Trajetórias Semânticas
q 
Trajetórias x Redes Sociais
2
A Explosão da Rede Sem Fio
Você utiliza algum desses dispositivos ?
Você alguma vez já se sentiu monitorado?
3
A Explosão da Rede Sem Fio
Dispositivos móveis ou programas aplicativos que detectam o seu IP
deixam traços digitais que podem ser coletados como trajetórias,
descrevendo a mobilidade de seus usuários
Geram um novo tipo de dado, chamado “ Trajetórias de Objetos Móveis”
4
A importância deste novo tipo de dado
Monitoramento de 100 mil usuários
Resultados podem ajudar epidemiologistas a prever como um
virus pode se espalhar e os administradores urbanos a alocar
os recursos
Pessoas seguem caminhos regulares com poucos destinos,
como casa e trabalho, e viagens longas ocasionais (férias)
A distancia percorrida varia entre a população, mas todas
seguem um padrão semelhante: “percorrem distâncias curtas
no dia a dia”
5
Serviços de Localização (Passado)
n 
Limitados a sinais de tráfego fixos
6
Serviços de Localização (Hoje)
n 
Tráfego
n 
Quantos carros estão na Estrada X?
n 
Qual é o tempo estimado para chegar ao destino?
n 
Onde está o congestionamento?
n 
Busca baseada em localização:
n 
n 
Quais são os restaurantes no raio de 5 km da
minha posição atual?
n 
Onde está a churrascaria mais próxima?
n 
Onde está o taxi mais próximo?
Avisos:
n 
Envie cupons a todos os clientes num raio de 4 km
da minha loja
7
Tipos de Dados de
Movimento
Dados de Movimento gerados por Telefone Celular
= célula (abrangência de uma
antena de telefonia celular)
9
Dados de Movimento gerados pelo Facebook
x2,y2,t2
texto
like
texto
like
x3,y3,t3
x1,y1,t1
texto
like
Dados tem:
- 
- 
- 
- 
Coordenadas do lugar onde o usuario
acessa o software
O que pensa
O que gosta
Rede de amigos
10
Dados de Movimento gerados pelo Twitter
x2,y2,t2
texto
like
texto
like
texto
like
x3,y3,t3
x1,y1,t1
Dados tem:
- 
- 
- 
Coordenadas do lugar onde
o usuario envia a mensagem
O que pensa
O que gosta
11
Dados de Movimento gerados por
aparelhos GPS
√
√
x2,y2,t2
x1,y1,t1
xn,yn,tn
Dados tem:
-  Apenas as coordenadas de cada ponto do
movimento
-  Mas tem-se o movimento detalhado
12
Exemplo de Trajetória real
13
Introdução a Trajetórias de
GPS
Como é um dado de trajetória computacionalmente
falando?
Trajetórias brutas:
<(x1,y1,t1), (x2,y2,t2), (x3,y3,t3),... (xn,yn,tn)>
15
Exemplo de uma tabela com trajetórias reais
TID
A
A
A
A
A
A
A
B
B
X
680271,8508
680272,0240
680271,8575
680271,5200
680271,0138
680270,0036
680269,6661
680269,6705
680269,6772
Y
7462623,6403
7462623,8229
7462624,1940
7462624,5672
7462625,1270
7462626,4312
7462626,8044
7462627,1735
7462627,7272
Data
07 04 16
07 04 16
07 04 16
07 04 16
07 04 16
07 04 16
07 04 16
08 04 16
08 04 16
HORA
20 59 28
20 59 29
20 59 30
20 59 31
20 59 32
20 59 34
20 59 35
15 59 36
16 05 37
16
Para que servem dados de trajetórias?
n 
Análise de:
q 
Como as pessoas se movem na cidade
n 
q 
q 
q 
q 
n 
Durante o dia, semana, final de semana, etc
Movimentos típicos?
Como os hábitos de movimento têm se alterado no último ano
por causa crise?
Quais regiões de uma cidade terão congestionamento às 15
horas?
Do que as pessoas gostam?
------17
Aplicações
n 
n 
n 
Rastreamento de Veículos
q 
Transportadoras monitoram seus caminhões
q 
Seguradoras instalam GPS para monitoriar veículos segurados
Segurança
q 
Localizar uma chamada 190
q 
Analisar o comportamento de um indivídulo em relação a um lugar
Trânsito
q 
n 
Comportamento de Animais
q 
n 
Alertar pessoas sobre uma área de congestionamento, acidente, etc
Quais são as trajetórias de determinado tipo de pássaro migratório?
Onde eles param? Por quanto tempo? ...
Controle de Barcos de Pesca
q 
Os barcos estão pescando em áreas onde realmente deveriam
pescar?
18
Bancos de Dados e
Tipos de Consultas em
Trajetórias
O poder de BD de Objetos Móveis (MOD)
(Wolfson 1999)
MOD
n 
Passado:
q 
Durante o ultimo ano, quantas vezes o ônibus 435 atrasou mais de 10 minutos ao
passar pela parada 215?
Restrição:
Aeronaves devem voar a uma distância mínima de 2km entre si.
  Futuro:
Quais caminhões chegarão ao seu destino nos próximos 20 minutos?
Presente: Onde estão os táxis a menos de 1 km de onde estou?
20
Protótipos de Bancos de Dados de Objetos Móveis
n 
SECONDO – Ralph Guting (Alemanha)
n 
HERMES – Yannis Theodoridis and Nikos Pelekis
(Grécia)
21
Tipos de Dados (Guting 1999)
Moving Point (mpoint)
Moving Region (mregion)
n 
n 
Tipos de Dados: mpoint e mregion são mapeamentos do
tempo para o espaço
q 
mpoint = ponto no tempo
q 
mregion = região no tempo
Exemplos:
q 
vôo (id: string, origem: string, destino: string, rota: mpoint)
q 
tempestade (id: string, tipo: string, area: mregion)
22
Operadores Espaço-Temporais
(Guting 1999)
Exemplos de Operadores:
n 
Intersection (mpoint, mregion) → mpoint
q 
n 
distance (mpoint, mpoint) → mreal
q 
n 
t2
t1
Ex: qual a menor distancia entre a trajetória de 2 aeronaves?
t1
t4
t3
t2
t3
t4
Ex: Qual o formato da trajetória do onibus Y?
deftime(mpoint) → period
q 
Ex: Qual a duração da trajetória do carro da polícia?
t0
n 
t5
trajectory (mpoint) → line
q 
n 
Ex: Que horas a tempestade irá atravessar a estrada x?
length (line) → real
tn
23
t5
Exemplos de Consultas Espaço-Temporais
n 
vôo (id: string, origem: string, destino: string, rota: mpoint)
n 
Consulta 1: “Encontre os vôos para Londrina que voaram mais de 4000 km.”
SELECT *
FROM voo
WHERE destino= ‘Londrina’ AND length (trajectory (rota) ) > 4000
n 
Consulta 2: “Encontre os pares de aviões que durante seus vôos se
aproximaram a menos de 2000 metros!”
SELECT f.id, g.id
FROM voo f, voo g
WHERE f.id <> g.id AND min (distance (f.rota, g.rota) ) < 2000
t2
t1
t1
t4
t3
t2
t3
t4
t5
24
Mineração de Trajetórias
Mineração de Trajetórias : A origem (<2007)
n 
Os primeiros trabalhos na área de mineração de
trajetórias só se preocupavam em agrupar as trajetórias
considerando:
q 
Tempo similar (ignorando o espaço)
n 
q 
Ex: Pessoas que se movem nos mesmos horários
Espaço similar (ignorando o tempo)
n 
Ex:Pessoas que viajam pelo mesmo caminho
q 
Formato similar (ignorando o tempo)
q 
Tempo e espaço similar
26
Mineração de Trajetórias
C
B
D
A
27
Mineração de Trajetórias : Clustering
n 
Agrupar trajetórias similares
n 
Gerar um resumo para cada grupo
28
Traclus (Lee et al 2007)
n 
Algoritmo de clustering
n 
Agrupa sub-trajetorias
n 
Como funciona:
q 
q 
n 
1) cada trajetória é particionada em um conjunto de segmentos de
linha( subtrajetórias) de comprimento L definido pelo usuário
2) Segmentos similares são agrupados com base numa função de distância
Tempo não é considerado
Exemplos Específicos de Tipos de Padrões Laube (2004)
Laube propôs 5 tipos de padrões baseados em movimento, direção
e localização : convergência, encontro, floco, lider e recorrência
  Convergência: ao menos m objetos passam por uma região
circular de raio r, não necessariamente ao mesmo tempo (e.g.
Pessoas chegando na parada de ônibus)
T1
T2
T4
convergence
T3
T5
Laube [2004]
n 
n 
n 
Flock pattern: ao menos m objetos estão dentro de uma região de raio r e se
movem na mesma direção no mesmo intervalo de tempo (e.g. Bando de aves)
Leadership: ao menos m objetos estão dentro de uma região circular de raio r, se
movem na mesma direção, e pelo menos um objeto está a frente naquela direção por
ao menos t instantes de tempo (e.g. Migração de aves, acidente de trânsito)
Encounter: ao menos m objetos permanecem dentro de uma área circular de raio r,
assumindo que eles se movam na mesma velocidade (e.g. encontro de estudantes em
um evento)
T2
T3
Leadership
T1
Encounter
Flock
Mineração de Trajetórias : Padrões Sequenciais
n 
Descoberta de caminhos percorridos com frequência
32
Mineração de Trajetórias : Classificação
n 
Extração de regras de comportamento ao longo do tempo
n 
Usar essas regras para prever o comportamento de
usuários no futuro
20%
5%
7%
60%
?
8%
33
Mineração de Trajetórias : Classificação
Lee et al (2008) classifica tipos de navios (cargas) de
acordo com os lugares (portos) aonde eles param
Alencar et al (2015) classifica pessoas em estudantes,
trabalhadores, aposentados, etc com base nos lugares
que frequentam
34
Mineração de Trajetórias : Outliers
Outlier: trajetória muito diferente das demais trajetórias do
conjunto.
Usado na identificação de:
•  carros ou pessoas com comportamento suspeito,
•  um animal doente que se afasta do grupo
•  veículo que conhece um caminho alternativo a uma rota
padrão
35
Mineração de Trajetórias : Outliers
Método TRAOD (Lee et al 2008) divide as trajetórias em
subtrajetórias
Agrupa trajetórias com movimento similar
Detecta aquelas com movimento diferente do grupo
36
Mineração de Trajetórias : Anomalias/Desvios
Alvares et al 2011
Lettich et al 2016
37
Mineração de Trajetórias : Anomalias/Fuga e
Ronda
38
Trajetórias Semânticas:
Uma nova era na área de
análise e mineração de
trajetórias (>2007)
Histórico
n 
Em 2007 foi criado um novo paradigma na área de
trajetórias
q 
n 
n 
Trajetórias passaram a ser vistas e analisadas não mais
como conjuntos de pontos localizados no tempo e no
espaço
Definiu-se que trajetórias possuem basicamente duas
partes (Alvares et al 2007)(Spaccapietra et al 2008):
q 
Paradas em lugares importantes (chamadas stops)
q 
Movimento (chamadas de moves)
A partir de 2007 iniciou-se uma linha nova de
pesquisa que considera o “mapa” da região aonde a
trajetória foi coletada.
40
A importância de considerar a semântica
n  O que é semântica em trajetórias?
q  É toda e qualquer informação a mais que se obtenha
sobre as trajetórias além dos dados de tempo e
espaço e que ajudem na interpretação do movimento
41
A importância de considerar a semântica
Trajetórias Brutas (x,y,t) Dados Geográficos Trajetória Bruta + mapa = Trajetória Semân.ca 42
A importância de considerar a semântica
C
R
R
T3
T2
T1
T4
Padrão Geométrico
C
SC
T2
T3
H
H
T1
H Hotel
T4
R
Restaurant
C Cinema
T1 e T2 são mais similares
Padrão SEMÂNTICO
(a)  Hotel p/ Restaurante, passando por SC
(b) Cinema, passando por SC
43
Trajetória Metafórica
(Spaccapietra et al 2008)
end
Time
(Professor, EPFL, 1988-2010)
(Professor, Dijon, 1983-1988)
(Lecturer, Paris VI, 1972-1983)
(Assistant, Paris VI, 1966-1972)
position
institution
begin
44
Modelo de Stops e Moves (Spacapietra et al 2008)
Traveler
location
0:N list
Has
1:1
Trajectory
2:N list
hasStops
1:1
0:1
From
1:1
Move
Stop
0:N
0:1
To
ƒ(T)
1:1
IsIn
0:N
Place
45
Adicionando semântica às trajetórias: usando STOPS
STOPS são dependentes da aplicação
1
2
Aeroporto
[08:00 – 08:30]
Ibis Hotel
[10:00-12:00]]
Museu Louvre
[13:00 – 17:00]
Torre Eifel
[17:30 – 18:00]
3
Aeroporto
[08:00 – 08:30]
Rótula
[08:40 – 08:45]
Congestionamento
[09:00 – 09:15]
Cruzamento
[12:15 – 12:22]
46
Métodos para Adicionar Semântica
1) IB-SMoT (baseado na duração da intersecção) (Alvares et al 2007)
2) CB-SMoT (baseado na velocidade) (Palma et al 2008)
Unknown stop
Louvre
09-12
IbisH.
13-14
Torre Eifel
47
Mineração de Trajetórias : Outliers Semânticos
Aquino et al (2013)
48
Trajetórias Mais e Mais
Semânticas (> 2010)
Descoberta de Atividades
n 
Com o modelo stops já foi possível responder
perguntas do tipo:
n 
n 
Aonde as pessoas vão? Quais lugares elas
visitam?
Mais recentemente, o objetivo tem sido em responder
perguntas do tipo:
n 
Para que as pessoas visitam um lugar? à
ATIVIDADES
n 
Com quem elas visitam um lugar? à
RELACIONAMENTOS
50
Encontros/Relacionamentos (Santos et al 2015)
n 
e
2
oid
{Louis,Marie}
3
{Louis, Marie,John} 3
{Louis, Marie, Susan} 3
frequencia
duração
12
4
3
area
3
3
3
Grau
Relacionamento
1
0.778
0.75
51
Mais recentemente (2014).....
n 
Um novo modelo foi proposto para trajetórias
semânticas (Bogorny et al 2014)
n 
Este modelo relaciona trajetórias com vários aspectos
do mundo real
n 
Meio de transporte
n 
Objetivo das trajetórias
n 
Atividades
n 
Eventos
n 
Ambiente Externo
52
CONSTAnT (Conceptual Data Model for Semantic
Trajectories) (Bogorny et al 2014)
53
Atividades em Redes Sociais
Neste tema existem dezenas de trabalhos, pois a análise de dados do
Twitter e Facebook já tem alguns anos
Por exemplo,
ZHU, Z. et al. Human activity recognition using social media data. In:
Proceedings of the 12th International Conference on Mobile and Ubiquitous Multimedia. New York, NY,
USA: ACM, 2013. (MUM ’13), p. 21:1–21:10. ISBN 978-1-4503-2648-3.
NOULAS, A.; MASCOLO, C.; FRIAS-MARTINEZ, E. Exploiting foursquare and cellular data to infer user
activity in urban environments. In: Mobile Data Management (MDM), 2013 IEEE 14th International
Conference on. [S.l.: s.n.], 2013. v. 1, p. 167–176.
ZHU, Z. et al. Prior knowledge of human activities from social data. In: Proceedings of the 2013
International Symposium on Wearable Computers. New York, NY, USA: ACM, 2013. (ISWC ’13), p. 141–
142. ISBN 978-1-4503-2127-3.
ZHU, Z.; BLANKE, U.; TRO ̈STER, G. Recognizing composite daily activities from crowd-labelled social
media data. Pervasive and Mobile Computing, v. 26, p. 103 – 120, 2016. ISSN 1574-1192. Thirteenth
International Conference on Pervasive Computing and Communications (PerCom 2015).
54
Atividades em Trajetórias de GPS
Este tema ainda está na infância
Por exemplo,
FURLETTI, B. et al. Inferring human activities from gps tracks. In:
Proceedings of the 2Nd ACM SIGKDD International Workshop on Urban Computing.
New York, NY, USA: ACM, 2013. (UrbComp ’13), p. 5:1–5:8. ISBN 978-1-4503-2331-4.
KIM, Y. et al. Activity recognition for a smartphone based travel survey based on crossuser history data. In: IEEE. 2014 22nd International Conference on Pattern Recognition
(ICPR). [S.l.], 2014. p. 432–437.
55
Trajetórias Semânticas X
Redes Sociais
O Futuro!
Integração de Trajetórias com Dados de Redes Sociais
n 
Com a constante busca por respostas para perguntas
do tipo: com quem você sai? Aonde você vai? Por que
você vai no lugar x? O que você faz no lugar x?
n 
n 
Está levando há um novo universo de pesquisa
que é a integração de dados de trajetórias de GPS
com dados de redes sociais
Isso vai ser a tendência nos próximos anos
57
Futuro
√
Xxxxxx
like
x2,y2,t2
√
x2,y2,t2
x1,y1,t1
Xxxxxx
like
x3,y3,t3
xn,yn,tn
Xxxxxx
like
Dados tem:
TUDO
58
Referencias
(Alencar et al 2015) Lucas Andre de Alencar, Luis Otávio Alvares, Chiara Renso,
Alessandra Raffaetà, Vania Bogorny:
A Rule-based Method for Discovering Trajectory Profiles. SEKE 2015: 244-249
(Aquino et al 2013) Artur Ribeiro de Aquino, Luis Otávio Alvares, Chiara Renso,
Vania Bogorny:Towards Semantic Trajectory Outlier Detection. GeoInfo 2013:
115-126
(Bogorny et al 2014) Vania Bogorny
Chiara Renso, Artur Ribeiro de Aquino, Fernando de Lucca Siqueira, Luis Otávio
Alvares: CONSTAnT - A Conceptual Data Model for Semantic Trajectories of
Moving Objects. Trans. GIS 18(1): 66-88 (2014)
(Carboni et al 2014) Eduardo M. Carboni, Vania Bogorny:
Inferring Drivers Behavior through Trajectory Analysis. IEEE Conf. on Intelligent
Systems (1) 2014: 837-848
(Santos et al 2015) Areli Andreia dos Santos, Andre Salvaro Furtado, Luis Otávio
Alvares, Nikos Pelekis, Vania Bogorny:
Inferring Relationships from Trajectory Data. GeoInfo 2015: 68-79
59
Referencias
(Palma et al 2008) Palma, A. T; Bogorny, V.; Kuijpers, B.; Alvares, L.O. A Clusteringbased Approach for Discovering Interesting Places in Trajectories. In: 23rd Annual
Symposium on Applied Computing, (ACM-SAC'08), Fortaleza, Ceara, 16-20 March
(2008) Brazil. pp. 863-868.
(Spaccapietra et al 2008) Spaccapietra, S., Parent, C., Damiani, M. L., de Macedo, J. A.,
Porto, F., and Vangenot, C. (2008). A conceptual view on trajectories. Data and
Knowledge Engineering, 65(1):126–146.
(Alvares et al 2007) Alvares, L. O., Bogorny, V., Kuijpers, B., de Macedo, J. A. F.,
Moelans, B., and Vaisman, A. (2007). A model for enriching trajectories with semantic
geographical information. In ACM-GIS, pages 162–169, New York, NY, USA. ACM Press.
(Manso et al. 2010). DB-SMoT: a Direction-based spatio-temporal clustering method.
IEEE International Conference on Intelligent Systems
60
Referencias
Laube, P. and Imfeld, S. (2002). Analyzing relative motion within groups of trackable
moving point objects. In Egenhofer, M. J. and Mark, D. M., editors, GIScience, volume
2478 of Lecture Notes in Computer Science, pages 132–144. Springer.
Laube, P., Imfeld, S., and Weibel, R. (2005a). Discovering relative motion patterns in
groups of moving point objects. International Journal of Geographical Information
Science, 19(6):639–668.
Laube, P., van Kreveld, M., and Imfeld, S. (2005b). Finding REMO: Detecting Relative
Motion Patterns in Geospatial Lifelines. Springer.
Lee, J.-G., Han, J., and Whang, K.-Y. (2007). Trajectory clustering: a partition-and-group
framework. In Chan, C. Y., Ooi, B. C., and Zhou, A., editors, SIGMOD Conference, pages
593–604. ACM.
Jae-Gil Lee, Jiawei Han, Xiaolei Li, and Hector Gonzalez, “TraClass: Trajectory
Classification Using Hierarchical Region-Based and Trajectory-Based Clustering”, Proc.
2008 Int. Conf. on Very Large Data Base (VLDB'08), Auckland, New Zealand, Aug.
2008.
Jae-Gil Lee, Jiawei Han, and Xiaolei Li, "Trajectory Outlier Detection: A Partition-andDetect Framework", Proc. 2008 Int. Conf. on Data Engineering (ICDE'08), Cancun,
Mexico, April 2008.
61
MUITO Obrigada !!!!
62
Download