Análise de dados de Movimento: você já pensou que está sendo monitoriado ? Vania Bogorny [email protected] Roteiro n Tipos de Dados de Movimento? n Para que servem Dados de Movimento? n Quais as principais diferenças entre os Dados de Movimento de Diferentes fontes? n Pesquisa em Trajetórias q Bancos de Dados e Tipos de Consultas em Trajetórias q Mineração de Trajetórias q Trajetórias Semânticas q Trajetórias x Redes Sociais 2 A Explosão da Rede Sem Fio Você utiliza algum desses dispositivos ? Você alguma vez já se sentiu monitorado? 3 A Explosão da Rede Sem Fio Dispositivos móveis ou programas aplicativos que detectam o seu IP deixam traços digitais que podem ser coletados como trajetórias, descrevendo a mobilidade de seus usuários Geram um novo tipo de dado, chamado “ Trajetórias de Objetos Móveis” 4 A importância deste novo tipo de dado Monitoramento de 100 mil usuários Resultados podem ajudar epidemiologistas a prever como um virus pode se espalhar e os administradores urbanos a alocar os recursos Pessoas seguem caminhos regulares com poucos destinos, como casa e trabalho, e viagens longas ocasionais (férias) A distancia percorrida varia entre a população, mas todas seguem um padrão semelhante: “percorrem distâncias curtas no dia a dia” 5 Serviços de Localização (Passado) n Limitados a sinais de tráfego fixos 6 Serviços de Localização (Hoje) n Tráfego n Quantos carros estão na Estrada X? n Qual é o tempo estimado para chegar ao destino? n Onde está o congestionamento? n Busca baseada em localização: n n Quais são os restaurantes no raio de 5 km da minha posição atual? n Onde está a churrascaria mais próxima? n Onde está o taxi mais próximo? Avisos: n Envie cupons a todos os clientes num raio de 4 km da minha loja 7 Tipos de Dados de Movimento Dados de Movimento gerados por Telefone Celular = célula (abrangência de uma antena de telefonia celular) 9 Dados de Movimento gerados pelo Facebook x2,y2,t2 texto like texto like x3,y3,t3 x1,y1,t1 texto like Dados tem: - - - - Coordenadas do lugar onde o usuario acessa o software O que pensa O que gosta Rede de amigos 10 Dados de Movimento gerados pelo Twitter x2,y2,t2 texto like texto like texto like x3,y3,t3 x1,y1,t1 Dados tem: - - - Coordenadas do lugar onde o usuario envia a mensagem O que pensa O que gosta 11 Dados de Movimento gerados por aparelhos GPS √ √ x2,y2,t2 x1,y1,t1 xn,yn,tn Dados tem: - Apenas as coordenadas de cada ponto do movimento - Mas tem-se o movimento detalhado 12 Exemplo de Trajetória real 13 Introdução a Trajetórias de GPS Como é um dado de trajetória computacionalmente falando? Trajetórias brutas: <(x1,y1,t1), (x2,y2,t2), (x3,y3,t3),... (xn,yn,tn)> 15 Exemplo de uma tabela com trajetórias reais TID A A A A A A A B B X 680271,8508 680272,0240 680271,8575 680271,5200 680271,0138 680270,0036 680269,6661 680269,6705 680269,6772 Y 7462623,6403 7462623,8229 7462624,1940 7462624,5672 7462625,1270 7462626,4312 7462626,8044 7462627,1735 7462627,7272 Data 07 04 16 07 04 16 07 04 16 07 04 16 07 04 16 07 04 16 07 04 16 08 04 16 08 04 16 HORA 20 59 28 20 59 29 20 59 30 20 59 31 20 59 32 20 59 34 20 59 35 15 59 36 16 05 37 16 Para que servem dados de trajetórias? n Análise de: q Como as pessoas se movem na cidade n q q q q n Durante o dia, semana, final de semana, etc Movimentos típicos? Como os hábitos de movimento têm se alterado no último ano por causa crise? Quais regiões de uma cidade terão congestionamento às 15 horas? Do que as pessoas gostam? ------17 Aplicações n n n Rastreamento de Veículos q Transportadoras monitoram seus caminhões q Seguradoras instalam GPS para monitoriar veículos segurados Segurança q Localizar uma chamada 190 q Analisar o comportamento de um indivídulo em relação a um lugar Trânsito q n Comportamento de Animais q n Alertar pessoas sobre uma área de congestionamento, acidente, etc Quais são as trajetórias de determinado tipo de pássaro migratório? Onde eles param? Por quanto tempo? ... Controle de Barcos de Pesca q Os barcos estão pescando em áreas onde realmente deveriam pescar? 18 Bancos de Dados e Tipos de Consultas em Trajetórias O poder de BD de Objetos Móveis (MOD) (Wolfson 1999) MOD n Passado: q Durante o ultimo ano, quantas vezes o ônibus 435 atrasou mais de 10 minutos ao passar pela parada 215? Restrição: Aeronaves devem voar a uma distância mínima de 2km entre si. Futuro: Quais caminhões chegarão ao seu destino nos próximos 20 minutos? Presente: Onde estão os táxis a menos de 1 km de onde estou? 20 Protótipos de Bancos de Dados de Objetos Móveis n SECONDO – Ralph Guting (Alemanha) n HERMES – Yannis Theodoridis and Nikos Pelekis (Grécia) 21 Tipos de Dados (Guting 1999) Moving Point (mpoint) Moving Region (mregion) n n Tipos de Dados: mpoint e mregion são mapeamentos do tempo para o espaço q mpoint = ponto no tempo q mregion = região no tempo Exemplos: q vôo (id: string, origem: string, destino: string, rota: mpoint) q tempestade (id: string, tipo: string, area: mregion) 22 Operadores Espaço-Temporais (Guting 1999) Exemplos de Operadores: n Intersection (mpoint, mregion) → mpoint q n distance (mpoint, mpoint) → mreal q n t2 t1 Ex: qual a menor distancia entre a trajetória de 2 aeronaves? t1 t4 t3 t2 t3 t4 Ex: Qual o formato da trajetória do onibus Y? deftime(mpoint) → period q Ex: Qual a duração da trajetória do carro da polícia? t0 n t5 trajectory (mpoint) → line q n Ex: Que horas a tempestade irá atravessar a estrada x? length (line) → real tn 23 t5 Exemplos de Consultas Espaço-Temporais n vôo (id: string, origem: string, destino: string, rota: mpoint) n Consulta 1: “Encontre os vôos para Londrina que voaram mais de 4000 km.” SELECT * FROM voo WHERE destino= ‘Londrina’ AND length (trajectory (rota) ) > 4000 n Consulta 2: “Encontre os pares de aviões que durante seus vôos se aproximaram a menos de 2000 metros!” SELECT f.id, g.id FROM voo f, voo g WHERE f.id <> g.id AND min (distance (f.rota, g.rota) ) < 2000 t2 t1 t1 t4 t3 t2 t3 t4 t5 24 Mineração de Trajetórias Mineração de Trajetórias : A origem (<2007) n Os primeiros trabalhos na área de mineração de trajetórias só se preocupavam em agrupar as trajetórias considerando: q Tempo similar (ignorando o espaço) n q Ex: Pessoas que se movem nos mesmos horários Espaço similar (ignorando o tempo) n Ex:Pessoas que viajam pelo mesmo caminho q Formato similar (ignorando o tempo) q Tempo e espaço similar 26 Mineração de Trajetórias C B D A 27 Mineração de Trajetórias : Clustering n Agrupar trajetórias similares n Gerar um resumo para cada grupo 28 Traclus (Lee et al 2007) n Algoritmo de clustering n Agrupa sub-trajetorias n Como funciona: q q n 1) cada trajetória é particionada em um conjunto de segmentos de linha( subtrajetórias) de comprimento L definido pelo usuário 2) Segmentos similares são agrupados com base numa função de distância Tempo não é considerado Exemplos Específicos de Tipos de Padrões Laube (2004) Laube propôs 5 tipos de padrões baseados em movimento, direção e localização : convergência, encontro, floco, lider e recorrência Convergência: ao menos m objetos passam por uma região circular de raio r, não necessariamente ao mesmo tempo (e.g. Pessoas chegando na parada de ônibus) T1 T2 T4 convergence T3 T5 Laube [2004] n n n Flock pattern: ao menos m objetos estão dentro de uma região de raio r e se movem na mesma direção no mesmo intervalo de tempo (e.g. Bando de aves) Leadership: ao menos m objetos estão dentro de uma região circular de raio r, se movem na mesma direção, e pelo menos um objeto está a frente naquela direção por ao menos t instantes de tempo (e.g. Migração de aves, acidente de trânsito) Encounter: ao menos m objetos permanecem dentro de uma área circular de raio r, assumindo que eles se movam na mesma velocidade (e.g. encontro de estudantes em um evento) T2 T3 Leadership T1 Encounter Flock Mineração de Trajetórias : Padrões Sequenciais n Descoberta de caminhos percorridos com frequência 32 Mineração de Trajetórias : Classificação n Extração de regras de comportamento ao longo do tempo n Usar essas regras para prever o comportamento de usuários no futuro 20% 5% 7% 60% ? 8% 33 Mineração de Trajetórias : Classificação Lee et al (2008) classifica tipos de navios (cargas) de acordo com os lugares (portos) aonde eles param Alencar et al (2015) classifica pessoas em estudantes, trabalhadores, aposentados, etc com base nos lugares que frequentam 34 Mineração de Trajetórias : Outliers Outlier: trajetória muito diferente das demais trajetórias do conjunto. Usado na identificação de: • carros ou pessoas com comportamento suspeito, • um animal doente que se afasta do grupo • veículo que conhece um caminho alternativo a uma rota padrão 35 Mineração de Trajetórias : Outliers Método TRAOD (Lee et al 2008) divide as trajetórias em subtrajetórias Agrupa trajetórias com movimento similar Detecta aquelas com movimento diferente do grupo 36 Mineração de Trajetórias : Anomalias/Desvios Alvares et al 2011 Lettich et al 2016 37 Mineração de Trajetórias : Anomalias/Fuga e Ronda 38 Trajetórias Semânticas: Uma nova era na área de análise e mineração de trajetórias (>2007) Histórico n Em 2007 foi criado um novo paradigma na área de trajetórias q n n Trajetórias passaram a ser vistas e analisadas não mais como conjuntos de pontos localizados no tempo e no espaço Definiu-se que trajetórias possuem basicamente duas partes (Alvares et al 2007)(Spaccapietra et al 2008): q Paradas em lugares importantes (chamadas stops) q Movimento (chamadas de moves) A partir de 2007 iniciou-se uma linha nova de pesquisa que considera o “mapa” da região aonde a trajetória foi coletada. 40 A importância de considerar a semântica n O que é semântica em trajetórias? q É toda e qualquer informação a mais que se obtenha sobre as trajetórias além dos dados de tempo e espaço e que ajudem na interpretação do movimento 41 A importância de considerar a semântica Trajetórias Brutas (x,y,t) Dados Geográficos Trajetória Bruta + mapa = Trajetória Semân.ca 42 A importância de considerar a semântica C R R T3 T2 T1 T4 Padrão Geométrico C SC T2 T3 H H T1 H Hotel T4 R Restaurant C Cinema T1 e T2 são mais similares Padrão SEMÂNTICO (a) Hotel p/ Restaurante, passando por SC (b) Cinema, passando por SC 43 Trajetória Metafórica (Spaccapietra et al 2008) end Time (Professor, EPFL, 1988-2010) (Professor, Dijon, 1983-1988) (Lecturer, Paris VI, 1972-1983) (Assistant, Paris VI, 1966-1972) position institution begin 44 Modelo de Stops e Moves (Spacapietra et al 2008) Traveler location 0:N list Has 1:1 Trajectory 2:N list hasStops 1:1 0:1 From 1:1 Move Stop 0:N 0:1 To ƒ(T) 1:1 IsIn 0:N Place 45 Adicionando semântica às trajetórias: usando STOPS STOPS são dependentes da aplicação 1 2 Aeroporto [08:00 – 08:30] Ibis Hotel [10:00-12:00]] Museu Louvre [13:00 – 17:00] Torre Eifel [17:30 – 18:00] 3 Aeroporto [08:00 – 08:30] Rótula [08:40 – 08:45] Congestionamento [09:00 – 09:15] Cruzamento [12:15 – 12:22] 46 Métodos para Adicionar Semântica 1) IB-SMoT (baseado na duração da intersecção) (Alvares et al 2007) 2) CB-SMoT (baseado na velocidade) (Palma et al 2008) Unknown stop Louvre 09-12 IbisH. 13-14 Torre Eifel 47 Mineração de Trajetórias : Outliers Semânticos Aquino et al (2013) 48 Trajetórias Mais e Mais Semânticas (> 2010) Descoberta de Atividades n Com o modelo stops já foi possível responder perguntas do tipo: n n Aonde as pessoas vão? Quais lugares elas visitam? Mais recentemente, o objetivo tem sido em responder perguntas do tipo: n Para que as pessoas visitam um lugar? à ATIVIDADES n Com quem elas visitam um lugar? à RELACIONAMENTOS 50 Encontros/Relacionamentos (Santos et al 2015) n e 2 oid {Louis,Marie} 3 {Louis, Marie,John} 3 {Louis, Marie, Susan} 3 frequencia duração 12 4 3 area 3 3 3 Grau Relacionamento 1 0.778 0.75 51 Mais recentemente (2014)..... n Um novo modelo foi proposto para trajetórias semânticas (Bogorny et al 2014) n Este modelo relaciona trajetórias com vários aspectos do mundo real n Meio de transporte n Objetivo das trajetórias n Atividades n Eventos n Ambiente Externo 52 CONSTAnT (Conceptual Data Model for Semantic Trajectories) (Bogorny et al 2014) 53 Atividades em Redes Sociais Neste tema existem dezenas de trabalhos, pois a análise de dados do Twitter e Facebook já tem alguns anos Por exemplo, ZHU, Z. et al. Human activity recognition using social media data. In: Proceedings of the 12th International Conference on Mobile and Ubiquitous Multimedia. New York, NY, USA: ACM, 2013. (MUM ’13), p. 21:1–21:10. ISBN 978-1-4503-2648-3. NOULAS, A.; MASCOLO, C.; FRIAS-MARTINEZ, E. Exploiting foursquare and cellular data to infer user activity in urban environments. In: Mobile Data Management (MDM), 2013 IEEE 14th International Conference on. [S.l.: s.n.], 2013. v. 1, p. 167–176. ZHU, Z. et al. Prior knowledge of human activities from social data. In: Proceedings of the 2013 International Symposium on Wearable Computers. New York, NY, USA: ACM, 2013. (ISWC ’13), p. 141– 142. ISBN 978-1-4503-2127-3. ZHU, Z.; BLANKE, U.; TRO ̈STER, G. Recognizing composite daily activities from crowd-labelled social media data. Pervasive and Mobile Computing, v. 26, p. 103 – 120, 2016. ISSN 1574-1192. Thirteenth International Conference on Pervasive Computing and Communications (PerCom 2015). 54 Atividades em Trajetórias de GPS Este tema ainda está na infância Por exemplo, FURLETTI, B. et al. Inferring human activities from gps tracks. In: Proceedings of the 2Nd ACM SIGKDD International Workshop on Urban Computing. New York, NY, USA: ACM, 2013. (UrbComp ’13), p. 5:1–5:8. ISBN 978-1-4503-2331-4. KIM, Y. et al. Activity recognition for a smartphone based travel survey based on crossuser history data. In: IEEE. 2014 22nd International Conference on Pattern Recognition (ICPR). [S.l.], 2014. p. 432–437. 55 Trajetórias Semânticas X Redes Sociais O Futuro! Integração de Trajetórias com Dados de Redes Sociais n Com a constante busca por respostas para perguntas do tipo: com quem você sai? Aonde você vai? Por que você vai no lugar x? O que você faz no lugar x? n n Está levando há um novo universo de pesquisa que é a integração de dados de trajetórias de GPS com dados de redes sociais Isso vai ser a tendência nos próximos anos 57 Futuro √ Xxxxxx like x2,y2,t2 √ x2,y2,t2 x1,y1,t1 Xxxxxx like x3,y3,t3 xn,yn,tn Xxxxxx like Dados tem: TUDO 58 Referencias (Alencar et al 2015) Lucas Andre de Alencar, Luis Otávio Alvares, Chiara Renso, Alessandra Raffaetà, Vania Bogorny: A Rule-based Method for Discovering Trajectory Profiles. SEKE 2015: 244-249 (Aquino et al 2013) Artur Ribeiro de Aquino, Luis Otávio Alvares, Chiara Renso, Vania Bogorny:Towards Semantic Trajectory Outlier Detection. GeoInfo 2013: 115-126 (Bogorny et al 2014) Vania Bogorny Chiara Renso, Artur Ribeiro de Aquino, Fernando de Lucca Siqueira, Luis Otávio Alvares: CONSTAnT - A Conceptual Data Model for Semantic Trajectories of Moving Objects. Trans. GIS 18(1): 66-88 (2014) (Carboni et al 2014) Eduardo M. Carboni, Vania Bogorny: Inferring Drivers Behavior through Trajectory Analysis. IEEE Conf. on Intelligent Systems (1) 2014: 837-848 (Santos et al 2015) Areli Andreia dos Santos, Andre Salvaro Furtado, Luis Otávio Alvares, Nikos Pelekis, Vania Bogorny: Inferring Relationships from Trajectory Data. GeoInfo 2015: 68-79 59 Referencias (Palma et al 2008) Palma, A. T; Bogorny, V.; Kuijpers, B.; Alvares, L.O. A Clusteringbased Approach for Discovering Interesting Places in Trajectories. In: 23rd Annual Symposium on Applied Computing, (ACM-SAC'08), Fortaleza, Ceara, 16-20 March (2008) Brazil. pp. 863-868. (Spaccapietra et al 2008) Spaccapietra, S., Parent, C., Damiani, M. L., de Macedo, J. A., Porto, F., and Vangenot, C. (2008). A conceptual view on trajectories. Data and Knowledge Engineering, 65(1):126–146. (Alvares et al 2007) Alvares, L. O., Bogorny, V., Kuijpers, B., de Macedo, J. A. F., Moelans, B., and Vaisman, A. (2007). A model for enriching trajectories with semantic geographical information. In ACM-GIS, pages 162–169, New York, NY, USA. ACM Press. (Manso et al. 2010). DB-SMoT: a Direction-based spatio-temporal clustering method. IEEE International Conference on Intelligent Systems 60 Referencias Laube, P. and Imfeld, S. (2002). Analyzing relative motion within groups of trackable moving point objects. In Egenhofer, M. J. and Mark, D. M., editors, GIScience, volume 2478 of Lecture Notes in Computer Science, pages 132–144. Springer. Laube, P., Imfeld, S., and Weibel, R. (2005a). Discovering relative motion patterns in groups of moving point objects. International Journal of Geographical Information Science, 19(6):639–668. Laube, P., van Kreveld, M., and Imfeld, S. (2005b). Finding REMO: Detecting Relative Motion Patterns in Geospatial Lifelines. Springer. Lee, J.-G., Han, J., and Whang, K.-Y. (2007). Trajectory clustering: a partition-and-group framework. In Chan, C. Y., Ooi, B. C., and Zhou, A., editors, SIGMOD Conference, pages 593–604. ACM. Jae-Gil Lee, Jiawei Han, Xiaolei Li, and Hector Gonzalez, “TraClass: Trajectory Classification Using Hierarchical Region-Based and Trajectory-Based Clustering”, Proc. 2008 Int. Conf. on Very Large Data Base (VLDB'08), Auckland, New Zealand, Aug. 2008. Jae-Gil Lee, Jiawei Han, and Xiaolei Li, "Trajectory Outlier Detection: A Partition-andDetect Framework", Proc. 2008 Int. Conf. on Data Engineering (ICDE'08), Cancun, Mexico, April 2008. 61 MUITO Obrigada !!!! 62