Data Mining em Redes Sociais

Propaganda
Data Mining em Redes Sociais
Felipe Botelho e Pedro Ugioni
Mineração de Dados
Processo de explorar grandes quantidades de dados,
Procura de padrões consistentes,
Regras de associação ou sequências temporais,
Detectar relacionamentos sistemáticos entre variáveis,
Detectar novos subconjuntos de dados auxiliando na
descoberta de conhecimento
Mineração de Textos
Área que tem como principal objetivo extrair
conhecimento implícito de grandes
quantidades de textos escritos em linguagem
natural.
Rede Social
Conjunto finito de atores e de relações definidas
entre eles
“A Web é mais uma criação social do que
técnica...Nela, nos reunimos em famílias,
associações e empresas ...” Tim Berners-Lee
Rede Social
Estrutura composta por pessoas que estão
conectadas:
● Rede de relações de amizade;
● Casamentos entre famílias;
● Comunidades de negócio;
Rede Social
Wikis, twitter, fóruns, blogs, entre outros
Grande quantidade de informação
Mineração de dados em
Redes Sociais
Introdução
- Organização saber como é seu publico alvo;
- Direcionar campanhas de marketing;
- Adaptar os serviços prestados;
Mineração de dados em
Redes Sociais
Introdução
- Uso de questionários em pesquisas é, muitas
vezes, ineficiente
- Alcance relativamente reduzido;
- Custo alto de aplicação;
Mineração de dados em
Redes Sociais
Introdução
Nas redes sociais:
- Dados são dispostos pelos usuários por
vontade própria;
- Amplo alcance;
- Evita influência nas respostas por parte de
aplicadores
Mineração de dados em
Redes Sociais
Utilizações das informações
"Dado amplo uso das rede sociais e a grande
diversidade de seus usuários, surge uma série de
oportunidades a serem exploradas"
- Anúncios de marketing e campanhas publicitárias para os
usuários
Mineração de dados em
Redes Sociais
Utilizações das informações
Objetivos:
- Explorar o conhecimento coletivo e
implicito;
- Descobrir padrões e regras de associação;
- Prever tendencias;
- Evolução da rede
Mineração de dados em
Redes Sociais
Coleta
Utiliza:
- Técnicas de mineração de dados e grafos;
- Técnicas de Aprendizagem de Máquina;
- Técnica de visualização de redes.
Mineração de dados em
Redes Sociais
Coleta
Métodos automáticos para coletar esses dados
dentro das redes sociais.:
- Mais utilizado é baseado na procura de
informações de ‘quem fala com quem’
Intensidade do laço entre os indivídos
Mineração de dados em
Redes Sociais
Coleta
• Descoberta dos nós
Quando todas as referências a pessoas (nomes,
emails,..) são identificadas.
• Detecção e resolução de pseudônimos
Resolve as ambiguidades entre as pessoas.
• Descoberta de conexões
Determina quando existe ou não conexões sociais
entre as pessoas identificadas
Mineração de dados em
Redes Sociais
Coleta
• Descoberta dos nós
Geralmente feita por meio da descoberta de nomes
pessoais e outras referências às pessoas.
Ela faz parte da chamada Reconhecimento de
Nomes de Entidades (RNE - mineração de texto).
Procurando padrões do tipo
[parte1]@[parte2].[parte3].
Mineração de dados em
Redes Sociais
Coleta
• Detecção e resolução de pseudônimos
Esse passo possui um objetivo duplo:
- Identificar todas as diferentes referências para a
mesma pessoa (ex.: ‘você’, ‘João’, ‘Sr. Carlos’ e
‘[email protected]’)
- Diferenciar duas ou mais pessoas que possuem o
mesmo nome.
Mineração de dados em
Redes Sociais
Coleta
• Descoberta de conexões
Depois que todos os nós da rede são
identificados e agrupados de modo a
representarem uma única pessoa, o
próximo passo é o de descobrir como estes
nós estão interligados.
Mineração de dados em
Redes Sociais
Privacidade
Por um lado a mineração de dados sobre nossos
perfis e gostos pode nos trazer comodidades no
dia a dia (as empresas sabem o que você quer,
por exemplo), mas até que ponto isso não é
invasão de privacidade?
“A vida privada de uma pessoa natural é de natureza
inviolável, e o juiz, a requerimento do interessado, adotará
as providências necessárias para impedir ou fazer cessar o
ato contrário a esta norma.” Código Civil, art. 21.
Privacidade
O que é crime?
O que é imoral?
O que é normal?
Crime
Venda de bancos de dados contento informações
privadas.
Mais comuns:
◦Informações Criminais
◦Informações Trabalhistas
Imoral
Mesmo não constituindo crime, é comum as
empresas visitarem os perfis dos usuários em
redes sociais para verificar sua conduta.
Isso as vezes é utilizado como forma de eliminação
em entrevistas.
Políticas de Privacidade
Política de privacidade determina até que ponto
suas informações pessoais serão expostas e
utilizadas.
A maioria das políticas de privacidades prevêem o
uso de dados gerais para melhorar a experiência
geral do usuário.
Facebook e Data Mining
Empresa Datalogix
Verificar se anúncios estão se pagando
Qual o limite?
Download