Data Mining em Redes Sociais Felipe Botelho e Pedro Ugioni Mineração de Dados Processo de explorar grandes quantidades de dados, Procura de padrões consistentes, Regras de associação ou sequências temporais, Detectar relacionamentos sistemáticos entre variáveis, Detectar novos subconjuntos de dados auxiliando na descoberta de conhecimento Mineração de Textos Área que tem como principal objetivo extrair conhecimento implícito de grandes quantidades de textos escritos em linguagem natural. Rede Social Conjunto finito de atores e de relações definidas entre eles “A Web é mais uma criação social do que técnica...Nela, nos reunimos em famílias, associações e empresas ...” Tim Berners-Lee Rede Social Estrutura composta por pessoas que estão conectadas: ● Rede de relações de amizade; ● Casamentos entre famílias; ● Comunidades de negócio; Rede Social Wikis, twitter, fóruns, blogs, entre outros Grande quantidade de informação Mineração de dados em Redes Sociais Introdução - Organização saber como é seu publico alvo; - Direcionar campanhas de marketing; - Adaptar os serviços prestados; Mineração de dados em Redes Sociais Introdução - Uso de questionários em pesquisas é, muitas vezes, ineficiente - Alcance relativamente reduzido; - Custo alto de aplicação; Mineração de dados em Redes Sociais Introdução Nas redes sociais: - Dados são dispostos pelos usuários por vontade própria; - Amplo alcance; - Evita influência nas respostas por parte de aplicadores Mineração de dados em Redes Sociais Utilizações das informações "Dado amplo uso das rede sociais e a grande diversidade de seus usuários, surge uma série de oportunidades a serem exploradas" - Anúncios de marketing e campanhas publicitárias para os usuários Mineração de dados em Redes Sociais Utilizações das informações Objetivos: - Explorar o conhecimento coletivo e implicito; - Descobrir padrões e regras de associação; - Prever tendencias; - Evolução da rede Mineração de dados em Redes Sociais Coleta Utiliza: - Técnicas de mineração de dados e grafos; - Técnicas de Aprendizagem de Máquina; - Técnica de visualização de redes. Mineração de dados em Redes Sociais Coleta Métodos automáticos para coletar esses dados dentro das redes sociais.: - Mais utilizado é baseado na procura de informações de ‘quem fala com quem’ Intensidade do laço entre os indivídos Mineração de dados em Redes Sociais Coleta • Descoberta dos nós Quando todas as referências a pessoas (nomes, emails,..) são identificadas. • Detecção e resolução de pseudônimos Resolve as ambiguidades entre as pessoas. • Descoberta de conexões Determina quando existe ou não conexões sociais entre as pessoas identificadas Mineração de dados em Redes Sociais Coleta • Descoberta dos nós Geralmente feita por meio da descoberta de nomes pessoais e outras referências às pessoas. Ela faz parte da chamada Reconhecimento de Nomes de Entidades (RNE - mineração de texto). Procurando padrões do tipo [parte1]@[parte2].[parte3]. Mineração de dados em Redes Sociais Coleta • Detecção e resolução de pseudônimos Esse passo possui um objetivo duplo: - Identificar todas as diferentes referências para a mesma pessoa (ex.: ‘você’, ‘João’, ‘Sr. Carlos’ e ‘[email protected]’) - Diferenciar duas ou mais pessoas que possuem o mesmo nome. Mineração de dados em Redes Sociais Coleta • Descoberta de conexões Depois que todos os nós da rede são identificados e agrupados de modo a representarem uma única pessoa, o próximo passo é o de descobrir como estes nós estão interligados. Mineração de dados em Redes Sociais Privacidade Por um lado a mineração de dados sobre nossos perfis e gostos pode nos trazer comodidades no dia a dia (as empresas sabem o que você quer, por exemplo), mas até que ponto isso não é invasão de privacidade? “A vida privada de uma pessoa natural é de natureza inviolável, e o juiz, a requerimento do interessado, adotará as providências necessárias para impedir ou fazer cessar o ato contrário a esta norma.” Código Civil, art. 21. Privacidade O que é crime? O que é imoral? O que é normal? Crime Venda de bancos de dados contento informações privadas. Mais comuns: ◦Informações Criminais ◦Informações Trabalhistas Imoral Mesmo não constituindo crime, é comum as empresas visitarem os perfis dos usuários em redes sociais para verificar sua conduta. Isso as vezes é utilizado como forma de eliminação em entrevistas. Políticas de Privacidade Política de privacidade determina até que ponto suas informações pessoais serão expostas e utilizadas. A maioria das políticas de privacidades prevêem o uso de dados gerais para melhorar a experiência geral do usuário. Facebook e Data Mining Empresa Datalogix Verificar se anúncios estão se pagando Qual o limite?