ICT Computadores que aprendem a ler, a assistir e a entender 31 08 2015 por Ben Deighton Os repositórios de dados, tais como o DBpedia, estão facilitando a compreensão do que é lido na página web pelos softwares. Imagem: Linking Open Data cloud diagram 2014, por Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ Os computadores estão sendo ensinados a compreender o significado por trás das palavras e imagens na internet, e isso está levando para a internet uma nova geração de software inteligente capaz de executar tarefas que somente os seres humanos têm sido capazes de realizar. É graças à aprendizagem das máquinas que a inteligência artificial é um ramo emergente da ciência da computação denominado web semântica. "As tecnologias semânticas podem ter um papel muito importante ao encontrar uma maneira mais inteligente de obter informações de alto nível do que aquela usada atualmente pelos operadores humanos", disse Andrea Ciapetti, especialista em software na Empresa Italiana de Engenharia, Tecnologia e Inovação. Andrea está trabalhando com a polícia de Madrid para criar um mecanismo de busca que analise imagens de vídeo para descobrir atos criminosos, por exemplo alguém sendo vítima de um batedor de carteira. O software permitirá identificar os elementos do vídeo que são de interesse, sendo que a web semântica examinará esses eventos e escolherá aqueles que podem indicar crimes em andamento. A empresa também está trabalhando no projeto DESCUBRA-IT, financiado pela EU, que visa a criar uma ferramenta de busca semântica para as empresas start-up. Essa ferramenta auxiliará na busca online de todas as patentes relevantes e dados de publicações de pesquisa de livre acesso, a fim de ajudar as start-ups a identificar ideias inovadoras. A tecnologia semântica anota palavras e imagens com informações complementares de maneira que o software possa entender o seu significado. "É isso que faz a web semântica: transforma a web de documentos que existem hoje, como se apresentam hoje para os seres humanos, numa rede de dados para consumo do software", disse Luca De Santis, da Net7, uma empresa de tecnologia web com sede em Itália. De Santis é o gerente do projeto STOM, também financiado pela UE, que pesquisa a maneira de comercializar duas máquinas de busca semântica desenvolvidas como parte de um projeto anterior, o SemLib. Um dos produtos, chamado EventPlace, é uma ferramenta de busca que reúne informações relativas a um evento, enquanto o outro, PunditBrain, é usado para criar anotações em documentos da web que, graças às tecnologias semânticas, são mais fáceis de buscar e reutilizar. "É isso que faz a web semântica: transforma a web de documentos que existe hoje, como se apresenta para os seres humanos, numa rede de dados para consumo do software." Luca De Santis, da Net7, Itália A busca semântica consegue encadear ideias semelhantes dessa maneira, porque adiciona informações explicativas às páginas web ou faz a ligação com repositórios externos que dão sentido e contexto às palavras. Wikipedia para computadores Os repositórios de dados, tais como o DBpedia, uma versão da Wikipedia para computadores, estão no âmago da tecnologia semântica, pois podem ser usados para anotar páginas da web, facilitando sua compreensão pelos sistemas semânticos. Assim, quando o software chega numa palavra que pode significar duas coisas, como 'rock', por exemplo, que poderia referir-se a música ou geologia, o software consegue verificar qual o real significado da palavra na frase. "Eu posso fornecer um link para a DBpedia, e dizer: 'Ok, isso é sobre música'", disse De Santis. As tecnologias semânticas já estão sendo utilizadas para agrupar artigos de notícias quando são sobre um mesmo assunto, ou para entender os interesses de um usuário do Facebook examinando as similaridades das páginas que ?curtiu?. "O Facebook, usando a tecnologia de semântica web, consegue saber do quê você realmente gosta", disse De Santis. "É a página sobre restaurantes, ou é sobre música rock?" Certeza matemática Um dos problemas com o uso de técnicas semânticas é que, em muitas áreas, o significado pode ser difícil de definir de uma forma matematicamente precisa, criando dados que não se adequam ao raciocínio lógico usado por computadores. A palavra ?vinho? é um bom exemplo: as palavras usadas para descrever o gosto do vinho, tais como doce ou frutado, podem significar coisas ligeiramente diferentes para pessoas diferentes. No entanto, para que a tecnologia de busca semântica consiga responder a perguntas como ?qual o vinho que vai bem com um prato específico?, ela precisa entender e usar esses termos diferentes. "Construir uma teoria lógica para esses domínios do mundo real é bastante complicado", explicou o Dr. Steven Schockaert, investigador principal do projeto FLEXILOG. Ele procura uma maneira de modelar espacialmente o sentido das palavras que possa ser utilizado para responder a consultas de pesquisa lógica. "O objetivo é ter um sistema que apenas aprenda, por si próprio, informações sobre vários domínios diferentes à medida que lê informações na web", disse o Dr. Schockaert, cujo trabalho foi financiado pelo Conselho Europeu de Investigação da UE. A estratégia é alimentar o sistema com informações que ele possa usar para aprender. "Inicialmente vamos trabalhar com a Wikipedia, depois aumentaremos a escala até cobrir uma parte substancial da web." More info DISCOVER-IT StoM FLEXILOG