Computadores que aprendem a ler, a assistir e a entender

Propaganda
Receive our editor’s picks
ICT
Computadores que aprendem a ler, a
assistir e a entender
31 08 2015
por Ben Deighton
Os repositórios de dados, tais como o DBpedia, estão facilitando a compreensão do que é lido na página web pelos softwares. Imagem: Linking
Open Data cloud diagram 2014, por Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod­cloud.net/
Os computadores estão sendo ensinados a compreender o significado por trás das palavras e imagens
na internet, e isso está levando para a internet uma nova geração de software inteligente capaz de
executar tarefas que somente os seres humanos têm sido capazes de realizar.
É graças à aprendizagem das máquinas que a inteligência artificial é um ramo emergente da ciência da
computação denominado web semântica.
"As tecnologias semânticas podem ter um papel muito importante ao encontrar uma maneira mais inteligente
de obter informações de alto nível do que aquela usada atualmente pelos operadores humanos", disse Andrea
Ciapetti, especialista em software na Empresa Italiana de Engenharia, Tecnologia e Inovação.
Andrea está trabalhando com a polícia de Madrid para criar um mecanismo de busca que analise imagens de
vídeo para descobrir atos criminosos, por exemplo alguém sendo vítima de um batedor de carteira.
O software permitirá identificar os elementos do vídeo que são de interesse, sendo que a web semântica
examinará esses eventos e escolherá aqueles que podem indicar crimes em andamento.
A empresa também está trabalhando no projeto DESCUBRA­IT, financiado pela EU, que visa a criar uma
ferramenta de busca semântica para as empresas start­up. Essa ferramenta auxiliará na busca online de todas
as patentes relevantes e dados de publicações de pesquisa de livre acesso, a fim de ajudar as start­ups a
identificar ideias inovadoras.
A tecnologia semântica anota palavras e imagens com informações complementares de maneira que o software
possa entender o seu significado.
"É isso que faz a web semântica: transforma a web de documentos que existem hoje, como se apresentam hoje
para os seres humanos, numa rede de dados para consumo do software", disse Luca De Santis, da Net7, uma
empresa de tecnologia web com sede em Itália.
De Santis é o gerente do projeto STOM, também financiado pela UE, que pesquisa a maneira de comercializar
duas máquinas de busca semântica desenvolvidas como parte de um projeto anterior, o SemLib.
Um dos produtos, chamado EventPlace, é uma ferramenta de busca que reúne informações relativas a um
evento, enquanto o outro, PunditBrain, é usado para criar anotações em documentos da web que, graças às
tecnologias semânticas, são mais fáceis de buscar e reutilizar.
A busca semântica consegue encadear ideias semelhantes dessa
maneira, porque adiciona informações explicativas às páginas web
ou faz a ligação com repositórios externos que dão sentido e
contexto às palavras.
Wikipedia para computadores
Os repositórios de dados, tais como o DBpedia, uma versão da
Wikipedia para computadores, estão no âmago da tecnologia
semântica, pois podem ser usados para anotar páginas da web,
facilitando sua compreensão pelos sistemas semânticos.
Assim, quando o software chega numa palavra que pode significar
duas coisas, como 'rock', por exemplo, que poderia referir­se a
música ou geologia, o software consegue verificar qual o real
significado da palavra na frase.
"É isso que faz a web
semântica: transforma a web
de documentos que existe
hoje, como se apresenta para
os seres humanos, numa rede
de dados para consumo do
software."
Luca De Santis, da Net7, Itália
"Eu posso fornecer um link para a DBpedia, e dizer: 'Ok, isso é
sobre música'", disse De Santis.
As tecnologias semânticas já estão sendo utilizadas para agrupar artigos de notícias quando são sobre um
mesmo assunto, ou para entender os interesses de um usuário do Facebook examinando as similaridades das
páginas que ‘curtiu’.
"O Facebook, usando a tecnologia de semântica web, consegue saber do quê você realmente gosta", disse De
Santis. "É a página sobre restaurantes, ou é sobre música rock?"
Certeza matemática
Um dos problemas com o uso de técnicas semânticas é que, em muitas áreas, o significado pode ser difícil de
definir de uma forma matematicamente precisa, criando dados que não se adequam ao raciocínio lógico usado
por computadores.
A palavra ‘vinho’ é um bom exemplo: as palavras usadas para descrever o gosto do vinho, tais como doce ou
frutado, podem significar coisas ligeiramente diferentes para pessoas diferentes. No entanto, para que a
tecnologia de busca semântica consiga responder a perguntas como ‘qual o vinho que vai bem com um prato
específico’, ela precisa entender e usar esses termos diferentes.
"Construir uma teoria lógica para esses domínios do mundo real é bastante complicado", explicou o Dr. Steven
Schockaert, investigador principal do projeto FLEXILOG.
Ele procura uma maneira de modelar espacialmente o sentido das palavras que possa ser utilizado para
responder a consultas de pesquisa lógica.
"O objetivo é ter um sistema que apenas aprenda, por si próprio, informações sobre vários domínios diferentes
à medida que lê informações na web", disse o Dr. Schockaert, cujo trabalho foi financiado pelo Conselho
Europeu de Investigação da UE.
A estratégia é alimentar o sistema com informações que ele possa usar para aprender.
"Inicialmente vamos trabalhar com a Wikipedia, depois aumentaremos a escala até cobrir uma parte
substancial da web."
More info
DISCOVER­IT
StoM
FLEXILOG
Download