Computadores que aprendem a ler, a assistir e a entender

ICT
Computadores que
aprendem a ler, a assistir
e a entender
31 08 2015
por Ben Deighton
Os repositórios de dados, tais como o DBpedia, estão facilitando a compreensão do que é lido na página web pelos softwares. Imagem:
Linking Open Data cloud diagram 2014, por Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/
Os computadores estão sendo ensinados a compreender o significado por trás das palavras e
imagens na internet, e isso está levando para a internet uma nova geração de software
inteligente capaz de executar tarefas que somente os seres humanos têm sido capazes de
realizar.
É graças à aprendizagem das máquinas que a inteligência artificial é um ramo emergente da ciência
da computação denominado web semântica.
"As tecnologias semânticas podem ter um papel muito importante ao encontrar uma maneira mais
inteligente de obter informações de alto nível do que aquela usada atualmente pelos operadores
humanos", disse Andrea Ciapetti, especialista em software na Empresa Italiana de Engenharia,
Tecnologia e Inovação.
Andrea está trabalhando com a polícia de Madrid para criar um mecanismo de busca que analise
imagens de vídeo para descobrir atos criminosos, por exemplo alguém sendo vítima de um batedor de
carteira.
O software permitirá identificar os elementos do vídeo que são de interesse, sendo que a web
semântica examinará esses eventos e escolherá aqueles que podem indicar crimes em andamento.
A empresa também está trabalhando no projeto DESCUBRA-IT, financiado pela EU, que visa a criar
uma ferramenta de busca semântica para as empresas start-up. Essa ferramenta auxiliará na busca
online de todas as patentes relevantes e dados de publicações de pesquisa de livre acesso, a fim de
ajudar as start-ups a identificar ideias inovadoras.
A tecnologia semântica anota palavras e imagens com informações complementares de maneira que o
software possa entender o seu significado.
"É isso que faz a web semântica: transforma a web de documentos que existem hoje, como se
apresentam hoje para os seres humanos, numa rede de dados para consumo do software", disse Luca
De Santis, da Net7, uma empresa de tecnologia web com sede em Itália.
De Santis é o gerente do projeto STOM, também financiado pela UE, que pesquisa a maneira de
comercializar duas máquinas de busca semântica desenvolvidas como parte de um projeto anterior, o
SemLib.
Um dos produtos, chamado EventPlace, é uma ferramenta de busca que reúne informações relativas a
um evento, enquanto o outro, PunditBrain, é usado para criar anotações em documentos da web que,
graças às tecnologias semânticas, são mais fáceis de buscar e reutilizar.
"É isso que faz a web
semântica: transforma a
web de documentos que
existe hoje, como se
apresenta para os seres
humanos, numa rede de
dados para consumo do
software."
Luca De Santis, da Net7,
Itália
A busca semântica consegue encadear ideias semelhantes dessa maneira, porque adiciona
informações explicativas às páginas web ou faz a ligação com repositórios externos que dão sentido e
contexto às palavras.
Wikipedia para computadores
Os repositórios de dados, tais como o DBpedia, uma versão da Wikipedia para computadores, estão
no âmago da tecnologia semântica, pois podem ser usados para anotar páginas da web, facilitando
sua compreensão pelos sistemas semânticos.
Assim, quando o software chega numa palavra que pode significar duas coisas, como 'rock', por
exemplo, que poderia referir-se a música ou geologia, o software consegue verificar qual o real
significado da palavra na frase.
"Eu posso fornecer um link para a DBpedia, e dizer: 'Ok, isso é sobre música'", disse De Santis.
As tecnologias semânticas já estão sendo utilizadas para agrupar artigos de notícias quando são sobre
um mesmo assunto, ou para entender os interesses de um usuário do Facebook examinando as
similaridades das páginas que ?curtiu?.
"O Facebook, usando a tecnologia de semântica web, consegue saber do quê você realmente gosta",
disse De Santis. "É a página sobre restaurantes, ou é sobre música rock?"
Certeza matemática
Um dos problemas com o uso de técnicas semânticas é que, em muitas áreas, o significado pode ser
difícil de definir de uma forma matematicamente precisa, criando dados que não se adequam ao
raciocínio lógico usado por computadores.
A palavra ?vinho? é um bom exemplo: as palavras usadas para descrever o gosto do vinho, tais como
doce ou frutado, podem significar coisas ligeiramente diferentes para pessoas diferentes. No entanto,
para que a tecnologia de busca semântica consiga responder a perguntas como ?qual o vinho que vai
bem com um prato específico?, ela precisa entender e usar esses termos diferentes.
"Construir uma teoria lógica para esses domínios do mundo real é bastante complicado", explicou o Dr.
Steven Schockaert, investigador principal do projeto FLEXILOG.
Ele procura uma maneira de modelar espacialmente o sentido das palavras que possa ser utilizado
para responder a consultas de pesquisa lógica.
"O objetivo é ter um sistema que apenas aprenda, por si próprio, informações sobre vários domínios
diferentes à medida que lê informações na web", disse o Dr. Schockaert, cujo trabalho foi financiado
pelo Conselho Europeu de Investigação da UE.
A estratégia é alimentar o sistema com informações que ele possa usar para aprender.
"Inicialmente vamos trabalhar com a Wikipedia, depois aumentaremos a escala até cobrir uma parte
substancial da web."
More info
DISCOVER-IT
StoM
FLEXILOG