1.3. Web Semântica

Propaganda
Publicação de Dados Governamentais
no Padrão Linked Data
1.3 – Web Semântica
Karin Breitman
José Viterbo
Edgard Marx
Percy Salas
LA C
Laboratory for Advanced Collaboration
Objetivos
1.Apresentar os conceitos relacionados à Web
Semântica;
2
Sumário
1.Introdução
2.Motivação
3.Definição
4.Web sintática X Web semântica
5.Processo de Desenvolvimento
6.Arquitetura
3
Introdução
Interoperabilidade na era da informação
Nova Demandas:
• Gerenciamento de
grandes conjuntos de
dados
• Maior poder de
computação e resolução
tempo espacial
• Resposta rapida
• Interdisciplinaridade
4
4
Introdução
Nosso alunos/filhos são nativos digitais. . .
• A experiência do consumidor guia expectativas
– Desktop  Mobile computing
– Web sites  Experiências Web
– Games  Cast member/participante/grupos
– Conteudo estático Interação em tempo real & colaboração
– Telefones  informação móvel e integrada, dispositivos de recreação e
redes sociais
– Email  video, voz e mensagens em texto
• Os melhores indicadores das tendências em TI passaram a ser as
feiras de eletro/eletrônicos e não mais as de informática (SUCESU,
Comdex, Fenasoft….)
5
Introdução
Nativos Digitais esperam que os
serviços acomodem suas preferências
•
•
•
•
•
•
Informação online, não “in line”
Informação sob demanda, livre de local ou hora
Experiência real e virtual mesclada (sala de aula..)
Conteúdo relevante
Conteúdo de múltiplas fontes, em vários formatos
Habilidade de contribuir (YouTube) e consumir
conteúdos
• Conteúdos interativos
6
Introdução
Web 2.0
• Aplicações e tecnologias avançadas na Internet, incluindo
blogs, wikis, RSS, bookmarking social, etc.
• Maior colaboração entre usuários da Internet, provedores
de conteúdo e empreendedores
• Participação do usuário na natureza e escopo do conteúdo
da Web, incluindo controle sobre ele em tempo real
• Habilidade de mesclar (“mash up”) informação de
diferentes fontes para criar o contexto desejado para a
informação
• Palavras-chave: dinâmica, interativa, colaborativa
• Lados bons e ruins – YouTube e blogs como armas.
7
Infra-estrutura de TI
• Redes crescerão 500% em capacidade nos
próximos 5 anos.
• Metade dos computadores serão portáteis.
• 60% de todas as universidades terão cobertura de
rede sem-fio em todo o campus.
• Redes de pesquisa crescerão de capacidade de
622 megabits a 80 gigabits.
• Video On-demand de alta definição irá consumir
uma grande parte da capacidade da rede.
8
Tendências e Tecnologias
Emergentes
• Reconhecimento de voz de melhor qualidade
• Baterias com maior tempo de duração
• Mais serviços baseados em localização, utilizando
GPS
• Lei de Moore (aumento da densidade dos chips)
• Maior largura de banda (100 terabyte com fibra
simples)
• Mais poder computacional
• Maior capacidade de armazenamento de dados
9
Tendências e Tecnologias
Emergentes
• Mecanismos de busca continuarão a aumentar o
acesso a livros, web sites, gravações, filmes, peças
educativas, palestras e o próprio desktop
• Aumento da renda com publicidade online.
• Busca está se transformando em “navegação”
• Google já lucra mais em publicidade que as redes
ABC, CBS e NBC combinadas
• Messagens instantâneas vão superar o e-mail em
volume de comunicação dentro de 5 anos
10
Evolução da Ciência
• Mil anos atrás:
ciência era empirírica
descrevendo fenômenos naturais
• Últimas séculos:
uma vertente teórica
usando modelos, generalizações
• Últimas décadas:
uma vertente computacional
simulando fenômenos complexos
• Hoje:
exploração de dados
sintetizando teoria, experimentação e
computação com gerenciamento avançado
de dados e estatísticas
 novos algoritmos!
11
2
 .
4π Gρ
c2
 a
 a  = 3 − Κ a 2
 
Crescimento dos Dados
Vivemos em um mundo Exponencial
• Massa de dados científicos dobra todo ano
– Causado pelas sucessias gerações de
sensores de baixo custo +
computação exponencialmente mais rápida
• Mudanças na natureza da computação científica
• Interdisciplinaridade (eScience)
• Vem se tornando cada vez mais difícil extrair conhecimento
• 20% dos servidores do mndo estão entre enormes data centers
dos “5 Grandes”
– Google, Microsoft, Yahoo, Amazon, eBay
• Não se trata apenas de dados científicos
12
Coleta de Dados
• Distribuição muito extensa de dados:
dados em todas as escalas!
• A maioria dos conjuntos de dados é pequena,
e mantida manualmente ( planilhas do Excel)
• Quantidade total de dados dominada pelo
outro lado (grandes instalações com arquivos
multi-TB)
• A maioria dos bytes são coletados via
sensores elêtronicos
13
Web Semântica
Motivação
Mas....
......a maior parte dos recursos
primários estão em linguagem natural,
compreensíveis para humanos (apenas).
14
Web Semântica
Definição
• “A Web Semântica é uma EXTENSÃO da web atual
na qual é dado a informação um SIGNIFICADO bem
definido, permitindo com que computadores e
pessoas trabalhem em cooperação.” Berners-Lee,
Hendler e Lassila
• "The Semantic Web is an extension of the current
web in which information is given well-defined
meaning, better enabling computers and people to
work in cooperation."
15
Web Semântica
Como humanos enxergam esta página
16
Web Semântica
Como o computador enxerga esta página
17
A Web de Hoje
• 8 bilhões de páginas
– Mecanismos de busca: Yahoo, Google,
AltaVista...
– Nenhum mecanismo para “interpretar” o
resultado das buscas.
18
Busca Sintática
Busca pela palavra “morango”
Did you mean: morongo 19
•
:: M o ra ng o :: - "As fotos aqui veiculadas, bem como os textos, frames, sinais distintivos,
logotipo e marca são de propriedade do site M ora ng o.com.br. ...
•
:: M o ra n g o -... Divirta-se! "As fotos aqui veiculadas, bem como os textos, frames, sinais distintivos,
logotipo e marca são de propriedade do site M o ra n g o .com.br. ...
•
deviantART: m o ra n g o
~m o ra n g o . Joana Vieira. is an Antagonist; is Female; is a deviant since Aug
8, 2002, 2:02 PM; has 9,972 pageviews; is located in Portugal; ...
500kv k'pow!
•
STRABERRY M o ra n g o
M O R A N G O - fruto produzido por erva rasteira, Fragancia vesca, originária
da Europa, possui inúmeras variedades naturais e híbridas. ...
•
California Casino M o ra n g o
California Casino M o ra n g o ( Casino ). Casino Shop for Casino from 600+ merchants
with one cart. Hundreds of trusted merchants. Thousands of popular brands. ...
•
vof M o ra n g o - smakelijke aardbeien, vers, vertrouwd en ...
vers. aardbeien zijn het lekkerst als ze vers zijn. van eind april tot in november
plukken wij ze dagelijks voor u. vertrouwd. van aardbeien ...
•
Batida M o ra n g o re c ip e
A delicious recipe for Batida M o ra n g o , with cachaca, strawberries, granulated sugar
and crushed ice. Also lists similar drink recipes. ... Batida M o ra n g o recipe. ...
Web Sintática
• Biblioteca Digital
– Uma biblioteca de documentos chamados páginas (web pages) interconectados
por links
• Base de Dados, plataforma para aplicações
– Portal comum para aplicações acessíveis através de páginas web e que
apresentam resultados utilizando estas mesmas páginas.
• Plataforma multimídia
– Internet Radio, Trailers de filmes, …
• Um esquema de nomeação
– Identidade única para documentos
RESUMO: Um lugar onde os computadores são responsáveis pela APRESENTAÇÃO
(o fácil) e as pessoas fazem a INTERPRETAÇÃO (o difícil)
Por que não fazer com que os computadores fiquem com a parte
mais pesada do trabalho?
20
Ref: Goble
Web Semântica
• Metadados
• Combinar recursos primários com
recursos de metadados
• Metadados em formato padronizado
podem ser entendidos por software e
pessoas
21
Objetivos
“enriquecer a informação disponível com semântica que
pode ser entendida por máquinas “
“fornecer acesso inteligente a informação heterogênea
e distribuída, permitindo que produtos de software
possam fazer uma intermediação entre as
necessidades do usuário e as fontes de informação
disponíveis. “
ontologia
22
Web Semântica
23
23
Processo de Desenvolvimento
Prototipação
Mundo aberto:
rápida
Evolui, Itera,
Reprojeta,
Reaplica
Levantar de
Infra-estrutura
Tecnológica
Adota
Abordagem
Tecnológica
Revisão de
Especialista &
Iteração
Evaluation
Uso de
ferramentas
Equipe pequena,
habilidades
diversas
Caso de uso
Análise
24
Desenvolve
modelo/ ontologia
Arquitetura da Web Semântica
OWL
RDF + rdfschema
XML + URI + XMLNS + xmlschema
XML
25
XML, RDF & OWL
•
XML: sintaxe universal
•
XML Schema: define a estrutura dos documentos XML
•
RDF: modelo de dados para objetos de recurso
•
RDF Schema: vocabulário básico para definição de RDFs
classes & propriedades e suas relações hierárquicas
•
26
OWL: estende o vocabulário para definição de classes e
propriedades, incluindo:
–
cardinalidade (ex. minCardinality 1)
–
igualdade (ex. equivalentClass)
–
relacionamentos entre classes (ex. disjointWith)
–
características de propriedades (ex. FunctionalProperty)
Principais Referências

K. Breitman. Web Semântica: a Internet do Futuro. Editora LTC, 2005;

H. Halpin, S. Hawke, I. Herman, E. Prud’hommeaux, D. Raggett and R.
Swick. W3C Semantic Web Activity, W3C. Disponível em
http://www.w3.org/2001/sw/;

I. Herman (mantenedor). W3C Semantic Web Frequently Asked Questions,
W3C. Disponível em http://www.w3.org/2001/sw/SW-FAQ.
27
Download