SRI-4 - Computação UFCG

Propaganda
Bibliotecas
Digitais
Justificativas
• Explosão da informação
• Tempo para encontrar a informação
• Sobrecarga de informação
(EUA 150Kg papel/estudante/ano + inf. eletrônica
Definição
Uma BIBLIOTECA DIGITAL é
um espaço virtual para dar suporte à pesquisa
em alguma área de conhecimento
Por Que Bibliotecas Digitais
•A biblioteca digital traz a biblioteca para o usuário
•A capacidade do computador é usado para
pesquisar e mostrar
•A informação pode ser compartilhada e copiada
•A informação é facilmente atualizada
•A informação está sempre disponível
•Novas formas de informação tornam-se possível
•Menor custo de manutenção
Características
Uma BIBLIOTECA DIGITAL é um
Sistema de informação com:
• suporte a colaboração
• preservação e recuperação de documentos digitais
(SGBDDig)
• suporte a Hipertexto, Hiperdocumentos, Multimídia
• filtragem e indexação da informação
• Módulos instrucionais
• Direitos de propriedade intelectual
• Inteface e processamento de consultas
• descoberta de recursos
• disseminação da informação
Características
apresentado
armazenado
• livros, monografias
• artigos, periódicos
• Imagens, etc.
• e-mails, programas,..
OBJETO DIGITAL
disseminado
Representada por
tipo
OBRA
meio
• papel
• papel digitalizado
• híbrido
• eletrônico puro
Características
Pesquisador
editora
USUÁRIO
Bibliotecário
livraria
Modelo 5S
1.
Sociedades (pessoas, componentes de HW e de SW)
ajudam a satisfazer as necessidades dos usuários
(administradores, usuários, relacionamentos entre atores)
2. Cenários (provêm serviços de informação)
serviços, atividades, tarefas, operações
(diagramas de sequência UML)
3. Espaços localizam e apresentam informação de forma
adequada = {objetos, operações}
(visões lógicas e de apresentação de diversos componentes)
4. Estruturas organizam informação de forma adequada
(grafos dirigidos com labels descrevendo metadados, hipertextos,
taxonomias, esquemas XML, RDF)
5. Streams comunicam informação com usuários e máquinas
(estáticos: sequências de bits, caracteres, imagens,..
dinâmicos: fluxo de informação, animação, sicronização)
Modelo 5S
Estrutura formal de 5 S
Estrutura formal de 5 S
Estrutura formal de 5 S
Objetos digitais
Objetos digitais
FORMATOS de
Intercâmbio (Metadados):
FORMATOS
dos Documentos
Indexação
catalogação
Identificação
• Z39.50
•MARC/IBICT
• DC – Dublin Core
• PDF, PS
• DOC, TXT
• HTML, XML, etc.
• MP3, MPEG, etc.
• CDU, CDD, CR
• MeSH
• LCSH.
• semântica X surrogate
• ISBN, URL, URN
• SICI – Serial Item and Contributor Id.
Sistema de Biblioteca (Digital)
resposta
consultas
cadastro
REFERÊNCIAS
Cópias
ASSUNTOS
indexação
DOCUMENTOS
USUÁRIOS
sugestões de
aquisição
Bi Di Global
Uma Federação de Bibliotecas Digitais
INTEROPERABILIDADE
• Técnica (hardware, redes,
protocolos)
• De Informação (escopo,
linguagem, metadados,
convenções, semânticas)
• Social (direitos e
responsabilidades pessoais
e de organizações)
TECNOLOGIAS
• Interfaces
• Recuperação Multilíngue
• Indexação Multimídia (textos,
análise de discursos, músicas,
vídeos, imagens, gráficos)
• Recuperação da Informação
Multimídia
• Novas Publicaçoes Eletrônicas
• Digitalização
Biblioteca Digital Federada
BD-1
cadastro
indexação
•
•
•
BD-n
I
N
T
E
R
F
A
C
E
resposta
consultas
Projetos
Digital Libraries Initiative
DLI1 (1994-1998)
DLI2 (1999-)
Coordenação de projetos de:
• University of California at Berkeley
- informação digital no trabalho [3.5 TB de dados, Consultas baseadas em imagens, ling. Natural, OCR, OR Postgres
• University of California at Santa Barbara
- informação espacial em mapas –
[Bib. Alexandria, mapas, fotos aéreas, múltiplas resoluções, OR Postgres
• Carnegie Mellon University
- análise de videos por conteúdo –
[200HS de gravações da TV pública, reconh. voz, reconh. rostos humanos,
ling. Natural]
Digital Libraries Initiative
• University of Illinois
- coleções federadas de publicações científicas [200.000 documentos digitais; Internet, rec. semântica, groupware]
• Stanford University (Garcia-Molina)
- interoperabilidade –
[Pub. Cienc. Computação; protocolos, agentes, interfaces)
InterLib
• University of Michigan
- agentes inteligentes para localização da informação –
[Agentes, interfaces, busca distribuida, aprendizagem colaborativa]
EU 6th Framework (2002-2006)
€12 billion
1.
2.
3.
4.
5.
6.
7.
genomics and biotechnology for health;
information society technologies;
nanotechnologies and nanosciences;
aeronautics and space;
food safety;
sustainable development; and
economic and social sciences.
EU 6th Framework (2002-2006)
advance the techniques for
evaluation of networked systems
COMBINA:
• bibliotecas digitais
• sistemas baseados em agentes,
• grid computing, e
• Web semântica
EU 6th Framework
DL
ABS
Common Metrics
Grid
SW
EU 6th Framework
• Issues of scale and scalability;
• Interoperability among heterogeneous sources and systems
challenge;
• usability of these systems by a broad range of individuals;
• information content, computational tools, and user needs.
• evaluation standards and measures.
PROJETOS
• DIPPO: Federação de dados estatísticos governamentais;
• Maeda et.al. Documentos Multiliguais (MHTML viewer)
• Klavans&Schäuble NSF_EU Multilingual Information access
• Endres&Fuhr MeDoc – Multimedia Electronic Documents.
• Gonçalves&Medeiros Disseminação Científica (BD
Tropicais+EMBRAPA+GEOLIB.
• NCSTRL-Networked Computer Science Technical Reports
Library Biblioteca Digital Distrribuída na Europa Central
• NEW ZEALAND DIGITAL LIBRARY
PROJETOS
• NEW ZEALAND DIGITAL LIBRARY
• Múltiplas línguas (Inglês, Francês, Alemão, Arábico, Maori,
Português, Swahili)
• Múltiplas midias (Local Oral History Collection Interiews and photographs),
Musik Library (10 000 folk tunes)
• Sistema MG para textos
• Sistema MR para músicas
Bibliotecas Digitais Federadas
}
 Bibliotecas setoriais
 Bibliotecas integradas
 USP +
 Unicamp +
 UNESP
}
USPDEDALUS
UNIBIBLI
EVENTOS
NSF Post Digital Library Futures Workshop
15-17 Junho 2003 – Massachusetts
(http://www.sis.pitt.edu/%7Edlwkshop/papers.html)
DELOS (Projeto ESPRIT, part of ERCIM DL Initiative) Workshops:
- "Information Seeking, Searching and Querying in Digital Libraries",
11-12 December 2000, Zurich, Switzerland.
- "Personalisation and Recommender Systems in Digital Libraries",
18-20 June 2001, Dublin, Ireland.
-"Interoperability and Mediation in Heterogeneous Digital Libraries",
8-9 September 2001, Darmstadt, Germany
- Evaluation of Digital Libraries: Testbeds, Measurements, and Metrics
6-7 June 2002 Budapest, Hungary
Topicos de pesquisa
•
•
•
•
•
•
•
•
•
Modelos de objetos
interfaces e interação
descoberta da informação (browsing+IR)
Metadados: catalocação e indexação
Processamento linguagem (multi-)lingual
material não textual (metadados e pesquisa)
armazenamento e gerência de coleções
conversão: físico -> digital
interoperabilidade (interfaces, identificação (URN),
formatos, metadados, pesquisa distrib.,
comunicação e transmissão )
• Autenticação e segurança (direitos autorais)
REFERÊNCIAS
• E. Fox & G. Marchionini (eds.) Towards a Worldwide Digital Library + diversos
Artigos sobre Interoperability, Special types of Digital Libraries; Multilingual
Support; National Efforts, Special Issue on DL, CACM 41(4) 1998
• E. Fox Overview of Digital Library Components and Developments
• M. Gonçalves, E. Fox et.al. Streams, Strtuctures, Spaces, Scenarios, Societies (5S):
A Formal Model for Digital Libraries
• W. Arms Digital Libraries, MIT Press, 2000
• N. Adami et. al, ToCAI: a Framework for Indexing and Retrieval of Multimedia
Documents
• E. Bertino, A. Elmagarmid & Hacid Quality of Services in Multimidia Digital
Libraries, ACM SIGMOD Record 30(1), 2001
• L. Feng, M. Jeusfeld & J. Hoppenbrowers Towards Knowledge Based Digital
Libraries, ACM SIGMOD Record 30(1):41-46, 2001
• IEEE Computer – Special Issue on Digital Libraries, February 1999
• Franciska de Jong & Thijs Westerveld MUMIS: multimedia indexing and
searching EU Founded project
• Alfredo Sánchez Bibliotecas Digitales: Introducción, ENC, 1997
SISTEMAS
• DIALOG Corporation
•Cobre mais de 500 bancos de dados. Recupera
informações bibliográficas e textos integrais
• LEXIS-NEXIS
• banco de dados de textos integrais sobre assuntos
jurídicos e de negócios
• OCLC (Online Computer Library Center)
• 70 bancos de dados com 1,5 milhões de textos
integrais
• H.W.Wilson
• 40 bancos de dados com informação colegial
(versões eletrônicas, CD-ROM e Web dos dados)
SISTEMAS
• DIALOG Corporation
•Alguns bancos de dados:
• Chemical abstracts (20 milhões, + 11.000/semana);
• MEDLINE (12 milhões + 7.700/semana);
• NYT full text desde 1981;
• Psych. Abstracts (2 milhões + 5000/mês);..
SISTEMAS
• Cada sistema tem sua linguagem
• Tentativas de standard:
• CCL (Common Command Language)
• NISO Z39.58
•ISO 8777
• Tipos de pesquisas comuns:
• Termo simples
• Frases
• Combinações Booleanas
• Proximidades (‘A’ adjacente/perto-de ‘B’)
• Colocações (‘A’ no título ou no resumo, etc.)
• Caminhar por relações entre termos (no thesaurus)
• funções de BDs específicos (p.ex. químico)
• Consultas são iterativas
• Pesquisas cross-databases
Acesso a bibliotecas – Ficha catalográfica
Autoria
Título da tese inicia-se
abaixo da 4º letra do
sobrenome
Notas
Assunto(s)
Imprenta
Subtítulo
Sobrenome do autor, Nome
Título da tese: subtítulo / Nome completo do autor. - - Rio de Janeiro:
UFRJ / Nome ou sigla da Unidade, ano.
Descrição Física
x, 90 f. : il. ; 31 cm.
Orientador: Nome
Tese (doutorado) – Universidade Federal do Rio de Janeiro,
Nome ou sigla da Unidade, Nome do Programa de Pós-graduação, ano.
1. Assunto. 2. Área de concentração – Tese. I. Sobrenome do orientador,
Nome. II. Universidade Federal do Rio de Janeiro, Nome da Unidade, Nome do
Programa de Pós-graduação. III.Título.
Tamanho: 12,5 cm x 7,5 cm
Pista
Acesso a bibliotecas – Ficha catalográfica
Pastura, Patrícia Souza Valle Cardoso
Infecção suspeita em crianças com neoplasia hematológica e neutropenia /
Patrícia Souza Valle Cardoso Pastura. -- Rio de Janeiro: UFRJ / Faculdade de
Medicina, 2003.
xi, 110 f. : il. ; 31 cm.
Orientadores: Guilherme Santoro Lopes e Marcelo Gerardin
Poirot Land
Dissertação (mestrado) – UFRJ / Faculdade de Medicina / DIP,
2003.
Referências bibliográficas: f. 88-104
1. Neutropenia. 2. Neoplasias hematológicas. 3. Leucemia linfocítica
aguda L1. 4. Infecção. 5. Febre. 6. Criança. 7. Prognóstico. 8. Estudos
prospectivos. 9. Doenças Infecciosas e Parasitárias - Tese. I. Lopes,
Guilherme Santoro. II. Land, Marcelo Gerardin Poirot. III.Universidade
Federal do Rio de Janeiro, Faculdade de Medicina, DIP. IV. Título.
Acesso a bibliotecas – Ficha BibTex
@Book{abramowitz+stegun,
author = "Milton Abramowitz and Irene A. Stegun",
title = "Handbook of Mathematical Functions with Formulas, Graphs, and
Mathematical Tables",
publisher = "Dover",
year = 1964, address = "New York",
edition = "ninth Dover printing, tenth GPO printing"
___________________________________________________________________
_______
@proceeding{646491,
editor = {Alberto H. F. Laender and Arlindo L. Oliveira},
title = {SPIRE 2002: Proceedings of the 9th International Symposium on String
Processing and Information Retrieval},
year = {2002},
isbn = {3-540-44158-1},
publisher = {Springer-Verlag},
address = {London, UK}, }
Acesso a bibliotecas – Ficha MARC
Autoria:Setzer, Valdemar Waingort, 1940Título:Curso de Fortran IV, básico.
Imprenta:São Paulo, E. Blucher, Ed. da U.S.P. [1972]
Descrição física:102 p. il.
Notas:Registro Pré-MARC
LDR005840000000002170004500
Assuntos:Fortran (Linguagem de programação) Programação, Linguagens de.
0012003083004544984914
Autorias secundárias:Simon, Imre, 1943- Kowaltowski, Tomasz, 1942003Br
Classificação Decimal de Dewey:651.8
00520030830045449.8
035__ |a 155489
082__ |a 651.8
092__ |a II-1,7,11
100__ |a Setzer, Valdemar Waingort, 1940245__ |a Curso de Fortran IV, básico.
260__ |a São Paulo, E. Blucher, Ed. da U.S.P. [1972]
300__ |a 102 p. il.
590__ |a Registro Pré-MARC
650__ |a Fortran (Linguagem de programação)
650__ |a Programação, Linguagens de.
700__ |a Simon, Imre, 1943700__ |a Kowaltowski, Tomasz, 1942856__ |a 142703
Acesso a bibliotecas – Ficha MARC
00001017cam a22002654a 450
00113216768
00520031008121527.0
008030529s2004 maua b 001 0 eng
906__ |a 7 |b cbc |c orignew |d 1 |e ocip |f 20 |g y-gencatlg
9250_ |a acquire |b 2 shelf copies |x policy default
955__ |a pc21 2003-05-29 to ASCD |c jf05 2003-06-02 to subj.; |d jf04 200306-02 to S.L. |e jf12 2003-06-02 to Dewey |a aa05 2003-06-03 |a ps07 200308-21 1 copy rec’d., to CIP ver. |a jf00 2003-08-28 |f jf05 2003-10-08 to sl |e
jf12 2003-10-08 to BCCD
010__ |a 2003052442
020__ |a 0321197844
040__ |a DLC |c DLC |d DLC
042__ |a pcc
05000 |a QA76.9.D3 |b D3659 2003
08200 |a 005.74 |2 21
1001_ |a Date, C. J.
24513 |a An introduction to database systems / |c C.J. Date.
24630 |a Database systems
250__ |a 8th ed.
260__ |a Boston : |b Pearson/Addison Wesley, |c 2004.
300__ |a xxvii, 983, 22 p. : |b ill. ; |c 24 cm.
504__ |a Includes bibliographical references and index.
650_0 |a Database management.
Acesso a bibliotecas – Registro MARC
01099cam 2200289 a
450000100080000000500170000800800410002503500210006690600450008795501280013201000
170026002000150027704000180029205000260031008200150033610000160035124500540036725
000120042126000550043330000360048844000460052450400510057065000250062192000410064
6991005200687991007000739-3012967-20010731111512.0-940201s1995 maua b 001 0
eng - 9(DLC) 94003187- a7bcbccorignewd1eocipf19gy-gencatlg- apc03 to ja00 02-01-94; jf06 to
subj 02-02-94; jf11 to sl 02-02-94; jf12 02-02-94; recd. je00 2Sept94; CIP ver je25 09-19-94- a
94003187 - a020154329X- aDLCcDLCdDLC-00aQA76.9.D3bD3659 1995-00a005.74220-1 aDate,
C. J.-13aAn introduction to database systems /cC.J. Date.- a6th ed.- aReading, Mass. :bAddisonWesley Pub. Co.,cc1995.- axxiii, 839 p. :bill. ;c24 cm.- 0aAddison-Wesley systems programming
series- aIncludes bibliographical references and index.- 0aDatabase management.- a** LC HAS
REQ'D # OF SHELF COPIES **- bc-GenCollhQA76.9.D3iD3659 1995tCopy 1wBOOKS- bcGenCollhQA76.9.D3iD3659 1995p00023608856tCopy 2v54329wCCF-
Acesso a bibliotecas : DC – Dublin Core
<rdf:Description rdf:about="http://www.ieee.org">
<dc:title>Proceedings of the 13th International Workshop on Research Issues on Data
Engineering: Multi-lingual Information Management-RIDE-MLIM</dc:title>
<dc:creator> CROFT W. Bruce </dc:creator>
<dc:creator> SANGAL Rajeev </dc:creator>
<dc:subject>Workshop</dc:subject>
<dc:subject>Management</dc:subject>
<dc:subject>Multilingual</dc:subject>
<dc:publisher>IEEE</dc:publisher>
<dc:date>2003</dc:date>
<dc:type>Proceedings</dc:type>
<dc:format>
<dc:medium>text</dc:medium>
<dc:extent pages>420</dc:extent pages>
</dc:format>
<dc:source>IEEE Computer Society</dc:source>
<dc:identifier>ISBN 0-7803-7868-7</dc:identifier>
</rdf:Description>
Acesso a bibliotecas - Catálogos
•
Fichas de papel,
•
Livros catalográficos, microfilmes, microfichas
•
On-Line (gerações de Hildreth):
1. pesquisa por autor, título, Palavras-chave
2. Visualização simples, detalhada e diálogos
personalizados
3. Assistência na pesquisa; texto livre ou com vocabulário
controlado; cross-database; correção de erros sensível ao
contexto
Acesso a bibliotecas – Catálogos on-line
OPAC-Online Public Acess Catalog
•
•
PROBLEMAS:
Interface amigável para catálogos MARC ou
assuntos LCSH.
•
Consequências:
1. retorno vazio ou retorno excessivo.
Estudo MELVYL: 82% de retornos vazios, 25% dos retornos não
continham a informação procurada
2. Borgman’86: “porque catálogos on-line são difíceis de
serem usados?”
3. Borgman’96: “porque catálogos on-line ainda são
difíceis de serem usados?”
Acesso a bibliotecas – Catálogos on-line
OPAC-Online Public Acess Catalog
•
•
•
SISTEMAS:
Comerciais: Voyager (EIS); INNOPAC; EOSi; OrtoDocs; Aleph
Acadêmicos:
1. MARIAN (Virginia Tech).(http://www.dlib.vt.edu/products/marian.html)
2. Okapi (City University-London)
3. Biblioteca Nacional (http://www.bn.br/site/default.htm)
4. MINIBLIO (http://buchada.dsc.ufcg.edu.br/miniblio/)
5. Biblioteca Nacional da Alemanha (Deutsche Nationalbibliothek)
(http://dispatch.opac.ddb.de/DB=4.1/SET=1/TTL=8/START_WELCOME)
6. Biblioteca do Congresso (Library of Congress) (http://catalog.loc.gov/)
7. USP-DEDALUS
(http://dedalus.usp.br:4500/ALEPH/por/USP/USP/DEDALUS/START)
8. UNIBIBLI (USP+UNESP+UNICAMP) (http://bibliotecascruesp.usp.br/scripts/odwp502k.dll?t=dfb&pr=cruesp_profile&db=cruesp_catalogo&sm=b&sort=on)
Bibliotecas Digitais
•
TIPOS DE DOCUMENTOS
1. Documentos Multilíngues
crescimento de documentos não-inglês
2.
Documentos Multimídia
(streams sincronizados)
3.
Documentos estruturados
(streams estruturados)
4.
Coleções distribuídas
Bibliotecas Digitais Distribuidas
Sistema BioKleisli
Publications = [title: string,
authors; {[name string, initial string]},
journal: <uncontrolled: string,
controlled <medline-jta: string, %Medline journal title abbreviation
isso-jta: string,
%ISO journal title abbreviation
journal-title: string,
%Full journal title
issn: string>>
%ISSN number
volume string,
issue string,
year int,
pages string,
abstract string,
keywd: {string}]}
Sistema BioKleisli
CPL – Collection Programming Language
{[title = p.title, authors = p.authors] \p <- DB,
p=“Date, C.”}
seleciona título e autor do banco de dados DB
Sistema BioKleisli
Sistema BioKleisli – BDs Fonte
• SGBD:
• Sybase; ASN.1-Entrez, ACeDB e OPM
• comunidade de archival nucleic acid (GenBank, EMBL, DDBJ e GSDB)
• Genome Database (GDB) de Sybase para OPM
• BLAST Software de comparação entre sequências de proteinas com um BD
de sequêncais
Sistema BioKleisli – Consultas
Sistema BioKleisli – Consultas
SQL
CPL
define Loci22 = GDB([query =
“select locus_symbol, genbank_ref
from locus, object_genbank_eref, locus_cyto_location
where locus.locus_id = locus_cyto_location_id
and locus.locus_id = object_genbank_eref.object_id
and object_class_key = 1
and loc_cyto_chrom_num = ’22’ “])
Download