Uso de software livre para implementação de provedores de

Propaganda
Uso de software livre para implementação
de provedores de serviços OAI-PMH:
caso do provedor de serviços Sabiia
Anderson Hirata1
Isaque Vacari2
Introdução
A iniciativa de Acesso Aberto promove a interoperabilidade entre
sistemas digitais, alcançada, sobretudo, com a definição e o estabelecimento do protocolo OAI-PMH3 (Open Access Initiative - Protocol for
Metadata Harvesting) a fim de facilitar o compartilhamento e a ampla
disseminação da informação científica. Na perspectiva dos arquivos
abertos existem dois atores principais: os provedores de dados e os
provedores de serviços (Figura 1).
Objetivo
(LEITE et al., 2009) destacam que a Empresa Brasileira de Pesquisa
Agropecuária (Embrapa), por meio do Sistema Embrapa de Bibliotecas
(SEB), definiu como objetivo estratégico a inserção da empresa no
movimento Acesso Aberto (Open Access Initiative) para armazena1
Pontifícia Universidade Católica de Campinas; [email protected]
2
Embrapa Informática Agropecuária; [email protected]
3
The Open Archives Initiative Protocol for Metadata Harvesting [http://www.
openarchives.org/OAI/openarchivesprotocol.html].
10
Figura 1. Esquema funcional dos arquivos abertos.
Provedores de Serviços:
Coletam metadados dos
provedores de dados.
Usuários:
Realizam suas buscas em
vários provedores de dados
distribuídos geograficamente
em uma única interface de
busca.
Camada OAI-PMH:
Padrão de interoperabilidade
entre provedores de dados.
Provedores de dados:
Armazenam documentos e
expõem seus metadados
(repositórios institucionais,
temáticos e periódicos
científicos).
VI Mostra de estagiários e bolsistas 2010
11
Embrapa Informática Agropecuária
mento e disseminação da informação técnico-científica produzida pela
área de Pesquisa e Desenvolvimento (P&D) e a criação do provedor
de serviços Sistema Aberto e Integrado de Informação em Agricultura
(Sabiia), caracterizado como sistema responsável pela integração de
todos os dados provenientes de repositórios institucionais, periódicos
científicos, bibliotecas digitais e outros, tanto internos quanto externos,
de interesse da Embrapa. O presente trabalho focará as soluções
livres escolhidas para a construção da ferramenta.
Material e métodos
A construção do provedor de serviços Sabiia resultou de uma análise
e teve como procedimentos as seguintes etapas:
Identificação de software livre para coleta de dados no padrão
OAI
Nessa etapa foram identificadas seis soluções de software livre para
coleta de dados no formato OAI. Baseando-se, principalmente em
critérios de recursos de captura de dados, escolheu-se a solução jOAI1
como mecanismo de coleta de dados da ferramenta Sabiia.
Escolha da ferramenta de indexação e busca textual
O mecanismo de indexação e busca Lucene tem sido largamente
utilizado em projetos open source. Entretanto, para o projeto Sabiia,
objetivou-se encontrar soluções livres capazes de complementar e
melhorar os recursos básicos da ferramenta Lucene2. O resultado
dessa investigação levou à escolha do software livre Solr3, que oferece
recursos de indexação e busca mais sofisticados, como facets (que
possibilita novas alternativas de busca a partir de uma busca efetuada),
1
Digital Library for Earth System Education – jOAI Software [http://www.dlese.org/
dds/services/joai_software.jsp].
2
The Apache Software Foundation - Apache Lucene [http://lucene.apache.org/solr].
3
The Apache Software Foundation - Apache Solr [http://lucene.apache.org/solr].
12
VI Mostra de estagiários e bolsistas 2010
busca com operadores booleanos, busca por campo, paginação do
resultado da busca, highlighting etc.
Arquitetura de software do provedor de serviços Sabiia
Além dos softwares livres jOAI e Solr, utilizou-se a arquitetura Java
EE1 (Servlets e Java Server Pages) para implementação da interface
web de busca e o servidor de aplicações Apache Tomcat2, conforme
ilustrado na Figura 2.
Figura 2. Arquitetura do provedor de serviços Sabiia.
Resultados e discussão
A combinação das tecnologias livres jOAI (coleta de dados), Solr
(mecanimo de indexação e busca) e Java EE (interface de busca)
1
Oracle Sun Developer Network - Java EE [http://java.sun.com/javaee].
2
The Apache Software Foundation - Apache Tomcat [http://tomcat.apache.org].
13
Embrapa Informática Agropecuária
contribuiu para a construção do provedor de serviços OAI denominado
Sabiia, bem como para conquista de autonomia tecnológica em
software livre para coleta de dados no padrão OAI. Por fim, o uso de
software livre tem-se consolidado nas atividades de pesquisa, desenvolvimento e inovação da Embrapa frente aos novos cenários e
desafios propostos.
Referências
LEITE, F. C. L.; BERTIN, P. R. B.; VACARI, I.; SIMÃO, V. P. M.; VISOLI,
M. C. Implementação de estratégias de acesso aberto em uma instituição
de pesquisa de grande porte na área de agricultura: a experiência da
Embrapa. In: REUNIÓN DE LA ASOCIACIÓN INTERAMERICANA
DE BIBLIOTECARIOS, DOCUMENTALISTAS Y ESPECIALISTAS EN
INFORMACIÓN AGRÍCOLA, 15., Lima, Peru, 2009. Innovación en el
acceso abierto a la información agrícola y de medio ambiente. Lima:
RIBDA, 2009. Não pagiando. RIBDA 2009. 14
Download