Uso de software livre para implementação de provedores de serviços OAI-PMH: caso do provedor de serviços Sabiia Anderson Hirata1 Isaque Vacari2 Introdução A iniciativa de Acesso Aberto promove a interoperabilidade entre sistemas digitais, alcançada, sobretudo, com a definição e o estabelecimento do protocolo OAI-PMH3 (Open Access Initiative - Protocol for Metadata Harvesting) a fim de facilitar o compartilhamento e a ampla disseminação da informação científica. Na perspectiva dos arquivos abertos existem dois atores principais: os provedores de dados e os provedores de serviços (Figura 1). Objetivo (LEITE et al., 2009) destacam que a Empresa Brasileira de Pesquisa Agropecuária (Embrapa), por meio do Sistema Embrapa de Bibliotecas (SEB), definiu como objetivo estratégico a inserção da empresa no movimento Acesso Aberto (Open Access Initiative) para armazena1 Pontifícia Universidade Católica de Campinas; [email protected] 2 Embrapa Informática Agropecuária; [email protected] 3 The Open Archives Initiative Protocol for Metadata Harvesting [http://www. openarchives.org/OAI/openarchivesprotocol.html]. 10 Figura 1. Esquema funcional dos arquivos abertos. Provedores de Serviços: Coletam metadados dos provedores de dados. Usuários: Realizam suas buscas em vários provedores de dados distribuídos geograficamente em uma única interface de busca. Camada OAI-PMH: Padrão de interoperabilidade entre provedores de dados. Provedores de dados: Armazenam documentos e expõem seus metadados (repositórios institucionais, temáticos e periódicos científicos). VI Mostra de estagiários e bolsistas 2010 11 Embrapa Informática Agropecuária mento e disseminação da informação técnico-científica produzida pela área de Pesquisa e Desenvolvimento (P&D) e a criação do provedor de serviços Sistema Aberto e Integrado de Informação em Agricultura (Sabiia), caracterizado como sistema responsável pela integração de todos os dados provenientes de repositórios institucionais, periódicos científicos, bibliotecas digitais e outros, tanto internos quanto externos, de interesse da Embrapa. O presente trabalho focará as soluções livres escolhidas para a construção da ferramenta. Material e métodos A construção do provedor de serviços Sabiia resultou de uma análise e teve como procedimentos as seguintes etapas: Identificação de software livre para coleta de dados no padrão OAI Nessa etapa foram identificadas seis soluções de software livre para coleta de dados no formato OAI. Baseando-se, principalmente em critérios de recursos de captura de dados, escolheu-se a solução jOAI1 como mecanismo de coleta de dados da ferramenta Sabiia. Escolha da ferramenta de indexação e busca textual O mecanismo de indexação e busca Lucene tem sido largamente utilizado em projetos open source. Entretanto, para o projeto Sabiia, objetivou-se encontrar soluções livres capazes de complementar e melhorar os recursos básicos da ferramenta Lucene2. O resultado dessa investigação levou à escolha do software livre Solr3, que oferece recursos de indexação e busca mais sofisticados, como facets (que possibilita novas alternativas de busca a partir de uma busca efetuada), 1 Digital Library for Earth System Education – jOAI Software [http://www.dlese.org/ dds/services/joai_software.jsp]. 2 The Apache Software Foundation - Apache Lucene [http://lucene.apache.org/solr]. 3 The Apache Software Foundation - Apache Solr [http://lucene.apache.org/solr]. 12 VI Mostra de estagiários e bolsistas 2010 busca com operadores booleanos, busca por campo, paginação do resultado da busca, highlighting etc. Arquitetura de software do provedor de serviços Sabiia Além dos softwares livres jOAI e Solr, utilizou-se a arquitetura Java EE1 (Servlets e Java Server Pages) para implementação da interface web de busca e o servidor de aplicações Apache Tomcat2, conforme ilustrado na Figura 2. Figura 2. Arquitetura do provedor de serviços Sabiia. Resultados e discussão A combinação das tecnologias livres jOAI (coleta de dados), Solr (mecanimo de indexação e busca) e Java EE (interface de busca) 1 Oracle Sun Developer Network - Java EE [http://java.sun.com/javaee]. 2 The Apache Software Foundation - Apache Tomcat [http://tomcat.apache.org]. 13 Embrapa Informática Agropecuária contribuiu para a construção do provedor de serviços OAI denominado Sabiia, bem como para conquista de autonomia tecnológica em software livre para coleta de dados no padrão OAI. Por fim, o uso de software livre tem-se consolidado nas atividades de pesquisa, desenvolvimento e inovação da Embrapa frente aos novos cenários e desafios propostos. Referências LEITE, F. C. L.; BERTIN, P. R. B.; VACARI, I.; SIMÃO, V. P. M.; VISOLI, M. C. Implementação de estratégias de acesso aberto em uma instituição de pesquisa de grande porte na área de agricultura: a experiência da Embrapa. In: REUNIÓN DE LA ASOCIACIÓN INTERAMERICANA DE BIBLIOTECARIOS, DOCUMENTALISTAS Y ESPECIALISTAS EN INFORMACIÓN AGRÍCOLA, 15., Lima, Peru, 2009. Innovación en el acceso abierto a la información agrícola y de medio ambiente. Lima: RIBDA, 2009. Não pagiando. RIBDA 2009. 14