Sistemas de Informação sobre Recursos Biológicos: CABRI, SICol e speciesLink Dora Ann Lange Canhos [email protected] Evolução do conceito de coleções de culturas • “depósitos” de material de pesquisa • depósito + serviços (preservação, identificação, distribuição ...) + catálogo • depósito + serviços + pesquisa + catálogo • depósito + serviços + pesquisa + centro de informação Centros de Recursos Biológicos (CRB) • Centros especializados que adquirem, validam, estudam e distribuem: organismos "cultiváveis“ (microorganismos, tecidos de plantas e animais, células humanas) partes replicáveis destes (genomas, plasmídeos, virus e bancos de cDNA) organismos viáveis mas ainda não cultivados • Centros de informação 3 Evolução: Catálogo (CC) Centro de Dados (CRB) 4 Centros de Recursos Biológicos: Funções Básicas • preservação e fornecimento de material biológico e informação; • pesquisa sobre o material biológico; • conservação da biodiversidade; • centros depositários de material envolvido em processos de patente; • educação e treinamento; e, • centros de informação para a formulação de políticas e para o público em geral (informação pública). Informação para a Tomada de Decisão Migrando de uma visão fragmentada para resolver problemas pontuais - reação à crise para Uma ação integrada com um caráter fortemente preditivo - evitando crises Informação • validação • armazenamento • manutenção • recuperação • disseminação • integração Informação • de acesso público: evolução da ciência, tomada de decisão, ... • de acesso restrito: patentes, biossegurança, bioética, ... • Texto, imagem Essencial • Colaboração e compartilhamento de dados Comunidade de pesquisa Pesquisadores e formuladores de políticas Pesquisadores e educadores Outras comunidades • Informação de qualidade (ou de qualidade conhecida) • Interoperabilidade Novo Cenário • Avanços em tecnologia de informação e comunicação Internet World Wide Web (um software acesso a praticamente todos os sistemas) XML para dados e documentos estruturados informação para diferentes usuários alvo Desenvolvimentos “open source” (desenvolvimento colaborativo) Desenvolvimento de padrões e protocolos Desafios • Mudança de cultura (compartilhamento de dados/ informações) • Adoção de padrões mínimos (integração de dados de fontes diversas) • Desenvolvimento e uso de ferramentas computacionais: Integração de dados e de interoperabilidade de sistemas Análise, síntese e visualização Modelo: CABRI – Common Access to Biological Resources and Information • Metas Aumentar a conscientização dos usuários científicos quanto à qualidade e variedade de coleções de culturas Européias Facilitar o acesso ao material e à informação • Estratégia adotada Desenvolvimento de um sistema de acesso único aos catálogos das coleções Garantia de um nível comum de qualidade do material e informação associada CABRI • Iniciativa da Comunidade Européia • Hoje é um consórcio de nove centros de recursos biológicos Belgian Co-ordinated Collections of Micro-organisms CABI Bioscience (UK) Centraalbureau voor Schimmelcultures (Holanda) Institut Pasteur CIP (França) CERDIC (França) Deutsche Sammlung von Mikroorganismen und Zellkulturen (Alemanha) European Collection of Cell Cultures (UK) National Institute for Cancer Research, Interlab Cell Line Collection (Itália) National Collections of Industrial, Marine and Food Bacteria (UK) http://www.cabri.org/ Vantagens • Busca simultânea em diversos catálogos • 3 formas de fazer buscas (CABRI Simple Search, SRS Standard interface, HyperCatalogue) • Coleções têm compromisso com o CABRI Quality Management Guidelines CABRI – padronização dos dados • dados mínimos, dados recomendados e dados completos para cada grupo taxonômico. • permite a inclusão de dados históricos • permite a inserção de dados mais completos Busca Simples SRS Interface CABRI Guidelines • Padrões de qualidade para o gerenciamento de coleções • Guidelines para a produção de catálogo • Manual de Procedimentos Microrganismos Introdução e documentos gerais • Guidelines for the Establishment and Operation of Collections of Cultures of Microorganisms, 2nd edition (revised by the WFCC Executive Board). Copyright: World Federation for Culture Collections, 1999 (ISBN 92 9109 043 3) Documentação e Informatização • Registro para cada linhagem: localização, substrato ou hospedeiro, data, nome da pessoa quem isolou. Depositante, nome de quem identificou, processo de preservação, meio e temperatura ótima de crescimento, dados bioquímicos, outras características, outros (quarentena, nível de segurança, patente) • Digitalização do acervo e disseminação via internet • Duplicatas dos arquivos • Equipe familiarizada com o processo de informatização Sistema de Informação de Coleções de Interesse Biotecnológico Apoio MCT/CNPq/Finep http://sicol.cria.org.br Objetivos do SICol • Servir de elemento integrador às diversas e diferenciadas coleções (CRBs). • Atender à demanda por informação das coleções e dos usuários de insumos biológicos na área da biotecnologia • Atender à demanda por informação dos formuladores de políticas públicas. A primeira fase do projeto envolveu: • A realização de um diagnóstico sobre a arquitetura recomendada, com base na infra-estrutura e capacitação existente nas coleções e no ferramental disponível na Internet; • Desenvolvimento de um web site Diagnóstico • na maioria dos casos, a documentação é básica (registro apenas de campos mínimos) e pouco estruturada (pouca/nenhuma utilização de vocabulário controlado e formatos comuns) • a maioria dos sistemas de informação existentes está voltada para o atendimento da demanda interna e, portanto, poucas coleções têm a sua informação disponível na Internet. • muitas coleções não têm acesso à Internet • a grande maioria das coleções necessita de um melhor sistema de gerenciamento de seu acervo Diagnóstico: Arquitetura do Sistema • Parâmetro: grau de informatização, padronização dos dados, qualidade do acesso Internet. • Diagnóstico: centralizado (no momento) • Princípios: • Os dados devem estar sob o total domínio, controle e responsabilidade do provedor da informação • Desenvolvimento do sistema: baseado em protocolos abertos (XML), “platform independent”, utilizando sempre que possível software de acesso público, não comercial . 2a. Fase: desenvolvimento do sistema on-line (catálogo virtual) Bactérias Fungos Usuário Células Interface Web Etc... Centros de Recursos Biológicos Base de dados do SICol Características do Sistema • Autonomia completa das coleções em relação aos dados. • Desenvolvido utilizando aplicativos “open source” ou livre • Compatibilidade com o padrão CABRI Autonomia das coleções • O SICol disponibiliza uma área de acesso restrito para que as coleções administrem os seus dados pela internet. • A qualquer momento as coleções podem inserir novos dados ou apagar os que estão sendo disponibilizados por ela. • A qualidade das informações disponibilizadas é de total responsabilidade de cada coleção. Interface web do SICol • Permite buscas fonéticas. Ex: bacilus ao invés de bacillus, xantomonas ao invés de xanthomonas, etc. • Os resultados são apresentados em forma de listagem (apenas o nome científico) ou em detalhes (informações completas) sobre cada espécimen. • As coleções inserem seus dados no SICol através do envio de um arquivo no formato “texto” ou de uma planilha no formato “Excel”. • Cada coleção pode resgatar seus dados da base do SICol como uma planilha no formato “Excel”. http://sicol.cria.org.br/cv Interface administrativa Envio de dados • a coleção tem que se cadastrar (recebe um nome de usuário e senha) • ela envia uma planilha ou exporta uma planilha Excel de seu banco de dados • ela pode recuperar os seus dados como planilha do sistema Atualização • CABRI: as coleções se comprometem a atualizar os seus catálogos a cada 6 meses • SICol: não existe qualquer compromisso nesse sentido “big brother” CABRI Projeto speciesLink • Suporte às coleções (herbários, coleções zoológicas, coleções microbianas do Estado de São Paulo) • Desenvolvimento do Protocolo DiGIR (Distributed Generic Information Retrieval) – open source, rede colaborativa • Modelagem speciesLink site http/xml lib DiGIR Portal Conectividade rápida e estável Coleção A http/xml Provider (PHP) registro Servidor Regional Provider (PHP) SQL Sistema de Gerenciamento SQL Mirror (SOAP server) Dados Dados (PostgreSQL) soap/http/xml Conectividade lenta ou instável Coleção D SQL dados Coleção B Coleção C Sistema de Gerenciamento spLinker (Java) Repositório de dados Entrada e saída de dados Distribuição geográfica das coletas de todas as coleções nacionais e internacionais na rede speciesLink Data Cleaning: Ex MZUSP Perfil do Acervo - CEPANN Estatística do Data Cleaning Vantagens de Compartilhar Dados • Agregar valor • Oportunidade de melhorar a qualidade dos dados Servidor de nomes Georeferenciamento Padronização (coletores, nome de estados, países, etc.) • Desenvolvimento e uso de aplicativos modelagem Para reflexão • Qualquer estudo sobre biodiversidade, sistemática, biotecnologia, monitoramento, etc, depende da qualidade e representatividade das coleções ex situ. • Para um país de megadiversidade como o Brasil, as coleções sistemáticas são um componente vital no esforço de descrever, gerenciar e utilizar sua riqueza biológica de maneira sustentável. • As coleções precisam responder a estes novos desafios e oportunidades através do desenvolvimento de mecanismos de capacitação institucional (infraestrutura e recursos humanos) e práticas operacionais inovadoras. Obrigada. Dora Ann Lange Canhos [email protected] www.cria.org.br