desenvolvimento do sistema on-line

Propaganda
Sistemas de Informação sobre
Recursos Biológicos:
CABRI, SICol e speciesLink
Dora Ann Lange Canhos
[email protected]
Evolução do conceito de coleções de
culturas
• “depósitos” de material de pesquisa
• depósito + serviços (preservação,
identificação, distribuição ...) + catálogo
• depósito + serviços + pesquisa + catálogo
• depósito + serviços + pesquisa + centro
de informação
Centros de Recursos Biológicos (CRB)
• Centros especializados que adquirem,
validam, estudam e distribuem:



organismos "cultiváveis“ (microorganismos, tecidos
de plantas e animais, células humanas)
partes replicáveis destes (genomas, plasmídeos,
virus e bancos de cDNA)
organismos viáveis mas ainda não cultivados
• Centros de informação
3
Evolução:
Catálogo (CC)
Centro de Dados (CRB)
4
Centros de Recursos Biológicos:
Funções Básicas
• preservação e fornecimento de material biológico e
informação;
• pesquisa sobre o material biológico;
• conservação da biodiversidade;
• centros depositários de material envolvido em processos
de patente;
• educação e treinamento; e,
• centros de informação para a formulação de políticas e
para o público em geral (informação pública).
Informação para a Tomada de
Decisão
Migrando de uma visão fragmentada para
resolver problemas pontuais - reação à
crise
para
Uma ação integrada com um caráter
fortemente preditivo - evitando crises
Informação
• validação
• armazenamento
• manutenção
• recuperação
• disseminação
• integração
Informação
• de acesso público: evolução da ciência,
tomada de decisão, ...
• de acesso restrito: patentes,
biossegurança, bioética, ...
• Texto, imagem
Essencial
• Colaboração e compartilhamento de
dados

Comunidade de pesquisa

Pesquisadores e formuladores de políticas

Pesquisadores e educadores

Outras comunidades
• Informação de qualidade
(ou de qualidade conhecida)
• Interoperabilidade
Novo Cenário
• Avanços em tecnologia de informação e
comunicação





Internet
World Wide Web (um software  acesso a
praticamente todos os sistemas)
XML para dados e documentos estruturados 
informação para diferentes usuários alvo
Desenvolvimentos “open source” (desenvolvimento
colaborativo)
Desenvolvimento de padrões e protocolos
Desafios
• Mudança de cultura (compartilhamento de
dados/ informações)
• Adoção de padrões mínimos (integração
de dados de fontes diversas)
• Desenvolvimento e uso de ferramentas
computacionais:


Integração de dados e de interoperabilidade de
sistemas
Análise, síntese e visualização
Modelo: CABRI – Common Access to
Biological Resources and Information
• Metas


Aumentar a conscientização dos usuários científicos
quanto à qualidade e variedade de coleções de
culturas Européias
Facilitar o acesso ao material e à informação
• Estratégia adotada


Desenvolvimento de um sistema de acesso único aos
catálogos das coleções
Garantia de um nível comum de qualidade do
material e informação associada
CABRI
• Iniciativa da Comunidade Européia
• Hoje é um consórcio de nove centros de recursos
biológicos

Belgian Co-ordinated Collections of Micro-organisms

CABI Bioscience (UK)

Centraalbureau voor Schimmelcultures (Holanda)

Institut Pasteur CIP (França)

CERDIC (França)

Deutsche Sammlung von Mikroorganismen und Zellkulturen (Alemanha)

European Collection of Cell Cultures (UK)


National Institute for Cancer Research, Interlab Cell Line Collection
(Itália)
National Collections of Industrial, Marine and Food Bacteria (UK)
http://www.cabri.org/
Vantagens
• Busca simultânea em diversos catálogos
• 3 formas de fazer buscas (CABRI Simple
Search, SRS Standard interface,
HyperCatalogue)
• Coleções têm compromisso com o CABRI
Quality Management Guidelines
CABRI – padronização dos
dados
• dados mínimos, dados recomendados
e dados completos para cada grupo
taxonômico.
• permite a inclusão de dados históricos
• permite a inserção de dados mais
completos
Busca Simples
SRS Interface
CABRI Guidelines
• Padrões de qualidade para o
gerenciamento de coleções
• Guidelines para a produção de catálogo
• Manual de Procedimentos
Microrganismos
Introdução e documentos gerais
• Guidelines for the Establishment and Operation
of Collections of Cultures of Microorganisms,
2nd edition (revised by the WFCC Executive
Board).
Copyright: World Federation for Culture
Collections, 1999 (ISBN 92 9109 043 3)
Documentação e Informatização
• Registro para cada linhagem: localização,
substrato ou hospedeiro, data, nome da pessoa
quem isolou. Depositante, nome de quem
identificou, processo de preservação, meio e
temperatura ótima de crescimento, dados
bioquímicos, outras características, outros
(quarentena, nível de segurança, patente)
• Digitalização do acervo e disseminação via
internet
• Duplicatas dos arquivos
• Equipe familiarizada com o processo de
informatização
Sistema de Informação de Coleções
de Interesse Biotecnológico
Apoio MCT/CNPq/Finep
http://sicol.cria.org.br
Objetivos do SICol
• Servir de elemento integrador às diversas
e diferenciadas coleções (CRBs).
• Atender à demanda por informação das
coleções e dos usuários de insumos
biológicos na área da biotecnologia
• Atender à demanda por informação dos
formuladores de políticas públicas.
A primeira fase do projeto envolveu:
• A realização de um diagnóstico
sobre a arquitetura recomendada,
com base na infra-estrutura e
capacitação existente nas coleções
e no ferramental disponível na
Internet;
• Desenvolvimento de um web site
Diagnóstico
• na maioria dos casos, a documentação é básica
(registro apenas de campos mínimos) e pouco
estruturada (pouca/nenhuma utilização de
vocabulário controlado e formatos comuns)
• a maioria dos sistemas de informação existentes
está voltada para o atendimento da demanda
interna e, portanto, poucas coleções têm a sua
informação disponível na Internet.
• muitas coleções não têm acesso à Internet
• a grande maioria das coleções necessita de um
melhor sistema de gerenciamento de seu acervo
Diagnóstico: Arquitetura do Sistema
• Parâmetro: grau de informatização, padronização
dos dados, qualidade do acesso Internet.
• Diagnóstico: centralizado (no momento)
• Princípios:
• Os dados devem estar sob o total domínio, controle
e responsabilidade do provedor da informação
• Desenvolvimento do sistema: baseado em
protocolos abertos (XML), “platform independent”,
utilizando sempre que possível software de acesso
público, não comercial .
2a. Fase: desenvolvimento do sistema on-line
(catálogo virtual)
Bactérias
Fungos
Usuário
Células
Interface
Web
Etc...
Centros de Recursos
Biológicos
Base de dados do
SICol
Características do Sistema
• Autonomia completa das coleções em relação
aos dados.
• Desenvolvido utilizando aplicativos “open
source” ou livre
• Compatibilidade com o padrão CABRI
Autonomia das coleções
• O SICol disponibiliza uma área de acesso
restrito para que as coleções administrem os
seus dados pela internet.
• A qualquer momento as coleções podem inserir
novos dados ou apagar os que estão sendo
disponibilizados por ela.
• A qualidade das informações disponibilizadas é
de total responsabilidade de cada coleção.
Interface web do SICol
• Permite buscas fonéticas. Ex: bacilus ao invés de
bacillus, xantomonas ao invés de xanthomonas, etc.
• Os resultados são apresentados em forma de listagem
(apenas o nome científico) ou em detalhes (informações
completas) sobre cada espécimen.
• As coleções inserem seus dados no SICol através do
envio de um arquivo no formato “texto” ou de uma
planilha no formato “Excel”.
• Cada coleção pode resgatar seus dados da base do
SICol como uma planilha no formato “Excel”.
http://sicol.cria.org.br/cv
Interface administrativa
Envio de dados
• a coleção tem que se cadastrar (recebe
um nome de usuário e senha)
• ela envia uma planilha ou exporta uma
planilha Excel de seu banco de dados
• ela pode recuperar os seus dados como
planilha do sistema
Atualização
• CABRI: as coleções se comprometem a
atualizar os seus catálogos a cada 6
meses
• SICol: não existe qualquer compromisso
nesse sentido
“big brother” CABRI
Projeto speciesLink
• Suporte às coleções (herbários, coleções
zoológicas, coleções microbianas do
Estado de São Paulo)
• Desenvolvimento do Protocolo DiGIR
(Distributed Generic Information Retrieval)
– open source, rede colaborativa
• Modelagem
speciesLink
site
http/xml
lib
DiGIR
Portal
Conectividade rápida e estável
Coleção A
http/xml
Provider
(PHP)
registro
Servidor
Regional
Provider
(PHP)
SQL
Sistema de
Gerenciamento
SQL
Mirror
(SOAP server)
Dados
Dados
(PostgreSQL)
soap/http/xml
Conectividade lenta ou instável
Coleção D
SQL
dados
Coleção B
Coleção C
Sistema de
Gerenciamento
spLinker
(Java)
Repositório
de dados
Entrada e saída de dados
Distribuição geográfica das coletas de todas as coleções nacionais e
internacionais na rede speciesLink
Data Cleaning: Ex MZUSP
Perfil do Acervo - CEPANN
Estatística do Data Cleaning
Vantagens de Compartilhar Dados
• Agregar valor
• Oportunidade de melhorar a qualidade
dos dados

Servidor de nomes

Georeferenciamento

Padronização (coletores, nome de estados, países,
etc.)
• Desenvolvimento e uso de aplicativos

modelagem
Para reflexão
• Qualquer estudo sobre biodiversidade, sistemática,
biotecnologia, monitoramento, etc, depende da
qualidade e representatividade das coleções ex situ.
• Para um país de megadiversidade como o Brasil, as
coleções sistemáticas são um componente vital no
esforço de descrever, gerenciar e utilizar sua riqueza
biológica de maneira sustentável.
• As coleções precisam responder a estes novos
desafios e oportunidades através do desenvolvimento
de mecanismos de capacitação institucional (infraestrutura e recursos humanos) e práticas
operacionais inovadoras.
Obrigada.
Dora Ann Lange Canhos
[email protected]
www.cria.org.br
Download