conclusão introdução material e métodos resultados

Propaganda
Plataforma de bancos de dados e ferramentas para visualização de dados moleculares no contexto genômico
Higa, R.H. ; Fernandes, M.A.C., Yamagishi, M.E.B.
Embrapa Informática Agropecuária ­ Av. André Tosello, 209 ­ Barão Geraldo ­ Caixa Postal 6041­ 13083­886 ­ Campinas, SP
RESUMO
O projeto “Tecnologias genômicas para aprimorar o melhoramento genético animal e produção pecuária” utiliza metodologias de genotipagem de marcadores SNP em larga escala e de expressão gênica para caracterizar amostras coletadas em projetos da Embrapa e de seus parceiros. Para analisar esses dados em conjunto com dados fenotípicos coletados dos respetivos projetos, no contexto genômico, primeiro é preciso criar uma plataforma de base de dados para armazenar esses dados, bem como dados relacionados e disponíveis publicamente. Para construir essa plataforma, foi escolhida a ferramenta GMOD ­ Generic Model Organism Database, que é constituída por um esquema de banco de dados (Chado) e um conjunto de ferramentas para visualização e análise desses dados. RESULTADOS
O GMOD foi instalado com o SGBD PostgreSQL (
http://www.lba.cnptia.embrapa.br/cgi­bin/gbrowse/bos1chado/?name=chr2). Duas montagens do genoma do B.Taurus foram carregadas no banco de dados (Montagens da Baylor College of Medicine's Human Sequencing Center – Btau_4.0 e da Univesity of Maryland – UMD2). Uma vez realizada a etapa de instalação derramenta para visualização de dados no contexto genômico – Gbrowse, foi possível observar o potencial oferecido pela ferramenta para análise visual de dados biológicos em contexto genômico (Figura 1).
Figura 1 INTRODUÇÃO
Um dos principais objetivos do PA2.2 é prover à Rede Genômica Animal uma plataforma de banco de dados que permita a armazenagem dos dados de genotipagem de marcadores SNP e de expressão gênica, bem como a visualização e análise desses dados no contexto do genôma de referência do organismo. O GMOD é formado por um esquema de banco de dados (Chado) e um conjunto de ferramentas de código aberto para criação, gerenciamento e visualização de dados biológicos em escala genômica (ex: Gbrowse, para visualização do genoma; CMAP, para comparação de mapas genéticos e físicos), sendo amplamente utilizado pela comunidade para organizar bases de dados genômicas de organismos modelo (ex: FlyBase, WormBase, SGD – Saccharomyces Genome Database). Seu projeto do esquema de banco de dados (Chado) é flexível, permitindo a representação de dados oriundos de diferentes organismos e plataformas experimentais (de mapeamento físco e PCR a tecnologias de high­
throughput como sequenciamento de todo o genoma, microarranjos e proteomica). Já as ferramentas componentes associadas constituem uma camada de aplicações de software que permitem ao usuário visualizar e manipular os dados de forma simples e transparente. Por isso, optou­se pela adoção da plataforma GMOD, com suas ferramentas componentes utilizadas para visualização de dados, para construção da plataforma de banco de dados da Rede Genômica Animal.
MATERIAL E MÉTODOS
Foi realizada uma comparação entre as plataformas de domínio público disponíveis para constução de bases de dados biológicas em escala genômica, tendo­se optado pela ferramenta GMOD e as suas ferramentas componentes. O GMOD não restringe a escolha do Sistema Gerenciador de Banco de Dados (SGBD) utilizado, tal que o SGBD PostgreSQL foi escolhido para esse fim.A instalação dos pacotes de software requeridos pelo GMOD, bem como de seu esquema de banco de dados ­ Chado ­ foi realizada conforme descrito em seu procedimento de instalação. Para carregar os dados do genoma de referência do B.Taurus, foram desenvolvidos dois scripts Phyton com o objetivo de corrigir o processo de conversão de arquivos genbank para GFF. Também foram realizadas correções manuais dos arquivos genbank. Nenhum dos dois problemas está documentado no procedimento de instalação do GMOD. A instalação do Gbrowse, uma das ferramentas que compõem o GMOD, foi realizada conforme descrito em seu procedimento de instalação.
CONCLUSÃO
O GMOD contitui uma plataforma bastante flexível para construção de bases de dados biológicas em escala genômica, permitindo tanto o armazenamento de dados privados, quanto a realização de análises visuais destes dados frente a dados disponíveis publicamente. Contudo, por ser uma plataforma livre, a sua instalação pode envolver algum esforço de adaptação, por vezes, sem o auxílio de um serviço de suporte. Apesar disso, considerando os potenciais benefícios de sua utilização, julgamos que sua razão custo/benefício é favorável. No momento, encontra­se me desenvolvimento uma aplicação web para entrada e saída de dados privados, que complementa o esforço empreendido até o momento para estabelecimento do GMOD como a plataforma de bases de dados biológicas da Rede Genômica Animal. Também está em curso a inclusão de diferentes dados públicos como QTLs e anotações GO.
BIBLIOGRAFIA
Mungall, C.J., Emmert, D.B., The FlyBase Consortium (2007) A Chado case study: an ontology­based modular scheme for representing genome associated biological information. Bioinformatics 23(13): I337­I346.
Download