O Código de Barras da Vida baseado no DNA “Barcoding of Life”: Considerações e Perspectivas. Ana Maria Lima de Azeredo- Espin Centro de Biologia Molecular e Engenharia Genética-CBMEG e Depto. de Genética e EvoluçãoDGE, Universidade Estadual de Campinas-UNICAMP. CEP 13083-970, Campinas, SP, Brasil. [email protected] A diversidade da vida justifica todos os estudos biológicos, mas também é um grande desafio. Enquanto os físicos lidam com um cosmo constituído de 12 partículas fundamentais, os biólogos confrontam um planeta constituído por milhões de espécies. Essa discriminação não é uma tarefa fácil. De fato, uma vez que poucos taxonomistas podem operacionalmente identificar cerca de 0.01%, das 10-15 milhões de espécies que habitam o nosso planeta, seriam requeridos cerca de 15.000 taxonomistas para identificar vida caso fossem mantidas as nossas esperanças no diagnóstico morfológico. Entretanto, esta abordagem para a identificação de espécies, para ser empregada como rotina, apresenta quatro limitações muito significativas. 1. Ambas, a plasticidade fenotípica e a variabilidade genética nos caracteres empregados para o reconhecimento de espécies podem, levar a uma identificação incorreta, 2. Essa abordagem omite taxa morfologicamente crípticos, que são comuns em vários grupos. 3. chaves morfológicas freqüentemente são eficientes somente para um estágio do ciclo de vida e assim muitos indivíduos não podem ser identificados. 4. embora versões interativas e modernas representem o principal avanço, o uso de chaves de identificação muitas vezes demanda a necessidade de recorrer a um especialista para não comprometer a identificação. A limitação herdada no sistema de identificação baseada na morfologia e a escassez de taxonomistas especializados nos diferentes grupos de organismos, sinalizam a necessidade de uma nova abordagem para identificação de táxons. Sistema de identificação microgenômica “DNA Barcoding” Este sistema de identificação pretende realizar a discriminação de todas as espécies vivas do planeta através da utilização de um pequeno segmento padronizado de DNA. Esta abordagem representa uma estratégia extremamente promissora para o diagnóstico da biodiversidade. A abordagem genômica para diagnóstico de táxon, explora a diversidade entre as seqüências de DNA para identificar organismos. Em termos reais, essas seqüências podem ser vistas como um “código de barras” que estão contidos em todas as células. Quando se considera a discriminação da diversidade da vida a partir de uma perspectiva combinatorial, isto é um problema modesto. O Código Universal de Produtos (código de barra universal dos produtos), utilizado para identificar produtos do mercado varejista, emprega 10 números alternados em 11 posições para gerar 100 bilhões de identificadores únicos. Um código de barras genômico tem somente quatro nucleotídeos alternados em cada posição, mas a cadeia de sítios disponíveis para a inspeção é maior. À análise de apenas 15 dessas posições de nucleotídeos, criam 415, portanto 1 bilhão de códigos, isto é, 100 vezes mais que o número requerido para discriminar vida se cada táxon fosse unicamente marcado Um sistema taxonômico global para o reino animal provavelmente incluirá pelo menos 10 milhões de espécies distribuídas em mais do que um milhão de gêneros. Devido a esta imensa 1 diversidade, existe um consenso na comunidade científica sobre a necessidade de uma assistência tecnológica para uma descrição inicial e um reconhecimento subseqüente. Investigações mais recentes têm sugerido que a possibilidade de se criar um sistema seguro de identificação consiste na análise de pequenos segmentos de DNA. Foi então proposto que um sistema de código de barras do DNA para o reino animal poderia se basear na diversidade de uma parte da seqüência do gene da subunidade I da citocromo oxidase (COI), um gene mitocondrial (relacionada ao terminal 5’ deste gene). Esta nova iniciativa é conhecida como DNA Barcoding ou “código de barras do DNA” (Herbert et al., 2003a; Blaxter, 2004). Um exemplo prático foi obtido analisando 650 pb do gene COI de várias espécies de borboletas (Leptodoptera) (Hebert et al. 2003). Foi verificado que a diversidade nas seqüências de nucleotídeos de 650pb do gene COI permitiu a discriminação de espécies proximamente relacionadas de borboletas, um grupo considerado com modestas taxas de evolução molecular e alta diversidade de espécies. Além disso, esses insetos forneceram um teste desafiador para verificar o potencial da diversidade de COI em resolver a barreira das espécies (discriminar as espécies). Argumento para a Taxonomia baseada no DNA: A idéia do DNA Barcoding O “Consortium for the Barcode of Life” (CBOL) (www.barcoding.si.edu), foi estabelecido em 2004, com o objetivo de auxiliar no desenvolvimento de um sistema capaz de identificar todas as espécies do planeta baseado na utilização de um pequeno fragmento padronizado de DNA, codificador de um gene. O CBOL conta com o financiamento da Alfred P. Sloan Foundation e da Moore Foundation e tem como objetivos estabelecer uma ferramenta acurada para a pesquisa taxonômica em espécies animais e vegetais, auxiliar na identificação correta de espécimens e de ampliar e estimular a taxonomia dos vários grupos de organismos vivos. Para os animais, foi estabelecido como código de barras, DNA Barcode, uma região de um gene mitocondrial denominado de citocromo c Oxidase Subunidade I (COI). A idéia em se utilizar um gene mitocondrial, baseou-se nas características apresentadas pelo genoma mitocondrial tais como, ser amplamente distribuído entre os animais, alto número de cópias por célula, apresentar taxa de mutação diferente entre espécies, não sofrer recombinação, ter uma herança predominantemente materna além de possuir baixo polimorfismo ancestral. Em plantas a escolha de uma região adequada para representar o DNA Barcode ainda não esta bem definida como nos animais devido ao genoma mitocondrial vegetal apresentar baixa variação em seqüências para ser utilizado como código de barras. Para os vegetais, genes ou regiões do genoma de plastídios e da região nuclear ITS, parecem ser os candidatos mais promissores (Chase, 2005). As vantagens em se estabelecer bancos de DNA barcodes completos dos principais grupos taxonômicos é uma oportunidade para minimizar a atual situação sobre a caracterização da diversidade biológica em grande escala, através de uma identificação de espécies baseada em pequenas seqüências de DNA. Este sistema permite que um grande número de exemplares seja estudado de modo eficiente e identificar os que apresentam código de barra do DNA diferentes que poderiam ser indicativos de novas espécies. Estas seriam em seguida estudadas e descritas por especialistas, os taxonomistas. Um aspecto importante para estabelecer um banco de DNA barcodes de um determinado grupo taxonômico consiste na necessidade de obter condições de infra-estrutura para a geração de uma grande quantidade de informações de seqüências de DNA aliada ao trabalho dos taxonomistas. Esta integração de dados ampliaria a escala de identificação e conhecimento da biodiversidade. 2 Esta iniciativa tem recebido apoio e grandes financiamentos indicando que nos próximos anos esta abordagem integrada assumirá um papel de destaque em projetos envolvendo estudos sobre a biodiversidade. Procedimento Básico do DNA Barcoding: O procedimento básico para a taxonomia baseada no DNA, DNA Barcoding, é direto. Uma amostra de tecido seria retirada de um indivíduo coletado e seu DNA extraído. Este tipo de abordagem tem a vantagem de poder ser realizada a partir de pequenas quantidades de tecido biológico, eliminando em muitos casos o sacrifício do animal estudado. Este DNA serve como uma amostra referência para que uma ou várias regiões gênicas possam ser amplificadas pela técnica de PCR e em seguida seqüenciadas. As seqüências resultantes correspondem a uma etiqueta de identificação para a espécie da qual a amostra de DNA foi retirada. Essa seqüência se torna disponibilizada através de um banco de dados, junto com a descrição da espécie e outras informações associadas, que idealmente incluem seu status taxonômico com referências associadas. Esta seqüência se torna um padrão para referências futuras, junto com o espécime tipo e a respectiva preparação do DNA, que será depositada em coleções de museus. Uma vez que um banco de dados de seqüências tenha sido estabelecido, novas amostras podem ser averiguadas contra estas seqüências existentes para auxiliar na re-identificação ou para acessar se a descrição de uma nova espécie poderá ser confirmada. A base de dados pode também servir para resolver questões sobre a identidade taxonômica de espécimes que derivaram de estágios diferentes de vida larval, ou para identificação de espécies ameaçadas de extinção, espécies invasoras, espécies pragas e assim por diante. Na fase inicial desta iniciativa, esforços concentrados devem ser realizados para alcançar uma boa cobertura de todas as espécies conhecidas (ou alguns subgrupos alvos específicos). Porém, uma vez que a base de dados se tornar suficientemente completa, essas comparações, incluindo as análises filogenéticas de seqüências examinadas, poderá rapidamente colocar qualquer seqüência de novos espécimes. A vantagem da informação de seqüências de DNA consiste em ser digital e não ficar influenciada por uma análise subjetiva. Esta análise poderá ser reproduzida em qualquer tempo e por qualquer pessoa, e de maneira universal. Conseqüentemente, poderá ser uma ferramenta de comunicação universal e padronizada para auxiliar na taxonomia, a qual poderá estar associada a qualquer tipo de informação biológica ou de biodiversidade. Embora a taxonomia baseada no DNA tenha suas limitações ela tem a vantagem de ser uma ferramenta universalmente aplicável. Outra vantagem da análise do DNA consiste na facilidade de extração além de ser uma molécula muito estável tanto em soluções tampão, como precipitado no etanol, ou congelado em freezer.. Como as amostras de DNA de qualquer organismo têm os mesmos requerimentos para preservação, as amostras poderão ser catalogadas e mantidas na ordem em que elas forem sendo obtidas, simplificando deste modo à organização das coleções. Qualquer amostra deverá ser separada em várias alíquotas que poderão ser assim distribuídas entre os vários museus e pesquisadores para análises mais específicas. A necessidade de se estabelecer protocolos padrões para as coleções de DNA tem crescido rapidamente. Embora existam vários projetos utilizando a análise do DNA para estudos sobre filogenia ou filogeografia de espécies, até muito recentemente não havia um esquema unificado para depósito de “vouchers” (isto é, de espécies amostradas). Assim, a principal meta a ser alcançada seria a proteção destas amostras potencialmente valiosas para referências futuras. 3 Outro objetivo do CBOL consiste em estabelecer uma biblioteca pública de ‘DNA barcodes’ possibilitando o acesso a esta informação, ampliando e democratizando estudos e conhecimentos sobre a biodiversidade. Ao lado das vantagens do DNA Barcode como aliado para o conhecimento da biodiversidade é necessário reconhecer alguns aspectos que precisam ser avaliados para minimizar questionamentos relativos a processos evolutivos envolvendo: espécies crípticas; os limites entre a variabilidade genética intra versus interespecíficas. Estes limites devem ser avaliados através da análise de vários espécimes da mesma localidade para se detectar a possível existência de haplótipos polimórficos cuja variação precede a divergência das espécies. O desafio biológico do Código de Barra do DNA: DNA Barcoding O “DNA barcoding” representa uma estratégia designada para satisfazer simultaneamente várias questões que incluem; melhoria na identificação taxonômica incluindo os não especialistas; diminuição de custo; praticidade, acesso rotineiro e rápido a informação e uma aplicabilidade em amplo espectro filogenético e taxonômico de organismos, incluindo muitas espécies novas, ainda não descritas. A função essencial do “DNA barcoding”, isto é, do código de barras baseado no DNA, consiste na habilidade em identificar corretamente um indivíduo dentro de uma espécie, ou de identificar a amostra como pertencente a uma nova espécie, ainda não descrita. O código de barra baseado no DNA não tem intenção de fornecer dados precisos sobre as relações filogenéticas entre as espécies, embora os esforços sejam compatíveis e idealmente, poderão complementar os estudos filogenéticos. O nível de identificação taxonômico pretendido com esta nova abordagem é o de espécie. A utilização de dados moleculares, e em particular de seqüências diferentes de DNA para o reconhecimento de espécies, determinação e descrição taxonômica não é uma abordagem nova. Mais propriamente, o diferencial da proposta do “DNA barcoding” consiste em fornecer aos pesquisadores protocolos padronizados com relação à escolha de genes, banco de dados eletrônicos, dados sobre coleção de espécimes, de documentação e etc, além da sua utilização como um sistema para rápido reconhecimento de espécies e identificação em vários contextos aplicados fora do inventário da espécie e da taxonomia. Portanto, a identificação de espécies baseada em uma seqüência padronizada de DNA deve ser considerada como um marcador molecular promissor. Talvez o maior desafio seja estimular a integração da informação molecular, aliando os avanços técnico-científicos de acesso ao DNA com a taxonomia para um melhor conhecimento da biodiversidade do nosso planeta. Custo da análise baseada em DNA Barcode. Seqüenciamento do DNA é uma tecnologia considerada complexa e cara. Parece que um taxonomista pode identificar espécimes de uma maneira mais rápida e barata quando comparada ao do seqüenciamento. Entretanto, essa percepção comum não é necessariamente acurada. Atualmente nós vivemos numa época onde o custo do trabalho esta aumentando rapidamente, enquanto o custo da automação diminui. Taxonomistas despendem tempo e dinheiro consideráveis para treinamento e este tempo geralmente não é utilizado para realização de identificação de rotina. De fato, taxonomistas utilizam seus conhecimentos especializados para conduzir projetos científicos específicos e normalmente não atuam como prestadores de serviços de identificação de espécimes (“facilitiy” de identificação de espécimes). Sob o esquema de uma taxonomia baseada no DNA, a identificação rotineira de espécimes coletados durante um projeto ecológico poderá ser realizada dentro de uma “facility” de sequenciamento de DNA . Para esta análise, há a necessidade de um sequenciador automático que atualmente se tornou mais acessível em diversos laboratórios devido aos vários projetos genomas em curso e que poderão ser adquiridos pelos principais museus. Uma alternativa será a associação com 4 outros laboratórios, já detentores destes equipamentos e da capacitação técnica necessária para processar e analisar as amostras. O estabelecimento de uma “facility de DNA” que poderia rotineiramente analisar aproximadamente 1000 amostras por dia poderá custar um valor aproximado ao de, por exemplo, uma análise através de microscópio de varredura. O custo em laboratórios europeus do material para cada amostra, incluindo a extração do DNA e o sequenciamento de 2 regiões independentes foi estimado ser em torno de 5 Euro por amostra em cada “facility”. Ainda assim, o custo para 1000 amostras processadas por dia, parece ser muito para uma escala de museu!, mas é ainda considerada bem modesto quando comparado com projetos genomas que estão em curso. Evidentemente este custo não deverá ficar sob a responsabilidade de cada museu e ou das instituições de pesquisas mantenedoras das coleções biológicas, mas sim estimular as agências e fundações de financiamento através de parcerias de longo prazo com Universidades e Centros de Biologia Molecular capacitados para operacionalizar grande número de seqüências rotineiramente. Finalmente, desenvolvimento de novas tecnologias fará o custo desta metodologia diminuir ainda mais. As principais vantagens de tais facilidades seriam duas: Primeiro, ela pode fornecer um serviço de custo efetivo para os pesquisadores ou mesmo amadores, que não tem acesso direto a seqüenciadores automáticos. Isto permitirá que pesquisadores de países em desenvolvimento possam participar diretamente nesse esquema. Segundo, eles podem estabelecer um padrão necessário para assegurar seqüências de alta-qualidade das amostras. Conclusão A revolução genômica nas últimas décadas tem fornecido as ferramentas que permitem que um sistema taxonômico universal baseado no DNA (DNA barcoding) se torne um objetivo executável e desejável. Esse sistema permite dar um novo estímulo nas pesquisas sobre biodiversidade, complementando várias outras iniciativas em curso para absorver os conhecimentos taxonômicos atuais e estimular o treinamento e a capacitação em taxonomia. Ainda mais importante, atualmente, é possível construir uma maneira de integrar o poder do sistema tradicional de identificação de espécies com as novas possibilidades tecnológicas. Isto permitirá uma utilização mais ampla e, de fato requerida, do valioso conhecimento dos taxonomistas que tem sido acumulado durante séculos, além de torná-los amplamente acessíveis. Também proporciona um novo papel aos Museus de História Natural, isto é, de um acervo molecular (facilities”) e detentores da diversidade biológica e genômica. Atingimos uma era em que os conhecimentos, molecular e morfológico, devem e podem ser formalmente e construtivamente associados. Perspectivas para o Brasil A iniciativa internacional denominada “Consortium for the Barcode of Life-CBOL” destinada a desenvolver o DNA Barcoding, tem recebido grande apoio financeiro na esfera internacional de fundações privadas de fomento à pesquisa, merecendo destaque às iniciativas “Canadian Barcode of Life Network” que pretende criar um banco de seqüências de todos os eucariotos do Canadá. Outra ambiciosa iniciativa consiste na “Barcoding All Birds” que tem como objetivo realizar o DNA barcode de todas as espécies de aves do mundo (www.barcodinglife.org). 5 O Brasil possui a maior biodiversidade do nosso planeta, abrigando a maior diversidade biológica entre os 17 países considerados megadiversos que reúnem 70% de espécies de animais e vegetais catalogadas no mundo. Calcula-se que o país possua o maior número de espécies endêmicas (Lewinsohn e Padro, 2002, Klazco e Vieira, 2003). A Mata Atlântica e o Cerrado foram designados como “hotspots” de biodiversidade pelos estudos da Conservation International (www.conservation.org). Com isso, o Brasil tem um importante papel na preservação da biodiversidade do nosso planeta. No entanto, estima-se que apenas 10% das cerca de 2 milhões de espécies da fauna e da flora brasileira já foram identificadas (Lewinsohn e Prado, 2002). De acordo com estes autores, a cada ano, o total de espécies catalogadas cresce, em média, 0.6%. Esta estimativa lenta é atribuída ao número reduzido de taxonomistas, técnicos em atividade e em número suficiente nos diferentes grupos de organismos e nas diferentes regiões do país, dificultando os inventários sobre a biodiversidade brasileira. Considerando este cenário que inclui a alta taxa de endemismo, dificuldade de identificação de muitas espécies, grande número de espécies não descritas associado à falta de especialistas para a identificação dos inúmeros espécimes já coletados para assegurar a conservação e o conhecimento da nossa biodiversidade, torna-se estratégico que o Brasil se associe a iniciativas como a proposta pelo Consortium for the Barcode of Life-CBOL. No Brasil, com a experiência adquirida na última década por vários grupos de pesquisa na área de genômica e de bioinformática, associada a reconhecida competência de vários pesquisadores na área de biodiversidade e da taxonomia, tem-se as condições essenciais para liderar um inventário sobre a nossa biodiversidade, com um enfoque multidisciplinar e em grande escala. Promover a integração entre pesquisadores destas áreas estratégicas incorporando os avanços e o acesso a ferramentas de informação tais como a do DNA barcoding, através da elaboração de projetos em grande escala sobre a biodiversidade no Brasil deve ser estimulada e fazer parte da agenda das agências brasileiras de fomento nos próximos anos. Bibliografia Chase, M.W.. 2005. The problems with plants:issues and possible solutions. In: First International Scientific Conference on DNA Barcoding. Natural History Museum, London. Consortium for the Barcode of Life” (CBOL) (www.barcoding.si.edu), Hebert, P. D. N., A. Cywinska, S. L. Ball and J. R. Dewaard, 2003. Biological identifications through DNA barcodes. Proceeding of the Royal Society of London, 270:313-321. Klaczko, L. B. & R. D. Vieira. 2003. Avaliação do estado do conhecimento da diversidade biológica no Brasil-Genética. Ministério do Meio Ambiente, 68p. Lewinshohn, T. M. & P. I. Prado. 2002. Biodiversidade Brasileira: Síntese do estado atual do conhecimento. Ministério do Meio Ambiente- Conservation International do Brasil. Ed. Contexto. 176p. 6