UNIVERSIDADE FEDERAL DE GOIÁS ESCOLA DE VETERINÁRIA E ZOOTECNIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA ANIMAL Disciplina: Seminário Aplicado VARIABILIDADE GENÉTICA E ANÁLISES ESTATÍSTICAS NA CONSERVAÇÃO DOS RECURSOS GENÉTICOS DE BOVINOS LOCAIS Diogo Alves da Costa Ferro Orientadora: Drª. Eliane Sayuri Miyagi GOIÂNIA 2011 ii DIOGO ALVES DA COSTA FERRO VARIABILIDADE GENÉTICA E ANÁLISES ESTATÍSTICAS NA CONSERVAÇÃO DOS RECURSOS GENÉTICOS DE BOVINOS LOCAIS Seminário apresentado junto à Disciplina Seminários Aplicados do Programa de Pós-Graduação em Ciência Animal da Escola de Veterinária e Zootecnia da Universidade Federal de Goiás. Nível: Mestrado. Área de Concentração: Produção Animal Linha de Pesquisa: Fatores genéticos e ambientais que influenciam o desempenho dos animais Orientadora: Profa. Drª. Eliane Sayuri Miyagi – UFG Comitê de Orientação: Prof. Dr. Emmanuel Arnhold - UFG Drª. Raquel Soares Juliano – Embrapa Pantanal GOIÂNIA 2011 iii SUMÁRIO LISTA DE ABREVIATURAS........................................................ iv LISTA DE QUADROS................................................................. v 1 INTRODUÇÃO............................................................................ 1 2 REVISÃO DA LITERATURA....................................................... 3 2.1 Conservação dos recursos genéticos......................................... 3 2.2 Caracterização genética.............................................................. 4 2.3 Marcadores moleculares............................................................. 5 2.3.1 Microssatélites............................................................................. 6 2.4 Análises estatísticas nos estudos da variabilidade genética...... 8 2.4.1 Frequência alélica....................................................................... 8 2.4.2 Heterozigosidade........................................................................ 10 2.4.3 Conteúdo de informação polimórfica (PIC)................................. 12 2.4.4 Equilíbrio de Hardy-Weinberg (EHW)......................................... 13 2.4.5 Probabilidade de exclusão.......................................................... 16 2.4.6 Índices de fixação ou estatísticas de F....................................... 17 2.4.7 Distância genética entre populações.......................................... 18 3 CONSIDERAÇÕES FINAIS........................................................ 21 REFERÊNCIAS........................................................................... 22 iv LISTA DE ABREVIATURAS AFLP - Amplified Fragment Length Polymorphisms EHW - Equilíbrio de Hardy-Weinberg FIS - Coeficiente de consangüinidade intrapopulacional FIT - Redução da heterozigosidade de um indivíduo com relação à metapopulação FST - Coeficiente de consangüinidade entre subpopulações He - Heterozigosidade esperada Ho - Heterozigosidade observada LINES - Long interspersed elements mtDNA - DNA mitocondrial PCR - Reação em cadeia polimerase PE - Probabilidade de exclusão PEC - Probabilidade de exclusão combinada PIC - Conteúdo de informação polimórfica RAPD - Radom Amplified Polymorphic DNA RFLP - Restriction Fragment Length Polymorphism SINES - Short interspersed elements SNPs - Single Nucleotide Polymorphisms SSR - Repetição de sequências simples v LISTA DE QUADROS QUADRO 1 Representação esquemática da separação eletoforética de uma proteína ou de um microssatélite com dois alelos comuns, A e B. AA, AB e BB correspondem aos genótipos observados em dez indivíduos, com frequências genotípicas e alélicas...................................... QUADRO 2 9 Expressão binomial para determinação da variância da frequência alélica................................................................ 10 QUADRO 3 Determinação da Ho com apena um loco........................... 11 QUADRO 4 Determinação da Ho com todos os locos........................... 11 QUADRO 5 Cálculo da heterozigosidade média esperada.................... 12 QUADRO 6 Equação que determina a frequência de três genótipos possíveis............................................................................. 12 QUADRO 7 Fórmula para determinação de valores de PIC.................. 13 QUADRO 8 Equação para verificação do EHW..................................... 14 QUADRO 9 Demonstração do não EHW na geração P......................... 15 QUADRO 10 Demonstração do EHW na geração 1................................ 16 QUADRO 11 Equações de obtenção da estatística F.............................. 18 QUADRO 12 Fórmulas para cálculos de distância genética.................... 20 1 INTRODUÇÃO O Brasil possui um grande número de raças locais, espalhadas por diversas regiões do país, tais como o bovino Pantaneiro localizado no Pantanal e o bovino Curraleiro, principalmente na região do Cerrado. Essas raças encontramse, em sua maioria, ameaçadas de extinção, devido o surgimento de raças especializadas para produção e pela realização de cruzamentos dessas raças com bovinos locais. Com isso tem-se diminuído a diversidade genética de algumas delas. Embora essas raças locais sejam consideradas menos produtivas que as especializadas, provocando pouco interesse para criação, elas são perfeitamente adaptadas às nossas condições ambientais, podendo ser bastante utilizadas nos programas de melhoramento genético, em função de sua adaptabilidade. Por despertar pouco interesse pela criação, proporcionando riscos de extinção, pode ocasionar perdas definitivas de alelos de determinadas raças. Por isso é de fundamental importância conhecer a variabilidade genética dessas raças locais, para promover estratégias de conservação desse patrimônio genético, auxiliando nos programas de conservação de recursos genéticos. A conservação de recursos genéticos é realizada por Universidade, Instituições e produtores, com o intuído de manter essa variabilidade genética. Uma alternativa que vem vendo utilizada para otimizar e quantificar a variabilidade genética é a adoção da caracterização genética de raças e populações (MENEZES, 2005). Como ferramenta para caracterização genética tem-se adotado a utilização de marcadores moleculares. Dentre os principais marcadores moleculares estão os microssatélites, que são abundantes e distribuídos ao acaso por todo o genoma, além de apresentar grande polimorfismo, sendo considerados de fácil identificação e utilização. Auxiliando no programa de conservação de recursos genéticos estão as análises estatísticas, como a frequência alélica, heterozigosidade observada e esperada, conteúdo de informação polimórfica, equilíbrio de Hardy-Weinberg, probabilidade de exclusão, estatísticas F e distâncias genéticas. 2 Nesse contexto, objetivou-se abordar a utilização da variabilidade genética e das análises estatísticas na conservação de recursos genéticos de bovinos locais. 3 2 REVISÃO DA LITERATURA 2.1 Conservação dos recursos genéticos Nos últimos anos diversos países têm se preocupado com a erosão genética de raças e populações, ocasionada pela substituição das raças locais. Essa substituição vem ocorrendo deste o final do século XIX, com a eliminação desses animais, considerados menos produtivos ou pela adoção do cruzamento absorvente (EGITO et al., 2002), principalmente com zebuínos da raça Nelore, por serem animais altamente especializados para produção de carne (RANGEL et al., 2004). A perda da diversidade genética dessas raças pode ser minimizada mantendo a variabilidade genética com a utilização de programas de conservação, executados pelas Universidades e Institutos de pesquisa (EGITO et al., 2002), como a Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) com o Programa Nacional de Conservação de Recursos Genéticos, coordenado pelo Centro Nacional de Pesquisa de Recursos Genéticos e Biotecnologia (CENARGEN), em parceria com criadores (EGITO, 2007). Segundo COSTA & MARTINS (2008), os programas de conservação genética podem ser in situ (manutenção do animal em seu habitat natural) e ex situ (manutenção fora do ambiente natural, com a inclusão de bancos de germoplasma). A conservação de recursos genéticos no Brasil tem como objetivo realizar a identificação, caracterização fenotípica e implantação dos núcleos de conservação, estabelecendo os centros de origem, diversidade e variabilidade genética, além do monitoramento dos núcleos já existentes, também ameaçados de extinção; conservação ex situ do material genético; caracterização das populações; e conscientização da sociedade sobre a importância da conservação (EGITO et al., 2002). A variabilidade genética é um parâmetro de fundamental importância para a caracterização de raça e populações (ALBUQUERQUE, 2005) e segundo GAMA (2004), na conservação dos recursos genéticos, onde o conhecimento da diversidade genética intra e inter-raciais pode contribuir para evitar uma erosão genética. 4 A variabilidade sofre grande impacto do sistema de acasalamento, que quando realizado de maneira incorreta pode aumentar a taxa de endogamia (MALHADO et al., 2008). A endogamia é caracterizada pelo acasalamento entre indivíduos que possuem algum grau de parentesco, aumentando a homozigose e diminuindo a heterozigose (QUEIROZ et al., 2000), podendo haver fixação e expressão de genes indesejáveis na população (SILVA et al., 2001). O controle da endogamia pode ocorrer com o auxilio da dissimilaridade genética, ou seja, pela diferença genética entre os bovinos, por meio da caracterização genética (RON et al., 1996), com a finalidade de permitir maior confiabilidade dos parâmetros genéticos (CURI & LOPES, 2001). 2.2 Caracterização genética A caracterização genética, principalmente de raças locais, até o final do século XX, baseava-se nas características morfológicas e produtivas dos animais, sendo altamente influenciadas pelo ambiente. Nas últimas duas décadas do século passado, foram desenvolvidas técnicas capazes de detectar variações ao nível de DNA, ficando livres das influências do meio ambiente, auxiliando nas decisões a serem tomadas nos programas de conservação (EGITO, 2007). A caracterização genética é de fundamental importância para os programas de conservação, sendo utilizado como alternativa para otimizar e quantificar a variabilidade genética (MENEZES, 2005). Considerado por BJORNSTAD et al. (2000), o primeiro passo para a conservação de raças locais, com a utilização de técnicas moleculares, baseadas em polimorfismos de DNA para a análise da variabilidade genética. O polimorfismo de DNA pode propiciar um estudo de grandes números de marcadores e técnicas, gerando uma maior acurácia da distância genética entre indivíduos ou populações. Com estas informações de distância genética, é possível promover o direcionamento de acasalamento, visando à manutenção da variabilidade genética, por meio da escolha de indivíduos menos similares genotipicamente (EGITO, 2007; MARIZ, 2010). 5 Para a determinação da caracterização genética e da variabilidade genética, podem ser utilizados marcadores moleculares, entre eles os marcadores microssatélites (MENEZES, et al., 2006), que permitem avaliar a variabilidade genética dentro de uma população além de estimar a relação genética entre os indivíduos (MENEZES, 2005). 2.3 Marcadores moleculares O estudo da variabilidade genética progrediu nos últimos anos com os avanços de técnicas moleculares, com o surgimento de diversos tipos de marcadores de DNA (ROCHA, 2009). Segundo MENEZES (2005), a variabilidade genética pode ser detectada mediantes marcadores moleculares como RFLP (Restriction Fragment Length Polymorphism), RAPD (Radom Amplified Polymorphic DNA), AFLP (Amplified Fragment Length Polymorphisms), SNPs (Single Nucleotide Polymorphisms), mtDNA (DNA mitocondrial) e os microssatélites. Marcadores moleculares são polimorfismos resultantes de adições, substituições ou deleções de pares nitrogenadas na molécula de DNA (CURI, 2000). Pode ser definido, segundo FERREIRA & GRATTAPAGLIA (1998), como todo e qualquer genótipo molecular oriundo de um gene expresso ou de um segmento específico de DNA, sendo considerado como um marcador genético. O estudo da utilização dos marcadores moleculares tem avançado ao longo dos anos devido o desenvolvimento da aplicação enzimática de segmentos do DNA via PCR (Reação em Cadeia Polimerase). Os marcadores moleculares são loci que apresentam características detectáveis que podem diferir entre indivíduos, apresentando variações nas sequências de DNA (MENEZES, 2005). Pode ser utilizado para identificação de paternidade, diagnóstico genético precoce, mapeamento genético, estudos evolucionários, seleção, na conservação dos recursos genéticos animais, caracterização genéticas, entre outros. Apresentando algumas vantagens como a necessidade de pequenas amostras de DNA, fácil interpretação e elevada heterozigosidade (EGITO, 2007). Entretanto, cada marcador molecular possui suas especificidades, 6 mostrando algumas vantagem e desvantagens em sua utilização, como o RFLP, obtido pelo corte da fita dupla de DNA, foi à primeira técnica utilizada para detectar o polimorfismo de DNA na caracterização do genoma, ainda vem sendo bastante utilizada, mas é considerada cara e lenta. O RAPD, baseado na amplificação do DNA genômico, é considerado simples e de fácil execução, mas possui baixo conteúdo de informação genética por locus, onde apenas um alelo é detectado. A técnica de Polimorfismo de Comprimento de Fragmentos Amplificados (AFLP), utilizado para construção de mapa genético, possuem grande números de fragmentos de restrição, mas são considerados menos informativos por não diferenciar heterozigoto e homozigoto. Também na formação de mapas genéticos estão os SNPs, considerados mutações pontuais distribuídos uniformemente pelo genoma e presentes em regiões codificantes, em locais que flanqueiam os genes, além de possuir técnica de detecção bastante simples (MENEZES, 2005). O marcador molecular mtDNA é formado por uma fita simples de DNA circular, localizados no citoplasma celular, dentro da mitocôndria, considerado de fácil amplificação e permite mostrar a distância genética entre indivíduos por meio da diferença de nucleotídeos entre genomas mitocondriais, mas não e capaz de detectar o fluxo gênico mediado pelo macho devido à sua herança materna (EGITO, 2007). Quando se trabalha com a conservação dos recursos genéticos animais, na formação dos mapas genéticos, tem-se utilizado preferencialmente os marcadores microssatélites, existentes em abundância no genoma e por estarem amplamente reportados, sendo facilmente automatizados, além de permitir a análise de vários locos de uma única vez. Considerados altamente sensíveis a seleção, com a diversidade observada como consequência da deriva genética e da mutação (BRUFORD et al., 2003). 2.3.1 Microssatélites O DNA dos mamíferos é constituído em sua grande maioria, de 50 a 60% por DNA não-repetitivo (LODISH et al., 1999). De acordo com ARAÚJO 7 (2004), a fração de DNA repetitivo é composta de sequências de DNA presentes em mais de uma cópia do genoma, podendo ser dividido em DNA moderadamente repetido e DNA altamente repetitivo, de acordo com a frequência de repetição. Sendo a fração moderadamente repetida composta por elementos móveis como transposons, LINES (long interspersed elements) e SINES (short interspersed elements), além de famílias gênicas muito duplicadas. O DNA altamente repetitivo também é conhecido como DNA satélite ou DNA com repetição de sequências simples (SSR) (LODISH et al., 1999). Essas sequências repetidas em tandem, que permitem um alinhamento imperfeito durante o pareamento dos cromossomos, são divididas em minissatélites e microssatélites (MENEZES, 2005). Os minissatélites são repetições ao acaso em sequências de 10 a 60 pares de base (pb), altamente polimórficos e com elevada taxa de heterozigosidade nas populações (JEFFREYS et al., 1985). Segundo TAUTZ (1989), os microssatélites são segmentos curtos de DNA de 1 a 6 pb, repetidos aleatoriamente ao acaso por todo o genoma, sendo altamente polimórficos (devido ao número de repetições de determinada sequência) e suas repetições específicas por loci de microssatélites são facilmente detectadas com utilização de PCR. A técnica de PCR é considerada rápida e versátil que engloba a síntese enzimática in vitro de milhões de cópias de um segmento específico de DNA na presença de enzima DNA polimerase. Essa técnica se baseia no anelamento e extensão enzimática de um par de oligonucleotídeos, correspondendo a 17-25 pb, utilizados como iniciadores (primers) (MENEZES, 2005), que segundo (ALBUQUERQUE, 2005), flanqueiam a sequência repetitiva. Essa técnica envolve a desnaturação da fita dupla de DNA, o reanelamento e a nova síntese de DNA (MENEZES, 2005). Os loci de microssatélites podem ser utilizados para estabelecer grupos de ligação, mapear cromossomos, identificação de indivíduos em uma população e determinar a probabilidade de parentesco entre dois indivíduos (ARAÚJO, 2004), com isso têm sido bastante utilizados na genética de populações (ROCHA, 2009), além de permitir estimar os níveis de variabilidade genética dentro das populações e analisar as relações genéticas existentes entre elas, permitindo estimar a diversidade genética entre as populações de animais domésticos 8 ameaçados de extinção. Estes marcadores permitem a identificação de alelos por locus e cálculos da frequência alélica, o que permite estimar a distância genética entre populações e indivíduos (MENEZES, 2005). Os microssatélites podem ser utilizados para a caracterização de rebanhos e segundo a FAO devem ser utilizados no mínimo 25 loci de microssatélites para o estudo da distância genética. Na escolha desses loci devem utilizar alguns critérios como escolher marcadores de domínio público, previamente reportado em publicações científicas; não ligados; exibir herança Mendeliana; cada microssatélite deve conter no mínimo quatro alelos; microssatélites devem possuir homologia em várias espécies relacionadas; e possível de ser usado em qualquer sequenciador automático e de fácil reprodutibilidade (KUMAR, 2000). 2.4 Análises estatísticas nos estudos da variabilidade genética As análises de polimorfismos de microssatélites vêm sendo bastante utilizadas em estudos de variabilidade genética para verificar a variação genética intra e inter-populacionais, também sendo utilizado para determinar a distância ou similaridade genética entre populações (MENEZES, 2005). Para este estudo tem-se utilizado as frequências alélicas, a heterozigosidade observada (Ho) e esperada (He), conteúdo de informação polimórfica (PIC), desvio do equilíbrio de Hardy-Weinberg (EHW), probabilidade de exclusão (PE), índices de fixação ou estatísticas de F e distâncias genéticas (ROCHA, 2009). 2.4.1 Frequência alélica Ao se conhecer a frequência alélica, os loci de microssatélites altamente polimórficos podem ser úteis para identificar os indivíduos em uma população e para determinar a probabilidade de parentesco dentre dois indivíduos (ARAÚJO, 2004). 9 O número médio de alelos é considerado uma medida alternativa bastante útil para caracterizar a variabilidade genética. Na determinação do número de alelos conta-se em cada locus o número de alelos detectados, com posterior soma dos valores obtidos e divisão pelo total de loci estudado, obtendo assim a frequência alélica. Para tal determinação faz-se necessário conhecer o resultado da análise de um conjunto de indivíduos de uma determinada população para uma proteína ou para um microssatélite (Quadro 1) (PEREIRA & ALMEIDA, 2005). Frequência genotípica f(AA) = 4/10 = 0,4 f(AB) = 4/10 = 0,4 f(BB) = 2/10 = 0,2 Frequência alélica f(A) = 12/20 = 0,6 ou 60% f(B) = 8/20 = 0,4 ou 40% QUADRO 1 – Representação esquemática da separação eletoforética de uma proteína ou de um microssatélite com dois alelos comuns, A e B. AA, AB e BB correspondem aos genótipos observados em dez indivíduos, com frequências genotípicas e alélicas. Fonte: Adaptado de PEREIRA & ALMEIDA (2005). Pode-se notar que se trata de um locus polimórfico com dois alelos (A e B), com a existência de três genótipos (AA, AB e BB), apresentando frequências genotípicas (0,4; 0,4; 0,2). Com isso pode-se estimar as frequências de alelos (A e B) nessa população. Observa-se um valor de 12 genes A no total de 20 genes da amostra correspondendo a 60% de frequência alélica A e uma soma de oito genes B, representando uma frequência alélica de 40% (PEREIRA & ALMEIDA, 2005). 10 Assumindo o pressuposto do EHW, pode-se determinar a frequência alélica ou frequência gênica, onde a variância de uma frequência alélica pode ser descrita pela expressão binomial, conforme o Quadro 2 (MENEZES et al., 2006). Onde: x = frequência alélica n = número de indivíduos da amostra QUADRO 2 – Expressão binomial para determinação da variância da frequência alélica. Fonte: MENEZES et al. (2006) 2.4.2 Heterozigosidade A heterozigosidade pode ser considerada uma medida de variabilidade genética (MENEZES, 2005), sendo a heterozigosidade de um locus definida como a probabilidade de um indivíduo ser heterozigoto naquele locus, em uma população (ARAÚJO, 2004). Considera-se um locus polimórfico quando o alelo mais comum apresenta uma frequência inferior a 95% e, um marcador é considerado altamente informativo com heterozigosidade maior que 70%. Onde a heterozigosidade de um marcador é a probabilidade de um indivíduo ser heterozigoto no locus marcador, sendo dependente do número de alelos e da frequência destes alelos na população (OTT, 1992). A He e a Ho, juntamente com o número médio de alelos, são os parâmetros mais utilizados para verificar a diversidade genética dentro de uma raça, onde os índices de diversidade genética, como a heterozigosidade média de uma população pode ser utilizada para verifica o nível de endocruzamento do rebanho (EGITO, 2007). 11 A Ho é a proporção de indivíduos heterozigotos observados em uma população estudada (ROCHA, 2009). Segundo MENEZES (2005), pode ser calculado diretamente a partir dos genótipos encontrados na população para todos os loci por intermédio do programa informático GENETIX v. 4.0.4, proposto por BELKHIR (1999). A determinação da Ho para apenas um loco (Quadro 3) ou para todos os locos pode ser realizada de acordo com o Quadro 4 (McMANUS et al., 2011). Ho = Nº de heterozigotos em cada loco Nº total de indivíduos pesquisados Exemplo: Ho = 25 heterozigotos = 0,25 100 indivíduos QUADRO 3 – Determinação da Ho com apena um loco. Fonte: McMANUS et al. (2011). Exemplo com 5 locos Onde Ho = Loco 1 25/100 = 0,25 Loco 2 0/100 = 0,00 Loco 3 10/100 = 0,10 Loco 4 5/100 = 0,05 Loco 5 25/100 = 0,25 Ho = (0,25 + 0 + 0,10 + 0,05 + 0,25)/5 = 0,13 QUADRO 4 – Determinação da Ho com todos os locos. Fonte: McMANUS et al. (2011). A heterozigosidade média esperada de um locus pode ser calculada pela fórmula (Quadro 5) proposta por NEI (1973), quando este parâmetro for equivalente à heterozigosidade observada, considerando-se apenas que as populações estão em completo equilíbrio (MENEZES, 2005). 12 Onde: xi = frequência de alelo i k = número de alelos QUADRO 5 – Cálculo da heterozigosidade média esperada. Fonte: NEI (1973). A He pode ser definida como uma fração estimada de todos os indivíduos que poderiam ser heterozigótico de um loco. Diferindo da Ho, por ser uma previsão baseada na frequência alélica, sendo que o desvio observado entre a He e Ho, pode ser um indicativo da dinâmica populacional. Então a He é calculada com base na frequência de alelos, como por exemplo, para uma simples característica gênica com dois alelos, A e a, com frequências expressas em p(A) e q(a), onde p + q = 1, determinado pela equação observada no Quadro 6 (McMANUS et al., 2011). Nº de indivíduos observados com cada genótipo Frequência de genótipos observados AA = 10 A = {(2x10) + 10)}/(2x80) Aa = 10 A = 0,1875 aa = 60 a = 1 – 0,1875 = 0,8125 Frequência de genótipos esperado p² = 0.0352 2pq = 0,3046 Nota que: p² + 2pq + q² = 1 Homozigotos = p² + q² Heterozigotos = 2pq q² = 0,6602 Total = 80 indivíduos amostrados = 160 alelos QUADRO 6 – Equação que determina a frequência de três genótipos possíveis. Fonte: Adaptado de McMANUS et al. (2011). 2.4.3 Conteúdo de informação polimórfica (PIC) O PCI surgiu para quantificar o valor da informação do polimorfismo de um locus marcador, sendo considerado um parâmetro que apresenta uma dependência do número de alelos e de suas frequências. As classificações dos 13 marcadores com valores de PIC, são considerados muito informativo, mediamente informativo e pouco informativo, com valores superiores a 0,5, entre 0,25 e 0,50 e, inferiores a 0,25 respectivamente (BOLSTEIN et al., 1980). De acordo com MENEZES (2005) eles podem ser calculados de acordo com a seguinte fórmula (Quadro 7). QUADRO 7 – Fórmula para determinação de valores de PIC. Fonte: BOLSTEIN et al. (1980). 2.4.4 Equilíbrio de Hardy-Weinberg (EHW) A lei de Hardy-Weinberg é uma teoria extremamente útil para possibilitar o entendimento do que acontece ás frequências gênicas e genotípicas de populações reais, onde a lei pode ser deduzida pela observação das frequências em qualquer população de animais que transpõe uma geração de cruzamentos ao acaso. Quando isso acontece, tornam-se evidentes algumas conclusões como as frequências genotípicas na prole são determinadas exclusivamente pelas frequências gênicas nos genitores, de modo que a frequência de homozigotos é igual ao quadrado da frequência de gene relevante e a frequência de heterozigoto é igual ao dobro do produto das frequências dos genes relevantes; e as frequências gênicas e genotípicas permanecem constantes de uma geração para a seguinte, quando isso acontece é dito que está em EHW. Isso é observado em uma população de cruzamento ao acaso, em que não há seleção, mutação, migração ou deriva genética (NICHOLAS, 2011). A seleção, migração, mutação e deriva genética são os quatro fatores que podem interferir no EHW de uma população, interferindo então na variabilidade genética da população. A seleção atua de maneira negativa na variabilidade genética, pois promove a fixação de genes na mesma, com a utilização de poucos indivíduos para o acasalamento. A migração está 14 relacionada com a entrada de novos genes em uma determinada população, podendo contribuir para a erosão genética da população local, com a utilização de cruzamentos absorventes. Mutação é uma variação brusca e hereditária, que pode ocorrer em algum gene. A deriva genética é uma alteração natural na frequência de alelos que ocorre em populações pela perpetuação de genes por meio da reprodução, podendo ocasionar rápida redução da variabilidade genética e aumento de homozigosidade (MARIZ, 2010). Segundo MENEZES (2005), qualquer desvio significativo no EHW indicará que a população está subdividida, que existe uma endogamia ou fluxo de genes de outra população. Para verificar esses desvios pode-se utilizar teste de qui-quadrado, teste exato de Fisher, entre outros. O EHW pode ser matematicamente demonstrado com uma equação binominal simples (para dois alelos) ou multinominal (alelos múltiplos) e na distribuição de frequência gênica, como mostra a Quadro 8 (McMANUS et al., 2011). p² + 2pq + q² QUADRO 8 – Equação para verificação do EHW. Fonte: McMANUS et al. (2011). O EHW é testado entre gerações, como foi exemplificado por REZENDE (2010), utilizando animais da raça Angus. Foram determinadas as frequências alélicas e genotípicas destes animais e realizou-se um acasalamento ao acaso e mesma frequência genotípica para machos e fêmeas. Após o primeiro ciclo de acasalamento ao acaso, foi observado que as frequências gênicas mantiveram-se, porém as frequências genotípicas alteraram-se, mostrando que a geração P não se encontrava em equilíbrio ao se comparar com a geração 1 (Quadro 9). No segundo momento foi estimado o acasalamento ao acaso e mesma frequência genotípica entre machos e fêmeas na geração 1. Após o acasalamento, pode-se afirmar que a geração 1 encontrava-se em EHW, pois as frequência gênicas e genotípicas permaneceram constantes (Quadro 10). 15 Como saber se uma população está em EHW? Ex: Cor da pelagem em bovinos da raça Angus BB ou Bb vermelho, bb preto 400 animais BB, 400 animais Bb e 200 animais bb f(B) = (800+400)/2000 = 0,60 Frequência alélica f(b) = (400+400)/2000 = 0,40 f(BB) = 400/1000 = 0,40 Frequência genotípica f(Bb) = 400/1000 = 0,40 f(bb) = 200/1000 = 0,20 Frequência dos acasalamentos Machos (geração P) BB (0,40) Bb (0,40) bb (0,20) Geração P Acasalamento Frequência BB x BB 0,16 BB x Bb 0,32 BB x bb 0,16 Bb x Bb 0,16 Bb x bb 0,16 bb x bb 0,04 Total 1 Frequência genotípica Frequência alélica BB (0,40) 0,16 0,16 0,08 Fêmeas (geração P) Bb (0,40) 0,16 0,16 0,08 bb (0,20) 0,08 0,08 0,04 BB 0,16 0,16 0 0,04 0 0 0,36 Geração 1 Bb 0 0,16 0,16 0,08 0,08 0 0,48 Bb 0 0 0 0,04 0,08 0,04 0,16 Geração P f(BB) = 0,40 f(Bb) = 0,40 f(bb) = 0,20 f(B) = 0,60 f(b) = 0,40 QUADRO 9 – Demonstração do não EHW na geração P. Fonte: Adaptado de REZENDE (2010). Geração 1 f(BB) = 0,36 f(Bb) = 0,48 f(bb) = 0,16 f(B) = 0,60 f(b) = 0,40 16 Frequência dos acasalamentos BB (0,36) Bb (0,48) bb (0,16) Machos (geração 1) BB (0,36) 0,1296 0,1728 0,0576 Fêmeas (geração 1) Bb (0,48) 01728 0,2304 0,0768 bb (0,16) 0,0576 0,0768 0,0256 BB 0,1296 0,1728 0 0,0576 0 0 0,36 Geração 2 Bb 0 0,1728 0,1152 0,1152 0,0768 0 0,48 bb 0 0 0 0,0576 0,0768 0,0256 0,16 Geração 1 Acasalamento Frequência BB x BB 0,1296 BB x Bb 0,3456 BB x bb 0,1152 Bb x Bb 0,2304 Bb x bb 0,1536 bb x bb 0,0256 Total 1 Geração 1 f(BB) = 0,36 f(Bb) = 0,48 f(bb) = 0,16 f(B) = 0,60 f(b) = 0,40 Frequência genotípica Frequência alélica Geração 2 f(BB) = 0,36 f(Bb) = 0,48 f(bb) = 0,16 f(B) = 0,60 f(b) = 0,40 QUADRO 10 – Demonstração do EHW na geração 1. Fonte: Adaptado de REZENDE (2010). 2.4.5 Probabilidade de exclusão (PE) A PE representa a probabilidade de um animal escolhido aleatoriamente, não ser o pai ou a mãe de uma determinada cria (ROCHA, 2009). Segundo ARAÚJO (2004), a fórmula de exclusão de paternidade é baseada na probabilidade teórica de exclusão dos pais escolhidos incorretamente. A PE 1 estima a chance de exclusão quando conhecido o genótipo do filho e de um dos possíveis pais. A PE 2, é quando se tem o genótipo do filho e o genótipo de um dos verdadeiro pais. Podendo também ser calculada a probabilidade de exclusão combinada (PEC), quando de trabalha com todos os locos, sendo calculada pela formula PEC = 1 – (1-PEn)k, onde n representa o número de alelos e k a probabilidade de exclusão de cada marcador. Mas independente do tipo de PE, todas podem ser calculadas por programas informáticos como o Cervus v. 2 (ROCHA, 2009). 17 2.4.6 Índices de fixação ou estatísticas de F As variações genéticas existentes podem ser quantificadas pela estatística F, descrita pela teoria de Sewall Wright nas décadas de 40 e 50, que introduziu os parâmetros FST, FIT e FIS, podendo fornecer de maneira sumarizada a estrutura da população estudada (ARAÚJO, 2004; MENEZES, 2005). FST é o índice de fixação ou coeficiente de consangüinidade entre subpopulações, onde seu valor é utilizado para medir a distância entre subpopulações, assumindo valores entre zero e um e, quanto maior for esse valor, maior será a diferenciação entre as subpopulações estudadas. F IS refere-se ao coeficiente de consangüinidade intrapopulacional, ou seja, a redução da heterozigosidade do indivíduo com relação a sua subpopulação, ela expressa a ocorrência de acasalamentos aleatórios dentro da subpopulação. Onde valores de FIS maior que zero, significa ocorrência de endogamia, quando o F IS for menor que zero, mostra a ocorrência de acasalamento entre indivíduos não aparentados. Já o FIT indica redução da heterozigosidade de um indivíduo com relação à metapopulação (BARROS, 2009). Os valores de FIT e FIS quando se apresentam negativos ou próximos de zero, significa que há variabilidade genética na população, uma vez que existe maior número de heterozigotos e valores distantes de zero indicam maiores valores de homozigotos (OLIVEIRA, 2007). A estatística F pode ser determinada com base na heterozigosidade obtida com marcadores genéticos, por meio de equações, descritas no Quadro 11 (ROCHA, 2009). 18 Onde: HI = heterozigosidade observada obtida pela média de todos os fragmentos populacionais HS = heterozigosidade esperada de Hardy-Weinberg obtida pela média de todos os fragmentos populacionais HT = heterozigosidade esperada de Hardy-Weinberg para a população total QUADRO 11 – Equações de obtenção da estatística F. Fonte: ROCHA (2009). 2.4.7 Distância genética entre populações A determinação da distancia genética por meio de marcadores moleculares entre populações, permite a tradução entre o grau de parentesco desses animais, verificando a variabilidade genética entre eles. Sendo de fundamental importância para a conservação de recursos genéticos, pois permite definir características únicas de algumas raças ou populações (PEREIRA & ALMEIDA, 2005). A distância genética entre raças ou populações pode ser determinada por meio de fórmulas matemáticas que medem a distância genética entre indivíduos, possibilitando a construção de árvores filogenéticas ou dendrogramas (MARIZ, 2010). 19 Se a distância genética entre populações for obtida com valor igual a zero, significa que não há diferença entre as duas populações, mas se as populações não apresentarem alelos em comum nos loci, significa que os valores de distância genética deve apresentar valor máximo. Com a utilização das distâncias genéticas pode-se realizar medidas de diversidade genética ou variabilidade genética. Atualmente para os cálculos de distâncias genéticas temse utilizado fórmulas propostas por Nei (estima o número de substituições gênicas que ocorrem em genes de duas populações desde sua divergência a partir de um ancestral comum) e Reynolds (divergência entre populações é em função da deriva genética) (ARAÚJO, 2004). Independente do tipo de fórmula escolhida para estudar a variabilidade genética de uma população, todos os dados utilizados devem conter informações sobre as frequências alélicas ou genotípicas, sendo está considerada a base de qualquer que seja o método (MARIZ, 2010). As funções matemáticas devem apresentar algumas propriedades para ser considerada com distância. Onde a distância entre uma população (X) e ela mesmo dever ser igual a zero {d (X,X) = 0)}; a distância entre duas populações deve ser positiva {d (X,Y) ≥ 0} e simétrica {d (X,Y) = d (X,Y)}; se a distância satisfaz as duas anteriores, denomina-se semimétrica, apresentando uma desigualdade triangular {d (X,Y) ≤ [d (X,Z) + d (Y,X)]}, sendo assim chamada de distância métrica (ARAÚJO, 2004). Segundo MENEZES (2005), a distância métrica é a mais utilizada no estudo das populações. Para o cálculo das distâncias genéticas podem ser utilizados algumas fórmulas descritas no Quadro 12, onde xi e yi são frequência de alelo ith traçados nas respectivas populações X e Y. As fórmulas das distâncias são dadas para um loco, mas para calcular vários locos, tem-se uma soma a mais de locos e dividi-se pelo número de locos onde a somatória aparece nas expressões (ROCHA, 2009). 20 QUADRO 12 – Fórmulas para cálculos de distância genética. Fonte: ROCHA (2009). A distância padrão de Nei é a medida mais utilizada e sua distância tem se mostrado proporcional ao tempo de divergência. A distância mínima de Nei (Dm) mede o número mínimo de alelos diferentes por locus. A distância de Nei (DA) é linear com o tempo, mais apresenta um problema com dados de microssatélites de populações divergentes, devido à alta proporção de mutação e grande número de alelos. E a distância de Reynolds (DReynolds) assume que não existe mutação e que todas as mudanças observadas nas frequências são oriundas de deriva genética (MENEZES, 2005). 21 3 CONSIDERAÇÕES FINAIS Com a perda da variabilidade e da diversidade genéticas das raças locais, ao longo dos anos, surgiram programas de conservação de recursos genéticos, visando à preservação de alelos dessas raças para futuros programas de melhoramento genético. A quantificação da variabilidade genética de raças locais vem sendo realizadas por meio da caracterização genética, com o auxilio de marcadores moleculares, com maior frequência de utilização de microssatélites e por meio de análises estatísticas, sendo consideradas ferramentas fundamentais nos programas de conservação de recursos genéticos. 22 REFERÊNCIAS 1.ALBUQUERQUE, M. S. M. Marcadores moleculares e variabilidade genética em búfalos do Brasil. 2005. 111f. Tese (Doutorado em Ciências) – Universidade de São Paulo, Ribeirão Preto. 2.ARAÚJO, A. M. Paternidade e diversidade genética em caprinos no Brasil por meio de microssatélites de DNA. 2004. 104f. Tese (Doutorado em Genética e Melhoramento) – Universidade Federal de Viçosa, Viçosa. 3.BARROS, E. A. Estrutura populacional e variabilidade genética do núcleo de conservação da raça marota no Piauí. 2009. 63f. Dissertação (Mestrado em Zootecnia) – Universidade Federal Rural de Pernambuco, Recife. 4.BELKHIR, K. Logiciel sous WindowsTM pour la génétique des populations. In Laboratoire Génome, Populations, Interactions, Vol. CNRS UPR 9060. 1999. 5.BJORNSTAD, G.; GUMBY, E.; ROED, K. H. Genetic structure of Norwegian horse breeds. Journal Animal Breeding and Genetics, v.117, p. 307-317. 2000. 6.BOLSTEIN, D.; WHITE, R. L.; SKOLNICK, M.; DAVIS, R. W. Construction of genetic linkage map in man using restriction fragment length polymorphism. American Journal of Human Genetics, v.32, p.314-331, 1980. 7.BRUFORD, M. W.; Bradley, D. G.; Luikart, G. DNA markers reveal the complexity of livestock domestication. Nat. Rev. Genet., v.4, n.11, p. 900910, 2003. 23 8.COSTA, P. M.; MARTINS, C. F. Conservação de recursos genéticos animais através de biotecnicas de reprodução. Universitas Ciências da Saúde, Brasília, v. 6, n. 1, p. 39-55, 2008. 9.CURI, R. A. Teste de paternidade por microssatélites em bovinos da raça Gir. 2000. 89f. Dissertação (Mestrado em Ciências Biológicas) – Instituto de Biociência, Universidade Estadual Paulista, Botucatu. 10. CURI, R. A.; LOPES, C. R. Teste de paternidade em bovinos. Biotecnologia, Ciência e Desenvolvimento, Brasília, v. 21, p. 40-45, 2001. 11. EGITO, A. A. Diversidade genética, ancestralidade individual e Miscigenação nas raças bovinas no Brasil com base em Microssatélites e haplótipos de DNA mitocondrial: Subsídios para a conservação. 2007. 246f. Tese (Doutorado em Ciências Biológicas) – Universidade de Brasília, Brasília. 12. EGITO, A. A.; MARIANTE, A. S.; ALBUQUERQUE, M. S. M. Programa brasileiro de conservação de recursos genéticos animais. Archivos de Zootecnia, Córdoba, v. 51, n.193-194, p. 50, 2002. 13. FERREIRA, M. E.; GRATTAPAGLIA, D. Introdução ao uso de marcadores moleculares em análises genéticas. 3.ed. Brasília: Embrapa-Cenargen, 1998. 220p. 14. JEFFREYS, A. J.; WILSON, V.; THEIN, S. L. Hypervariable “minisatellite” regions in human DNA. Nature, v.314, p.67-73, 1985. 15. GAMA, L. T. Manutenção da variabilidade genética em programas de seleção. In: I Simpósio Internacional de Conservação de Recursos Genéticos (Raças Nativas para o Semi-árido), Recife-PE. Anais... p.38-44, 2004 24 16. KUMAR, D. DNA markers for the differentiation of farm animal breeds. In: SAHAI, R.; VIJH, R. K. Domestic Animal Diversity: conservation and sustainable development. Karnal: SI Publications, 2000. p.305-312. 17. LODISH, H.; BERK, A.; ZIPURSKY, S. L.; MATSUDAIRA, P.; BALTIMORE, D.; DARNELL, J. Molecular cell biology. W. H. Freeman and Company. 4. ed., 1999. 1084p. 18. McMANUS, C.; PAIVA, S.; CORRÊA, P. S.; SEIXAS, L.; MELO, C. B. Estatísticas para descrever genética de populações. 2011. Disponível em <www.animal.unb.br>. Acesso em 19 de abril de 2011. 19. MALHADO, C. H. M.; CARNEIRO, P. L. S.; PEREIRA, D. G.; MARTINS FILHO, R. Progresso genético e estrutura populacional do rebanho nelore do Estado da Bahia. Pesquisa Agropecuária Brasileira, Brasília, v. 43, n. 9, p. 1163-1169, 2008. 20. MARIZ, T. M. A. Caracterização zoométrica, estrutura populacional e índices reprodutivos da raça Sindi no Brasil. 2010. 121f. Tese (Doutorado em Zootecnia) – Universidade Federal da Paraíba, Areia. 21. MENEZES, M. P. C.; MARTINEZ, A. M.; RIBEIRO, M. N.; PIMENTA FILHO, E. C.; BERMEJO, J. V. D. Caracterização genética de raças caprinas nativas brasileiras utilizando-se 27 marcadores microssatélites. Revista Brasileira de Zootecnia, Viçosa, v. 35, n. 4, p. 1336-1341, 2006. 22. MENEZES, M. P. C. Variabilidade e relações genéticas entre raças caprinas nativas brasileiras, ibéricas e canárias. 2005. 110f. Tese (Doutorado em Produção Animal) – Universidade Federal da Paraíba, Universidade Federal Rural de Pernambuco, Universidade Federal do Ceará, Areia. 25 23. NEI, M. Analysis of gene diversity in subdivided populations. Proceedings of the National Academy of Sciences, v.70, p.3321-3323, 1973. 24. NICHOLAS, F. W. Introdução à genética veterinária. 3.ed. Porto Alegre: Artmed, 2011. 347p. 25. OLIVEIRA, J. C. V. Diversidade genética em caprinos. 2007. 104f. Tese (Doutorado em Produção Animal) – Universidade Federal Rural de Pernambuco, Recife. 26. OTT, J. Strategies for characterizing highly polymorphic markers in human gene mapping. American Journal of Human Genetics. v. 51, pp. 283290, 1992. 27. PEREIRA, A. B.; ALMEIDA, N. F. Genética, biotecnologia e agricultura. 1.ed. Porto: SIG, 2005. 96p. 28. QUEIROZ, S. A.; ALBUQUERQUE, L. G.; LANZONI, N. A. Efeito da endogamia sobre características de crescimento de bovinos da raça Gir no Brasil. Revista Brasileira de Zootecnia, Viçosa, v. 29, n. 4, p. 1014-1019, 2000. 29. RANGEL, P. N.; ZUCCHI, M. I.; FERREIRA, M. E. Similaridade genética entre raças bovinas brasileiras. Pesquisa Agropecuária Brasileira, Brasília, v. 39, n.1, p. 97-100, 2004. 30. REZENDE, F. M. Genética de populações. 2010. Disponível em <http://www.usp.br/gmab/discip/>. Acesso em 19 de abril de 2011. 31. ROCHA, L. L. Estudo genético de populações caprinas locais e exóticas através de marcadores microssatélites. 2009. 151f. Tese (Doutorado em Zootecnia) – Universidade Federal Rural de Pernambuco, Universidade Federal da Paraíba, Universidade Federal do Ceará, Recife. 26 32. RON, M.; BLANC, Y.; BAND, M.; EZRA, E.; WELLER, J.I. Misidentification rate in the Israeli dairy cattle population and its implications for genetic improvement. Journal of Dairy Science, Champaign, v. 79, p. 676-681, 1996. 33. SILVA, M. V. G. B.; FERREIRA, W. J.; COBUCI, J. A.; GUARAGNA, G. P.; OLIVEIRA, P. R. P. Efeito da endogamia sobre características produtivas e reprodutivas de bovinos do ecótipo Mantiqueira. Revista Brasileira de Zootecnia, Viçosa, v. 30, n. 4, p. 1236-1242, 2001. 34. TAUTZ, D.; TRICK, M.; DOVER, G. A. Cryptic simplificity in DNA is a major source of genetic variation. Nature, v.322, p.652-656, 1986.