GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA & SÍNTESE Departamento de Ecologia, ICB, Universidade Federal de Goiás, Brasil ([email protected]) Programação 1. Introdução / Aspectos Operacionais 2. Um breve historico e definição do campo de estudo 3. Padrões e Processos 4. Abordagens Espacialmente Implícitas 5. Abordagem Espacial Explicita: definição de “espaço” 6. Introdução à estatistica espacial: Teste de Mantel 7. Autocorrelação espacial 8. Regressão Espacial 9. Descontinuidade Espacial 10. Nicho Ecologico, Distribuição geográfica e variação genética Aspectos Operacionais 1. Aulas Teóricas (www.ecoevol.ufg.br/diniz) - Analise & Estatistica Espacial - Análise de Paisagem (Dr Ricardo Dobrovolski) 2. Aulas “práticas” - Softwares (SAM) - Outros programas (Jacqueline Silva) 3. Seminários & Analise Cienciométrica “Background”: Genética -Teoria Básica de Genética Populacional -Marcadores moleculares (?) Estatística & Análise de Dados - Estatística Descritiva & Inferência - Correlação, Modelos lineares (?) e Análise Multivariada (?) INTRODUÇÃO & BREVE HISTÓRICO Estatistica Espacial e Inferências Teoria Ecológica & Evolutiva Genética & Espaço Geográfico Analise de Dados INTRODUÇÃO & BREVE HISTÓRICO Estatistica Espacial e Inferências Teoria Ecológica & Evolutiva Genética & Espaço Geográfico Analise de Dados GENETICA POPULACIONAL (Segundo Hedrick) Sp = (pq / 2w ) (dw/dp) Teórica Experimental Empírica GENETICA POPULACIONAL (Segundo Hedrick) Sp = (pq / 2w ) (dw/dp) Teórica Experimental Empírica O inicio da biologia molecular ou genética molecular Richard Lewontin A teoria neutra da Evolução Molecular A estrutura do DNA Marcadores moleculares... Perspectivas GENÉTICA GEOGRAFICA B. K. Epperson Leitura obrigatória... GENÉTICA ECOLOGIA Origens da Genética Geográfica Robert Sokal Sokal, R. R. & Oden, N. L. 1978. Spatial autocorrelation in biology: 1. methodology 2. Some biological implications and four applications of evolutionary and ecological interest Biological Journal of Linnean Society 10: 199-249. B. K. Epperson Genética em Escala da Paisagem (Landscape Genetics) Landscape ecology is a sub-discipline of ecology and geography that address how spatial variation in the landscape affects ecological processes such as the distribution and flow of energy, materials and individuals in the environment (which, in turn, may influence the distribution of landscape "elements" themselves such as hedgerows). Landscape ecology typically deals with problems in an applied and holistic context GENÉTICA DA PAISAGEM Paisagem “natural” (barreiras ao fluxo gênico, estrutura metapopulacional) GENÉTICA EVOLUTIVA (inferência de processos de microevolução) Paisagem “antropizada” GENÉTICA DA CONSERVAÇÃO ADAPTATIVA Variação genética NEUTRA surrogate Variabilidade Genética “ISOLAMENTO” Marie-Josee Fortin Helen Wagner GENÉTICA GEOGRÁFICA GENÉTICA DA PAISAGEM Genética da Paisagem como caso particular de Genética Geográfica ? (contexto antrópico) GENÉTICA GEOGRÁFICA GENÉTICA DA PAISAGEM Ecologia da Paisagem (contexto antrópico) GENÉTICA DA CONSERVAÇÃO FILOGEOGRAFIA Sentido amplo – relação entre padrões espaciais e estruturas filogenéticas Sentido estrito – padrões espaciais em linhagens uni-parentais (e.g. mtDNA) Sykes A importância da genética para a conservação da biodiversidade... Ações para conservação Conhecimentos teóricos & metodológicos Modelando o Nicho Ecológico e a Distribuição das Espécies Case: 3530 S9 Longitude (X Centroid): -57.5 Latitude: -1 S9: 1 S > 0.9 Case: 2623 maxent Longitude (X Centroid): -71.5 1 Latitude: -3 maxent: 0.942 0.95 0.9 0.85 Case: 2939 S7 Longitude (X Centroid): -67.5 Latitude: 3 S7: 1 0.8 0.75 0.7 0.65 0.6 S > 0.7 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 Case: 3125 0.05 0 Mapas de probabilidade de ocorrencia S > 0.5 S5 Longitude (X Centroid): -64.5 Latitude: -15 S5: 1 Genética de Populações (PGMP) ou Genética Evolutiva (PGBM) Microsatelites: Evolução & aplicações (PGBM) Filogeografia (EcoEvol) GENÉTICA GEOGRÁFICA Métodos de Análise de Fluxo Gênico em Plantas (PGMP) Analise Espacial (EcoEvol) Macroecologia (EcoEvol) Biologia da Conservação (EcoEvol) Analise Multivariada (EcoEvol) Biometria de Marcadores (PGMP) Curso com Ênfase em Métodos... PADRÕES & PROCESSOS Teoria básica em genética de populações Componentes espaciais dos processos evolutivos Teoria sintética Darwinismo Neodarwinismo Mendelismo Principios da Genética Populacional Teorema fundamental da seleção natural Sp = (pq / 2w ) (dw/dp) Teoria do equilíbrio deslocante (paisagem adaptativa) TEOREMA DE HARDY-WEINBERG Godfrey Harold Hardy (1877-1947) Wilhelm Weinberg (1862-1937) O equilíbrio de H-W é um modelo nulo contra o qual são contrastados os efeitos dos diferentes processos evolutivos: -Seleção Natural; Efeitos determinísticos ou extrínsecos -Mutação; -Deriva genética; Efeitos estocásticos ou intrínsicos (à estrutura) -Fluxo gênico. Os balanços entre os processos estocásticos são mais importantes aqui, pois envolvem processos neutros, dados os marcadores moleculares mais frequentemente utilizados para descrever a estrutura genética populacional Dadas as frequencias alélicas, p = Np / 2N e q = Nq / 2N Onde Np e Nq são o numero de cópias dos alelos p e q, pode-se definir a heterozigose esperada (He) sob H-W por 2pq Sob H-W, o indice de fixaçao F = 0 Contando-se os heterozigotos na populações, obtèm a heterozigose observada (Ho) Se o F > 0, é porque há um déficit de heterozigotos (há mais homozigotos) Vários alelos...e média de locus He é uma medida da diversidade genética Efeito da deriva Genética com diferentes N Efeito da deriva Genética com diferentes frequencias iniciais Declínio da heterozigose por deriva O componente espacial... O efeito combinado dos 3 processos estocásticos: mutação, deriva e fluxo Sewall Wright 1931 Estatísticas-F e estrutura genética populacional Valor = 0 Valor = 1 FST FIS f FIS 0 FIT F FST 0,33 FIT 0,33 Wright’s FST Análise de Variância de Frequencias Alélicas (P) Kent Holsinger AMOVA RST Holsinger’s Bayesian ST GST QST (fenótipo) Bruce Weir Wright’s FST Análise de Variância de Frequencias Alélicas (P) AMOVA RST Holsinger’s Bayesian ST GST Valor “global” AST QST e PST (fenótipo) Valores “para-par” (n * n, simétrica) Keith Crandall Uma outra abordagem... Considere dados de 3 alelos em 1 locus para 2 populações (subpopulações 1 e 2) A probabilidade de dois alelos iguais serem amostrados dentro de uma população 1 é A probabilidade de dois alelos iguais serem amostrados dentro de uma população 2 é A probabilidade total de dois alelos iguais serem amostrados entre as 2 populações é Assim, a identidade genética entre 2 populações é dada pela probabilidade de amostrar o mesmo alelo nas 2 dividida pelo produto das probabilidades de encontrar o mesmo alelo em cada uma delas independentemente O logaritmo das identidade é a chamada Distância Genética de Nei (1973, 1978) Masatoshi Nei Artigo mais citado do Am.Nat. UMA ABORDAGEM EVOLUTIVA para as distâncias genéticas de Nei Modelos heurísticos que “capturam” os processos Movimento Browniano No Excel, na célula A1=0... =A1+(ALEATÓRIO()-0.5) Distribuição uniforme (0-1) 15 réplicas do mesmo processo ao longo do tempo Distribuição de Y (frequencia alélica) após um tempo t... Divisão de populações (gerando uma estrutura filogenética) 50 time-steps 50 time-steps Speciation 50 time-steps 100 time-steps 50 time-steps 100 time-steps 50 time-steps 100 time-steps 50 time-steps 50 time-steps 50 time-steps Expected VCV matrix 1 0.333 0 0 0 1 0 0 0 1 0.333 0.333 1 0.666 1 Aqui as populações divergem independentemente Aqui há subdivisão de populações Se esse processo é repetido muitas vezes... Como????? trait1 trait2 trait3 trait4 trait5 trait6 trait7 trait8 trait9 trait10 trait11 trait12 trait13 trait14 trait15 trait16 trait17 trait18 trait19 trait20 sp1 sp2 sp3 sp4 sp5 -0.928 -3.010 0.246 -0.433 -0.422 -2.914 0.788 2.486 3.308 1.628 6.631 2.590 4.200 2.394 3.227 -6.380 -5.593 -2.074 1.013 -0.208 -0.593 9.725 0.968 3.546 2.101 2.627 -4.549 1.953 -1.208 3.152 4.411 -2.070 0.513 5.043 6.609 -1.565 -9.055 -1.118 2.523 -3.547 1.329 1.315 5.062 -1.551 -0.145 -0.292 -1.601 -2.935 -5.727 -5.107 -1.430 -3.896 -2.494 0.280 -0.925 -0.585 2.413 -1.444 -1.901 -0.052 -2.029 -2.192 -3.938 -2.575 -5.659 -1.281 -1.863 3.187 -0.340 -1.974 4.104 9.415 -0.205 4.210 7.856 -2.212 -3.050 -4.495 -6.210 -6.638 -0.649 -7.015 -0.971 -2.823 2.670 -3.046 0.229 -4.418 -1.767 1.183 1.134 1.465 0.842 -2.105 0.011 1.241 -1.303 -0.091 4.491 0.607 ... trait1000 ... -3.246 ... 0.329 ... -4.418 ... -2.767 Each line is a simulation that gives Y values for each species... Calcule uma matriz de correlação de Pearson entre as populações Matriz “Observada” (10000 “loci”) -1.827 1 0.539 0.341 0.354 0.274 1 0.350 0.360 0.285 1 0.333 0.333 1 0.666 1 D = -ln (I) Nei’s genetic distances Where I = Σxiyi / (Σxi2 Σyi2)0.5 Masatoshi Nei A identidade de Nei é, portanto, a correlação de Pearson entre as populações “ao longo” das frequencias alélicas... 1 0.539 1 0.341 0.350 1 0.354 0.360 0.333 1 0.274 0.285 0.333 0.666 1 Expected VCV (standardized) matrix 1 0.333 0 0 0 1 0 0 0 1 0.333 0.333 1 0.666 1 0.7 0.6 r = 0.948 OBSERVED 0.5 0.4 0.3 0.2 0.1 0.0 0.0 Observed matrix (10000 “traits”) 1 0.539 0.341 0.354 0.274 1 0.350 0.360 0.285 1 0.333 0.333 1 0.666 0.1 0.2 0.3 0.4 0.5 EXPECTED 0.6 This is the correlation among “phenotypes” 1 0.7 Mais estruturação na subdivisão... 100 time-steps 95 time-steps 100 time-steps 5 time-steps 100 time-steps 95 time-steps 75 time-steps 25 time-steps Expected VCV (standardized) matrix 1 0.487 0 0 0 1 0 0 0 1 0.487 0.487 1 0.872 1 Expected VCV (standardized) matrix 1 0.487 0 0 0 1 0 0 0 1 0.487 0.487 1 0.872 0.9 1 0.8 r = 0.991!!!! OBSERVED 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 Observed matrix (10000 “traits”) 1 0.425 0.042 0.044 0.061 1 0.046 0.098 0.095 1 0.569 0.497 1 0.861 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 EXPECTED 1 A identidade genética (I) apresenta uma relação LINEAR com o tempo de subdivisão... Wright’s FST Análise de Variância de Frequencias Alélicas (P) AMOVA RST Holsinger’s Bayesian ST Valor “global” GST QST (fenótipo) Distancias HETEROGENEIDADE ESPACIAL Modelos de estrutura populacional espacialmente explícitos ISOLAMENTO-POR-DISTÂNCIA em populações contínuas D = 99 D=3 GRADIENTES ESPACIAIS “clina” -> “Gradiente” espacial -Declínio das frequencias alélicas no espaço geográfico -Seleção natural (correlação com fatores ambientais); -Expansão de range, difusão e “allelic surfing”; -Contato secundário OBS: IBD não gera clines... Heterogeneidade espacial sem padrão espacial Heterogeneidade espacial com padrão espacial OS DADOS EMPÍRICOS Frequencias alélicas “Populações” Relação espacial entre objetos Marcadores Moleculares (Genotipos) Individuos Outros descritor es Núcleo de excelência em genética e conservação de espécies do Cerrado – GECER (PRONEX - CNPq/FAPEG ) Genética geográfica e planejamento regional para conservação de recursos naturais no Cerrado – GENPAC (PRÓ-CO - CNPq/FAPEG ) Biologia da Conservação Macroecologia Mariana Telles Genética Molecular Guilherme Oliveira Ricardo Dobrovolski Ecoinformática Genética de Populações Rosane Collevatti Genética Quantitativa José Alexandre Diniz-Filho João Carlos Nabout Evolução Melhoramento Silvicultura Thannya Soares Ronaldo V Naves Lázaro J Chaves Organismo “modelo” inicial do nosso projeto... Dipteryx alata (“Baru”) Thannya Soares Genética e Conservação de Dipteryx alata (Fabaceae) - Baru • Polinizada por abelhas • Dispersão barocórica e por animais Genética e Conservação de Dipteryx alata (Fabaceae) - Baru Genética e Conservação de Dipteryx alata (Fabaceae) - Baru - 25 subpopulações naturais (644 indivíduos) - 8 marcadores microssatélites Genética e Conservação de Dipteryx alata (Fabaceae) - Baru Variabilidade: - 2,8 alelos/loco (variando de 2 a 6) - He = 0,43 Então, há heterogeneidade espacial...E os padrões? ABORDAGENS ESPACIAIS ESPACIALMENTE IMPLICITAS Ecologia & Genética ESPACIALMENTE EXPLICITAS