Impacto do tamanho amostral na estimativa de diversidade genética

Propaganda
56º Congresso Brasileiro de Genética
Resumos do 56º Congresso Brasileiro de Genética • 14 a 17 de setembro de 2010
Casa Grande Hotel Resort • Guarujá • SP • Brasil
www.sbg.org.br - ISBN 978-85-89109-06-2
163
Impacto do tamanho amostral na estimativa de
diversidade genética a partir de sequências de DNA
Costa, LS¹; Stefenon, VM¹; Tatsch, GL¹
¹ Universidade Federal do Pampa – Campus São Gabriel
[email protected]
Palavras-chave: marcadores moleculares, polimorfismo, DNA, coalescência, variabilidade genética.
Introdução: Os avanços tecnológicos desde o início do século permitiram, através da implementação dos marcadores
moleculares, uma grande evolução nos estudos que visam acessar a variabilidade genética em populações de
plantas. A maioria desses estudos objetiva estabelecer um padrão molecular para uma determinada espécie em
questão, geralmente através de marcadores SSR e SNPs, devido ao seu alto grau de polimorfismo. No entanto,
para que sejam obtidas estimativas mais próximas da realidade, torna-se necessário estabelecer um número
mínimo de indivíduos a serem analisados. Existem poucos estudos disponíveis a respeito do número mínimo de
plantas que devem ser analisadas para evitar o estabelecimento de um padrão molecular que não represente a
diversidade genética da espécie em estudo, pois mesmo em espécies que se reproduzem por autofecundação é
comum encontrar variabilidade. Objetivo: Analisar o impacto do tamanho amostral na estimativa do número de
sítios segregantes (Theta_S) e do número médio de diferenças par-a-par (pi) em sequências de DNA. Métodos: Uma
população constituída de 10.000 indivíduos alógamos foi simulada utilizando-se o programa Simcoal. Amostrouse aleatoriamente sub-sets com 25, 50, 100 e 500 indivíduos (100 repetições para cada sub-set) e estimativas de
Theta_S e de pi foram calculadas a partir de sequências de 300 bases de cada indivíduo, utilizando o software
Arlequim. Resultados: A população total (10.000 indivíduos) apresentou valores de pi=49,39 e de Theta_S=30,65.
Estas estimativas representam os valores reais da população. O valor médio das 100 amostragens independentes
de cada sub-set para as estimativas foram: pi=48,84 e Theta_S=46,11 para 25 indivíduos amostrados; pi=49,35 e
Theta_S=49,44 para 50 indivíduos amostrados; pi=49,35 e Theta_S=51,18 para 100 indivíduos amostrados e;
pi=47,18 e Theta_S=44,17 para o sub-set de 500 indivíduos amostrados. Conclusões: Os resultados sugerem que
estimativas de pi não são influenciadas de forma significativa pelo tamanho amostral. Em conformidade com
a literatura especializada, que demonstra que o aumento no tamanho amostral não é proporcional ao aumento
no número de sítios polimórficos, estimativas de Theta_S oscilaram bastante, sendo a estimativa obtida com
500 indivíduos mais próxima do valor real que a estimativa obtida com 50 indivíduos. Este fato demonstra a
necessidade de cautela ao se analisar a diversidade genética populacional baseado no número de sítios segregantes.
Apoio: FAPERGS, CNPq e UNIPAMPA.
Download