ISSN 1984-8218 Cadeias de Markov aplicadas à Genética Camila Nogueira Gonçalves* Marcela Pimenta Furtado* Departamento de Matemática, FAMAT, UFU 38400-902, Uberlândia, MG E-mail: [email protected], [email protected] Marcos Antônio da Câmara** Universidade Federal de Uberlândia – Faculdade de Matemática 38400-902, Campus Santa Mônica, Uberlândia, MG E-mail: [email protected] RESUMO A genética possibilita prever probabilisticamente as características de uma população. Utiliza-se Cadeias de Markov para uma modelagem probabilística dessa população pelo fato de suas características poderem ser representadas em estados discretos e a probabilidade de transição dessas características, em períodos também discretos, depender do estado inicial da população (fenômenos como migração, mutação e seleção natural não serão abordados). Um fenômeno que possa ser classificado em estados finitos e discretos chama-se processo de Markov cuja probabilidade de transição entre tais estados, em um intervalo de tempo também discreto, depende apenas do estado corrente e do estado seguinte. A sequência de estados seguindo esse processo é denotada Cadeia de Markov. Este estudo tem como base alguns conceitos da genética clássica, criada por Gregor Mendel (1822 – 1884). De acordo com a genética clássica, algumas características das plantas e dos animais são determinadas por um par de genes, cada um dos quais podendo ser de dois tipos, denotados por A e a. Existem três genótipos possíveis: AA, Aa (que equivale a aA) e aa. O indivíduo chama-se dominante (D) se tem o genótipo AA, heterozigoto (H) se tem genótipo Aa e recessivo (R) se tem o genótipo aa. Em alguns casos, esses três genótipos resultam em três características diferentes e, em outros, AA e Aa resultam na mesma característica. A previsão de genótipos em uma população pode ser bastante útil quando se faz necessária a monitoração e o possível controle de algumas características por seleção artificial, sejam elas desejáveis ou não, como as doenças genéticas. As cadeias de Markov podem ser úteis nesse tipo de previsão. O primeiro passo será definir os estados, que no caso serão os genótipos D, H e R, e obter a probabilidade de cada genótipo para cruzamentos entre indivíduos DxD, DxH, DxR, HxH, HxR e RxR. As probabilidades desses cruzamentos são exibidas na tabela seguinte. Genótipo/Cruzamento DxD DxH DxR HxH HxR RxR D(AA) 1 0,5 0 0,25 0 0 H(Aa) 0 0,5 1 0,5 0,5 0 R(aa) 0 0 0 0,25 0,5 1 Com base nas probabilidades, o segundo passo será construir uma Cadeia de Markov para fazer uma previsão de genótipos para três períodos, ou seja, após três gerações. Para isso, será necessário elaborar matrizes de transição formadas por vetores de probabilidade dos *Bolsista MEC/SESu **Professor Orientador e Tutor do PET Matemática - UFU 285 ISSN 1984-8218 cruzamentos com indivíduos de genótipo H, depois, com indivíduos de genótipo D e, por último, com indivíduos de genótipo R. Segue abaixo o exemplo de como essas matrizes de transição formadas por vetores de probabilidade são montadas e analisadas. Esse método de construção das matrizes de transição é mostrado em [1]. Para isso, utilizaremos o cruzamento com indivíduos do genótipo H. A matriz de transição abaixo é formada pelos vetores de probabilidade dos cruzamentos DxH, HxH e RxH, respectivamente. M= Considerando que, no processo de seleção artificial, a primeira geração a cruzar com o genótipo H seja formada exclusivamente por indivíduos homozigotos dominantes, a previsão para o período de três gerações é dada pela equação, seguindo o processo descrito em [2]: O vetor de probabilidade resultante, considerando após três gerações com a primeira de genótipos D e os outros cruzamentos sempre envolvendo um genótipo H, fornece as indicações de que há a probabilidade de 31% da terceira geração ter genótipo D, 50% ter genótipo H e 19% ter genótipo R. Sobre esse método de previsão utilizado, deve-se fazer as seguintes considerações: 1) Após a primeira geração, é provável que surjam genótipos diferentes dos inicialmente adotados, nesse exemplo, os genótipos D e H. 2) Embora a matriz de transição permita que todos os genótipos sejam representados, ela traz apenas as probabilidades de cruzamento com um genótipo pré-determinado. 3) Para que o resultado encontrado seja válido, é preciso que haja controle dos cruzamentos de forma que um dos genótipos, em cada cruzamento, seja do tipo prédeterminado. Porém, nem sempre o controle total dos cruzamentos é possível. Palavras-chave: Cadeias de Markov, Genética, Biomatemática Agradecimentos Os autores agradecem à FAPEMIG pelo apoio financeiro. Referências [1] A. Howard, C. Rorres, “Álgebra Linear e Aplicações”, Bookman, Porto Alegre, 2001. [2] J. L. Boldrini, “Álgebra Linear”, Harbra, São Paulo, 1980. 286