IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Evolução, Genética e Computação 1 Base biológica 1.1 Hereditariedade (BURNS, 1983) A história da genética é fascinante principalmente pela velocidade com que se evoluiu de observações a demonstrações experimentais dos mecanismos fundamentais envolvidos. Na antiguidade, defendia-se a idéia de que o sexo era determinado pela procedência do líquido seminal no homem: se do testículo direito sexo masculino; se do testículo esquerdo sexo feminino. A mulher era vista apenas como uma “incubadeira” neste processo. Tópico 2 Evolução, Genética e Computação 1 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 1672: descoberta do óvulo pelo holandês Graaf as fêmeas de mamíferos também apresentam ovulação! 1675: descoberta do espermatozóide pelo holandês Von Leeuwenhoeck. 1866: idéias efetivas acerca da hereditariedade monge agostiniano Gregor Mendel (República Tcheca). Ele atacou o problema de modo simples e lógico, escolheu material adequado, concentrou-se em poucas características contrastantes, desenvolveu um programa de cruzamentos controlados, tratou os resultados de forma eficiente e sugeriu fatores causais (hoje chamados de genes) como sendo os responsáveis pelos fenômenos observados. Ninguém havia chegado tão perto da compreensão real da hereditariedade (ficou faltando, em essência, apenas elucidar os mecanismos celulares envolvidos), mas foram necessários mais de 30 anos para que a comunidade científica se desse conta da importância e eficácia desses resultados. Tópico 2 Evolução, Genética e Computação 2 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux É curioso constatar que um dos fatores que dificultaram a assimilação dos resultados de Mendel foi justamente o intenso debate reinante nos meios científicos após a divulgação da teoria de seleção natural de Darwin. 1900: redescoberta das idéias de Mendel de forma independente por três pesquisadores. 1a lei de Mendel: Cada caráter é condicionado por dois fatores. Eles separam-se na formação dos gametas, passando apenas um fator por gameta. Tópico 2 Evolução, Genética e Computação 3 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 1.2 Do Darwinismo ao Neo-Darwinismo DARWIN (1859) sugeriu que, para haver evolução, é necessário que exista uma população de indivíduos sujeita a: 1. Reprodução com herança; 2. Variação; e 3. Seleção Natural. Embora Darwin tenha considerado essas hipóteses como suficientes para explicar a origem das espécies, hoje elas são aceitas apenas como suficientes para explicar os processos ecológicos. Na época de Darwin (meados de 1800), entretanto, sabia-se muito pouco sobre os processos de reprodução e praticamente nada sobre genética. Além disso, não havia um bom entendimento sobre como operam os mecanismos de seleção natural. Tópico 2 Evolução, Genética e Computação 4 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux A união da genética com diversos conceitos e teorias sobre seleção natural leva ao que hoje é chamado de Neo-Darwinismo. Sobre a Seleção Natural O princípio da seleção natural indica que os indivíduos cujas variações se adaptam melhor ao ambiente terão maior probabilidade de sobreviver e se reproduzir. A seleção natural é probabilística, e seu alvo primário é o indivíduo, embora seu efeito resultante vá se manifestar na espécie como um todo. A espécie é o beneficiário final do processo evolutivo (MAYR, 1988). 1.3 Terminologia biológica A terminologia biológica a ser empregada representa uma analogia com as entidades biológicas reais, em que as entidades computacionais corresponderão invariavelmente a estruturas bem mais simples que seus equivalentes biológicos. Tópico 2 Evolução, Genética e Computação 5 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Célula órgão sistema organismo população comunidade ecossistema Comunidade Órgão Sistema Célula Ecossistema População Organismo Nível fisiológico Nível ecológico Figura 1: Divisão hierárquica dos sistemas biológicos (de Castro & Timmis, 2002). Célula: unidade estrutural básica dos seres vivos, que se compõe de numerosas partes, sendo as fundamentais a parede ou membrana, o protoplasma e o núcleo. A célula é a menor unidade de matéria viva que pode existir de maneira independente, e ser capaz de se reproduzir. Toda célula de um mesmo organismo Tópico 2 Evolução, Genética e Computação 6 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux contém o mesmo conjunto de um ou mais cromossomos. Nos seres humanos, cada célula somática (não-germinativa) contém 23 pares de cromossomos. Cromossomo: estrutura nucleoprotéica formada por uma cadeia de DNA, sendo a base física dos genes nucleares, os quais estão dispostos linearmente. Cada espécie apresenta um número característico de cromossomos. Quando os cromossomos são arranjados em pares (cada cromossomo proveniente de um dos pais, embora haja exceções), os respectivos organismos são chamados diplóides. Organismos cujos cromossomos não se apresentam aos pares são chamados haplóides. Tópico 2 Evolução, Genética e Computação 7 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux gene gene gene Figura 2: Ampliação de um organismo para enfocar o material genético. Organismo célula cromosomo gene DNA Genes: blocos funcionais de DNA, os quais codificam uma proteína específica. É a denominação que damos hoje ao fator mendeliano. Cada gene está localizado em uma posição (locus) particular do cromossomo. Quando dois genes se comportam segundo a 1a lei de Mendel, são ditos alelos, e se encontram no mesmo locus de dois cromossomos homólogos. Para exemplificar em termos muito simples, é possível pensar um gene como o responsável pela definição de uma característica Tópico 2 Evolução, Genética e Computação 8 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux do indivíduo, como a cor dos olhos. As diferentes colorações (azul, castanho etc.) correspondem a alelos. No entanto, também existem pontos de vista muito mais refinados (DAWKINS, 1990). Como muitos organismos apresentam células com mais de um cromossomo, o conjunto de todos os cromossomos compõe o material genético do organismo, denominado genoma. Cromosomo diagramático Locus Alelos: {A, B} A B A A B A B B A B Gene Figura 3: Ilustração pictórica de um cromosomo salientando o locus, os genes e os alelos. Tópico 2 Evolução, Genética e Computação 9 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux gene produto caráter epistasia: interferência funcional entre genes localizados em posições diferentes. pleiotropia: quando um único gene afeta múltiplas características fenotípicas. poligenia: quando uma única característica fenotípica é determinada pela interação simultânea de muitos genes. Figura 4: Pleiotropia e poligenia. Tópico 2 Evolução, Genética e Computação 10 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 1.4 Fenótipo x Genótipo (FOGEL, 1995) 1909: introdução dos conceitos de genótipo e fenótipo. Genótipo: representa o conjunto específico de genes do genoma. Neste caso, indivíduos com o mesmo genoma são ditos terem o mesmo genótipo. Fenótipo: é a manifestação do genótipo no comportamento, fisiologia e morfologia do indivíduo, como um produto de sua interação com o ambiente. A seleção natural opera somente na expressão fenotípica do genótipo (MAYR, 1970; HARTL & CLARK, 1989). Para modelar este fenômeno, ATMAR (1992) estendeu um resultado da literatura baseado no emprego de dois espaços de estados: 1. G: espaço genotípico (representa a informação); 2. P: espaço fenotípico (representa o comportamento). que permitem a definição de quatro funções, onde I representa um conjunto de efeitos do ambiente (entrada), na forma: Tópico 2 Evolução, Genética e Computação 11 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux f1: I G P (epigênese); f2: P P (seleção); f3: P G (sobrevivência genotípica); f4: G G (variação genética). A adaptação evolutiva ocorre a partir da aplicação iterativa dessas funções. Tópico 2 Evolução, Genética e Computação 12 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux g2 f4 g1 Espaço genotípico G g1 f1 f3 f2 Espaço fenotípico F p1 p2 Figura 5: Evolução explicada através de mapeamentos entre os espaços genotípico e fenotípico. Tópico 2 Evolução, Genética e Computação 13 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 1.5 Adaptação evolutiva Sob um processo de competição por recursos limitados e seleção natural, indivíduos mais bem adaptados têm uma maior probabilidade de sobreviver e propagar seu material genético. A adaptação (fitness) pode ser definida como a probabilidade de sobrevivência e reprodução (viabilidade), ou então como uma função do número de descendentes que o organismo produziu (fertilidade). ATMAR (1994) indicou que uma medida singular da adaptação evolutiva é dada pela habilidade de uma população antecipar seu ambiente e agir no sentido de atender aos requisitos associados às predições realizadas. Uma alternativa a esta definição de medida de adaptação é a idéia simplificada de que a adaptação pode ser medida em termos de mudanças na freqüência gênica dentro da população (FISHER, 1930). Esta definição despreza os efeitos importantes de pleiotropia e poligenia, ao assumir a relação (um gene) (uma característica) para descrever o relacionamento (genótipo) (fenótipo). Tópico 2 Evolução, Genética e Computação 14 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Sistemas naturais em evolução são fortemente pleiotrópicos e altamente poligênicos (HARTL & CLARK, 1989). Além disso, a seleção natural atua sobre uma coleção de características fenotípicas, e não sobre uma única característica isolada. Como conseqüência, um gene não pode ser considerado como uma unidade individual de seleção, pelo fato de não ser possível atribuir a um gene isolado um valor significativo para o seu nível de adaptação. Logo, a evolução se refere mais apropriadamente a mudanças em adaptação e diversidade, e não diretamente a mudanças na freqüência gênica. Além disso, a evolução é oportunista, ou seja, características críticas serão intensamente otimizadas, enquanto características menos críticas podem sofrer uma grande variedade de tratamentos alternativos. Tópico 2 Evolução, Genética e Computação 15 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 1.6 Reprodução assexuada e sexuada Embora os detalhes da evolução biológica ainda não estejam completamente compreendidos, existem alguns aspectos fundamentados em fortes evidências experimentais: 1. a evolução é um processo que opera sobre cromossomos e não sobre organismos; 2. a seleção natural é o mecanismo que relaciona cromossomos com a eficiência da entidade que eles representam, permitindo assim que organismos mais bem adaptados ao meio ambiente tenham uma taxa maior de reprodução; 3. o processo evolutivo se dá durante o estágio reprodutivo. Dentre os fenômenos que podem ocorrer neste estágio é possível citar a mutação e a recombinação genética (crossover); 4. o processo evolutivo não possui memória direta. Tópico 2 Evolução, Genética e Computação 16 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Reprodução assexuada: na natureza, a codificação da informação genética é realizada de modo a admitir reprodução assexuada. Neste caso, os filhos apresentam quase sempre a mesma informação genética do pai. Um número muito grande de organismos naturais se reproduzem de forma assexuada, incluindo a maior parte das bactérias. Mitose Replicação Divisão Haplóide Figura 6: Reprodução assexuada em cromosomos haplóides. Tópico 2 Evolução, Genética e Computação 17 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Reprodução sexuada: neste caso, os filhos apresentam uma informação genética que corresponde a uma combinação da informação genética de seus pais. Na reprodução sexuada diplóide, cada pai fornece uma célula haplóide denominada gameta, formada por cromossomos resultantes da recombinação dos pares de cromossomos existentes nos respectivos pais. Os cromossomos presentes nos gametas fornecidos pelos pais se emparelham para gerar uma nova célula diplóide. Ovo Meiose Replicação Separação dos homólogos Zigoto diplóide Diplóide Esperma Gametas haplóides Tópico 2 Evolução, Genética e Computação 18 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Durante a reprodução sexuada, os cromossomos estão sujeitos à recombinação. Recombinação ou crossover: consiste na troca aleatória de material genético entre dois cromossomos. Figura 7: Recombinação genética (crossover) entre dois cromossomos. 1.7 Mutação Tanto na reprodução assexuada como na sexuada, o processo de cópia do material genético dos pais está sujeito a erros, denominados mutações. Uma mutação corresponde então à troca aleatória, no processo de cópia do material genético, de um nucleotídeo por outro. Tópico 2 Evolução, Genética e Computação 19 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Nucleotídeo: unidade elementar do DNA. Figura 8: Ilustração de diferentes tipos de mutação. A mutação é uma conseqüência inescapável da existência de sistemas que se reproduzem continuamente em um universo com diferencial de entropia positivo, sendo um mecanismo importante de implantação da diversidade entre os indivíduos. Tópico 2 Evolução, Genética e Computação 20 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Em estágios iniciais do processo evolutivo natural, as taxas de mutação podem ter sido muito maiores. O fato de que as taxas de mutação atuais nos organismos vivos são muito baixas na maioria dos casos observados pode ser devido a estes organismos, como espécie, terem atingido um estado de estacionariedade em relação às condições ambientais atuais. Neste caso, o nível de evolução orgânica atual não deve servir de referência para nenhum tipo de implementação computacional de algoritmo evolutivo. Geralmente, a recombinação deve ter probabilidades de ocorrência muito maior que a mutação. Observação: em implementação computacional, à primeira geração de indivíduos é geralmente imposto um determinado nível de diversidade. Teoricamente, as taxas ótimas de mutação são inversamente proporcionais ao número de variáveis de decisão envolvidas e diretamente proporcionais à distância do ótimo. A probabilidade de ocorrência de mutação deve ser inversamente Tópico 2 Evolução, Genética e Computação 21 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux proporcional ao tamanho da população (DE JONG, 1975). Existem estratégias que incorporam a definição da taxa de mutação ao próprio genótipo. 2 A notação computacional Obs: as informações contidas nesta seção podem não ser genéricas e também podem referir-se ao caso de algoritmos evolutivos específicos. Um cromossomo haplóide geralmente corresponde a uma estrutura de dados (p.ex. cadeia de bits) que representa um candidato à solução (indivíduo de uma população) de um problema. Um gene corresponde a um único bit, ou então a um pequeno bloco de bits adjacentes que codificam um elemento particular da solução candidata. Por exemplo, em otimização de funções multiparamétricas, o conjunto de bits utilizado para codificar um parâmetro específico pode ser considerado um único gene. Tópico 2 Evolução, Genética e Computação 22 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Em uma cadeia de bits, um alelo é 0 ou 1. Para alfabetos maiores, mais alelos podem ser considerados para cada posição (locus). A grande maioria das aplicações de algoritmos evolutivos emprega codificação haplóide e baseada em um único cromossomo. Neste caso, o genótipo passa a corresponder à configuração de bits do cromossomo. Cromosomo utilizando representação binária Locus Alelos: {0,1} 1 0 0 0 1 1 0 0 1 0 Gene Figura 9: Estrutura de dados (cadeia de bits ou binária) de um algoritmo evolutivo. 2.1 Superfície de adaptação Uma vez definido o processo de codificação (representação) para um dado problema, o objetivo é buscar uma solução desejada dentre todos os possíveis candidatos à solução (elementos do espaço de busca). Tópico 2 Evolução, Genética e Computação 23 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Genótipo: uma solução potencial de um dado problema pode ser codificada na forma de uma ou mais cadeias cromossômicas (estrutura de dados). Fenótipo: a decodificação de um ou mais cromossomos leva a um ponto na superfície de adaptação, definida no espaço de busca. Espaço de busca normado: coleção de candidatos à solução do problema + uma norma (operador que estabelece a noção de vizinhança). Nota: os algoritmos evolutivos geralmente assumem que existe alguma correlação entre candidatos à solução que sejam vizinhos (segundo a norma estabelecida). Assumindo representação haplóide e baseada em um único cromossomo, e considerando genes correspondentes a um único bit, o número de possíveis candidatos à solução em função do comprimento do cromossomo é dado nas figuras a seguir: Tópico 2 Evolução, Genética e Computação 24 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 5 1200 12 c 1000 a n 800 d i d 600 a t 400 o s 200 c 10 a n 8 d i d 6 a t 4 o s 2 0 0 2 4 6 comprimento 8 10 x 10 0 10 12 14 16 comprimento 18 20 Superfície de adaptação: foi originalmente definida pelo biólogo Sewell Wright, em 1931, como a representação do nível de adaptação de todos os genótipos. Observe que aqui é realizada uma avaliação diretamente sobre o genótipo, sem considerar o fenótipo. Exemplo: suponha que cada genótipo é uma cadeia de bits de comprimento p, e que a distância entre dois genótipos é dada pela distância de Hamming, ou seja, o número de posições cujos bits são diferentes. Também suponha que a cada genótipo pode ser atribuído um nível de adaptação. Neste caso, a superfície de Tópico 2 Evolução, Genética e Computação 25 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux adaptação vai ser um mapeamento de dimensão p+1, que associa a cada genótipo no espaço de dimensão p um nível de adaptação definido no eixo p+1. No contexto de superfícies de adaptação, a evolução é um processo responsável pela movimentação da população nesta superfície, a partir de operadores genéticos como mutação e recombinação, no sentido de conduzir os indivíduos para as regiões de máximo local. Neste caso, a seleção natural pode ser vista como um processo que conduz à maturação ou aumento da adaptação média da população. Obs: a idéia de evolução a partir do deslocamento da população ao longo de uma superfície de adaptação fixa é biologicamente irreal, porque um indivíduo da população não pode receber um valor de adaptação independente dos demais. O nível médio de adaptação de um indivíduo em um ambiente não-estacionário varia em função da dinâmica do ambiente e das interações deste indivíduo e de outros com o ambiente e entre si. Tópico 2 Evolução, Genética e Computação 26 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 3 Da Biologia Evolutiva para a Computação Evolutiva Biologia (Genética) Cromossomo Gene Locus Alelo Crossover Mutação Fitness Seleção Genótipo Fenótipo Algoritmos Evolutivos Estrutura de dados Um ou mais atributos ocupando uma determinada posição da estrutura de dados Posição ocupada por um gene em uma estrutura de dados Diferentes valores (dados) que um gene pode assumir Troca de porções entre duas ou mais estruturas de dados Variação aleatória em uma estrutura de dados individual Valor que quantifica a qualidade relativa (nível de adaptação) de um indivíduo dada função de avaliação Processo que permite a sobrevivência e reprodução dos indivíduos mais aptos em detrimento dos menos aptos Estrutura de dados que representa uma solução candidata à um determinado problema Decodificação de um ou mais cromossomos que leva a um ponto da superfície de adaptação, definida no espaço de busca Tópico 2 Evolução, Genética e Computação 27 IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux 4 Bibliografia ATMAR, W. On the Rules and Nature of Simulated Evolutionary Programming. Proc. of the First Ann. Conf. On Evolutionary Programming, pp. 17-26, 1992. ATMAR, W. Notes on the Simulation of Evolution. IEEE Trans. on Neural Networks, vol. 5, no. 1, pp. 130-148, 1994. BERGSON, H. A Evolução Criadora, Editora da Unesp, 2010. BURNS, G.W. The Science of Genetics - An Introduction of heredity. 1983. DARWIN, C. The Origin of Species, John Murray, 1859 (Penguin Classics, 1985). DAWKINS, R. The Selfish Gene, Oxford University Press, 1990. DE CASTRO, L. N. & TIMMIS, J. I.. Artificial Immune Systems: A New Computational Intelligence Approach, Springer Verlag, 2002 C DE JONG, K.A. An analysis of the behavior of a class of genetic adaptive systems. Ph.D. Thesis, The University of Michigan, 1975. FISHER, R.A. The Genetical Theory of Natural Selection. Clarendon Press, 1930. FOGEL, D.B. Evolutionary Computation: Toward a New Philosophy of Machine Intelligence, IEEE Press, 1995. HARTL, D.L., CLARK, A.G. Principles of Popultion Genetics. Sinauer, 1989. MAYR, E. Populations, Species, and Evolution. Belknap Press, 1970. MAYR, E. Toward a New Philosophy of Biology: Observations of an Evolutionist. Belknap Press, 1988. MITCHELL, M. An Introduction to Genetic Algorithms. MIT Press, 1996. Tópico 2 Evolução, Genética e Computação 28