P - DCA

Propaganda
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
Evolução, Genética e Computação
1 Base biológica
1.1 Hereditariedade (BURNS, 1983)
 A história da genética é fascinante principalmente pela velocidade com que se
evoluiu de observações a demonstrações experimentais dos mecanismos
fundamentais envolvidos.
 Na antiguidade, defendia-se a idéia de que o sexo era determinado pela
procedência do líquido seminal no homem: se do testículo direito  sexo
masculino; se do testículo esquerdo  sexo feminino. A mulher era vista apenas
como uma “incubadeira” neste processo.
Tópico 2  Evolução, Genética e Computação
1
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 1672: descoberta do óvulo pelo holandês Graaf  as fêmeas de mamíferos
também apresentam ovulação!
 1675: descoberta do espermatozóide pelo holandês Von Leeuwenhoeck.
 1866: idéias efetivas acerca da hereditariedade  monge agostiniano Gregor
Mendel (República Tcheca). Ele atacou o problema de modo simples e lógico,
escolheu material adequado, concentrou-se em poucas características contrastantes,
desenvolveu um programa de cruzamentos controlados, tratou os resultados de
forma eficiente e sugeriu fatores causais (hoje chamados de genes) como sendo os
responsáveis pelos fenômenos observados.
 Ninguém havia chegado tão perto da compreensão real da hereditariedade (ficou
faltando, em essência, apenas elucidar os mecanismos celulares envolvidos), mas
foram necessários mais de 30 anos para que a comunidade científica se desse conta
da importância e eficácia desses resultados.
Tópico 2  Evolução, Genética e Computação
2
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 É curioso constatar que um dos fatores que dificultaram a assimilação dos
resultados de Mendel foi justamente o intenso debate reinante nos meios
científicos após a divulgação da teoria de seleção natural de Darwin.
 1900: redescoberta das idéias de
Mendel de forma independente por
três pesquisadores.
 1a lei de Mendel: Cada caráter é
condicionado por dois fatores. Eles
separam-se na formação dos gametas,
passando apenas um fator por gameta.
Tópico 2  Evolução, Genética e Computação
3
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
1.2 Do Darwinismo ao Neo-Darwinismo
 DARWIN (1859) sugeriu que, para haver evolução, é necessário que exista uma
população de indivíduos sujeita a:
1. Reprodução com herança;
2. Variação; e
3. Seleção Natural.
 Embora Darwin tenha considerado essas hipóteses como suficientes para explicar
a origem das espécies, hoje elas são aceitas apenas como suficientes para explicar
os processos ecológicos.
 Na época de Darwin (meados de 1800), entretanto, sabia-se muito pouco sobre os
processos de reprodução e praticamente nada sobre genética. Além disso, não
havia um bom entendimento sobre como operam os mecanismos de seleção
natural.
Tópico 2  Evolução, Genética e Computação
4
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 A união da genética com diversos conceitos e teorias sobre seleção natural leva ao
que hoje é chamado de Neo-Darwinismo.
Sobre a Seleção Natural
 O princípio da seleção natural indica que os indivíduos cujas variações se adaptam
melhor ao ambiente terão maior probabilidade de sobreviver e se reproduzir.
 A seleção natural é probabilística, e seu alvo primário é o indivíduo, embora seu
efeito resultante vá se manifestar na espécie como um todo. A espécie é o
beneficiário final do processo evolutivo (MAYR, 1988).
1.3 Terminologia biológica
 A terminologia biológica a ser empregada representa uma analogia com as
entidades biológicas reais, em que as entidades computacionais corresponderão
invariavelmente a estruturas bem mais simples que seus equivalentes biológicos.
Tópico 2  Evolução, Genética e Computação
5
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Célula  órgão  sistema  organismo  população  comunidade 
ecossistema
Comunidade
Órgão
Sistema
Célula
Ecossistema
População
Organismo
Nível fisiológico
Nível ecológico
Figura 1: Divisão hierárquica dos sistemas biológicos (de Castro & Timmis, 2002).
 Célula: unidade estrutural básica dos seres vivos, que se compõe de numerosas
partes, sendo as fundamentais a parede ou membrana, o protoplasma e o núcleo. A
célula é a menor unidade de matéria viva que pode existir de maneira
independente, e ser capaz de se reproduzir. Toda célula de um mesmo organismo
Tópico 2  Evolução, Genética e Computação
6
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
contém o mesmo conjunto de um ou mais cromossomos. Nos seres humanos, cada
célula somática (não-germinativa) contém 23 pares de cromossomos.
 Cromossomo: estrutura nucleoprotéica formada por uma cadeia de DNA, sendo a
base física dos genes nucleares, os quais estão dispostos linearmente. Cada espécie
apresenta um número característico de cromossomos. Quando os cromossomos são
arranjados em pares (cada cromossomo proveniente de um dos pais, embora haja
exceções), os respectivos organismos são chamados diplóides. Organismos cujos
cromossomos não se apresentam aos pares são chamados haplóides.
Tópico 2  Evolução, Genética e Computação
7
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
gene
gene
gene
Figura 2: Ampliação de um organismo para enfocar o material genético. Organismo  célula
 cromosomo  gene  DNA
 Genes: blocos funcionais de DNA, os quais codificam uma proteína específica. É a
denominação que damos hoje ao fator mendeliano. Cada gene está localizado em
uma posição (locus) particular do cromossomo. Quando dois genes se comportam
segundo a 1a lei de Mendel, são ditos alelos, e se encontram no mesmo locus de
dois cromossomos homólogos. Para exemplificar em termos muito simples, é
possível pensar um gene como o responsável pela definição de uma característica
Tópico 2  Evolução, Genética e Computação
8
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
do indivíduo, como a cor dos olhos. As diferentes colorações (azul, castanho etc.)
correspondem a alelos. No entanto, também existem pontos de vista muito mais
refinados (DAWKINS, 1990).
 Como muitos organismos apresentam células com mais de um cromossomo, o
conjunto de todos os cromossomos compõe o material genético do organismo,
denominado genoma.
Cromosomo diagramático
Locus
Alelos: {A, B}
A
B
A A
B A
B B A B
Gene
Figura 3: Ilustração pictórica de um cromosomo salientando o locus, os genes e os alelos.
Tópico 2  Evolução, Genética e Computação
9
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
gene
produto
caráter
 epistasia: interferência
funcional entre genes
localizados em posições
diferentes.
 pleiotropia: quando um único
gene afeta múltiplas
características fenotípicas.
 poligenia: quando uma única
característica fenotípica é
determinada pela interação
simultânea de muitos genes.
Figura 4: Pleiotropia e poligenia.
Tópico 2  Evolução, Genética e Computação
10
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
1.4 Fenótipo x Genótipo (FOGEL, 1995)
 1909: introdução dos conceitos de genótipo e fenótipo.
 Genótipo: representa o conjunto específico de genes do genoma. Neste caso,
indivíduos com o mesmo genoma são ditos terem o mesmo genótipo.
 Fenótipo: é a manifestação do genótipo no comportamento, fisiologia e morfologia
do indivíduo, como um produto de sua interação com o ambiente.
 A seleção natural opera somente na expressão fenotípica do genótipo (MAYR,
1970; HARTL & CLARK, 1989).
 Para modelar este fenômeno, ATMAR (1992) estendeu um resultado da literatura
baseado no emprego de dois espaços de estados:
1. G: espaço genotípico (representa a informação);
2. P: espaço fenotípico (representa o comportamento).
 que permitem a definição de quatro funções, onde I representa um conjunto de
efeitos do ambiente (entrada), na forma:
Tópico 2  Evolução, Genética e Computação
11
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 f1: I  G  P (epigênese);
 f2: P  P (seleção);
 f3: P  G (sobrevivência genotípica);
 f4: G  G (variação genética).
 A adaptação evolutiva ocorre a partir da aplicação iterativa dessas funções.
Tópico 2  Evolução, Genética e Computação
12
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
g2
f4
g1
Espaço genotípico G
g1
f1
f3
f2
Espaço fenotípico F
p1
p2
Figura 5: Evolução explicada através de mapeamentos entre os espaços genotípico e
fenotípico.
Tópico 2  Evolução, Genética e Computação
13
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
1.5 Adaptação evolutiva
 Sob um processo de competição por recursos limitados e seleção natural,
indivíduos mais bem adaptados têm uma maior probabilidade de sobreviver e
propagar seu material genético. A adaptação (fitness) pode ser definida como a
probabilidade de sobrevivência e reprodução (viabilidade), ou então como uma
função do número de descendentes que o organismo produziu (fertilidade).
 ATMAR (1994) indicou que uma medida singular da adaptação evolutiva é dada
pela habilidade de uma população antecipar seu ambiente e agir no sentido de
atender aos requisitos associados às predições realizadas.
 Uma alternativa a esta definição de medida de adaptação é a idéia simplificada de
que a adaptação pode ser medida em termos de mudanças na freqüência gênica
dentro da população (FISHER, 1930). Esta definição despreza os efeitos importantes
de pleiotropia e poligenia, ao assumir a relação (um gene)  (uma característica)
para descrever o relacionamento (genótipo)  (fenótipo).
Tópico 2  Evolução, Genética e Computação
14
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Sistemas naturais em evolução são fortemente pleiotrópicos e altamente
poligênicos (HARTL & CLARK, 1989). Além disso, a seleção natural atua sobre uma
coleção de características fenotípicas, e não sobre uma única característica isolada.
 Como conseqüência, um gene não pode ser considerado como uma unidade
individual de seleção, pelo fato de não ser possível atribuir a um gene isolado um
valor significativo para o seu nível de adaptação.
 Logo, a evolução se refere mais apropriadamente a mudanças em adaptação e
diversidade, e não diretamente a mudanças na freqüência gênica.
 Além disso, a evolução é oportunista, ou seja, características críticas serão
intensamente otimizadas, enquanto características menos críticas podem sofrer
uma grande variedade de tratamentos alternativos.
Tópico 2  Evolução, Genética e Computação
15
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
1.6 Reprodução assexuada e sexuada
 Embora os detalhes da evolução biológica ainda não estejam completamente
compreendidos, existem alguns aspectos fundamentados em fortes evidências
experimentais:
1. a evolução é um processo que opera sobre cromossomos e não sobre
organismos;
2. a seleção natural é o mecanismo que relaciona cromossomos com a eficiência
da entidade que eles representam, permitindo assim que organismos mais bem
adaptados ao meio ambiente tenham uma taxa maior de reprodução;
3. o processo evolutivo se dá durante o estágio reprodutivo. Dentre os fenômenos
que podem ocorrer neste estágio é possível citar a mutação e a recombinação
genética (crossover);
4. o processo evolutivo não possui memória direta.
Tópico 2  Evolução, Genética e Computação
16
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Reprodução assexuada: na natureza, a codificação da informação genética é
realizada de modo a admitir reprodução assexuada. Neste caso, os filhos
apresentam quase sempre a mesma informação genética do pai. Um número muito
grande de organismos naturais se reproduzem de forma assexuada, incluindo a
maior parte das bactérias.
Mitose
Replicação
Divisão
Haplóide
Figura 6: Reprodução assexuada em cromosomos haplóides.
Tópico 2  Evolução, Genética e Computação
17
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Reprodução sexuada: neste caso, os filhos apresentam uma informação genética
que corresponde a uma combinação da informação genética de seus pais. Na
reprodução sexuada diplóide, cada pai fornece uma célula haplóide denominada
gameta, formada por cromossomos resultantes da recombinação dos pares de
cromossomos existentes nos respectivos pais. Os cromossomos presentes nos
gametas fornecidos pelos pais se emparelham para gerar uma nova célula diplóide.
Ovo
Meiose
Replicação
Separação dos
homólogos
Zigoto
diplóide
Diplóide
Esperma
Gametas
haplóides
Tópico 2  Evolução, Genética e Computação
18
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Durante a reprodução sexuada, os cromossomos estão sujeitos à recombinação.
 Recombinação ou crossover: consiste na troca aleatória de material genético entre
dois cromossomos.
Figura 7: Recombinação genética (crossover) entre dois cromossomos.
1.7 Mutação
 Tanto na reprodução assexuada como na sexuada, o processo de cópia do material
genético dos pais está sujeito a erros, denominados mutações. Uma mutação
corresponde então à troca aleatória, no processo de cópia do material genético, de
um nucleotídeo por outro.
Tópico 2  Evolução, Genética e Computação
19
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Nucleotídeo: unidade elementar do DNA.
Figura 8: Ilustração de diferentes tipos de mutação.
 A mutação é uma conseqüência inescapável da existência de sistemas que se
reproduzem continuamente em um universo com diferencial de entropia positivo,
sendo um mecanismo importante de implantação da diversidade entre os
indivíduos.
Tópico 2  Evolução, Genética e Computação
20
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Em estágios iniciais do processo evolutivo natural, as taxas de mutação podem ter
sido muito maiores. O fato de que as taxas de mutação atuais nos organismos vivos
são muito baixas na maioria dos casos observados pode ser devido a estes
organismos, como espécie, terem atingido um estado de estacionariedade em
relação às condições ambientais atuais. Neste caso, o nível de evolução orgânica
atual não deve servir de referência para nenhum tipo de implementação
computacional de algoritmo evolutivo.
 Geralmente, a recombinação deve ter probabilidades de ocorrência muito maior
que a mutação.
 Observação: em implementação computacional, à primeira geração de indivíduos é
geralmente imposto um determinado nível de diversidade.
 Teoricamente, as taxas ótimas de mutação são inversamente proporcionais ao
número de variáveis de decisão envolvidas e diretamente proporcionais à distância
do ótimo. A probabilidade de ocorrência de mutação deve ser inversamente
Tópico 2  Evolução, Genética e Computação
21
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
proporcional ao tamanho da população (DE JONG, 1975). Existem estratégias que
incorporam a definição da taxa de mutação ao próprio genótipo.
2 A notação computacional
 Obs: as informações contidas nesta seção podem não ser genéricas e também
podem referir-se ao caso de algoritmos evolutivos específicos.
 Um cromossomo haplóide geralmente corresponde a uma estrutura de dados (p.ex.
cadeia de bits) que representa um candidato à solução (indivíduo de uma
população) de um problema.
 Um gene corresponde a um único bit, ou então a um pequeno bloco de bits
adjacentes que codificam um elemento particular da solução candidata. Por
exemplo, em otimização de funções multiparamétricas, o conjunto de bits utilizado
para codificar um parâmetro específico pode ser considerado um único gene.
Tópico 2  Evolução, Genética e Computação
22
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Em uma cadeia de bits, um alelo é 0 ou 1. Para alfabetos maiores, mais alelos
podem ser considerados para cada posição (locus).
 A grande maioria das aplicações de algoritmos evolutivos emprega codificação
haplóide e baseada em um único cromossomo. Neste caso, o genótipo passa a
corresponder à configuração de bits do cromossomo.
Cromosomo utilizando
representação binária
Locus
Alelos: {0,1}
1
0
0
0
1
1
0
0
1 0
Gene
Figura 9: Estrutura de dados (cadeia de bits ou binária) de um algoritmo evolutivo.
2.1 Superfície de adaptação
 Uma vez definido o processo de codificação (representação) para um dado
problema, o objetivo é buscar uma solução desejada dentre todos os possíveis
candidatos à solução (elementos do espaço de busca).
Tópico 2  Evolução, Genética e Computação
23
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
 Genótipo: uma solução potencial de um dado problema pode ser codificada na
forma de uma ou mais cadeias cromossômicas (estrutura de dados).
 Fenótipo: a decodificação de um ou mais cromossomos leva a um ponto na
superfície de adaptação, definida no espaço de busca.
 Espaço de busca normado: coleção de candidatos à solução do problema + uma
norma (operador que estabelece a noção de vizinhança).
 Nota: os algoritmos evolutivos geralmente assumem que existe alguma correlação
entre candidatos à solução que sejam vizinhos (segundo a norma estabelecida).
 Assumindo representação haplóide e baseada em um único cromossomo, e
considerando genes correspondentes a um único bit, o número de possíveis
candidatos à solução em função do comprimento do cromossomo é dado nas
figuras a seguir:
Tópico 2  Evolução, Genética e Computação
24
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
5
1200
12
c 1000
a
n 800
d
i
d 600
a
t 400
o
s
200
c 10
a
n 8
d
i
d 6
a
t 4
o
s
2
0
0
2
4
6
comprimento
8
10
x 10
0
10
12
14
16
comprimento
18
20
 Superfície de adaptação: foi originalmente definida pelo biólogo Sewell Wright,
em 1931, como a representação do nível de adaptação de todos os genótipos.
Observe que aqui é realizada uma avaliação diretamente sobre o genótipo, sem
considerar o fenótipo.
 Exemplo: suponha que cada genótipo é uma cadeia de bits de comprimento p, e
que a distância entre dois genótipos é dada pela distância de Hamming, ou seja, o
número de posições cujos bits são diferentes. Também suponha que a cada
genótipo pode ser atribuído um nível de adaptação. Neste caso, a superfície de
Tópico 2  Evolução, Genética e Computação
25
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
adaptação vai ser um mapeamento de dimensão p+1, que associa a cada genótipo
no espaço de dimensão p um nível de adaptação definido no eixo p+1.
 No contexto de superfícies de adaptação, a evolução é um processo responsável
pela movimentação da população nesta superfície, a partir de operadores genéticos
como mutação e recombinação, no sentido de conduzir os indivíduos para as
regiões de máximo local. Neste caso, a seleção natural pode ser vista como um
processo que conduz à maturação ou aumento da adaptação média da população.
 Obs: a idéia de evolução a partir do deslocamento da população ao longo de uma
superfície de adaptação fixa é biologicamente irreal, porque um indivíduo da
população não pode receber um valor de adaptação independente dos demais.
 O nível médio de adaptação de um indivíduo em um ambiente não-estacionário
varia em função da dinâmica do ambiente e das interações deste indivíduo e de
outros com o ambiente e entre si.
Tópico 2  Evolução, Genética e Computação
26
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
3 Da Biologia Evolutiva para a Computação Evolutiva
Biologia
(Genética)
Cromossomo
Gene
Locus
Alelo
Crossover
Mutação
Fitness
Seleção
Genótipo
Fenótipo
Algoritmos Evolutivos
Estrutura de dados
Um ou mais atributos ocupando uma determinada posição da
estrutura de dados
Posição ocupada por um gene em uma estrutura de dados
Diferentes valores (dados) que um gene pode assumir
Troca de porções entre duas ou mais estruturas de dados
Variação aleatória em uma estrutura de dados individual
Valor que quantifica a qualidade relativa (nível de adaptação) de
um indivíduo dada função de avaliação
Processo que permite a sobrevivência e reprodução dos
indivíduos mais aptos em detrimento dos menos aptos
Estrutura de dados que representa uma solução candidata à um
determinado problema
Decodificação de um ou mais cromossomos que leva a um ponto
da superfície de adaptação, definida no espaço de busca
Tópico 2  Evolução, Genética e Computação
27
IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux
4 Bibliografia
ATMAR, W. On the Rules and Nature of Simulated Evolutionary Programming. Proc. of the First Ann. Conf. On Evolutionary
Programming, pp. 17-26, 1992.
ATMAR, W. Notes on the Simulation of Evolution. IEEE Trans. on Neural Networks, vol. 5, no. 1, pp. 130-148, 1994.
BERGSON, H. A Evolução Criadora, Editora da Unesp, 2010.
BURNS, G.W. The Science of Genetics - An Introduction of heredity. 1983.
DARWIN, C. The Origin of Species, John Murray, 1859 (Penguin Classics, 1985).
DAWKINS, R. The Selfish Gene, Oxford University Press, 1990.
DE CASTRO, L. N. & TIMMIS, J. I.. Artificial Immune Systems: A New Computational Intelligence Approach, Springer
Verlag, 2002 C
DE JONG, K.A. An analysis of the behavior of a class of genetic adaptive systems. Ph.D. Thesis, The University of Michigan,
1975.
FISHER, R.A. The Genetical Theory of Natural Selection. Clarendon Press, 1930.
FOGEL, D.B. Evolutionary Computation: Toward a New Philosophy of Machine Intelligence, IEEE Press, 1995.
HARTL, D.L., CLARK, A.G. Principles of Popultion Genetics. Sinauer, 1989.
MAYR, E. Populations, Species, and Evolution. Belknap Press, 1970.
MAYR, E. Toward a New Philosophy of Biology: Observations of an Evolutionist. Belknap Press, 1988.
MITCHELL, M. An Introduction to Genetic Algorithms. MIT Press, 1996.
Tópico 2  Evolução, Genética e Computação
28
Download