Um Novo Algoritmo de Busca Heurística Baseado no

Um Novo Algoritmo de Busca Heurística Baseado no
Processamento do Córtex Cerebral
Javier Ropero Peláez & Marcelo Godoy Simões
Escola Politécnica da Universidade de São Paulo
PMCIMecatrónica
Os últimos descobrimentos neurológicos reforçam a idéia de que há cadeias d e ativação seqüencial entre os
neurônios piramidais no córtex cerebral; esta possibilidade sugere que o raciocínio é uma conseqüência de uma
ativação seqüencial dos neurônios. A organização hierárquica dos neurônios no córtex é muito similar a uma
estrutura de árvore nos algoritmos de busca heuristica. Neste trabalho propõense um novo algoritmo de busca
heuristica baseado nestes desenvolvimentos biológicos. Uma novidade neste algoritmo é que a ramificação da
árvore é guiada pelas restrições impostas pelo entorno sensorial.
l.INTRODUÇÃO:
Árvores de decisão e árvores neurais. As
árvores de decisão utilizadas na área de inteligência
artificial [5],[11] para encontrar o melhor conjunto
de atuações a fim de obter um determinado
objetivo a partir de
um estado inicial, têm
similaridades importantes com a organização dos
neurônios no córtex cerebral [4],[13], similaridades
estas que serão explicadas a seguir.
a. Estrutura hierarquizada. De uma maneira
esquemática suponhamos que todo racionamento é
do tipo: Partindo do estado A deve-se chegar ao B.
Como foi mencionado antes, o conjunto de
processos para, saindo de A, chegar até B é
chamado árvore de decisão, ou árvore de busca
heuristica. Neste artigo se postula que, no caso
biológico,
existem estruturas cerebrais
que
permitem desenvolver um problema desde uma
origem (A) a um objetivo (B) mediante uma árvore
de decisão. Neste caso os neurônios piramidais [4],
que formam uma estrutura em árbore , são os
primeiros candidatos para se estudar esta
possibilidade.
Nas árvores de decisão, os nós que representam os
estados de uma determinada variável estão
organizados em camadas. Cada nó numa camada é o
resultado de um outro nó de uma camada superior.
Um nó de hierarquia máxima, chamado nó raiz,
pode definir o inicio, A, (Fig.l) do raciocínio na
busca heuristica para a frente
("data-driven
search") .Em outro caso, um nó raiz pode definir o
objetivo, B, no raciocínio para trás a partir dos
estados objetivo ("goal-driven search"). Além disto
uma outra possibilidade, que existe na inteligência
artificial e que se propõe para o processo cerebral, é
que o raciocínio comece simultaneamente desde os
dois nós, origem.A, e destino B, e seja propagado
em ambos sentidos, desde A para B e desde B para
A pela árvore heuristica (Fig.l)
b. Nós origem e nõs objetivo. Nas árvores
corticais o neurônio superior representa um estado
de máxima integração conceitual [14]. Propõense
que a ativação de um ou vários destes neurônios
podem representar um objetivo, B, que se deseja
resolver como acontece com os nós "goal" da busca
heuristica. Os nós que representam estados iniciais,
A, também seriam representados pela ativação de
neurônios corticais de hierarquia máxima. Em geral,
considera-se que os neurônios
das camadas
superiores representam conceitos mais elaborados
que os das camadas imediatamente inferiores.
Poderiase especular que tendo em vista que alguns
neurônios respondem de maneira específica frente a
conceitos complexos (como a visão de um rosto) ,
os neurônios
subordinados representariam
características mais simples que compõem estes
conceitos (nariz, boca, olhos, linhas [15] etc.)
Os neurônios que integram informação sensorial
serão considerados como moduladores do fluxo de
A para B. Apesar disto, a origem "A" pode
Nó objetivo, B
Fig.l Exemplo de árvore de decisão de dois
sentidos, combinando a busca para frente "data
driven search" com a busca para atrás "goal driven
search".
377
representar, como veremos, o ambiente externo que
a pessoa quer modificar com seu pensamento .
Neste caso o neurônio que integra a informação
externa tornar-se-á o nó inicial da árvore.
c. Competição dentro de cada camada. Em
alguns algoritmos de busca como no "best first"
[11], um só dos nós candidatos é selecionado
(aquele que tem a melhor avaliação). Em algumas
ocasiões o critério de avaliação é a eleição do nó
que tem o maior peso no seus arcos . Nas camadas
corticais, os neurônios piramidais que pertencem a
um mesmo "cluster" competem entre si até que um
dos neurônios corticais seja o vencedor (vide
aprendizagem competitiva) [9], [10]. Neste caso, o
critério de avaliação é o valor máximo das entradas
ponderados pelo reforço sináptico em cada
neurônio . Esta competição é produzida quando os
neurônios piramidais
ativam
os neurônios
inibitórios que os rodeiam. Neste campo de inibição
só o neurônio piramidal mais ativado sobrevive.
d. Ponderações nos arcos que unem cada nó.
Nas árvores de busca heurística cada arco tem uma
ponderação onde o valor de cada nó é a soma das
ponderações de todos os trechos no caminho desde
o nó raiz até o nó em questão . As conexões entre os
neurônios também levam ponderações que foram
desenvolvidas durante a aprendizagem [I] , [6]
a
. Camada 1
2
2. UM ALGORITMO PARA O CONSENSO
NEURAL. Nas diversas áreas do córtex cerebral os
neurônios piramidais estão dispostos em camadas .
Na Fig. 2.a está representado o tipo mais freqüente
de conexão entre um neurônio 1 de uma camada
superior, e dos neurônios 2 de uma camada
imediatamente abaixo. Como se pode ver, o
neurônio 1 da camada superior faz conexão com os
neurônios 2 da camada inferior. Os neurônios da
camada inferior, geralmente fornecem um sinal de
consenso de volta ao neurônio I.
Assim explica-se o processamento
"up-down"
dirigido desde as camadas superiores (de maior
nível hierárquico) as quais supomos que podem
fornecer tanto os objetivos como os estados iniciais
da busca heurística.
No caso mais geral o neurônio "raiz" na camada
superíor dispara sobre vários neurônios na camada
seguinte . Na Fig.2.B a ativação do neurônio "A"
faz com que os neurônios na camada dois
concorram entre si até o momento em que um
deles seja vencedor, neste caso o neurônio B.
(Observe que o peso de A para B, 0.6, é maior que
de A para C, 0.4). Apesar disto o neurônio B não
será um vencedor definitivo, mas somente um
candidato. Sua candidatura deverá ser avaliada
pelos neurônios da camáda seguinte: D,E,F . Neste
caso, B dispara com maior intensidade sobre E, ' e
este sobre C, favorecendo a mudança da
candidatura de B porC na segunda camada (a soma
3
4
c
Fig.2 (a) Disposição mais geral das sinapses entre
duas camadas de neurônios piramidais no córtex
cerebral. (b) Processamento na árvore heurístico
cujos estados envolvem a ativação dos neurônios
piramidais.( c) Árvore heurística no qual os estados
estão codificados pela ativação seqüencial em bucle
de vários neurônios (circulos).
total dos pesos sobre C termina sendo I, enquanto
que sobre B é 0.6). O processo de avaliação da
candidatura de C continua do mesmo modo,
enquanto outras candidaturas subseqüentes são
avaliadas (como a candidatura de E na terceira
camada). Neste modo obtém-se um consenso geral
que poderíamos denominar "democracia neural"
entre o neurônio raiz e os neurônios das seguintes
camadas.
378
Recentes estudos neurológicos e computacionais
[3],[17],[14] indicam que os conteúdos conceituais
poderiam não estar restritos a neurônios individuais
mas a grupos de neurônios piramidais. Nestes
grupos,
os
neurônios
podem
disparar
seqüencialmente e hipoteticamente podem formar
buc1es oscilatórios fechados, para manter os
conteúdos que armazenam de maneira estável
durante um certo periodo de tempo. Desta forma o
algoritmo apresentado acima seria melhor
representado, se ao invés de neurônios individuais,
as unidades conceituais fossem buc1es de ativação
de vários neurônios (Fig. 2.C). Recentes estudos
neuro-fisiológicos e computacionais parecem indicar
que o reforço sináptico permite não apenas criar
vínculos
entre
os
neurônios '
ativados
simultaneamente, mas também memorizar a
. seqüência exata em que diferentes neurônios se
ativaram durante a apresentação de um determinado
estímulo [6], [14]. Neste caso o significado de um
buc1e pode ser tanto uma entidade conceitual
individual como uma seqüência de fatos envolvidos
na descrição de um outro fato.
Fig.3 A informação sensorial reforça determinados
caminhos para o fluxo de um raciocínio. Neste caso
o caminho reforçado é A-C.
Na Fig. 4 representa-se um exemplo de como
poderia ser o raciocínio em uma execução simples
como a de escrever a letra "a". Os dados sensoriais,
neste caso os dados procedentes da visão, são
processados pelo táIamo. O táIamo pode ser
considerado
uma etapa intermédia no
processamento das árvores heuristicas no córtex, e
está representado como uma elipse no centro do
cérebro, na Fig. 4. Na figura 4.A e 4.B o grupo de
três neurônios na esquerda são neuronios do córtex
associativo enquanto o neurônio à direita é um
neurônio sensorial. Suponhamos que a letra "a" está
representada pela ativação de um neurônio que pela
sua similaridade com os nós raiz da inteligência
artificial chamaremos neurônio raiz, o qual tem dois
neurônios subordinados: o primeiro representa uma
parte da letra "a", que é o círculo, e o segundo
representa a cauda da letra "a". Suponhamos que
existe um neurônio da área do córtex associativo
que é capaz de processar o objetivo de desenhar a
letra "a". As tarefas de desenhar o círculo e a cauda
estariam representadas pela ativação de dois
neurônios piramidais subordinados. Antes de
começar a desenhar, a folha de papel em branco é
percebida pelo córtex sensorial. Suponhamos que
exista um neurônio piramidal que processa o dado
informativo de uma folha em branco, Fig. 4.A. Este
neurônio piramidal representaria o nó origem da
árvore heuristico enquanto o neurônio na área
associativa que processa o objetivo de desenhar a
letra "a" representaria o nó objetivo da árvore. No
caso da figura 4.A o nó origem (neurônio do córtex
sensorial que processa a folha branca) reforça a
ativação do neurônio do córtex associativo cujo
objetivo é riscar o círculo da letra "a" (a união
entre estes neurônios esta representada por linhas
descontinuas).
3. O' AMBIENTE RESTRINGE A RAMIFICAÇÃO
DAS ÁRVORES DE NEURÔNIOS ORIENTANDO A
BUSCA HEURÍSTICA. Quando alguém resolve um
problema, leva-se em consideração o meio ao redor
para dirigir sua maneira de pensar. Dependendo-se
do ambiente que rodeia a pessoa, esta raciocina de
forma diferente e as percepções do ambiente
orientam o desenvolvimento do raciocínio. Na Fig.
3 a informação sensorial (pré-processada no t álamo
[2],[7],[8],[13],[16]) reforça o fluxo de informação
de A para C. O outro caminho A-B é restrito
(Como foi visto antes, a ativação de um neurônio
na uma camada cria um campo inibidor que
restringe a ativação de outros neurônios na' mesma
camada) . Durante o processo de raciocínio o ser
humano normalmente interage com o meio na
direção do objetivo pretendido. Este meio
modificado impõe novas restrições ao fluxo de
pensamento no cérebro, fechando alguns caminhos e
abrindo outros. Por
exemplo, durante o
desenvolvimento de uma idéia
as pessoas
costumam fazer esquemas em ' papel, de maneira
que estes esquemas sejam os novos dados sensoriais
que interagem com o fluxo de pensamento para
produzir o raciocínio. Sejam rascunhos no papel ou
outro tipo de resultados provisionais, a informação
sensorial pode facilitar ao cérebro o processamento
dos dados intermediários em um raciocínio. Além
disso, a informação sensorial atua inicialmente
como o nó "inicio" na busca heuristica na árvore de
propagação dupla.
379
A figura 4.B representa a etapa seguinte. A
primeira parte da letra "a", o círculo, já
desenhado; nesta ocasião o córtex sensonal
representa este fato (o círculo) e reforça a opção de
desenhar a cauda da letra "a"
no córtex
associativo.
A última etapa está representada pela FigA.C .
Nesta figura o raciocínio para escrever a letra "a" já
está terminado. Ilustra-se também o fato de que os
neurônios sensoriais que respondem frente a
conceitos simples (neste caso um círculo ou uma
linha) dão lugar a representações conceituais mais
complexas (neste caso a letra "a") convergindo
sobre os neurônios de camadas superiores. Assim o
círculo e a cauda produziriam a representação da
letra "a" no neurônio superior. Nesta figura, os
desenhos dos neurônios piramidais representam
dados ainda relativamente complexos. Como foi
indicado anteriormente, um conceito pode ser
representado não só pelo disparo de um neurônio
individual, mas por uma seqüência de ativação de
neurônios . Novamente, com um fim pedagógico e
sem pretender uma representação rigorosa, poderiase dizer que, por exemplo , o círculo da letra "a"
seria conseqüência da uma ativação seqüencial de
outros neurônios que representam segmentos retos
como se mostra na Fig. 5.
Fig. 5 Uma representação conceitual simples como
um círculo pode ser o resultado da ativação em
seqüência de representações ainda mais simples
como por exemplo linhas retas.
FigA
Os
dados
sensonais
ajudam
ao
desenvolvimento de um processo cognitivo, neste
caso ao processo de desenho da letra "a".
4.DISCUSSÃO: Neste trabalho são discutidas as
hipóteses de que as árvores de busca heuristica.da
inteligênciaartificial poderiam ter uma contrapartida
real nas árvores de neurônios piramidais no córtex
cerebral. Considerando vários fatos, como o tipo
das conexões sinápticas entre os neurônios, a
competição entre neurônios de cada camada, e a
possibilidade de ativação em bucle dos neurônios,
desenvolveu-se um novo paradigma de busca
heurística. Neste novo algoritmo
_busca, os
neurônios-nós de cada camada não apenas se
comunicam com os nós subordinados nas camadas
inferiores, também fornecem um sinal de consenso
o outro ' neurônio que representa a cauda da letra
"a" ficará inibido. A ativação do neurônio-círculo
fornecerá o inicio da etapa B da figura (Fig. 4.B)
Resumindo a etapa A: o dado sensorial produz a
ativação do neurônio da área sensorial com o
desenho da folha em branco na figura 4.A .Este
neurônio é equivalente a um nó-origem. Tendo o
objetivo de desenhar a letra "a" dividido em dois
processos, o de desenhar círculo e o de desenhar a
cauda, somente o objetivo de riscar círculo é
reforçado nesta ocasião peles dados sensoriais
(folha em branco no nó brigem).
380
ou divergência para as camadas . de maior nívelhierárquico. Desta maneira, se obtém um consenso
de todas as camadas sobre as decisões forn-ecidas
em cada uma destas . Um outro fato importante é
que a busca heuristica não só é desenvolvida na
direção início-objetivo , mas também em sentido
oposto. Os nós inícial e raiz na árvore de decisão na
inteligência
artificial
poderiam
ter
um
correlacionamento biológico com a ativação de
neurôníos de alto nível
hierárquico na área
associativa do córtex. Em tarefas que implicam uma
alta iteração com o meio sensorial, o nó início pode
estar sendo fornecido por uma representação do
ambiente no córtex sensorial. No cérebro "tudo
flui" . Incluso os dados aparentemente estáticos são
representados por seqüências de neur ônios, por isso
a permanência de uma imagem fixa no cérebro é
mais perdurável na memoria quando esta imagem
está também fora . E por isto que é muito útil a
referência sensorial nos resultados transitórios de
um processo de pensamento . Estas referências
sensoriais podem ser os resultados provisórios em
uma determinada tarefa ou os rascunhos para o
desenvolvimento de uma idéia. O tálamo, além de
ser a principal via de acesso do sentidos ao córtex,
seria também o ponto de encontro de diversos tipos
de informações sensoriais e cognitivas (como a
formulação de problemas e proposição de objetivos
etc.). Neste sentido o tálamo fornece o local onde o
"goal driven search" e o "data driven search" de um
algoritmo de busca bi-direcional se encontram .
Synaptic Efficacy by Coincidence of
Postsynaptic Aps and EPSPs. Science,
275:213-215
[7]Llinas,R.
&
Jahnsen,H.
(1982) .
Electrophysiology of mammalian thalamic
neurons in vitro. Nature, 297, :406-408.
[8]Llinas,R.R. ; Grace,AA.
&
Yarom, Y.
(1991)./n vitro neurons in mammalian
cortical layer 4 exhibit intrinsic oscilatory
activity in the 10- to 50-Hz frequency range.
Proc. Natl. Aead. Sei., 88:897-901.
[9]McClelland, 1.L., Rumelhart , D.E . & The
PDP Research Group . (1986) . Parallel
distributed processing: Exploration in the
microstructure of cognition. Cambridge, MA:
MITPress.
[lO]McClelland, 1.L., Rumelhart , D.E. (1988) .
Explorations
in
parallel
distributed
processing . Cambridge, MÀ: MIT Press.
[11]Pearl, 1. 1984. Heuristics: Intelligent
Strategies for Computer Problem Solving.
Reading, MA : Addison-Wesley.
[12]Ropero Pelaez, 1.
(1996) . A formal
representation of thalamus and cortex
computation. In: Eds. R. Moreno-Diaz; 1.
Mira-Mira . Brain processes, theories, and
models: an international conference in honor
of W.S. McCulloch 25 years after bis death
(pp. 154-163) Cambridge, Mass ., MIT Press .
[13]Ropero Pelaez, 1. (1996). A Model of
information processing and learning through
thalamus and cortex neural connectivity and
their neuron specific properties. In : Eds . The
Inst. of Electrical Engineers of Japan and
Muroran Inst. of Technology, Proceedings
of International Workshop on Soft
Computing in Industry 96 (pp . 139-147).
Muroran,Japan.
[14]Ropero Peláez, J. (1.997) "Plato's theory of
ideas revisited" .Neural Networks, Special
Issue on Consciousness (In Press)
[15]Sillito A., Cudeiro J, Murphy P. (1993)
Orientation Sensitive Elements in the
Corticofugal System from Visual Cortex to
Lateral Genículate Nucleus in the Cat (with
an
Appendix
on
Geniculo-cortical
Monosyriaptic Connections) . Exp. Brain
Researeh, 93:6-16
[16]Steriade, M. & Llinas,R.R. (1988), The
Functional State of the Thalamus and the
Associated
Neuronal Interplay . Physiol.
Rev.,68(3):649-739.
[17]Wehr Michael & Laurent Gilles (1996) .
Odour encoding by temporal sequences of
firing in oscillating neural assernblies, Nature,
384:162-165
5.REFERÊNCIAS:
[I] Artola, A. ; Brocher,S. & Singer W. (1990).
Different voltage-dependent threshold for
inducing long-term depression and long-tem
potentiation in siices of rat visual cortex .
Nature,347 :69-72
[2] Churchland, P .S. & Sejnowsky, T.J. (1992) .
The Computational Brain . Cambridge, MA:
MIT Press.
[3] DeCharms , R.Christopher & Merzeních,
Michael M. (1996) Primary cortical
repres--tation of sounds by the coordination
of actio-potential timing. Nature , 381 : 619612
[4]DeFelipe,1. & Farinas.I. (1992) . The
pyramidal neuron of the cerebral cortex .
Morphological and chemical characteristics
of the synaptic inputs. Progress in
Neurobiology,39:563-607 .
[5]Horowitz,
E.
&
Sahni,S.
(1978)
Fundamentais of Computer Algorithms .
Rockville, MD: Computer Science Press .
[6]Markram Henry, Lubke Joachim, Frotscher
Michael, Sakrnann Bert .(1997) Regulation of
381