Um Novo Algoritmo de Busca Heurística Baseado no Processamento do Córtex Cerebral Javier Ropero Peláez & Marcelo Godoy Simões Escola Politécnica da Universidade de São Paulo PMCIMecatrónica Os últimos descobrimentos neurológicos reforçam a idéia de que há cadeias d e ativação seqüencial entre os neurônios piramidais no córtex cerebral; esta possibilidade sugere que o raciocínio é uma conseqüência de uma ativação seqüencial dos neurônios. A organização hierárquica dos neurônios no córtex é muito similar a uma estrutura de árvore nos algoritmos de busca heuristica. Neste trabalho propõense um novo algoritmo de busca heuristica baseado nestes desenvolvimentos biológicos. Uma novidade neste algoritmo é que a ramificação da árvore é guiada pelas restrições impostas pelo entorno sensorial. l.INTRODUÇÃO: Árvores de decisão e árvores neurais. As árvores de decisão utilizadas na área de inteligência artificial [5],[11] para encontrar o melhor conjunto de atuações a fim de obter um determinado objetivo a partir de um estado inicial, têm similaridades importantes com a organização dos neurônios no córtex cerebral [4],[13], similaridades estas que serão explicadas a seguir. a. Estrutura hierarquizada. De uma maneira esquemática suponhamos que todo racionamento é do tipo: Partindo do estado A deve-se chegar ao B. Como foi mencionado antes, o conjunto de processos para, saindo de A, chegar até B é chamado árvore de decisão, ou árvore de busca heuristica. Neste artigo se postula que, no caso biológico, existem estruturas cerebrais que permitem desenvolver um problema desde uma origem (A) a um objetivo (B) mediante uma árvore de decisão. Neste caso os neurônios piramidais [4], que formam uma estrutura em árbore , são os primeiros candidatos para se estudar esta possibilidade. Nas árvores de decisão, os nós que representam os estados de uma determinada variável estão organizados em camadas. Cada nó numa camada é o resultado de um outro nó de uma camada superior. Um nó de hierarquia máxima, chamado nó raiz, pode definir o inicio, A, (Fig.l) do raciocínio na busca heuristica para a frente ("data-driven search") .Em outro caso, um nó raiz pode definir o objetivo, B, no raciocínio para trás a partir dos estados objetivo ("goal-driven search"). Além disto uma outra possibilidade, que existe na inteligência artificial e que se propõe para o processo cerebral, é que o raciocínio comece simultaneamente desde os dois nós, origem.A, e destino B, e seja propagado em ambos sentidos, desde A para B e desde B para A pela árvore heuristica (Fig.l) b. Nós origem e nõs objetivo. Nas árvores corticais o neurônio superior representa um estado de máxima integração conceitual [14]. Propõense que a ativação de um ou vários destes neurônios podem representar um objetivo, B, que se deseja resolver como acontece com os nós "goal" da busca heuristica. Os nós que representam estados iniciais, A, também seriam representados pela ativação de neurônios corticais de hierarquia máxima. Em geral, considera-se que os neurônios das camadas superiores representam conceitos mais elaborados que os das camadas imediatamente inferiores. Poderiase especular que tendo em vista que alguns neurônios respondem de maneira específica frente a conceitos complexos (como a visão de um rosto) , os neurônios subordinados representariam características mais simples que compõem estes conceitos (nariz, boca, olhos, linhas [15] etc.) Os neurônios que integram informação sensorial serão considerados como moduladores do fluxo de A para B. Apesar disto, a origem "A" pode Nó objetivo, B Fig.l Exemplo de árvore de decisão de dois sentidos, combinando a busca para frente "data driven search" com a busca para atrás "goal driven search". 377 representar, como veremos, o ambiente externo que a pessoa quer modificar com seu pensamento . Neste caso o neurônio que integra a informação externa tornar-se-á o nó inicial da árvore. c. Competição dentro de cada camada. Em alguns algoritmos de busca como no "best first" [11], um só dos nós candidatos é selecionado (aquele que tem a melhor avaliação). Em algumas ocasiões o critério de avaliação é a eleição do nó que tem o maior peso no seus arcos . Nas camadas corticais, os neurônios piramidais que pertencem a um mesmo "cluster" competem entre si até que um dos neurônios corticais seja o vencedor (vide aprendizagem competitiva) [9], [10]. Neste caso, o critério de avaliação é o valor máximo das entradas ponderados pelo reforço sináptico em cada neurônio . Esta competição é produzida quando os neurônios piramidais ativam os neurônios inibitórios que os rodeiam. Neste campo de inibição só o neurônio piramidal mais ativado sobrevive. d. Ponderações nos arcos que unem cada nó. Nas árvores de busca heurística cada arco tem uma ponderação onde o valor de cada nó é a soma das ponderações de todos os trechos no caminho desde o nó raiz até o nó em questão . As conexões entre os neurônios também levam ponderações que foram desenvolvidas durante a aprendizagem [I] , [6] a . Camada 1 2 2. UM ALGORITMO PARA O CONSENSO NEURAL. Nas diversas áreas do córtex cerebral os neurônios piramidais estão dispostos em camadas . Na Fig. 2.a está representado o tipo mais freqüente de conexão entre um neurônio 1 de uma camada superior, e dos neurônios 2 de uma camada imediatamente abaixo. Como se pode ver, o neurônio 1 da camada superior faz conexão com os neurônios 2 da camada inferior. Os neurônios da camada inferior, geralmente fornecem um sinal de consenso de volta ao neurônio I. Assim explica-se o processamento "up-down" dirigido desde as camadas superiores (de maior nível hierárquico) as quais supomos que podem fornecer tanto os objetivos como os estados iniciais da busca heurística. No caso mais geral o neurônio "raiz" na camada superíor dispara sobre vários neurônios na camada seguinte . Na Fig.2.B a ativação do neurônio "A" faz com que os neurônios na camada dois concorram entre si até o momento em que um deles seja vencedor, neste caso o neurônio B. (Observe que o peso de A para B, 0.6, é maior que de A para C, 0.4). Apesar disto o neurônio B não será um vencedor definitivo, mas somente um candidato. Sua candidatura deverá ser avaliada pelos neurônios da camáda seguinte: D,E,F . Neste caso, B dispara com maior intensidade sobre E, ' e este sobre C, favorecendo a mudança da candidatura de B porC na segunda camada (a soma 3 4 c Fig.2 (a) Disposição mais geral das sinapses entre duas camadas de neurônios piramidais no córtex cerebral. (b) Processamento na árvore heurístico cujos estados envolvem a ativação dos neurônios piramidais.( c) Árvore heurística no qual os estados estão codificados pela ativação seqüencial em bucle de vários neurônios (circulos). total dos pesos sobre C termina sendo I, enquanto que sobre B é 0.6). O processo de avaliação da candidatura de C continua do mesmo modo, enquanto outras candidaturas subseqüentes são avaliadas (como a candidatura de E na terceira camada). Neste modo obtém-se um consenso geral que poderíamos denominar "democracia neural" entre o neurônio raiz e os neurônios das seguintes camadas. 378 Recentes estudos neurológicos e computacionais [3],[17],[14] indicam que os conteúdos conceituais poderiam não estar restritos a neurônios individuais mas a grupos de neurônios piramidais. Nestes grupos, os neurônios podem disparar seqüencialmente e hipoteticamente podem formar buc1es oscilatórios fechados, para manter os conteúdos que armazenam de maneira estável durante um certo periodo de tempo. Desta forma o algoritmo apresentado acima seria melhor representado, se ao invés de neurônios individuais, as unidades conceituais fossem buc1es de ativação de vários neurônios (Fig. 2.C). Recentes estudos neuro-fisiológicos e computacionais parecem indicar que o reforço sináptico permite não apenas criar vínculos entre os neurônios ' ativados simultaneamente, mas também memorizar a . seqüência exata em que diferentes neurônios se ativaram durante a apresentação de um determinado estímulo [6], [14]. Neste caso o significado de um buc1e pode ser tanto uma entidade conceitual individual como uma seqüência de fatos envolvidos na descrição de um outro fato. Fig.3 A informação sensorial reforça determinados caminhos para o fluxo de um raciocínio. Neste caso o caminho reforçado é A-C. Na Fig. 4 representa-se um exemplo de como poderia ser o raciocínio em uma execução simples como a de escrever a letra "a". Os dados sensoriais, neste caso os dados procedentes da visão, são processados pelo táIamo. O táIamo pode ser considerado uma etapa intermédia no processamento das árvores heuristicas no córtex, e está representado como uma elipse no centro do cérebro, na Fig. 4. Na figura 4.A e 4.B o grupo de três neurônios na esquerda são neuronios do córtex associativo enquanto o neurônio à direita é um neurônio sensorial. Suponhamos que a letra "a" está representada pela ativação de um neurônio que pela sua similaridade com os nós raiz da inteligência artificial chamaremos neurônio raiz, o qual tem dois neurônios subordinados: o primeiro representa uma parte da letra "a", que é o círculo, e o segundo representa a cauda da letra "a". Suponhamos que existe um neurônio da área do córtex associativo que é capaz de processar o objetivo de desenhar a letra "a". As tarefas de desenhar o círculo e a cauda estariam representadas pela ativação de dois neurônios piramidais subordinados. Antes de começar a desenhar, a folha de papel em branco é percebida pelo córtex sensorial. Suponhamos que exista um neurônio piramidal que processa o dado informativo de uma folha em branco, Fig. 4.A. Este neurônio piramidal representaria o nó origem da árvore heuristico enquanto o neurônio na área associativa que processa o objetivo de desenhar a letra "a" representaria o nó objetivo da árvore. No caso da figura 4.A o nó origem (neurônio do córtex sensorial que processa a folha branca) reforça a ativação do neurônio do córtex associativo cujo objetivo é riscar o círculo da letra "a" (a união entre estes neurônios esta representada por linhas descontinuas). 3. O' AMBIENTE RESTRINGE A RAMIFICAÇÃO DAS ÁRVORES DE NEURÔNIOS ORIENTANDO A BUSCA HEURÍSTICA. Quando alguém resolve um problema, leva-se em consideração o meio ao redor para dirigir sua maneira de pensar. Dependendo-se do ambiente que rodeia a pessoa, esta raciocina de forma diferente e as percepções do ambiente orientam o desenvolvimento do raciocínio. Na Fig. 3 a informação sensorial (pré-processada no t álamo [2],[7],[8],[13],[16]) reforça o fluxo de informação de A para C. O outro caminho A-B é restrito (Como foi visto antes, a ativação de um neurônio na uma camada cria um campo inibidor que restringe a ativação de outros neurônios na' mesma camada) . Durante o processo de raciocínio o ser humano normalmente interage com o meio na direção do objetivo pretendido. Este meio modificado impõe novas restrições ao fluxo de pensamento no cérebro, fechando alguns caminhos e abrindo outros. Por exemplo, durante o desenvolvimento de uma idéia as pessoas costumam fazer esquemas em ' papel, de maneira que estes esquemas sejam os novos dados sensoriais que interagem com o fluxo de pensamento para produzir o raciocínio. Sejam rascunhos no papel ou outro tipo de resultados provisionais, a informação sensorial pode facilitar ao cérebro o processamento dos dados intermediários em um raciocínio. Além disso, a informação sensorial atua inicialmente como o nó "inicio" na busca heuristica na árvore de propagação dupla. 379 A figura 4.B representa a etapa seguinte. A primeira parte da letra "a", o círculo, já desenhado; nesta ocasião o córtex sensonal representa este fato (o círculo) e reforça a opção de desenhar a cauda da letra "a" no córtex associativo. A última etapa está representada pela FigA.C . Nesta figura o raciocínio para escrever a letra "a" já está terminado. Ilustra-se também o fato de que os neurônios sensoriais que respondem frente a conceitos simples (neste caso um círculo ou uma linha) dão lugar a representações conceituais mais complexas (neste caso a letra "a") convergindo sobre os neurônios de camadas superiores. Assim o círculo e a cauda produziriam a representação da letra "a" no neurônio superior. Nesta figura, os desenhos dos neurônios piramidais representam dados ainda relativamente complexos. Como foi indicado anteriormente, um conceito pode ser representado não só pelo disparo de um neurônio individual, mas por uma seqüência de ativação de neurônios . Novamente, com um fim pedagógico e sem pretender uma representação rigorosa, poderiase dizer que, por exemplo , o círculo da letra "a" seria conseqüência da uma ativação seqüencial de outros neurônios que representam segmentos retos como se mostra na Fig. 5. Fig. 5 Uma representação conceitual simples como um círculo pode ser o resultado da ativação em seqüência de representações ainda mais simples como por exemplo linhas retas. FigA Os dados sensonais ajudam ao desenvolvimento de um processo cognitivo, neste caso ao processo de desenho da letra "a". 4.DISCUSSÃO: Neste trabalho são discutidas as hipóteses de que as árvores de busca heuristica.da inteligênciaartificial poderiam ter uma contrapartida real nas árvores de neurônios piramidais no córtex cerebral. Considerando vários fatos, como o tipo das conexões sinápticas entre os neurônios, a competição entre neurônios de cada camada, e a possibilidade de ativação em bucle dos neurônios, desenvolveu-se um novo paradigma de busca heurística. Neste novo algoritmo _busca, os neurônios-nós de cada camada não apenas se comunicam com os nós subordinados nas camadas inferiores, também fornecem um sinal de consenso o outro ' neurônio que representa a cauda da letra "a" ficará inibido. A ativação do neurônio-círculo fornecerá o inicio da etapa B da figura (Fig. 4.B) Resumindo a etapa A: o dado sensorial produz a ativação do neurônio da área sensorial com o desenho da folha em branco na figura 4.A .Este neurônio é equivalente a um nó-origem. Tendo o objetivo de desenhar a letra "a" dividido em dois processos, o de desenhar círculo e o de desenhar a cauda, somente o objetivo de riscar círculo é reforçado nesta ocasião peles dados sensoriais (folha em branco no nó brigem). 380 ou divergência para as camadas . de maior nívelhierárquico. Desta maneira, se obtém um consenso de todas as camadas sobre as decisões forn-ecidas em cada uma destas . Um outro fato importante é que a busca heuristica não só é desenvolvida na direção início-objetivo , mas também em sentido oposto. Os nós inícial e raiz na árvore de decisão na inteligência artificial poderiam ter um correlacionamento biológico com a ativação de neurôníos de alto nível hierárquico na área associativa do córtex. Em tarefas que implicam uma alta iteração com o meio sensorial, o nó início pode estar sendo fornecido por uma representação do ambiente no córtex sensorial. No cérebro "tudo flui" . Incluso os dados aparentemente estáticos são representados por seqüências de neur ônios, por isso a permanência de uma imagem fixa no cérebro é mais perdurável na memoria quando esta imagem está também fora . E por isto que é muito útil a referência sensorial nos resultados transitórios de um processo de pensamento . Estas referências sensoriais podem ser os resultados provisórios em uma determinada tarefa ou os rascunhos para o desenvolvimento de uma idéia. O tálamo, além de ser a principal via de acesso do sentidos ao córtex, seria também o ponto de encontro de diversos tipos de informações sensoriais e cognitivas (como a formulação de problemas e proposição de objetivos etc.). Neste sentido o tálamo fornece o local onde o "goal driven search" e o "data driven search" de um algoritmo de busca bi-direcional se encontram . Synaptic Efficacy by Coincidence of Postsynaptic Aps and EPSPs. Science, 275:213-215 [7]Llinas,R. & Jahnsen,H. (1982) . Electrophysiology of mammalian thalamic neurons in vitro. Nature, 297, :406-408. [8]Llinas,R.R. ; Grace,AA. & Yarom, Y. (1991)./n vitro neurons in mammalian cortical layer 4 exhibit intrinsic oscilatory activity in the 10- to 50-Hz frequency range. Proc. Natl. Aead. Sei., 88:897-901. [9]McClelland, 1.L., Rumelhart , D.E . & The PDP Research Group . (1986) . Parallel distributed processing: Exploration in the microstructure of cognition. Cambridge, MA: MITPress. [lO]McClelland, 1.L., Rumelhart , D.E. (1988) . Explorations in parallel distributed processing . Cambridge, MÀ: MIT Press. [11]Pearl, 1. 1984. Heuristics: Intelligent Strategies for Computer Problem Solving. Reading, MA : Addison-Wesley. [12]Ropero Pelaez, 1. (1996) . A formal representation of thalamus and cortex computation. In: Eds. R. Moreno-Diaz; 1. Mira-Mira . Brain processes, theories, and models: an international conference in honor of W.S. McCulloch 25 years after bis death (pp. 154-163) Cambridge, Mass ., MIT Press . [13]Ropero Pelaez, 1. (1996). A Model of information processing and learning through thalamus and cortex neural connectivity and their neuron specific properties. In : Eds . The Inst. of Electrical Engineers of Japan and Muroran Inst. of Technology, Proceedings of International Workshop on Soft Computing in Industry 96 (pp . 139-147). Muroran,Japan. [14]Ropero Peláez, J. (1.997) "Plato's theory of ideas revisited" .Neural Networks, Special Issue on Consciousness (In Press) [15]Sillito A., Cudeiro J, Murphy P. (1993) Orientation Sensitive Elements in the Corticofugal System from Visual Cortex to Lateral Genículate Nucleus in the Cat (with an Appendix on Geniculo-cortical Monosyriaptic Connections) . Exp. Brain Researeh, 93:6-16 [16]Steriade, M. & Llinas,R.R. (1988), The Functional State of the Thalamus and the Associated Neuronal Interplay . Physiol. Rev.,68(3):649-739. [17]Wehr Michael & Laurent Gilles (1996) . Odour encoding by temporal sequences of firing in oscillating neural assernblies, Nature, 384:162-165 5.REFERÊNCIAS: [I] Artola, A. ; Brocher,S. & Singer W. (1990). Different voltage-dependent threshold for inducing long-term depression and long-tem potentiation in siices of rat visual cortex . Nature,347 :69-72 [2] Churchland, P .S. & Sejnowsky, T.J. (1992) . The Computational Brain . Cambridge, MA: MIT Press. [3] DeCharms , R.Christopher & Merzeních, Michael M. (1996) Primary cortical repres--tation of sounds by the coordination of actio-potential timing. Nature , 381 : 619612 [4]DeFelipe,1. & Farinas.I. (1992) . The pyramidal neuron of the cerebral cortex . Morphological and chemical characteristics of the synaptic inputs. Progress in Neurobiology,39:563-607 . [5]Horowitz, E. & Sahni,S. (1978) Fundamentais of Computer Algorithms . Rockville, MD: Computer Science Press . [6]Markram Henry, Lubke Joachim, Frotscher Michael, Sakrnann Bert .(1997) Regulation of 381