Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Capítulo 03. O Modelo de seleção pelas consequências: O nível filogenético Camila Muchon de Melo 2 Universidade Estadual de Londrina (UEL) Alexandre Dittrich Universidade Federal do Paraná Márcio Borges Moreira Instituto Walden4, Instituto de Educação Superior de Brasília Ricardo Corrêa Martone Universidade de Brasília Introdução Se parássemos por um momento para tentar identificar as diferenças mais básicas, mais fundamentais, entre as diferentes abordagens psicológicas, talvez chegássemos à conclusão de que essas diferenças dizem respeito ao modelo explicativo (ou modelo causal) de cada abordagem. Um modelo explicativo é um quadro geral de referência a partir do qual cada abordagem psicológica (ou cada área da ciência) parte para tentar explicar os fenômenos que estuda, isto é, para tentar identificar, de maneira geral, os determinantes dos fenômenos que estuda. Neste sentido, praticamente todas as abordagens psicológicas são deterministas. Há muita confusão no uso do termo determinismo em Psicologia. Muitas vezes esse termo é usado com um sentido de “predestinação”, trazendo uma conotação de imutabilidade. Essa ideia de determinismo, entre outras, é absolutamente equivocada. De maneira geral, dizer que uma abordagem psicológica é determinista é o mesmo que dizer que para esta abordagem o comportamento humano possui causas (múltiplas causas na maioria das vezes), que é passível de explicação e não simplesmente um produto do acaso ou algo meramente espontâneo. O modelo explicativo, por exemplo, da Psicanálise, baseia-se em um determinismo psíquico. Isto quer dizer que, dentro do quadro de referência da Psicanálise, os comportamentos têm uma causa, um explicação, e essa explicação, essa causa, encontra-se na psique do indivíduo (e.g., motivações inconscientes). Outras abordagens ou áreas da psicologia podem estar mais baseadas em um determinismo biológico, ou seja, o quadro geral de referência para explicar o comportamento estará relacionado a variáveis biológicas (e.g., níveis de serotonina). Portanto, não é, de forma alguma, pejorativo dizer que uma abordagem é determinista, já que todas – ou quase todas – 2 Partes desse capítulo foram originalmente publicadas na dissertação de mestrado da primeira autora e da tese de doutorado do segundo e quarto autores: • Melo, C. M. (2004). A concepção de Homem no Behaviorismo Radical de Skinner: um compromisso com o 'bem' da cultura. Dissertação de mestrado, Universidade Federal de São Carlos-SP. • Dittrich, A. (2004). Behaviorismo radical, ética e política: aspectos teóricos do compromisso social. Tese de doutorado, Universidade Federal de São Carlos-SP. • Martone, R. C. (2008). Efeito de consequências externas e de mudanças na constituição do grupo sobre a distribuição dos ganhos em uma metacontingência experimental. Tese de doutorado, Universidade de Brasília-DF. www.walden4.com.br 24 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. consideram que o comportamento humano pode ser, de alguma maneira, explicado, que não é meramente espontâneo (pelo menos boa parte dele); e se não fosse assim, seria difícil pensar na existência de uma ciência chamada Psicologia. O modelo explicativo da Análise do Comportamento baseia-se em um determinismo ambiental. O adjetivo ambiental, embora empregado corretamente para qualificar o tipo de determinismo na qual se baseia a Análise do Comportamento, gera muitas vezes concepções erradas sobre essa abordagem – talvez em função do uso cotidiano do termo ambiente. Talvez pudéssemos falar, com relação à Análise do Comportamento, em um determinismo sócio-histórico, ou em um determinismo interacionista, já que a Análise do Comportamento busca explicar/descrever o comportamento humano, em grande parte, a partir das interações que a pessoa estabelece, ao longo de sua vida, com outras pessoas. Entretanto, essas interações não são tudo e, por isso, o termo ambiental parece ser ainda o mais apropriado (esperamos que isso fique mais claro ao longo deste capítulo). O modelo explicativo proposto por B. F. Skinner foi influenciado pelo modelo selecionista de Charles Darwin e pela Lei do Efeito de Edward Thorndike . É um modelo de causalidade dinâmico, baseado em interações organismo-ambiente e, principalmente, um modelo que foi baseado em dados empíricos sobre o comportamento dos organismos e pode ser testado empiricamente: o modelo de seleção pelas consequências. Esse modelo de causalidade foi descrito explicitamente por B. F. Skinner em 1981/2007, em um artigo intitulado Seleção por Consequências. Neste trabalho Skinner definiu que tanto características biológicas quanto características comportamentais e culturais evoluem por intermédio de processos seletivos. Profundamente influenciado pelas proposições de Darwin e Wallace a respeito de como as espécies evoluíram, Skinner cunhou o termo seleção por consequências para descrever o processo pelo qual o comportamento é determinado. Lembrando sempre que o objeto de estudo para Skinner é o comportamento, variações comportamentais no repertório de um organismo serão selecionadas por intermédio de sua relação com o ambiente, possibilitando, assim, a atuação de contingências seletivas. É por intermédio do processo de seleção pelas consequências que as espécies, o comportamento dos organismos e as culturas evoluem. Assim, podemos identificar três níveis de processos de variação e seleção: 1) filogenético, o qual estabelece as características denominadas filogenéticas (ou inatas) das espécies; 2) ontogenético (ou aprendidas), o qual estabelece as características individuais dos organismos; e 3) cultural (aprendido), o qual possibilita o surgimento e transmissão de práticas culturais. Embora os processos de variação e seleção atuem de maneira semelhante nos três níveis, discutiremos cada um deles, por razões didáticas, em separado. www.walden4.com.br 25 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Seleção pelas consequências no nível filogenético (nível 1) Em seu livro de 1859, A Origem das Espécies, Darwin explica a origem das diferentes espécies de seres vivos, bem como diferenciações de uma mesma espécie, a partir de dois processos básicos principais: variação e seleção. Cada indivíduo de uma dada espécie é único, no sentido de ser diferente, em maior ou menor grau, de outros membros da mesma espécie. Essas diferenças referem-se a características anatômicas, fisiológicas e comportamentais. Falamos aqui, então, de variação ou variabilidade entre membros de uma mesma espécie. Estes membros desta espécie vivem, geralmente, em um mesmo ambiente, e suas características anatômicas, fisiológicas e comportamentais são favoráveis à vida neste ambiente, isto é, a espécie está adaptada ao ambiente. Enquanto este ambiente se mantiver inalterado, há uma probabilidade maior de manutenção das características da espécie, mesmo que haja diferenças entre cada membro. De acordo com Darwin (1859), entretanto, se houver mudanças no ambiente desta espécie, aqueles indivíduos cujas características mostrarem-se mais adequadas ao novo ambiente terão mais chances de sobreviver e passar seus genes adiante (prole). Vejamos um exemplo fornecido por Darwin: Vejamos o exemplo de um lobo, que caça vários tipos de animais, conseguindo alguns pela estratégia de caça, outros pela força e outros pela rapidez; suponhamos que uma presa mais rápida, um veado, por exemplo, por algum motivo, aumentou seu número em um determinado local, ou que outras presas diminuíram seu número, durante a época do ano na qual o lobo mais precisa de comida. Sob essas circunstâncias, não vejo razão para duvidar que os lobos mais rápidos e mais magros teriam as melhores chances de sobreviverem, e, portanto, de serem preservados ou selecionados (...) (Darwin, 1859). No exemplo acima podemos identificar os dois princípios básicos apontados por Darwin (1859): lobos, membros de uma mesma espécie, diferem, por exemplo, em força e agilidade ou rapidez (variabilidade); e quando o ambiente muda (maior disponibilidade de presas velozes), aqueles lobos que são mais velozes têm mais chances de sobreviver e transmitir seus genes para sua prole e, consequentemente, depois de algum tempo haverá uma maior quantidade de lobos mais velozes. Neste sentido, dizemos que o ambiente selecionou esta característica (maior velocidade). Dizer que o ambiente selecionou uma característica é o mesmo que dizer que ela se tornou mais frequente. No exemplo de Darwin (1859), em um primeiro momento, a maioria dos lobos era capaz de correr a certa velocidade média X. Alguns poucos lobos eram capazes de correr a uma velocidade média um pouco menor que X e outros a uma velocidade média um pouco maior (variabilidade). Quando as presas disponíveis no ambiente dos lobos eram aquelas mais velozes, aqueles poucos lobos que eram mais rápidos (e isso era uma característica genética deles) foram mais capazes de se alimentar e transmitir seus genes para seus descendentes, que, provavelmente, também eram mais velozes que a média. Depois de algum tempo, aquela velocidade média (mais veloz) passou a ser bem mais www.walden4.com.br 26 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. frequente naquele grupo de lobos, isto é, havia mais lobos capazes de desenvolver velocidades maiores. Segundo Skinner (1981/2007), o processo de seleção por consequências é um princípio causal encontrado apenas em seres vivos ou em máquinas construídas por seres vivos. Por sua vez, a evolução, presumivelmente, é a própria consequência da seleção natural, ou seja, apenas quando observamos que uma espécie evoluiu é que podemos inferir que ela passou por um processo de seleção natural. Nesse processo, as variações que forem favoráveis à sobrevivência e reprodução da espécie são mantidas e as desfavoráveis são extintas. Entretanto, o “favorável” e o “desfavorável” são critérios arbitrários sem direção a um objetivo, pois a seleção natural não tem sentido de “progresso”. Ela não tem um propósito, é apenas o efeito ou a consequência da interação dos organismos com as variações ambientais. Ressalta-se que a seleção natural é apenas um dos mecanismos envolvidos na evolução das espécie; deriva genética e fluxo gênico são exemplos de outros mecanismos envolvidos na evolução das espécies. A seleção por consequências no nível 1 ocorre quando peculiaridades em uma espécie são transmitidas de geração a geração. A seleção de um traço que favoreça a sobrevivência e/ou a reprodução da espécie pode demorar milhões de anos, fato que dificulta o próprio estudo das contingências de sobrevivência que selecionaram as características observadas nos estágios atuais das espécies. Skinner (1981/2007) enfatiza que biólogos estudam os processos pelos quais as variações surgem e são selecionadas, porém, dificilmente eles conseguem reconstruir em um ambiente experimental o processo de evolução de uma espécie. O grau de suscetibilidade à aprendizagem dos seres humanos, e consequentemente a possibilidade do desenvolvimento da cultura, são exemplos de variações que devem ter favorecido a seleção da espécie humana. A seleção natural possibilitou a evolução da suscetibilidade dos organismos às consequências de reforço e, no caso da espécie humana, a musculatura vocal também passou a ser sensível a esse tipo de controle, isto é, nossa capacidade de aprendermos a falar da forma como falamos, nossa linguagem. Sendo assim, tais características possibilitaram à espécie humana comportar-se de maneiras cada vez mais complexas: O comportamento funcionava apropriadamente apenas sob condições relativamente similares àquelas sob as quais fora selecionado. A reprodução sob uma ampla gama de condições tornou-se possível com a evolução de dois processos por meio dos quais organismos individuais adquiriam comportamentos apropriados a novos ambientes. Por meio do condicionamento respondente (pavloviano), respostas preparadas previamente pela seleção natural poderiam ficar sob o controle de novos estímulos. Por meio do condicionamento operante, novas respostas poderiam ser fortalecidas (“reforçadas”) por eventos que imediatamente as seguissem (Skinner, 1981/2007). Como apontado por Skinner (1981/2007) no trecho acima, quando um determinado comportamento é selecionado em uma determinada espécie, esse comportamento somente será adaptativo enquanto as condições ambientais que o selecionaram permanecerem as mesmas. No entanto, o próprio processo de seleção natural teria sido responsável pela seleção de duas características importantes que passaram a permitir que os membros de uma espécie pudessem, durante o período de sua vida, se adaptar a ambientes diferentes – ou lidar mais facilmente com mudanças em seu próprio ambiente. Essas características podem ser definidas como capacidades para aprender a interagir de novas formas com o ambiente. Vejamos mais um exemplo de variação e seleção pelas consequências no nível filogenético. A Figura 1 mostra dois quadros, um com fundo branco (Período 1) e outro com fundo em degrade (Períodos 2, 3 e 4). O fundo de cada www.walden4.com.br 27 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. quadro representa a cor da casca de uma espécie de árvore em determinados períodos de tempo. Cada “ampulheta” dentro dos quadros representa um indivíduo de uma espécie de mariposa. Note que no primeiro quadro (Período 1), a casca das árvores é branca, bem como a maioria das mariposas. As mariposas terem a mesma cor da casca das árvores tem uma vantagem evolutiva óbvia: elas ficam camufladas e, portanto, são menos suscetíveis ao ataque de predadores, podendo viver por mais tempo e ter chances de se reproduzirem. A cor branca da cada mariposa é determinada por seus genes, portanto, há uma grande chance de que sua prole também seja branca e também tenha boas chances de sobreviver e transmitir seus genes para seus descendentes, perpetuando a espécie. No entanto, cada mariposa que nasce é ligeiramente diferente de seus progenitores e em alguns poucos casos, é bastante diferente. Observe na Figura 1, no primeiro quadro, que há mariposas de vários tamanhos e, embora a Figura 1: Ilustração de mudanças em características casca das árvores seja branca, há anatômicas em função de mudanças no ambiente. Cada algumas poucas mariposas que são “ampulheta” representa um indivíduo de uma espécie de mais escuras que as outras. Estas mariposas e os fundos da figuras representam a cor da de árvores na quais as mariposas frequentemente mariposas mais escuras são poucas casca repousam. justamente porque têm menos chances que as outras de sobreviver e reproduzir. Sempre haverá mariposas ligeiramente diferentes e algumas poucas bastante diferentes. E isso é variação, neste caso, de uma característica anatômica. O mesmo raciocínio pode ser aplicado para variações fisiológicas e comportamentais. Na Figura 1, o segundo quadro começa com a cor branca e fica mais escuro – Períodos 2, 3 e 4. O interessante deste quadro é notar que à medida que as cascas das árvores, por algum motivo (poluição, por exemplo), ficam mais escuras, o número de mariposas brancas diminui gradativamente, até que a proporção entre mariposas claras e escuras se inverte. À medida que a casca das árvores fica mais escura, as mariposas mais escuras têm mais chances de sobreviver e reproduzir que as mais claras. Não diríamos nesse exemplo que “as mariposas mudaram de cor para se adaptar”. Simplesmente dizemos que o ambiente selecionou as variações (cor, nesse exemplo) mais adaptadas ao ambiente. Variabilidade e fontes de variabilidade no nível filogenético Como dito anteriormente, existe variabilidade entre membros de uma mesma espécie (e.g., altura, cor, força, etc.). Boa parte dessa variabilidade se deve a características genéticas. A Figura 2 ilustra algumas dessas diferenças, diferenças essas que não ocorrem em função do que ocorre ao longo da vida de um organismo (pessoa, planta ou animal), mas em função de sua dotação genética. Sabemos que a alimentação, por exemplo, pode influenciar a altura que uma pessoa irá ter em sua idade adulta. No www.walden4.com.br 28 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. entanto, chegar a quase 2,4 metros de altura ou não chegar a meio metro certamente está relacionado a questões genéticas. O mecanismo de transmissão genética das características hereditárias não era conhecido na época em que Darwin desenvolveu sua teoria, mas o processo começou a ser desvendado a partir da década de 1920. Grande parte dos genes permanece inalterado durante sua reprodução e transmissão para as sucessivas gerações de organismos. A permanência dos genes no “fundo” genético de uma espécie depende, porém, das consequências de sua expressão fenotípica na interação com o ambiente. Figura 2: Exemplos de variabilidade filogenética (anatômicas) entre membros da mesma espécie. Contudo, há exceções nesse processo, e elas explicam a variação dos genes. Na reprodução sexual, a geração de gametas por divisão meiótica permite o reagrupamento dos genes dos organismos reprodutores através de recombinação (parte desse processo é ilustrada na Figura 3). Novas variações de unidades genéticas surgem a partir desse processo, que precede regularmente o contato sexual. Mutações genéticas, por outro lado, são acontecimentos muito mais raros, e normalmente suas consequências são desvantajosas para o fenótipo. Porém, as mutações também podem favorecer filogeneticamente o organismo – e, neste sentido, desempenham papel fundamental na produção de variabilidade em uma população de genes. Por Figura 3: A parte esquerda da figura ilustra a recombinação definição, todas as mutações são genética (chamada crossing over) dos genes paterno e materno. A parte direita da figura é a ilustração de uma “erros” – isto é, todas originam-se molécula de DNA (ácido desoxirribonucléico). de falhas no processo de replicação genética. Em sentido estritamente www.walden4.com.br 29 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. evolutivo, porém, somente as variáveis selecionadoras podem definir se uma mutação é um “erro” ou um “acerto”. É mesmo possível que certa mutação seja um “acerto” sob certas circunstâncias ambientais e um “erro” dadas outras circunstâncias. O que é selecionado? Em sua obra máxima, The Origin of Species (1859/1902), Darwin argumenta que a atuação da seleção natural ocorre sobre organismos individuais – isto é, sobre suas características morfológicas, fisiológicas e comportamentais. Posteriormente, surgiria a hipótese de que a seleção atuaria não sobre o indivíduo, mas sobre a espécie à qual este pertence. Durante décadas, a questão foi alvo de acalorados debates – e, a rigor, ainda não há acordo definitivo sobre o tema. Atualmente, porém, a chamada síntese neodarwiniana – isto é, a base do pensamento evolucionista atual, derivada da conjugação e atualização dos trabalhos de Darwin e Mendel – tende a reconhecer o gene como a unidade primária sobre a qual age a seleção natural (Dawkins, 1976/1979). Essa hipótese permite explicar, por exemplo, a seleção de parentesco, e mesmo formas de comportamento “altruísta” que parecem beneficiar grupos de organismos. Ao que parece, não é possível pensar em um altruísmo genético “puro”. O comportamento filogenético sempre deve favorecer a transmissão dos genes do organismo que se comporta, mesmo que por vias aparentemente tortuosas. É nesse sentido que podemos afirmar que o gene é uma entidade “egoísta”: o “altruísmo” filogenético sempre deve reverter em benefício da transmissão do gene para a descendência. A opinião de Darwin pode ser justificada, em parte, pelo nível de conhecimento sobre o assunto em sua época. O trabalho de Mendel sobre os mecanismos de hereditariedade só receberia o devido reconhecimento a partir de 1900 (embora tenha vindo a público já em 1866), e a genética molecular começaria a desenvolver-se algumas décadas depois. Embora a ação das variáveis ambientais ocorra sobre o fenótipo, a seleção no nível 1 ocorre, efetivamente, sobre os genes. (Também é equivocado afirmar que a seleção ocorre sobre genótipos, pois estes, enquanto combinações de genes, são únicos em cada indivíduo. Não é o genótipo a unidade transmitida para a prole, mas apenas parte dos genes que o compõem.) Não há uma definição universalmente aceita sobre o que seja um gene, mas, para tomar este conceito como unidade básica da seleção natural, é prudente defini-lo como uma porção de material cromossômico com poucas possibilidades de divisão e grande capacidade de auto-replicação. Essas características permitem ao gene, em princípio, uma longa permanência no “fundo” genético de sucessivas gerações (Dawkins, 1976/1979, cap. 3). É exatamente essa possibilidade de permanência que permite tomar o gene, assim definido, como unidade básica do processo seletivo. Mas essa definição é, obviamente, uma idealização. Eventualmente, os genes dividem-se ou fazem “cópias” imperfeitas de si mesmos. Genes assim gerados, por sua vez, também constituem unidades sujeitas à seleção. O próprio processo seletivo só é possível, na verdade, porque “erros” desse tipo acontecem. Como ocorre a seleção? A ação da seleção natural é entendida hoje de forma próxima àquela delineada por Darwin (1859/1902) no quarto capítulo de sua obra máxima – à exceção da transmissão genética. O conjunto de genes de certo organismo confere ao mesmo a base de suas características fenotípicas. Cada uma dessas características está relacionada, de alguma www.walden4.com.br 30 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. forma, à interação dos ascendentes do organismo em questão com ambientes passados. Se o fenótipo desse organismo satisfaz às exigências de sobrevivência e reprodução do ambiente atual, o organismo terá condições de transmitir, para cada um de seus descendentes, metade de seus genes. Variações fenotípicas desfavoráveis, que impeçam a sobrevivência ou a reprodução, determinam a eliminação dos genes do organismo portador do “fundo” genético da espécie. Skinner (1966/1984) nota que variações fenotípicas complexas devem resultar do acúmulo de pequenas e sucessivas variações selecionadas pelo ambiente, cada uma destas variações podendo estar relacionadas a diferentes vantagens adaptativas. Figura 4: Exemplo de distribuição de frequência da característica “altura” na população. Dizemos que essa característica tem uma distribuição normal. A seleção no nível 1 ocorre, portanto, pela ação das contingências de sobrevivência e reprodução presentes no ambiente no qual vive o organismo. O próprio organismo, porém, é um produto de ambientes passados. As semelhanças e diferenças entre os ambientes que selecionaram certos genes e os ambientes com os quais interagem os organismos atuais, gerados por estes genes, são da mais alta importância na determinação das chances de sobrevivência e reprodução. Genes são entidades selecionadas por ambientes que não mais existem. Sua reprodução está condicionada à estabilidade das contingências filogenéticas (Skinner, 1981/2007; 1988/1989). A “sobrevivência do mais apto” é, portanto, um produto necessariamente histórico. Características genotípicas e fenotípicas dos organismos só podem ser compreendidas a partir desse fato. Darwin mesmo convoca-nos a considerar “(...) cada produção da natureza como algo que passou por uma longa história” (1859/1902). www.walden4.com.br 31 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Uma forma interessante, e didática, de se abordar os processos de variação e seleção é através da curva normal, que, grosso modo, pode ser definida (ou entendida) como uma distribuição de frequências. A Figura 4 apresenta um exemplo (hipotético) da distribuição de frequência da altura para a população. Se a altura média da população (todas as pessoas no globo terrestre) fosse 1,7m de altura, e o desvio padrão fosse 10cm, isso significaria que 68,26% da população mundial teria entre 1,6m e 1,8m de altura. Neste caso, quanto mais distante uma certa altura está da média (para cima ou para baixo) menor será o número de indivíduos que encontraremos com essa determinada altura. É por esse motivo que a curva normal tem a forma de um sino. Nesse exemplo, com relação à característica “altura”, fica bastante evidente a variabilidade de uma determinada característica em membros de uma mesma espécie. Figura 5: Deslocamento da média (tamanho médio do pescoço) em dois períodos diferentes. A Figura 5 ilustra como podemos utilizar a curva normal, por exemplo, para entender o famoso exemplo do “tamanho do pescoço das girafas”. Observando o deslocamento do tamanho médio dos pescoços na figura, podemos observar como os processos de variação e seleção interagem. Na Figura 5 temos 3 girafas com três tamanhos de pescoços diferentes. No Período 1, no qual a copa das árvores das quais as girafas se alimentam são mais baixas, a maioria (a média) das girafas tem o pescoço mais ou menos do tamanho da girafa do meio. Neste período, da mesma forma que temos pessoas mais altas e outras mais baixas, havia também girafas com pescoços maiores e menores. Portanto, no Período 1, temos que: (1) a maioria das girafas tinha um pescoço com tamanho ideal para poder comer as folhas das maiorias das árvores; (2) algumas poucas girafas não conseguiam ou tinham dificuldades de se alimentar porque seus pescoços eram muito pequenos; e (3) algumas poucas girafas tinham que abaixar seus pescoços para comer porque estes eram muito compridos. www.walden4.com.br 32 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Agora, imagine que, por algum motivo, as copas das árvores foram, ao longo de séculos ou milênios, ficando cada vez mais altas. Chegamos então ao Período 2 da Figura 5. No Período 2, no qual a copa das árvores está mais alta, temos que: (1) aquelas girafas com pescoços menores e que tinham dificuldades para se alimentar, não conseguem mais alimento e padecem; (2) aqueles girafas, cujos pescoços tinham o tamanho médio têm menos chances de alimentar e ficam menos frequentes (menor número de indivíduos na população de girafas), deixam de ser “a média”; e (3) aquelas girafas, que no Período 1 tinham pescoços mais altos que as copas, agora têm pescoços na altura exata das copas e, portanto, têm maiores chances de se alimentar, por conseguinte se reproduzir, e passam a ser “a média”. Dissemos anteriormente que por algum motivo as copas das árvores foram, ao longo de séculos ou milênios, ficando cada vez mais altas. Podemos utilizar o mesmo raciocínio que aplicamos à mudança no tamanho médio do pescoço das girafas para entender esse “algum motivo”. No Período 1 (Figura 5), também havia variabilidade na altura da copa das árvores. Árvores mais altas tinham mais chances de produzir descendentes, pois a maioria das girafas não alcançava suas copas e, aos poucos, as árvores mais altas foram se tornando cada vez mais numerosas na população de árvores. (Questão para pesquisa e reflexão: como esse processo atinge um equilíbrio? Será que as árvores continuam ficando cada vez mais altas e os pescoços das girafas cada vez maiores?). O modelo de seleção pelas consequências no nível filogenético explica, portanto, como determinadas variações de determinadas características das diversas espécies são selecionadas (tornam-se mais frequentes), desaparecem ou sofrem alterações (deslocamento da média). Demos ênfase, ao longo texto, a características anatômicas (altura, tamanho de pescoço, cor, etc.) por serem mais fáceis de se ilustrar. No entanto, é preciso ficar claro que o mesmo raciocínio se aplica a características fisiológicas (metabolismo, funcionamento do sistema cardiovascular, feedback hormonal, etc.), e, de principal interesse para a Psicologia, comportamentais – ou psicológicos (agressividade, inteligência, personalidade, reflexos inatos, etc.) Todos nós já presenciamos a ocorrência de alguns padrões comportamentais selecionados filogeneticamente: a forma como abelhas e formigas trabalham em conjunto; aranhas tecendo suas teias; o canto de alguns pássaros; bocejar quando estamos com sono ou entediados. Se observarmos um bebê humano por alguns minutos, interagindo com sua mãe, veremos uma série de comportamentos selecionados filogeneticamente: a sucção quando algo toca a boca do bebê; fechar a mão quando algo encosta-se à palma da mão; balbucios; sorrisos quando acariciados; choro quando incomodados e uma série de outros comportamentos. Questões para estudo 1. O que é um modelo explicativo? 2. O que significa dizer que determinada abordagem psicológica é determinista? 3. De forma geral, qual a principal diferença entre o modelo explicativo da análise do comportamento e o modelo explicativo da psicanálise? 4. Por que é correto dizer que a análise do comportamento se baseia em um determinismo sócio-histórico, ou em um determinismo interacionista? www.walden4.com.br 33 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. 5. Explique e exemplifique o conceito de variação ou variabilidade, no nível filogenético, entre membros de uma mesma espécie e sua relação com as característica do ambiente no qual a espécie vive. 6. O que quer dizer “o ambiente selecionou uma determinada característica de uma espécie”? 7. Explique, resumidamente, o modelo selecionista de Charles Darwin (1859). 8. Com relação à origem de novas espécies (Charles Darwin,1859), o modificações nas características de uma espécie, qual a relação entre variação e seleção? Exemplifique sua resposta. 9. Por que Darwin (1859) chamou seu modelo explicativo de seleção natural? 10. O que explica o modelo de seleção pelas consequências no nível filogenético? 11. Descreva, de modo geral, como ocorre a seleção natural usando como referência a figura abaixo (explicite o que representa a seleção e o que representa a variabilidade na figura). Referências bibliográficas Darwin, C. R. (1859). On the origin of species by means of natural selection, or the preservation of favoured races in the struggle for life. London: John Murray. Darwin, C. R. (1902). The origin of species. London: John Murray. (Originalmente publicado em em 1859) Dawkins, R. (1979). O gene egoísta (G. H. M. Florsheim, Trad.). Belo Horizonte: Itatiaia; São Paulo: EDUSP. (Originalmente publicado em 1976) Skinner, B. F. (1984). The phylogeny and ontogeny of behavior. Em A. C. Catania & S. Harnad (Eds.), Canonical papers of B.F. Skinner (pp. 669-677). The Behavioral and Brain Sciences, 7, 473-724. (Originalmente publicado em em 1966) Skinner, B. F. (1989). Genes and behavior. Em B. F. Skinner, Recent issues in the analysis of behavior (pp. 49-56). Columbus, OH: Merrill. (Originalmente publicado em 1988) Skinner, B. F. (2007). Seleção por consequências. Revista Brasileira de Terapia Comportamental e Cognitiva, 9, 129-137. (Originalmente publicado em 1981). www.walden4.com.br 34 A pr en d iza g em o 1 -1 D i- u Paulo Roney Kílpp Goulart ■Paulo Elias Gotardelo Audebert Delage ■Viviane Verdu Rico ■Ana Leda de Faria Bríno IN T R O D U Ç Ã O O Q U E É A PRENDIZAGEM ? A aprendizagem é um tem a recorrente entre as disci­ plinas preocupadas com algum aspecto do comportamento hum ano, sejam as diversas abordagens da psicologia, as neurociências ou a pedagogia, para citar algumas. Todavia, em bora possamos encontrar com facilidade material de qualidade sobre um a variedade de tópicos dentro do tema —processos de aprendizagem, mecanismos neurais da aprendi­ zagem, aprendizagem associativa, aprendizagem por tentativa e erro, déficits de aprendizagem etc. —, raramente encon­ tramos um a definição formal de aprendizagem. Aparen­ tem ente, trata-se de um daqueles conceitos que todos parecem compreender, mas ninguém é capaz de definir. O fato é que os episódios reconhecidos como casos de apren­ dizagem são tão variados e as explicações que cada disci­ plina privilegia são tão diversas (e, por vezes, até incompa­ tíveis entre si) que se torna realmente difícil arriscar um a definição suficientemente abrangente e coerente o bastante para agradar a leitores de todas as predileções teóricas. Este capítulo não busca fornecer essa definição abran­ gente. N ão pretendem os englobar todas as facetas que possam vir a ser atribuídas ao “fenôm eno” aprendizagem, nos seus mais diversos tratam entos. Pelo contrário, o objetivo aqui é identificar características com portam entais m inim am ente definidoras daquelas ocorrências reco­ nhecidas como aprendizagem. Por certo, os hum anos não são os únicos animais capazes de aprender, então, nossa definição de aprendizagem precisa ter características que sejam observadas tam bém em outros animais. Conside­ remos, então, o que no com portam ento de um organismo nos faz reconhecer um caso de aprendizagem. N o laboratório de condicionamento operante, dizemos que um rato aprendeu a pressionar a barra quando essa resposta passa a ser frequente, sendo que observamos no passado que ele não a em itia em quantidade significa­ tiva. Se ouvimos um a mãe dizer que seu filho finalmente aprendeu a andar de bicicleta sem rodinhas, supom os imediatamente que, há pouco tempo, aquela criança não era capaz de se equilibrar por conta própria e pedalar ao mesmo tem po. Se perguntamos a um a criança o que ela aprendeu na escola, esperamos que ela nos conte algo novo, que não era capaz de fazer anteriorm ente. U m a pessoa, tendo sua pia de cozinha entupida, pode afirm ar que aprendeu, “da pior forma possível”, a não jogar restos de comida no ralo, mas somente concordaremos que ela de fato aprendeu se passar a jogar os restos em outro lugar no futuro. Em todos esses exemplos, reconhecer ou não algo como aprendizagem depende de se considerar o estado presente de algum aspecto do com portam ento de um a pessoa em comparação com seu estado anterior. Apren­ dizagem, então, é um a demonstração de com portam ento novo ou modificado. É um a alteração no m odo como um indivíduo responde a parcelas relevantes do m undo. N o entanto, nem toda alteração na relação do orga­ nismo com o ambiente qualificar-se-á como aprendizagem. Certas ocorrências podem modificar tem porariam ente a maneira como um organismo responde. Por exemplo, uma pessoa que acabou de assistir a um filme de terror pode responder por algum tempo de maneira exacerbada a certos ruídos, mesmo àqueles com os quais está familiarizada. Aprendizagem Em manipulações experimentais, é possível observar um ruído provocar um sobressalto maior que o usual em um rato quando antecedido por um choque elétrico. O utro exemplo de modificação circunstancial da maneira como o organismo responde a partes do m undo é quando certos eventos deixam de evocar as respostas que norm alm ente evocam se forem apresentados em rápida sucessão ou de modo continuado. É o que acontece quando você simples­ mente deixa de notar o ruído da sua geladeira, por exemplo. Alterações desse tipo na relação dos organismos com o ambiente (conhecidas na literatura técnica como “sensi­ bilização” e “habituação”, respectivamente) são exemplos im portantes de m odulação da influência dos estímulos ou da sensibilidade do organismo, dependendo do ponto de vista), mas não serão tratados como casos de aprendi­ zagem, devido ao seu caráter transitório e pontual. Essas são situações em que um determ inado arranjo ambiental causa um a modificação no responder, mas esse responder modificado está restrito à ocorrência daquele arranjo espe­ cífico: sem o choque, o rato do exemplo citado voltará a responder aos ruídos da mesma maneira que antes de ter experimentado a sucessão choque-ruído. Estamos interes­ sados aqui em mudanças na relação do organismo com o ambiente que sejam duradouras, no sentido de perdurar e repercutir no responder futuro do organismo, mesmo que ele não volte a ter contato com o arranjo ambiental específico que originou a mudança no responder. As condi­ ções que favorecem esse tipo de modificação duradoura no responder dos organismos serão discutidas no decorrer deste capítulo. O utra ressalva é feita por Catania (1998/1999) em seu livro Aprendizagem. O autor comenta que se, após encarar um eclipse solar, um observador tiver dano perm anente nos olhos, seu com portam ento futuro certam ente será alterado, mas, “se alguém afirmasse que essa alteração é um caso de aprendizagem, provavelmente discordaríamos” p. 22). Certam ente, nesse caso, a relação daquele orga­ nismo com toda estimulação visual passa a ser diferente do que foi no passado, mas isso ocorre porque ele deixou de ser sensível àquela parcela do m undo. N ão é que ele responda de m odo diferente... Ele não é mais capaz de responder! Claro que há situações em que deixar de responder a um estím ulo é um caso de aprendizagem, como seria não jogar restos de com ida na pia. A diferença é que, nesses casos, o indivíduo é capaz de perceber o evento, ainda que não responda de m aneira específica a ele. O indivíduo responde de outras maneiras (joga restos de comida no lixo, por exemplo) e pode, inclusive, vir a 21 responder da maneira que não responde hoje (volta a jogar os restos na pia). Ao observarmos um a mudança no modo como determinado indivíduo interage com certos eventos ambientais, devemos considerar se o organismo perm a­ nece sensível àquele conjunto de acontecim entos antes de reconhecermos aquela m udança como sendo aprendi­ zagem. Para a Análise do C om portam ento, ambiente não diz respeito a todo o universo que circunda o organismo, mas justam ente àqueles eventos que exercem influência de fato sobre o seu com portam ento (ver, por exemplo, Tourinho, 2001). Portanto, podem os considerar que aqueles eventos aos quais um organismo responderia se tivesse um aparato visual intacto deixam de ser “ambiente” para a pessoa que teve dano visual permanente. Q uando falarmos em “ambiente”, então, estaremos nos referindo a aspectos do m undo que um organismo é capaz de perceber (ver no Capítulo 3 como a percepção pode ser tratada de um a perspectiva analítico-comportamental). Após essas considerações, podemos, agora, arriscar uma definição comportamental de aprendizagem. Aprendizagem é qualquer mudança duradoura na maneira como os orga­ nismos respondem ao ambiente. Tal definição será suficiente para identificarmos a maioria dos casos de aprendizagem, seja na natureza, no laboratório ou na escola, mas ainda é necessário que consideremos os meios pelos quais a modifi­ cação da “relação organismo-ambiente” se dá. Essa relação, a qual nos referimos de m aneira mais ou menos genérica até então, diz respeito à relação funcional observada entre eventos ambientais e respostas do organismo, ou seja, a relação entre estímulos e respostas. Assim, a “m udança na relação organism o-am biente” que caracteriza a aprendi­ zagem pode ser tanto a modificação de um a relação estím ulo-resposta preexistente com o o estabelecim ento de um a relação estímulo-resposta nova. As relações entre estímulos e respostas não são todas iguais. Alguns estímulos estão fortem ente vinculados a uma resposta, de modo que a resposta ocorre praticamente toda vez que o organismo entra em contato com o estí­ mulo (como a contração da pupila no contato com uma fonte de iluminação intensa). O utras respostas, embora claramente ligadas a certo estímulo, não acontecem sempre que o estímulo está presente (como abrir a porta da gela­ deira) e ainda podem se relacionar com outros estímulos (a porta do carro, de casa, do arm ário). A literatura da Análise do C om portam ento costum a dividir as relações comportam entais em duas categorias - “com portam ento respondente” e “comportamento operante” —, dependendo das correlações entre eventos ambientais e com portam en- 22 Temas Clássicos da Psicologia sob a Ótica da Análise do Comportamento tais que as descrevem. Apresentaremos a seguir um a breve caracterização dessas duas classes de relações com portamentais, antes de abordarmos as maneiras como elas se estabelecem e/ou se modificam, ou seja, os processos de aprendizagem propriam ente ditos. Som alto e repentino Resposta de sobressalto US UR FIGURA 2.1 Exemplo de um com portam ento reflexo incondicionado, no qual US (unconditioned stimulus) é o estím ulo incondicionado e U R (unconditioned response) é a resposta incondicionada. As siglas se referem aos term os em inglês, sendo as siglas usadas na literatura. Comportamento respondente O term o “com portam ento respondente” é usado em Análise do Com portam ento para se referir aos compor­ tam entos conhecidos com o reflexos, costum eiram ente caracterizados como reações involuntárias do organismo a certos eventos. O exemplo mais célebre é o reflexo de salivar dos cães, estudado por Ivan Petrovich Pavlov (1849­ 1936). As relações comportam entais ditas respondentes são as mais fundamentais encontradas em organismos que apresentam sistema nervoso central. Em termos analíticocomportamentais, são caracterizadas por um a reação alta­ mente provável do organismo a um estímulo específico do am biente (Catania, 1998/1999; Millenson, 1967/1975; Skinner, 1953/2000; Skinner, 1974). Sob condições ótim as,1 a resposta ocorrerá toda vez que o organismo entrar em contato com o estímulo. Diante de uma relação estímulo-resposta desse tipo, um analista do com portam ento dirá que o estímulo eliciou a resposta reflexa (Figura 2.1). Eliciar é o termo usado para dizer que a resposta foi provocada pelo estímulo. Quando a resposta reflexa do organismo a determinado estímulo não precisou ser aprendida, usa-se o termo incondicionado ou primário para se referir tanto ao estímulo quanto à resposta (Catania, 1998/1999; M illenson, 1967/1975; Skinner, 1953/2000). Os seres hum anos não precisam aprender a contrair a pupila diante de um a luz intensa. Esse reflexo é, portanto, um reflexo incondicionado. As relações respon­ dentes incondicionadas são inatas e foram selecionadas na história de cada espécie em razão de seu valor de sobrevi­ vência. Por exemplo, afastar a mão rapidamente de uma fonte de calor é um reflexo im portante na m anutenção de 'O comportamento reflexo obedece a algumas leis que regem a sua ocor­ rência. Por exemplo, o estímulo incondicionado tem que ocorrer em intensidade suficiente para eliciar a resposta incondicionada, de modo que existe um limiar a partir do qual o estímulo produz a resposta. Uma fonte de calor pouco intensa provavelmente não provocará o afastamento irresistível da mão. Além disso, quanto maior a intensidade do estímulo, maior a força (ou magnitude) da resposta reflexa e mais rapidamente ela se seguirá ao estímulo (menor latência entre estímulo e resposta). U m tratam ento mais completo das leis do reflexo pode ser encontrado em Catania (1998/1999), Millenson (1967/1975) e Skinner (1938). nossa integridade física. Assustar-se com um som alto e repentino é um reflexo relevante, pois prepara o organismo para um a potencial situação de perigo. Comportamento operante N o século 19, Edw ard L. T horndike (1874-1949) descreveu pela prim eira vez que o com portam ento dos animais era influenciado por seus efeitos. Ele construiu uma variedade de caixas-problema, nas quais colocava dife­ rentes animais. Esses animais deveriam aprender a resposta que abria a caixa, que lhes permitia sair da mesma e comer o alimento colocado fora dela. Por tentativa e erro, todos os animais aprendiam tal resposta (puxar um a corda, abrir um trinco etc.). Primeiramente, os animais abriam a caixa por acaso, enquanto se movimentavam dentro dela. Com o passar do tem po, movimentos que perm itiam o escape da caixa ocorriam após intervalos de tempo cada vez mais curtos a partir da inserção do anim al na caixa. C om a resposta já aprendida, os animais passavam a abrir a caixa quase que instantaneamente, assim que eram colocados lá dentro. A aprendizagem era avaliada pela redução no tempo que o animal levava para escapar da caixa-problema nas inserções sucessivas do sujeito dentro do aparato. A partir dessas observações, Thorndike (1898/1911) elaborou a Lei do Efeito, que basicamente dizia que o com portam ento era modificado em função de seus efeitos. N a década de 1930, Burrhus Frederic Skinner (1904­ 1990), ao estudar com portam ento reflexo em ratos, cons­ tatou que muitos comportam entos não podiam ser expli­ cados em termos de relações reflexas (como se supunha na época). D iferentem ente do observado nos reflexos, naqueles comportamentos não havia uma relação de deter­ minação absoluta de um estímulo antecedente sobre um a determinada resposta, porque ou havia imprecisão em se verificar a ocorrência de qualquer estímulo que pudesse estar controlando um a resposta observada, ou, quando verificada sua presença, a apresentação do estímulo não era garantia de ocorrência da resposta. A relação entre estí- Aprendizagem mulos e respostas era marcada pela flexibilidade: a probabi­ lidade de ocorrência da resposta variava ao longo de m últi­ plas exposições ao estímulo. Além disso, vários estímulos podiam estar relacionados com a mesma resposta e várias respostas com o mesmo estímulo. U nindo suas observa­ ções aos estudos de Thorndike, Skinner identificou que, nesses casos, a ocorrência ou não das respostas e sua relação com os estímulos que as antecediam eram influenciadas por suas consequências passadas. Alguns eventos am bien­ tais consequentes, isto é, que ocorrem após a emissão de um a resposta pelo organismo, fazem com que respostas semelhantes a ela tenham m aior ou m enor probabili­ dade de ocorrer no futuro (Baum, 1994/1999; Catania, 1998/1999; Millenson, 1967/1975; Skinner, 1953/2000, Skinner, 1974). Se a resposta passa a ocorrer com maior frequência em situações semelhantes àquelas em que a consequência foi produzida, dizemos tratar-se de um a consequência reforçadora. Se, ao contrário, a frequência da resposta dim inuir naquelas situações, dizemos que a consequência é aversiva. Vejamos um exemplo: Todos conhecem a curiosidade das crianças. Qualquer objeto novo as fascina de tal maneira que elas logo se apro­ ximam e m anipulam o objeto. Ao ver um a tomada, uma criança se aproxima e não demora m uito para começar a colocar o dedo ou até mesmo objetos em seus orifícios. Em um determ inado m om ento, ela leva um pequeno choque e se afasta da tomada. Será pouco provável que ela volte a colocar o dedo ou objetos em seus orifícios, visto que choques costum am ter funções aversivas. Em outra situação, esta mesma criança vê um a bola e começa a manipulá-la. Ela aperta a bola, joga a bola, observa a bola pulando, chuta a bola etc. Se houver um adulto presente, provavelmente ele brincará de jogar a bola com a criança. Todas essas consequências da resposta de manipular a bola são potencialm ente reforçadoras, o que se confirmará se a criança frequentem ente pegar e brincar com um a bola quando esse objeto estiver presente no seu ambiente. Certas respostas, portanto, tornam-se mais ou menos prováveis em situações semelhantes àquelas nas quais costumam estar correlacionadas com determinadas consequências. Dito 23 de outra forma, os contextos semelhantes àquele no qual certas respostas foram consistentemente acompanhadas de reforçadores têm m aior probabilidade do que outros de evocar aquelas respostas. Por isso, a Análise do C om por­ tam ento descreve o com portam ento operante por meio da tríplice contingência, que envolve não só a resposta e a consequência, mas ainda o contexto em que ocorrem (Figura 2.2). Esse contexto, a estimulação antecedente à resposta, recebe o nom e de estímulo discriminativo (SD). Em princípio, podemos imaginar que as respostas podem se tornar mais ou menos frequentes de m aneira genera­ lizada, a despeito do contexto, mas basta um a inspeção mais atenta para notarm os que não é isso o que acon­ tece. Considerem os o exemplo de chutar um a bola. O que chamamos de resposta, ‘chutar bola”, se pensarmos bem, já é um a relação entre estímulos e respostas: como seria possível chutar um a bola na ausência de uma bola? Ainda assim, a presença da bola nem sempre vai evocar respostas de “chutar bola”. Imaginem os que tenham os observado que a criança em questão norm alm ente chuta a bola quando há um adulto presente, que se engaja em chutar a bola de volta. Então, a relação comportam ental, nesse caso, inclui a presença da bola e de um adulto. Essa relação será modificada dependendo das consequências. Se o adulto costum eiram ente se engajar em jogar bola com a criança, chutar a bola sob aquelas condições será mais provável no futuro. Por outro lado, se aquele adulto estiver rotineiramente cansado e não brincar com a criança, a relação será enfraquecida. No caso dos operantes, a relação entre o estímulo ante­ cedente e a resposta não é considerada um a relação de eliciação. Respostas de “chutar a bola” são emitidas em determ inadas situações e sua emissão é m odulada pelas suas consequências. Relações com portam entais m odu­ ladas pelas consequências são am plam ente encontradas na natureza, nas mais variadas espécies. Skinner estudou esses com portam entos com pombos e ratos por meio de um a câmara experimental —a famosa Caixa de Skinner —, que perm itia o controle automatizado da apresentação de eventos ambientais antes e após a ocorrência de uma Chutar a bola Receber bola de volta R FIGURA 2.2 Esquem a de um a tríplice contingência operante. SD é o estím ulo antecedente (estím ulo discrim inativo), R a resposta e SR o es­ tím ulo reforçador. 24 Temas Clássicos da Psicologia sob a Ótica da Análise do Comportamento resposta arbitrariamente definida (tradicionalmente, bicar um disco transilum inado, no caso de pom bos, e pres­ sionar um a barra, no caso de ratos). Q uando os animais efetuavam a resposta requerida, o aparato disponibilizava, por exemplo, um bocado de ração. O ambiente do animal era organizado de m odo que seu comportamento operava sobre o ambiente, produzindo uma consequência, daí o nome “com portam ento operante”. E im p o rtan te ressaltar, todavia, que, do ponto de vista do organismo, é irrelevante se a consequência foi ou não produzida por seu com portam ento. Se eventos reforçadores se sucederem de m odo contíguo a um a resposta em determ inada situação, a resposta tornar-seá ligeiram ente mais provável sob situações similares, no futuro. O próprio Skinner (1948) identificou situações em que a contiguidade acidental entre respostas e conse­ quências produzia um aum ento transitório na frequência daquelas respostas, as quais ele denom inou “com porta­ m entos supersticiosos”. U m a vez que o am biente esteja configurado de modo que a contiguidade resposta-consequência seja recorrente, serão produzidas relações entre estímulos e respostas estáveis características do “com por­ tam ento operante”. O conceito original de com porta­ m ento operante vem sendo refinado desde sua origem, como é com um ocorrer na ciência (Todorov, 2002), mas a relação entre resposta e consequência mantém-se central em sua definição. Vim os, então, que os organism os já nascem com o potencial para responder prontam ente de m aneira adaptativa a alguns eventos am bientais. São os cham ados reflexos incondicionados, que já “vêm de fábrica”, por assim dizer; não dependem de aprendizagem para ocorrer. Entretanto, é possível que novos estímulos passem a eliciar respostas semelhantes no decorrer da vida do organismo, tendo com o p onto de partida as relações reflexas estímulo-resposta incondicionadas. Por sua vez, os operantes são caracterizados pela flexibilidade e arbitrariedade das relações entre estímulos e respostas, possibilitando varia­ bilidade com portam ental para além da observada nas relações reflexas. Em todos os casos, a determinação dos estím ulos e respostas que participarão das novas rela­ ções com portam entais do repertório de um organismo é produto da história específica de contato de cada orga­ nism o com seu am biente durante a sua vida. A seguir, abordarem os os principais processos de aprendizagem encontrados na natureza, tendo com o base as relações estabelecidas entre estímulos ambientais e respostas do organismo. PROCESSOS BÁSICOS _______ DE A PREN D IZA G EM _______ Condicionamento respondente Com o dito antes, a partir dos reflexos incondicionados é possível produzir novos reflexos, chamados condicionados. Os reflexos condicionados são originados a partir de uma história de condicionamento respondente (também chamado de condicionamento clássico ou pavloviano). Essa possibili­ dade de condicionamento permite que o comportamento reflexo inato seja modificado de acordo com as necessidades de adaptação do organismo às mudanças no ambiente em que vive (Skinner, 1974). D a mesma maneira como ocorre com o reflexo incondicionado, no reflexo condicionado um estímulo elicia imediatamente um a resposta. Entretanto, esta relação entre o estímulo e a resposta se desenvolve durante a vida do organismo (ontogênese), em vez de ser determinada pela história evolutiva da espécie (filogênese) (Catania, 1998/1999; Skinner, 1974). Os principais estudos que contribuíram para a compre­ ensão do condicionam ento reflexo datam do início do século 20. Foi o já citado fisiólogo russo Ivan P. Pavlov quem sistematizou um a metodologia de estudo do condi­ cionamento respondente. Daí o fato de este ser chamado também de condicionamento pavloviano. Nossa exposição do condicionam ento respondente será centralizada nos estudos de Pavlov, mas é im portante ressaltar que contin­ gências respondentes são foco de investigação ainda hoje (ver Rescorla, 1988; 2000, por exemplo). Em 1927, Pavlov estudava a atividade digestiva de cães quando se deparou com um fenômeno interessante. Ele percebeu que os cães não salivavam apenas quando tinham com ida na boca (que é um reflexo incondicio­ nado), mas tam bém quando viam a vasilha de comida, quando entravam na sala em que eram alimentados e até m esmo quando viam o tratador ou ouviam seus passos (Keller, Schoenfeld, 1950/1974; M illenson, 1967/1975). A partir dessa observação, Pavlov supôs que a resposta de salivação a esses estímulos havia sido aprendida e pôs-se a testar essa hipótese com experimentos que usavam o paream ento regular entre estímulos “neutros”2 e o estí- 2É im portante ressaltar que o estímulo é considerado “neutro” em relação à resposta reflexa que está em foco, mas provavelmente será estímulo eliciador para outras respostas. Por exemplo, o som de um a sineta é originalmente neutro para a resposta de salivar, mas pode ter função eliciadora sobre a resposta de virar a cabeça na direção do som. Aprendizagem Reflexo incondicionado Alimento na boca US Salivação UR Condicionamento respondente Som + Alimento na boca NS US -> Salivação UR Reflexo condicionado Som CS -► Salivação CR FIGURA 2.3 Esquem a do processo de condicionam ento respondente. As siglas usadas significam: U S, estím ulo incondicionado; U R , res­ posta incondicionada; N S, estím ulo neutro; CS (conditioned stim u­ lus), estím ulo condicionado; C R (conditioned response), resposta con­ dicionada. As siglas se referem aos term os em inglês, sendo as siglas usadas na literatura. mulo incondicionado, o que se tornou o procedim ento clássico para a produção de um a relação reflexa condicio­ nada (Figura 2.3). Basicamente, o que Pavlov fazia era tocar um som (estí­ mulo neutro) sempre que colocava alimento na boca do cão (estímulo incondicionado), coletando as gotas de saliva produzidas (resposta incondicionada). Esse procedimento foi feito regularmente, por alguns dias. Em seguida, Pavlov com eçou a apresentar o som (estímulo condicionado) sozinho, verificando a ocorrência da resposta de salivação I resposta condicionada). O que ocorre no condiciona­ mento respondente, então, é que um estímulo neutro passa a eliciar um a resposta reflexa, com o produto do paream ento frequente entre esse estímulo e um outro eliciador que pode ser incondicionado ou condicionado). Q uando o estímulo originalmente neutro passa a eliciar a resposta, recebe o nom e de estím ulo condicionado. A resposta, por sua vez, em bora seja semelhante à resposta eliciada incondicionalm ente, recebe o nom e resposta condicio­ nada, por estar sendo eliciada em decorrência de apren­ dizado por condicionamento, e não por um a relação inata entre estímulo e resposta (Catania, 1998/1999; Millenson 1967/1975). Nesse experimento descrito, o pareamento do estímulo neutro com o estímulo incondicionado ocorreu de modo que os dois foram apresentados ao mesmo tempo. Entre­ tanto, essa não é a única configuração tem poral possível 25 da ocorrência dos estímulos no condicionam ento respon­ dente. O estímulo neutro pode tam bém ser apresentado antes ou depois do estímulo incondicionado (ou de outro estímulo condicionado). Na verdade, há diversas maneiras de pareamento e cada um a delas tem um efeito diferente na força do condicionam ento (Catania, 1998/1999). Por exemplo, quando o estímulo neutro é apresentado imedia­ tam ente antes do estímulo incondicionado, o condicio­ nam ento é mais eficaz do que quando ambos são apre­ sentados ao mesmo tem po. Q uando o estímulo neutro é apresentado depois do incondicionado, o condiciona­ m ento respondente dificilmente acontece. O tem po entre a apresentação dos estímulos no paream ento tam bém é um a variável relevante: para que o condicionam ento ocorra, a distância temporal entre os estímulos não deve ultrapassar certo lim ite e, quanto mais próxim os entre si, mais rápido ocorre o condicionam ento. Para que os efeitos do condicionam ento respondente se m antenham , isto é, para que a relação entre estímulo eliciador condi­ cionado e resposta condicionada perdure, é necessário que, pelo menos de tempos em tempos, os estímulos condicio­ nado e incondicionado sejam novamente pareados. Caso contrário, observa-se um processo de extinção da relação reflexa condicionada (extinção respondente): gradual­ m ente, o tem po entre a exposição ao estímulo condicio­ nado e a ocorrência da resposta aum entará e a m agni­ tude da resposta diminuirá até, finalmente, alcançar níveis próximos aos observados antes do condicionamento. No caso dos seres humanos, o condicionamento respon­ dente pode ajudar a explicar alguns com portam entos comuns. As nossas emoções são, em grande parte, expli­ cadas por condicionam ento respondente. Q uando nosso coração bate forte ao ouvirmos um a música que tocava muito quando namorávamos determinada pessoa, estamos diante de um caso que envolve um reflexo condicionado. Q uando nos apavoramos diante de um a pessoa que nos lembre, de algum modo, alguém que nos assaltou, estamos diante de outro caso de condicionam ento respondente (este tema será abordado com maiores detalhes no Capí­ tulo 6). M uitos casos de fobia, por exemplo, resultam de condicionam ento respondente, como m edo generali­ zado de cães ou medo de dentista. Um a m ordida de um cão bravo pode tornar todo e qualquer cão um aversivo condicionado, e a exposição a um procedim ento espe­ cialmente doloroso no consultório dentário pode fazer o mesmo com tudo que se relacione com dentista. Além disso, contingências respondentes têm sido implicadas em aspectos da drogadição, tanto em estudos com porta- 26 Temas Clássicos da Psicologia sob a Ótica da Análise do Comportamento mentais (p. ex., DeGrandpre, Bickell, 1993) como neurofisiológicos e bioquímicos (ver, p. ex., Everitt, Robbins, 2005, para um a revisão). Condicionamento operante Na breve exposição feita sobre comportamento operante, falamos sempre de respostas que produzem consequências, mas é im portante dizer que o Behaviorismo Radical não define um com portam ento operante pela forma (ou topo­ grafia) específica da resposta, e sim por sua função; um a resposta em itida por um organismo nunca é idêntica a outra. A chance de que o organismo apresente uma resposta topograficamente idêntica a anterior é m uito pequena, de m odo que ocorrerão variações nas formas das respostas. O analista do com portam ento reconhece todas as respostas que tiveram sua frequência aum entada por um mesmo tipo de consequência como da mesma função.3 Pensemos no com portam ento de abrir uma porta, por exemplo. O m odo como um a pessoa abre a porta depende de um a série de fatores. Pode abrir a porta com a m ão direita ou com a mão esquerda. Pode abri-la apoiando o coto­ velo na maçaneta, porque tem as mãos ocupadas. Pode ainda pedir que alguém que a acom panha abra a porta. Enfim, há diversas formas (topografias) de se abrir uma porta, mas todas elas têm a mesma função: ter acesso ao am biente que se encontra atrás da porta. É por isso que o analista do com portam ento não fala apenas em respostas, mas em classe de respostas, no sentido de que existe todo um grupo de topografias possíveis que têm a mesma função, ou seja, que têm sua ocorrência influenciada pela mesma consequência (Catania, 1998/1999; Skinner, 1953/2000). Todas as respostas usadas para abrir um a porta formam a classe de respostas “abrir a porta”. O u tra razão para a adoção da noção de classe é lógica: a consequência que segue um a determ inada resposta não pode reforçar essa mesma resposta, porque ela ocorreu antes da consequência. Q uando falamos que um a resposta é reforçada, portanto, estamos, na verdade, falando do aumento da probabilidade futura de respostas de um a mesma classe. A mesma noção de classe se aplica quando falamos de estímulos. Em bora falemos costum eiram ente em o estí­ 3É com um esse term o ser tom ado com a conotação de que as respostas funcionam, agem, de m odo a produzir certa consequência, ou que sua função é produzi-la. Entretanto, o sentido mais apro­ priado para o term o “função” nesse contexto seria o usado na mate­ mática: o aumento ou a m anutenção da frequência das respostas da classe R é fimção da apresentação contingente da consequência X. mulo, os eventos que o organismo encontrará em diversas ocasiões não são necessariamente os mesmos, nem são semelhantes em todos os aspectos. Mais adiante, veremos como diversos eventos ambientais podem vir a ser agru­ pados em um a m esm a classe de estímulos, isto é, um conjunto de estímulos que, mesmo não sendo exatamente idênticos entre si nem aos que o organismo encontrou no passado, estão relacionados com um a m esm a classe de respostas. São m uitos os exemplos de aprendizagem operante, envolvendo desde com portam entos mais simples, como levar a colher até a boca durante um a refeição, a com por­ tamentos mais complexos, como a resolução de problemas matemáticos. Todos dependem da correlação entre eventos ambientais antecedentes, respostas e eventos consequentes. Essa correlação entre eventos, quando produz a m odifi­ cação da probabilidade de que certos estímulos antece­ dentes e certas respostas coocorram, recebe o nom e de condicionamento operante. Em condições artificialmente arranjadas, como no laboratório, isso é obtido basicamente pela disponibilização de certos eventos ambientais como consequência para a emissão de determinadas respostas e não de outras sob um a estimulação antecedente específica (Catania, 1998/1999; Skinner, 1953/2000). N a natureza, o condicionamento ocorre quando determinadas ações do organismo consistentemente promovem o contato com consequências ecologicamente relevantes, o que costuma acontecer em contextos específicos. Por exemplo, se um babuíno jovem permanece próximo de um a fêmea, igno­ rando o m acho alfa que se aproxim a com os dentes à mostra, provavelmente será violentamente atacado. Se ele sobreviver, é provável que não se aproxime daquela fêmea, ou somente o faça na ausência do macho alfa e trate de se afastar rapidamente ao avistá-lo. O analista do com por­ tam ento reconheceria aí uma contingência natural (visão do macho alfa —>permanecer próximo à fêmea —> sofrer agressão) promovendo a aprendizagem. Q u a n d o falam os em “ações que consisten tem ente prom ovem contato com consequências ecologicam ente relevantes”, pode parecer que cada resposta de um orga­ nism o precisa produzir determ inada consequência para que seja reconhecida um a contingência. N ão é esse o caso. A contingência operante consiste na coocorrência reguläre.ntre respostas e consequências em dada situação, mas não é essencial que cada ocorrência de um a classe de resposta seja acom panhada da consequência que define aquela classe. N a verdade, as contingências mais com uns parecem ser aquelas em que a consequência é Aprendizagem produzida para algumas ocorrências de um a classe de respostas, nao para todas. Tom em os como exemplo um pássaro que forrageia virando pedras com seu bico em busca de pequenos insetos. N em todas as pedras revi­ radas serão abrigo de insetos, mas seu com portam ento de virar pedras será m an tid o se pelo m enos algum as delas apresentarem alim ento em quantidade suficiente para suprir a dem anda energética do animal. Em outros casos, a disponibilidade da consequência no am biente do organism o depende não da quantidade de respostas efetuadas, mas da passagem de um período de tem po antes que a resposta ocorra. Im agine um a pessoa que recebe m ensalm ente um a correspondência im portante, mas ainda não notou que ela chega sempre após as 14 h do q u in to dia útil. N em todas as respostas de abrir a caixa de correio “produzirão” a consequência prevista: não im porta que a pessoa verifique sua caixa de correio todo dia ou 1 vez por semana, a carta som ente estará lá se a caixa for aberta após as 14 h do quinto dia útil de cada mês. A literatura de Análise do C om portam ento estuda esse tipo de contingência em que a relação entre respostas e reforçadores é interm itente sob as rubricas Reforçamento Interm itente e Esquemas de Reforçamento. C atania (1998/1999) divide os esquem as de reforça­ m ento em três tipos básicos: • Aqueles em que a produção do reforçador depende da ocorrência de um núm ero fixo ou variável de respostas, como no exemplo do pássaro forrageando (conhecidos como esquemas de razão) • Aqueles em que a produção do reforçador depende não apenas da emissão de um a resposta, mas da passagem de um intervalo de tem po fixo ou variável, com o no exemplo da carta (conhecidos como esquemas de intervalo) • Aqueles que dependem da taxa de respostas ou do espaçamento temporal entre respostas. H á ainda um a variedade de esquem as com plexos derivados da com binação de esquem as básicos. C ada arranjo de contingências que caracteriza um esquem a produz um padrão de respostas peculiar, com taxas de respostas e distribuição distintas. A literatura da área é tão rica que m esm o um tratam ento superficial extra­ polaria em m u ito o escopo deste capítulo. (Para um tratam en to porm enorizado, ver C atan ia 1998/1999; Ferster, Skinner, 1957). H á um a série de eventos “ecologicamente relevantes”, eventos ambientais im portantes de serem considerados 27 para a sobrevivência do organismo, tais como alim ento, água, contato sexual, eventos danosos etc. Em bora tenham os até então enfatizado exemplos de fortaleci­ m ento de relações entre estímulos e respostas, é im por­ tante ressaltar que os processos que envolvem o enfra­ quecim ento de relações com portam entais tam bém são processos de aprendizagem . C om o dissemos anterior­ mente, as consequências que estão correlacionadas com a dim inuição da frequência de certa classe de respostas em determ inado contexto são chamadas “aversivas”. Aqueles eventos cujo valor reforçador ou aversivo decorre da história da espécie (filogênese) são denom inados incon­ dicionados ou prim ários. U m a enorm e variedade de estímulos, entretanto, adquire valor reforçador ou aver­ sivo ao longo da vida do organismo ao serem pareados com eventos que já apresentam um a dessas funções. Isso ocorre po r um processo de aprendizagem com o qual o leitor já está fam iliarizado, o condicionam ento respondente. Esses eventos recebem o nom e de reforçadores/aversivos condicionados ou secundários. Vejamos o exemplo do dinheiro como reforçador condicionado. D inheiro é um p ro d u to da cultura h u m an a e não da história da espécie. N a verdade, não passa de pedaços de papel ou círculos de metal. E ntretanto, é um reforçador condicionado poderoso, pois ao longo de nossa vida ele foi pareado a praticam ente todos os reforçadores incon­ dicionados e condicionados que existem.4 Com dinheiro, adquirem -se alim ento, água potável, proteção (roupas, calçados, casas etc.), diversão, entre outras coisas. N ão é de se estranhar que m uitas pessoas façam qualquer coisa para ter acesso a este reforçador. Prim ários ou secundários, a questão é que qualquer resposta que perm ita ao organism o obter os eventos reforçadores ou evitar os eventos aversivos será forta­ lecida no seu repertório co m p o rtam en tal. Por o u tro lado, respostas que p ro d u zam eventos aversivos ou elim inem reforçadores serão enfraquecidas. T anto o fo rtalecim en to com o o e n fraq u ecim en to de um a classe de respostas em um a dada situação são casos de aprendizagem : a relação do organism o com parcelas do am biente se m odifica de algum a form a duradoura. 4Q uando um reforçador condicionado tem seu valor reforçador com base em vários reforçadores primários, costuma-se chamá-lo de refor­ çador generalizado. Por essa relação com vários reforçadores primá­ rios, o reforçador condicionado generalizado pode ser efetivo quando contingente a diversas classes de respostas (Catania, 1998/1999). 28 Temas Clássicos da Psicologia sob a Ótica da Análise do Comportamento A lém disso, os dois processos fre q u e n te m en te estão envolvidos em um a m esm a aprendizagem . O babuíno do exemplo citado pode aprender a ficar longe da fêmea na presença do m acho alfa; ao se aproxim ar, produz consequências aversivas; e pode aprender tam bém a se aproxim ar dela na ausência do m acho alfa; quando se aproxim a, produz consequências reforçadoras. Temos duas relações co m p o rtam en tais com suas p ro b ab ili­ dades de ocorrência m odificadas em função de suas consequências: especificamente “aproximar-se da fêmea na presença do m acho alfa” d im in u in d o a frequência e “aproxim ar-se da fêmea na ausência do m acho alfa” a u m e n tan d o a frequência. O s processos que levam a essas variações n a aprendizagem o p e ra n te serão descritos a seguir. Q u a n d o um c o m p o rtam e n to é m a n tid o p o r suas consequências, dizem os que ele foi reforçado (fortale­ cido) e que a consequência é, p o rta n to , reforçadora. Q u a n d o , ao co n trário , um co m p o rtam en to dim in u i de frequência (ocorre menos) ou deixa de ocorrer em decorrência de suas consequências, dizemos que ele foi pu n id o (enfraquecido) e que a consequência é, então, p u n itiv a ou p u n id o ra (B aum , 1 9 9 4 /1 9 9 9 ; C atania, 1998/1999; Skinner, 1953/2000). O s term os “p u n i­ tivo” e “refo rçad o r” não se referem a características intrínsecas dos estím ulos, mas sim à função que exer­ ceram sobre dada classe de respostas. N ote que o que define se a consequência é reforçadora ou punidora não é o estím ulo em si, mas o seu efeito sobre a frequência da resposta. N ão se pode, po rtan to , definir a priori se um a consequência será punitiva ou reforçadora. Essa regra se aplica ta n to aos reforçadores condicionados q u a n to aos in co n d icio n ad o s. U m m esm o estím ulo pode ser reforçador para um indivíduo e punitivo para outro. N a verdade, um m esm o estím ulo pode desem ­ penhar as duas funções para um m esm o indivíduo, a depender do contexto. Por exem plo, quando estamos com fome, o alim ento torna-se altam ente reforçador. Se com em os demais, entretanto, a m era visão da com ida pode nos causar náuseas. N o prim eiro caso, a com ida é p o ten c ialm en te reforçadora, pois é provável que em itam os respostas para obtê-la; no segundo caso, é um estím ulo potencialm ente aversivo, pois é provável que respondam os de m odo a evitá-la. A lém disso, respostas podem tanto produzir a apresentação de um evento quanto produzir a sua remoção. Em certos casos, a in tro d u ção de um estím ulo pode ser reforçadora e sua elim inação pu n itiv a (um sorvete, p o r exem plo). Em outros casos, a introdução de um estím ulo pode ser p u n itiv a e sua elim inação reforçadora (digam os, um choque elétrico).5 O processo de condicionam ento pelo qual um orga­ nismo aprende a responder diferencialmente na presença ou ausência de um estímulo antecedente é chamado de discriminação. A discriminação ocorre quando o com por­ tam ento do organismo é controlado6 pela presença ou ausência de determ inado padrão de estimulação antece­ dente. Ao analisar o com portam ento, o pesquisador iden­ tifica aquelas propriedades do ambiente que se relacionam de maneira significativa com o comportamento sob análise. As propriedades que consistentemente participam juntas do controle do com portam ento são identificadas pelo experim entador como um “estímulo”. Os casos em que um a resposta somente é evocada por um mesmo agrupa­ m ento de propriedades, ou seja, de um mesmo estímulo, costumam ser denominados “discriminação simples”. Um exemplo é um cão fazer festa quando seu dono chega a casa, mas não o fazer quando a empregada chega. Entretanto, há casos em que o organismo responde de maneiras distintas a diferentes combinações de dois ou mais agrupamentos de propriedades. Suponhamos que, de m anhã cedo, o cão busque a atenção do dono e ignore a empregada, mas, ao m eio-dia, busca a atenção da em pregada e ignore o dono. Casos desse tipo costumam ser identificados como “discriminação condicional”, pois se entende que a função dos estímulos (“dono” e “empregada”, no nosso exemplo) 5Uma maneira de se referir à função dos estímulos que o leitor encon­ trará com frequência na literatura é que certos estímulos são “reforça­ dores positivos” (se reforçam quando acrescentados, somados ao ambiente) e “punidores negativos" (se punem quando eliminados, subtraídos); enquanto outros estímulos são “reforçadores negativos” (se sua subtração do ambiente é reforçadora) e “punidores positivos’ (se sua adição é puni­ tiva). Âs vezes, no entanto, pode parecer confuso dizer que um estímulo aversivo (geralmente danoso) tem função reforçadora. U m a maneira de evitar a confusão seria considerar não que um evento - choque elétrico, por exemplo - está sendo introduzido ou retirado do ambiente, mas que a “introdução do choque” é um evento ambiental e a “eliminação do choque” é outro. O primeiro é um evento potencialmente punitivo, pois respostas que produzem a “introdução do choque” geralmente diminuem de frequência, ao passo que o segundo é potencialmente reforçador, pois respostas que produzem “a eliminação do choque” tendem a se tornar mais frequentes (ver, p. ex., Michael, 1975; Baron, Galizio, 2005; 2006). 6Quando dizemos que o estímulo antecedente controla a ocorrência de determinado comportamento, queremos dizer que, por ter sido reforçada na sua presença, a classe de respostas tem maior probabilidade de ocorrer novamente diante deste estímulo. E equivalente a dizer que o estímulo antecedente “evoca” a resposta que produz determinada consequência. Vale lembrar que controlar dicriminativamente determinada resposta, entre­ tanto, é diferente de eliciar (como ocorre com o comportamento reflexo). A prendizagem é modificada dependendo de outros estímulos (“m anhã cedo” ou “meio dia”), os estímulos condicionais. Cada um desses casos é tratado de uma maneira específica na Análise do Comportamento, mas ambos são exemplos do processo mais amplo de discriminação.7 Vejamos um exemplo de como o responder discriminado se estabelece. Digamos que você se m ude para um apartam ento novo e não conheça seus vizinhos. Você aprendeu, ao longo de sua vida, a cum prim entar as pessoas (ao menos aquelas que estão sempre presentes no seu am biente). Todas as m anhãs você encontra dois m oradores do prédio, que vão trabalhar no mesmo horário que você. Inicialmente, a presença de ambos evoca a resposta de cum prim entálos com um “bom-dia”, porque essa classe de respostas foi am plam ente reforçada na sua história. Acontece, entre­ tanto, que apenas um dos moradores responde ao cum pri­ m ento, enquanto o outro se lim ita a continuar o que está fazendo sem sequer olhar na sua direção. Por alguns dias você ainda insiste em cum prim entar a ambos, afinal de contas, essa classe de respostas está m uito bem estabe­ lecida no seu repertório com portam ental, mas a reação de ambos os moradores permanecem as mesmas. Com o passar do tempo, você vai deixando de cum prim entar o m orador que nunca responde ao cum prim ento, porque essa resposta nunca é reforçada na sua presença. Já o outro morador, que devolve o “bom-dia”, é cumprimentado por ocê diariamente, porque você aprendeu que, na presença dele, o cum prim ento será seguido de reforço. Q uando falamos do procedim ento de discriminação, portanto, estamos falando que um a determ inada classe de respostas é mais frequentemente seguida de uma conse­ quência específica na presença de um estímulo do que de outro (ver Figura 2.4). Isso faz com que esta classe de respostas torne-se mais provável diante do prim eiro estímulo, chamado de SD, e praticam ente não ocorra na presença do outro estím ulo, condição cham ada de SA (Catania, 1998/1999). N o exemplo dado, o m orador que responde ao seu cumprimento seria o SDpara a resposta de dizer “bom-dia”, enquanto o outro morador seria o SApara i mesma resposta. O reforçam ento diferencial (contato "De fato, alguns autores defendem que os exemplos de controle de estímulos tradicionalmente estudados sob a rubrica discriminação condicional pode­ riam ser vistos como controle antecedente por combinações de estímulos, mas sem um caráter condicional, hierárquico (p. ex., Thomas, Schmidt, 1989). Nessa visão, as respostas de “buscar atenção” do cão seriam contro-adas pelos estímulos compostos “dono + manhã” e “empregada + tarde”, mas não pelos estímulos compostos “dono + tarde” e “empregada + manhã”. S D ---------V R ---------► S R —z ~ s â ---------- m R 29 r 7 ** sR FIGURA 2 .4 E squem a do p ro ced im en to de discrim inação. SD é o estím ulo discrim inativo, R a resposta, SR o estím ulo reforçador e SA (S-delta) representa a ausência. com o reforço em certas situações e não em outras) é essen­ cial para o estabelecimento de controle discriminativo. Se o com portam ento for reforçado com frequência similar em qualquer situação, não há razão para que o indivíduo atente para o contexto (estímulo antecedente). N ão custa realçar que parar de dizer “bom -dia” para o vizinho que nunca responde tam bém é um caso de aprendizagem , po rq u e respostas que não produzem modificações no am biente não têm função adaptativa e ten d em a reduzir em frequência. D e certo m odo, você aprende a não dizer “bom -dia” para aquela pessoa. H á, no cotidiano, diversas situações que exigem que com portam entos dim inuam de frequência no repertório do indivíduo. Para enfraquecer um a relação com por­ tam ental operante, é preciso, inicialm ente, saber quais as consequências que a m antém . Vejamos o exemplo de um a criança que co n stan tem en te em ite respostas de “fazer birra” no superm ercado sempre que a mãe diz que não vai com prar o doce que ela pediu. A criança se joga no chão, bate pés e mãos, grita, chora etc. Esse é um padrão de com portam ento inaceitável socialm ente e, p o rta n to , precisa ser elim inado do rep ertó rio da criança. C om o essas não são respostas inatas de um ser hum ano, é m uito provável que estejam sendo m antidas por suas consequências. No caso, quase sempre a criança obtém da mãe o que quer ao em itir um a resposta que se insere na classe “fazer birra”. Então, com o elim inar esse com portam ento? O m elhor é fazer com que a classe de respostas “fazer birra” deixe de produzir as conse­ quências que pro d u z n o rm alm ente. A m ãe poderia deixar de atender ao pedido da criança quando ela faz birra. O que se observa com esse procedim ento é que, de início, a birra aum enta, com o que para cham ar mais a atenção da m ãe, mas, com o o reforçam ento nu n ca ocorre, essa classe de respostas vai ficando m enos frequente até praticam en te deixar de ocorrer. A este procedim ento de quebra da relação entre um a classe de 30 Temas Clássicos da Psicologia sob a Ótica da Análise do Comportamento respostas e a consequência que a m antém dá-se o nom e de extinção operante (C atania, 1998/1999; M illenson 1967/1975; Skinner, 1953/2000). O padrão de resposta descrito no exemplo é típico do processo de extinção operante. C om o a classe de respostas em processo de extinção foi m uito reforçada na história do indivíduo, é esperado que nao seja tão fácil eliminá-la de seu repertório. E em decorrência dessa questão do reforçam ento que há um aum ento abrupto na frequência de um a classe de respostas subm etida a um a condição de extinção antes que possamos observar a redução de sua ocorrência. Esse fenôm eno tem sido am plam ente observado com os mais diversos tipos de com portam ento operante em diversas espécies (Catania, 1998/1999). Acontece ainda que dificilm ente a resposta que passou pelo processo de extinção deixa de ocorrer indefinidam ente. O casionalm ente, essa resposta pode voltar a ser emitida e, se pensarmos bem, é adaptativo que assim seja. Para que um organismo tenha m aior chance de sobrevivência, é preciso que tenha um a variabilidade com portam ental a partir da qual novas respostas possam ser reforçadas, a depender das exigências do ambiente. Se a cada processo de extinção classes de respostas deixassem de existir, teríam os um organismo com um repertório com portam ental m uito restrito e, consequentem ente, com m enor capacidade de se adaptar às m udanças no am biente. O fenôm eno do ressurgim ento de respostas que foram reforçadas na história do organismo (Reed, M organ, 2006), observado durante a aplicação do proce­ d im ento de extinção a um a dada classe, sustenta essa hipótese. O princípio unificado do reforço E m b o ra tenham os descrito os co n d icionam entos resp o n d en te e o p erante em separado, atu alm en te é bastante difu n d id a na Análise do C o m p o rtam en to a noção de que essa separação é m eram en te didática. C om o o leitor deve ter percebido quando falamos dos eventos reforçadores/aversivos condicionados, há na natureza um a sobreposição, ou entrelaçam ento, de contingências operantes e respondentes. Os estímulos que funcionam como reforçadores são necessariamente estím ulos eliciadores de um a resposta reflexa. Em um a contingência operante (SD —R —SR), em que o estí­ m ulo “eliciador” (reforçador) é consistentem ente corre­ lacionado com o estím ulo discrim inativo, tem os um a contingência respondente “em butida” na contingência operante. C om o consequência disso, o estím ulo discri­ m inativo tam bém pode assum ir função eliciadora (da resposta eliciada pelo reforçador) e pode inclusive servir com o reforçador condicionado para outras respostas operantes. Além disso, as relações reflexas podem servir de p o n to de partid a para o desenvolvim ento de rela­ ções operantes. Tom e-se com o exem plo o reflexo de sucção dos bebês hum anos. Já nos prim eiros m om entos de vida qu alq u er estim ulação tátil dos lábios de um bebê elicia um padrão de sucção, im p o rtan tíssim o para o seu contato inicial com alim ento. E n tretan to , apenas um a parcela restrita do am biente disponibiliza alim ento. C o m o passar do tem po, o contato com as consequências diferenciais faz com que as respostas de sugar sejam evocadas apenas pelos estímulos relevantes. O mesmo ocorre com o choro. As crianças rapidam ente aprendem a chorar com m aior frequência em dadas ocasiões em função das consequências do chorar, isto é, das m udanças produzidas no am biente por interm édio do com portam ento dos cuidadores.8 Ambos os tipos de condicionamentos têm em comum o estabelecimento de um a nova relação entre estímulos e respostas. N o condicionam ento respondente, a corre­ lação entre um estímulo neutro e um estímulo eliciador faz com que o estímulo inicialmente neutro passe a eliciar a resposta reflexa. No condicionamento operante, estímulos e respostas que coocorrem em correlação com um estímulo “eliciador” (o reforçador) passam a ocorrer juntos com mais frequência. Nos dois casos, uma relação S-R é fortalecida pela correlação com um estímulo eliciador. A diferença está nos arranjos ambientais que produzem essas relações e no controle do estímulo sobre a resposta. Reconhecendo essa afinidade, os pesquisadores Donahoe e Palmer (1994) propuseram o Princípio Unificado do Refiorço. A ideia, basi­ camente, é que em ambos os condicionamentos ocorre o mesmo processo de fortalecimento. Em linhas gerais, o sistema nervoso dos organismos capazes de aprender está configurado de modo que os estímulos e as respostas que consistentemente ocorrem contiguamente a um estímulo eliciador terão maior probabilidade de ocorrer juntos no “U m a parcela considerável dos eventos ambientais que influenciam o comportamento humano é composta por produtos do comportamento de outrem. Em Análise do Comportamento, os comportamentos que são estabelecidos e mantidos por consequências mediadas por outros indivíduos são estudados sob a rubrica de “Comportamento Verbal”, cuja formulação original pode ser encontrada em Skinner (1957) e descrita no Capítulo 7. Aprendizagem Contingência respondente 31 Contingência operante Estímulo Resposta operante FIGURA 2 .5 D iagram a ilustrando a apren­ dizagem sob a perspectiva do P rincípio U nificado do Reforço. T an to co n tin g ên ­ cias respondentes com o operantes correla­ cionam estím ulos, respostas e reforçadores (eliciadores). A espessura das linhas ligando estím ulo e respostas representa a força da relação. O efeito de m últiplas correlações, em ambos os casos, é o fortalecim ento de um a relação entre estím ulos antecedentes e respostas. (As aspas na palavra eliciador são inclusões dos organizadores d a obra). futuro,9 independente de como tais eventos se correla­ cionem em primeiro lugar. Dessa perspectiva, os qualifi­ cativos “respondente” e “operante” caracterizam os proce­ dimentos que o experimentador usa no laboratório para “O princípio unificado do reforço é parte da proposta “biocomportamental” de D onahoe e Palmer (1994), que busca suplementar a explicacão do comportamento com dados acerca da fisiologia dos organismos. Os autores defendem que a base fisiológica do reforço é o fortalecimento íináptico produzido em certas regiões do cérebro quando o organismo entra em contato com os eventos reforçadores. Em resumo, os reforça­ dores são estímulos que atuam sobre uma área do sistema límbico chamada =rea tegum entar ventral (VTA). A VTA interage com um conjunto de regiões do cérebro onde há sinapses entre neurônios que participam do contato com eventos ambientais e neurônios que participam da produção de respostas. Quando o organismo entra em contato com um reforçador, is sinapses provenientes da VTA lançam o neurotransmissor dopamina naquelas regiões. U m efeito da dopam ina é promover o aum ento da eficácia das sinapses que estão ativas no m om ento em que entram em contato com ela. Se o organismo for exposto recorrentemente a arranjos ambientais em que o contato com certos estímulos e a emissão de certas respostas são consistentemente acompanhados do contato com um refor­ çador (eliciador), o efeito cumulativo do fortalecimento das sinapses ativas no contato com o reforço será o favorecimento de uma rede neural que, grosso modo, subsidia a relação entre estímulos e respostas. Diversas invesngações acerca da neurobiologia da aprendizagem têm corroborado e esten­ dido esse modelo (para um a revisão desses estudos, ver Guerra, 2006; para mais detalhes sobre a proposta biocomportamental, ver Donahoe, ?ilmer, 1994; para uma discussão acerca da participação de eventos neurais na contingência de reforço, ver Silva, Gonçalves, Garcia-Mijares, 2007). fortalecer relações entre estímulos e respostas, não tipos diferentes de comportam ento. A Figura 2.5 ilustra essa noção. Tanto contingências respondentes como contingências operantes correlacionam eventos ambientais inicialmente “neutros” com respostas e estímulos eliciadores. Com o você deve lembrar, os dois tipos de contingências diferem no m om ento de apresen­ tação do estím ulo eliciador. No condicionamento respon­ dente, o estímulo eliciador é apresentado contiguamente a um estímulo neutro, ao passo que no condicionam ento operante o eliciador é apresentado contiguamente a uma resposta. Apesar dessas diferenças formais, o efeito da coocorrência recorrente desses eventos é a mesma nos dois casos: o fortalecimento da relação entre todos os estímulos e respostas que coincidiram com a apresentação do estí­ mulo eliciador. Após múltiplas exposições à contingência, o estímulo originalmente neutro eventualm ente passa a ser seguido daquelas respostas mesmo na ausência do estí­ m ulo “eliciador”. Repare que, na contingência operante, o estímulo que se tornará discriminativo para a resposta em questão tam bém passa a eliciar as respostas reflexas produzidas pelo reforçador. Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Capítulo 05. O Modelo de Seleção Pelas Consequências: O nível cultural Alexandre Dittrich4 Universidade Federal do Paraná Camila Muchon de Melo Universidade Estadual de Londrina (UEL) Márcio Borges Moreira Instituto Walden4, Instituto de Educação Superior de Brasília Ricardo Corrêa Martone Universidade de Brasília Introdução A seleção natural, ou filogenia, nos ajuda a entender a origem das diferenças entre as espécies; a seleção operante, ou ontogenia, nos ajuda a entender a origem das diferenças comportamentais entre os indivíduos e, embora este segundo nível de seleção nos permita explicar uma infinidade de comportamentos e processo psicológicos, há ainda uma lacuna para a adequada compreensão do ser humano. Segundo Skinner (1981/2007) essa lacuna é preenchida por um terceiro nível de seleção pelas consequências: o nível de seleção cultural. O terceiro nível de seleção, dado na cultura, é o campo das contingências culturais, ou seja, contingências especiais de reforço mantidas por um grupo. Skinner (1981/2007) argumenta que o fato primordial para o desenvolvimento dos ambientes sociais foi quando a musculatura vocal na espécie humana passou a ser sensível ao controle operante, o que por sua vez permitiu a evolução do comportamento verbal. O comportamento verbal possibilitou aos indivíduos da espécie humana desenvolver padrões comportamentais de cooperação, formação de regras e aconselhamento, aprendizagem por instrução, desenvolvimento de 4 Partes desse capítulo foram originalmente publicadas na tese de doutorado do primeiro autor, dissertação de mestrado da segunda autora e tese de doutorado do quarto autor. • Dittrich, A. (2004). Behaviorismo radical, ética e política: aspectos teóricos do compromisso social. Tese de doutorado, Universidade Federal de São Carlos-SP. • Melo, C. M. (2004). A concepção de Homem no Behaviorismo Radical de Skinner: um compromisso com o 'bem' da cultura. Dissertação de mestrado, Universidade Federal de São Carlos-SP. • Martone, R. C. (2008). Efeito de consequências externas e de mudanças na constituição do grupo sobre a distribuição dos ganhos em uma metacontingência experimental. Tese de doutorado, Universidade de Brasília-DF. www.walden4.com.br 45 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. práticas éticas, técnicas de autogestão e, além disso, permitiu o desenvolvimento do autoconhecimento ou da consciência: O desenvolvimento do controle ambiental sobre a musculatura vocal aumentou consideravelmente o auxílio que uma pessoa recebe de outras. Comportando-se verbalmente, as pessoas podem cooperar de maneira mais eficiente em atividades comuns. Ao receberem conselhos, ao atentarem para avisos, ao seguirem instruções, e ao observarem regras, as pessoas podem se beneficiar do que outros já aprenderam. Práticas éticas são fortalecidas ao serem codificadas em leis, e técnicas especiais de autogoverno ético e intelectual são desenvolvidas e ensinadas. O autoconhecimento ou consciência emergem quando uma pessoa pergunta a outra questões como “O que você vai fazer?” ou “Por quê você fez aquilo?”. A invenção do alfabeto propagou essas vantagens por grandes distâncias e períodos de tempo. Há muito tempo, diz-se que essas características conferem à espécie humana sua posição única, embora seja possível que tal singularidade seja simplesmente a extensão do controle operante à musculatura vocal (Skinner, 1981/2007, p. 131). De acordo com Skinner (1981/2007), o surgimento da linguagem permitiu o surgimento de ambientes sociais cada vez mais complexos, ou seja, permitiu o rápido desenvolvimento da cultura (ou de práticas culturais). Para Skinner, assim como o modelo de seleção pelas consequências nos explica as origens e as diferenças entre as espécies (nível filogenético), explica-nos as origens e as diferenças dos comportamentos individuais (nível ontogenético), esse modelo também nos explica as origens e as diferenças entre as culturas. Vimos que a variabilidade nas características (anatômicas, fisiológicas e comportamentais) entre membros de uma mesma espécie permite a seleção de novas características que, em algum momento, passam a ser mais adequadas a um ambiente (seleção no nível filogenético). Vimos também que a variabilidade nos comportamentos individuais permite que novos comportamentos sejam selecionados pelo ambiente (seleção no nível ontogenético). Da mesma forma, variabilidade nas práticas culturais de um grupo permite o surgimento de novas práticas culturais, isto é, permite a mudança na cultura. www.walden4.com.br 46 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. As práticas culturais de um povo, segundo Skinner (1953/2000; 1981/2007), produzem certas consequências para esse grupo. Por exemplo, se a maioria dos indivíduos de um determinado grupo, que mora à beira de um rio, emite regularmente comportamentos que mantêm o rio limpo, e observamos esse hábito através das gerações nesse grupo, dizemos então que esses comportamentos constituem uma prática cultural daquele grupo. Nesse caso, ter o rio limpo (uma fonte de água livre de doenças, água potável, etc.) é uma consequência da prática cultural e é esta consequência, esse efeito sobre o grupo como um todo, que provavelmente mantém a ocorrência dessa prática. Neste sentido, dizemos que esta consequência selecionou aquela prática cultural. No terceiro nível de seleção pelas consequências falamos, portanto, do surgimento, manutenção, transformação e extinção de práticas culturais. Variabilidade e fontes de variabilidade no nível cultural Práticas culturais são compostas por operantes ou conjuntos de operantes em contingências entrelaçadas. Assim, para analisar a reprodução e variação de práticas culturais, devemos partir da análise da reprodução e variação de operantes. Vimos que, no repertório de certo indivíduo, operantes “reproduzem-se” – isto é, repetem-se – porque geram consequências reforçadoras em situações específicas. Este é um requisito indispensável para a reprodução de práticas culturais. Mas, em se tratando do nível da cultura, o conceito de reprodução refere-se à transmissão e preservação de práticas entre as sucessivas gerações de uma cultura – isto é, à transmissão de operantes entre indivíduos. Por que os integrantes de certa geração em determinada cultura transmitem as práticas da cultura à geração seguinte? É fundamental compreender esse ponto para que a distinção entre os níveis 2 e 3 (ontogenético e cultural) fique clara. Práticas culturais são transmitidas entre gerações porque aqueles que as transmitem são reforçados por fazê-lo. O reforço pode ser direto (através do comportamento daquele(s) para o(s) qual(is) a prática é transmitida) ou indireto (através de agências governamentais, educacionais, religiosas, etc. ou de outras formas de reforço social dos comportamentos envolvidos na transmissão da prática). Práticas culturais não são transmitidas porque beneficiam a cultura (assim como genes não são transmitidos porque beneficiam a espécie). “Benefícios culturais” não integram contingências de reforço; integram, isto sim, contingências culturais de sobrevivência das práticas culturais. Esses “benefícios” culturais traduzem-se por 1) sobrevivência dos membros da cultura e 2) sobrevivência das práticas que caracterizam a cultura. Práticas culturais não-benéficas ou prejudiciais à cultura coexistem com práticas benéficas – assim como, no nível 1, certo número de genes não-adaptativos sempre permanece no “fundo” de certa espécie. A questão que se impõe, de imediato, diz respeito aos “motivos” que levam os integrantes das culturas a transmitir suas práticas. A resposta esclarece, em grande parte, o paralelo entre seleção natural e seleção cultural: as culturas que não transmitiram suas práticas simplesmente não estão mais entre nós; extinguiram-se, assim como as espécies que não transmitiram seus genes. A pergunta sobre os “motivos” para a transmissão de práticas culturais reveste-se, assim, de novo sentido. Resta-nos avaliar mais profundamente a questão da variação das práticas culturais. É necessário que nos reportemos, inicialmente, à variação dos operantes, pois desta depende a variação das práticas culturais. A topografia das respostas que compõem um operante pode variar drasticamente, mas, por definição, as respostas mais eficientes em www.walden4.com.br 47 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. cada situação tenderão a apresentar maior frequência. Há muitas formas de produzir fogo, por exemplo; mas algumas delas, presumivelmente, apresentam maiores possibilidades de reforço – porque despendem menos tempo e energia, porque são mais seguras, etc. Temos, assim, um primeiro sentido no qual podemos entender a variação dos operantes – isto é, a variação das respostas no contexto de um mesmo operante permite que este apresente diferentes magnitudes de reforço. A variação de respostas também é fundamental, nesse sentido, se considerarmos que as contingências ambientais estão continuamente sujeitas a mudanças. Em um segundo sentido, a variação pode ocorrer através do surgimento de operantes originais – ou seja, operantes que produzem consequências até então ausentes na história de reforço do comportamento de certo organismo. O termo “originais” não indica, é claro, a concorrência de qualquer força extrínseca às contingências de sobrevivência e Figura 1. Um pequeno exemplo da diversidade cultural encontrada na espécie humana. de reforço. Qualquer comportamento, seja ou não considerado “original”, deve ser compreendido como o resultado de certa história filogenética e ontogenética (Skinner, 1953/1965). “Contingências originais” presumivelmente explicam a ocorrência de comportamentos desse tipo. Não há diferenças de natureza entre os dois processos de variação dos operantes ora descritos. Porém, a diferenciação entre a variação das respostas em um mesmo operante e o surgimento de operantes “originais” permanece válida se lembrarmos que este último termo implica a produção de consequências inéditas em relação ao comportamento de www.walden4.com.br 48 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. certo organismo. (Em linguagem leiga, pode-se dizer que há diferentes formas de se fazer a mesma coisa, assim como há muitas formas de se fazer coisas diferentes.) Ambos os tipos de variação de operantes são, obviamente, relativos apenas ao comportamento individual. A variabilidade pode ser considerada uma característica “endógena” das práticas culturais, dado o caráter igualmente “endógeno” da variação do comportamento individual (Glenn, 1991). A principal característica das culturas, porém, é a transmissão de padrões de comportamento entre indivíduos. Nenhum processo comportamental adicional precisa ser postulado para explicar essa transmissão, mas o surgimento de novas práticas culturais e a manutenção de sua frequência entre os membros de certo grupo social exige, frequentemente, formas de descrição sintéticas – em oposição à descrição das contingências envolvendo cada membro do grupo. Os indivíduos que “integram” certa prática cultural mudam constantemente, e a prática, em decorrência, pode também mudar – mas uma descrição individual destes efeitos é irrelevante. (Na verdade, o impacto da mudança de um único indivíduo é, em muitos casos, desprezível em relação aos resultados finais da prática (Glenn, 1988). Diversas circunstâncias ambientais, produzidas ou não pela cultura, podem ter efeito sobre a configuração das práticas culturais. Intercâmbios ou choques entre diferentes culturas, por exemplo, podem modificar dramaticamente as feições das práticas culturais originais – mas, novamente, não haveria sentido em analisar os efeitos individuais destes acontecimentos. “A alergia a comida de um forte líder pode dar origem a uma lei relativa à dieta” (Skinner, 1971, p. 130), mas qual seria a utilidade em descrever o efeito da lei sobre cada indivíduo do grupo social? Por outro lado, é de grande interesse analisar os fatores que podem levar um dos membros de certo grupo a tornar-se um “forte líder”, ou ainda as circunstâncias culturais que levam à codificação de leis em relação ao comportamento dos membros do grupo. A reprodução e a variação de práticas culturais, em suma, devem ser explicadas através dos princípios da análise do comportamento, mas isso não implica a proibição de referências a fenômenos grupais. A complexidade das culturas, além disso, impede a adoção de explicações simplistas desses fenômenos. É impossível analisar a totalidade das variáveis implicadas na configuração de certa cultura, mas é preferível considerar tantas variáveis quantas possíveis – sejam quais forem suas origens – ao invés de confinar a análise a contingências isoladas. É mais provável, por exemplo, que certo grupo social adote leis relativas à dieta se um “forte líder” apresenta alergia a determinado tipo de alimento – mas o que ocorreria se um vassalo apresentasse problema semelhante? Certamente há, aqui, uma questão relativa à hierarquia ou status, cuja avaliação pede a análise de contingências adicionais, mas este é apenas um exemplo. Ele aponta para o fato de que o surgimento e a transmissão de práticas culturais dependem, em grande medida, das práticas já existentes em certa cultura (assim como, na análise do comportamento individual, um organismo é sempre um “organismo com história”, modificado por contingências de reforço anteriores). As possibilidades de evolução de certa cultura são influenciadas por seu grau atual de desenvolvimento – este, por sua vez, sendo determinado pela história desta cultura. Assim, embora a origem da variação das práticas culturais seja, estritamente falando, o comportamento operante individual, variáveis de ordem cultural devem ser invocadas para a avaliação das possibilidades de adoção e transmissão de certa prática. Essas variáveis, por sua vez, atuam sobre o comportamento de indivíduos – mas, como vimos, descrições individuais dos efeitos dessas práticas nem sempre serão úteis. A Figura 2 ilustra como podemos utilizar a curva normal para descrever a variabilidade com relação a uma prática cultural. Quando dizemos que um determinado conjunto de www.walden4.com.br 49 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Figura 2. Exemplo de como a curva normal pode ser usada para descrevermos a incidência de uma prática cultural. No exemplo retratado, a prática cultural refere-se a “jogar lixo no lixo”. No grupo de indivíduos em questão, a prática cultural é um cuidado nem displicente nem engajado com relação ao lixo. comportamentos corresponde a uma prática cultural, estamos dizendo, entre outras coisas, que a maior parte dos indivíduos de um determinado grupo emite alguns – ou todos – comportamentos deste conjunto. No exemplo retratado na Figura 2 a prática cultural em questão é “jogar lixo no lixo”. Em alguns grupos sociais a maioria dos membros joga, quase sempre, o lixo no lixo; em outros grupos, a maioria dos membros joga, quase sempre, o lixo fora do lixo; em outros grupos ainda a maioria dos membros não é absolutamente displicente (ou “sugismundo”) ou absolutamente engajado (ou defensor do meio ambiente). A Figura 2 retrata um grupo como este último. É interessante notar que neste grupo hipotético a maioria dos indivíduos joga o lixo no lixo, digamos, sempre que possível, um número pequeno de indivíduos nunca, ou raramente, joga o lixo no lixo e um outro número, também pequeno, de indivíduos jogo o lixo sempre, ou quase sempre, no lixo. Podemos notar nesse exemplo, portanto, a variabilidade nos comportamentos relativos à prática cultural em questão. (Para reflexão: baseando-se no que foi explicado sobre os níveis filogenético e ontogenético, tente formular um exemplo de como a prática cultural do exemplo poderia mudar; como o número de membros do grupo que sempre jogam o lixo no lixo poderia passar a ser a média, a ser o maior número de indivíduo no grupo social). www.walden4.com.br 50 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. O que é selecionado? De acordo com Skinner (1971), as unidades de seleção no terceiro nível são as práticas culturais. Tais práticas são definidas de acordo com suas consequências ou produtos: “(...) fazer uma ferramenta, cultivar alimento ou ensinar uma criança” (Skinner, 1981/1984, p. 478). O adjetivo “culturais” indica que a aprendizagem de tais práticas é mediada por outros seres humanos – visto que “cultura”, para Skinner (1953/1965), é o conjunto das contingências de reforço mantidas por certo grupo social. Mas qual a fonte original dessas unidades? Práticas culturais surgem a partir de contingências que afetam o comportamento de indivíduos (Skinner, 1981/1984) – e, neste sentido, seu surgimento em nada difere do surgimento dos operantes no repertório comportamental dos organismos. Mas, nesse caso, o que diferencia as práticas culturais dos operantes? Práticas culturais são constituídas por operantes, mas para que a adoção do conceito seja justificada, tais práticas devem apresentar características indicativas de um novo nível de organização seletiva. De imediato, duas dessas características são identificáveis: 1) Em princípio, qualquer operante pode tornar-se uma prática cultural, desde que seja reforçado e transmitido pelos membros de certa cultura. Em muitos casos, porém, equiparar práticas culturais a operantes individuais é uma simplificação. Diferentes formas de cultivar alimentos, educar crianças e governar países não são “operantes”, em sentido estrito, mas sim longas e complexas cadeias de operantes, envolvendo diversos indivíduos e sendo definidos por expressões que apontam para suas consequências ou produtos finais. Um operante simples pode tornar-se uma prática cultural: “cumprimentar”, por exemplo, é um operante e uma prática cultural. Usualmente, porém, práticas culturais são constituídas por contingências de reforço entrelaçadas (Glenn, 1988; 1991) – isto é, contingências nas quais os indivíduos envolvidos não apenas comportam-se, mas, ao fazê-lo, criam variáveis ambientais que participam do controle do comportamento de outros indivíduos. Normalmente, as contingências entrelaçadas que integram práticas culturais contam com a participação de grupos de indivíduos desenvolvendo ações coordenadas para a produção de certos resultados que não poderiam ser alcançados pela ação isolada dos membros do grupo. Esses resultados, por sua vez, retroagem sobre o grupo, influenciando as possibilidades de sobrevivência tanto de seus membros quanto das práticas que executam. 2) Uma prática cultural é um operante – ou conjunto de operantes – reforçado pelos membros de certa cultura. Isoladamente, porém, essa afirmação não basta para caracterizar práticas culturais, pois a imensa maioria dos operantes emitidos por seres humanos são modelados pelas culturas. Não haveria qualquer utilidade, para nossa discussão, em distinguir entre aqueles operantes que sofrem ou não influência cultural. Porém, cabe notar que, se nossa definição de práticas culturais se limitasse ao fato de que elas são reforçadas pelas culturas, praticamente qualquer comportamento humano selecionado em nível ontogenético deveria ser considerado uma prática cultural. Portanto, a simples presença da cultura enquanto ambiente seletivo não nos permite diferenciar entre operantes e práticas culturais. Uma www.walden4.com.br 51 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. segunda característica deve ser igualmente considerada. Para que possamos denominálos práticas culturais, operantes devem ser transmitidos como partes de um ambiente social. Sabemos que a frequência de certa prática cultural em um ambiente social dependerá da extensão na qual esta prática é reforçada por seus membros – mas isso não é suficiente para explicar a continuidade da prática enquanto tal. Para que operantes – ou conjuntos de operantes – possam ser caracterizados como práticas culturais, a transmissão entre gerações sucessivas deve ser assegurada – e isso ocorre quando membros do grupo social não apenas são ensinados a “praticar a prática”, mas também são “ensinados a ensinar” a prática. A continuidade de certa prática cultural depende fundamentalmente desse processo de transmissão das unidades de seleção. Essas são, portanto, as características definidoras das práticas culturais: elas são operantes (ou conjuntos de operantes ligados por contingências entrelaçadas) reforçados por certa cultura e transmitidos entre as sucessivas gerações desta cultura. A conjunção dessas características permite atribuir a um terceiro nível seletivo a configuração das culturas. O comportamento dos planejadores culturais é selecionado pelas consequências do controle que exercem. A introdução deliberada de variáveis visando o controle de práticas culturais acelera e otimiza o processo evolutivo no nível 3 – e é, por este motivo, selecionada. Que frequentemente os planejadores culturais beneficiem-se de sua posição, explorando o comportamento alheio em benefício próprio, não apenas é evidente, como é um problema central para as discussões éticas sobre a tecnologia comportamental (Skinner, 1953/1965, Holland, 1974; Sidman, 1989; Carrara, 1998). No entanto, importa aqui simplesmente destacar que práticas de planejamento e controle do comportamento são, também elas, práticas culturais, tanto quanto cultivar alimentos ou produzir artefatos – e, enquanto tais, estão igualmente sujeitas à seleção no nível 3 (Skinner, 1953/1965). Isso é importante para que não cometamos o erro de polarizar nossa discussão entre práticas culturais sujeitas ao controle, por um lado, e práticas de controle, por outro. Ainda que seja útil e necessário realizar tal distinção no momento correto e sob o prisma adequado, a seleção cultural é, em relação a esse aspecto, tão “cega” quanto nos níveis anteriores, pois lida tão somente com unidades de seleção, ignorando distinções hierárquicas. Ao fazer tais observações, visamos simplesmente desvincular as implicações éticas e políticas de nossa discussão da análise sobre os méritos do modelo de seleção por consequências enquanto instrumento de interpretação das culturas. É evidente que conceituar “cultura” como um conjunto de contingências de reforço mantidas por um grupo(Skinner, 1974) ou como “(...) todas as variáveis afetando-o [um indivíduo] que são arranjadas por outras pessoas” (Skinner, 1953/1965, p. 419) implica apontar controladores e controlados – mas, no que concerne ao modelo de seleção por consequências, não se trata de identificá-los, necessariamente, com governantes e governados. Um ponto de partida é necessário para a realização de uma análise comportamental – mas, nas contingências entrelaçadas que compõem uma cultura, o controle é um predicado de todos os participantes. Skinner, obviamente, não foi o único autor a traçar analogias entre a seleção natural e a seleção de práticas culturais. A sociobiologia e o darwinismo social, por exemplo, angariaram considerável atenção nas últimas décadas. Skinner critica ambas as alternativas (1971) – basicamente, por 1) ignorar o nível operante de seleção, comparando diretamente a seleção natural à seleção cultural; 2) conferir demasiada ênfase à competição entre culturas, negligenciando a “competição” das culturas com seus próprios ambientes. www.walden4.com.br 52 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. Como ocorre a seleção? A frequência e a diversidade dos operantes (incluindo aqueles que compõem práticas culturais) no repertório dos membros de uma cultura são controladas pelas práticas de reforço mantidas por esta cultura. O surgimento dessas práticas, como vimos, pode ser planejado ou acidental, mas sua permanência dependerá, em última análise, de seus efeitos sobre as possibilidades de manutenção da cultura. Cabe lembrar que operantes, incluindo práticas culturais, são sempre controlados por contingências de reforço – isto é, por contingências de nível 2. As contingências de sobrevivência no nível 3 determinam apenas quais dessas contingências de reforço serão favorecidas por suas consequências relativas à sobrevivência da cultura. Figurativamente, é possível dizer que as contingências culturais de reforço somente perduram quando são “avalizadas” pelas contingências de sobrevivência no nível 3. Isso deve ficar claro, pois é fácil confundir os níveis 2 e 3 quando da utilização de expressões como “seleção cultural” ou “evolução cultural”. Uma cultura seleciona práticas culturais no sentido de reforçá-las (nível 2), mas a seleção de práticas culturais no nível 3 depende apenas em parte da ação das culturas. Práticas culturais são julgadas por seu valor de sobrevivência, a despeito de qualquer planejamento cultural. A forma clássica do controle cultural de operantes é a utilização de regras. A maior parte dos empreendimentos humanos pode ser incluída nessa categoria: ciência, educação, religião, direito, psicologia, economia, arte, etc. O papel das agências de controle é fundamental para a observação de tais regras pelos membros da cultura (Skinner, 1953/1965, seção V). A atuação dessas agências na reprodução de práticas culturais é bastante óbvia. O melhor exemplo está no sistema educacional: é um conjunto de agências de controle majoritariamente preocupadas com a transmissão de comportamentos. Porém, a participação dessas agências na produção de variações não pode ser desprezada – ainda que, presumivelmente, muitas destas variações sejam produzidas de modo acidental. De qualquer modo, sempre que se discuta a seleção de práticas culturais é imprescindível fazer referência a estas duas características distintivas das culturas humanas: o controle por regras e a institucionalização deste controle através de agências (ambos envolvendo, por sua vez, outras práticas culturais). Há um problema final que merece ser aprofundado. Em que sentido podemos dizer que o nível 3 difere do nível 2? O processo de condicionamento operante é a base a partir da qual surgem as unidades seletivas, tanto no nível 2 como no nível 3. Mas, nesse caso, onde está a diferença entre os níveis? No nível 3, estamos falando, é claro, de grupos sociais, de culturas, de agências de controle – em suma, estamos tratando de www.walden4.com.br 53 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. coletividades, e não de indivíduos. Estamos, também, lidando com espaços temporais de análise diferentes: o ciclo da seleção ontogenética encerra-se com a existência de certo organismo, mas a seleção de práticas culturais transcende os indivíduos. As condições para o surgimento de um terceiro nível de seleção são dadas por certas características excepcionais legadas pela evolução natural à espécie humana: a ampla suscetibilidade ao condicionamento operante, o controle da musculatura vocal e a consequente possibilidade de exercer controle relativamente preciso sobre o comportamento dos membros da cultura. A possibilidade de transmissão intergeracional de operantes é, sem dúvida, a marca principal desse processo, permitindo que se fale, propriamente, de evolução cultural – uma vez que verifica-se, a partir de então, a continuidade seletiva de elementos culturais de gerações anteriores. De certo modo, ao fornecer subsídios para que se fale de modo original sobre variação, reprodução e seleção de unidades, as culturas criam um universo evolutivo próprio. Isso não significa que tais elementos devam ser tratados como pertencentes a uma dimensão não-natural. A ideia de “salto” ou “divisão” entre natureza e cultura é uma abstração desnecessária. O nível 3 é um produto evolutivo do nível 2, assim como este é um produto evolutivo do nível 1 – e é neste sentido que deve ser compreendida a já citada frase de Skinner (1981/1984): “Em última análise, é claro, é tudo uma questão de seleção natural (...)” (p. 478). Um nível não deixa de agir em função do surgimento do nível seguinte – e, desta forma, o comportamento humano é produto da intersecção de variáveis atuando nos três níveis. Leis científicas, como vimos, não são obedecidas pela natureza, mas por homens que lidam efetivamente com a natureza. Assim, a justificativa para a adoção de um terceiro nível de seleção não deve ser procurada na “natureza” distintiva deste nível, mas na produtividade proporcionada pela extensão da metáfora da seleção ao nível cultural. É possível, necessário e útil falar em termos de variação, reprodução e seleção de unidades no nível cultural ou a análise do comportamento individual é suficiente para compreender e planejar culturas? O simples fato de que o nível 2 limita-se ao período de existência dos organismos individuais fornece pistas para a resposta. É por isso que Skinner insiste em afirmar que, ainda que contingências de reforço do comportamento operante sejam necessárias para a ocorrência da evolução cultural, ela é uma contingência de seleção diferente, e que é o efeito sobre o grupo, não as consequências reforçadoras para membros individuais, que são responsáveis pela evolução da cultura. É fácil confundir-se nesse ponto e tomar essa expressão simplesmente como representando a soma das contingências de reforço afetando os membros de certa cultura. Se esse fosse o caso, haveria bons motivos para questionar a necessidade de um terceiro nível de análise. No entanto, quando falamos em evolução das culturas, estamos lidando com “uma contingência de seleção diferente” – isto é, estamos avaliando os efeitos de longo prazo das práticas culturais sobre as possibilidades de sobrevivência de certa cultura (e, em consequência, de suas práticas). Esse é o “efeito sobre o grupo” ao qual Skinner se refere. Contingências de reforço (nível 2) selecionam o comportamento de indivíduos em termos ontogenéticos – inclusive os comportamentos que compõem práticas culturais. Contingências de sobrevivência (nível 3) selecionam as contingências entrelaçadas que compõem práticas culturais entre sucessivas gerações. Assim como no nível 1, deparamo-nos aqui, novamente, com uma “contingência de sobrevivência”. Questões para estudo 1. O que são contingências culturais? www.walden4.com.br 54 Moreira, M. B. (Org.) (2013). Comportamento e Práticas Culturais. Brasília: Instituto Walden4. 2. Explique a seguinte frase: “o fato primordial para o desenvolvimento dos ambientes sociais foi quando a musculatura vocal na espécie humana passou a ser sensível ao controle operante, o que por sua vez permitiu a evolução do comportamento verbal.” 3. O que explica o modelo de seleção pelas consequências no nível cultural? 4. O que é selecionado no nível cultural? Exemplifique sua resposta. 5. Quais são as fontes de variabilidade (ou variação) no nível cultural? Exemplifique sua resposta. 6. Qual a relação entre variabilidade e seleção pelas consequências no nível cultural? Exemplifique sua resposta. 7. Trace um paralelo entre seleção por consequências no nível filogenético, no nível ontogenético e no nível cultural. 8. Descreva o modelo de Seleção pelas Consequências proposto por Skinner. Liste os três níveis em que ele ocorre e o que é selecionado em cada nível, fornecendo exemplos para ilustrar sua resposta. Referências Bibliográficas Carrara, K. (1998). Behaviorismo radical: Crítica e metacrítica. Marília: UNESP; São Paulo: FAPESP. Glenn, S. S. (1988). Contingencies and Metacontingencies: Toward a synthesis of behavior analysis and Cultural Materialism. The Behavior Analyst, 11, 161-179. Glenn, S.S. (1991). Contingencies and Metacontingencies: Relations among behavioral, cultural, and biological evolution. In P.A. Lamal (ed.) Behavioral Analysis of Societies and Cultural Practices, (pp. 39-73). New York: Hemisphere Publishing Corporation. Holland, J.G. (1974). Are behavioral principles for revolutionaries? In F.S. Keller & E. Ribes-Inesta (Eds.), Behavior modification: Applications to education, (pp. 195-208). New York: Academic Press Sidman, M. (1989). Coercion and its fallout. Boston: Authors Cooperative. Skinner, B.F. (1965). Science and human behavior. New York: Macmillan. (Originalmente publicado em 1953) Skinner, B.F. (1971). A behavioral analysis of value judgments. In E. Tobach, I. R. Aronson, E. Shaw (Eds.) The biopsychology of development (pp. 543-551). New York: Academic Press. Skinner, B.F. (1974). About behaviorism. New York: Alfred A. Knopf. Skinner, B.F. (1984). Selection by consequences. Em A.C. Catania & S. Harnad (Orgs.), Canonical papers of B. F. Skinner (pp. 477-481). The Behavioral and Brain Sciences, 7, 473-724. (Originalmente publicado em 1981). Skinner, B. F. (2000). Ciência e Comportamento Humano (Tradução de João Claudio Todorov e Rodolfo Azzi). São Paulo: Martins Fontes. (T Originalmente publicado em 1953) Skinner, B. F. (2007). Seleção por consequências. Revista Brasileira de Terapia Comportamental e Cognitiva, 9, 129-137. (Originalmente publicado em 1981) www.walden4.com.br 55