EXPERIMENTOS CLÁSSICOS EM ANÁLISE DO COMPORTAMENTO ORGANIZADORES Paulo Guerra Soares João Henrique de Almeida Carlos Renato Xavier Cançado www.walden4.com.br 2016 Instituto Walden4 E71 Experimentos clássicos em análise do comportamento [recurso eletrônico] / organizado por Paulo Guerra Soares, João Henrique de Almeida, Carlos Renato Xavier Cançado. - Brasília : Instituto Walden4, 2016. 333 p. ISBN: 978-85-65721-10-3 1. Psicologia experimental. 2. Análise do comportamento. I. Soares, Paulo Guerra, org. II. de Almeida, João Henrique, org. III. Cançado, Carlos Renato Xavier, org. IV. Título. CDD 150.724 Coordenadora: Seila Cibele Sitta Preto Projeto Gráfico: Leandro Brasil Melo Diagramação: Lorena Shimizu Capa: Lorena Shimizu DEDICATÓRIA Dedicamos esse livro à Profa. Sônia dos Santos Castanheira, ao Prof. Roosevelt Riston Starling, e ao Prof. Ernani Henrique Fazzi, responsáveis por nosso primeiro contato com a Análise Experimental do Comportamento. iii AUTORES E AUTORAS Alina Barboza Cabral Bianco Estudante de Graduação (Psicologia) – Universidade de Rio Verde. Carlos Eduardo Costa Doutor em Psicologia Experimental – Universidade de São Paulo. André Augusto Borges Varella Doutor em Psicologia – Universidade Federal de São Carlos. Carlos Renato Xavier Cançado Doutor em Psicologia/Análise do Comportamento – West Virginia University, Estados Unidos. Andréia Schmidt Doutora em Psicologia Experimental – Universidade de São Paulo. Armando Domingos Batista Machado Doutor em Psicologia – Duke University, Estados Unidos. Candido Vinícius Bocaiuva Barnsley Pessôa Doutor em Psicologia Experimental – Universidade de São Paulo. Carlos Augusto de Medeiros Doutor em Psicologia – Universidade de Brasília. iv Carolina Coury Silveira Mestre em Psicologia – Universidade Federal de São Carlos. Cristiano Coelho Doutor em Psicologia – Universidade de Brasília. Cristiano Valério dos Santos Doutor em Psicologia Experimental – Universidade de São Paulo. Edson Massayuki Huziwara Doutor em Psicologia Experimental – Universidade de São Paulo. Elenice Seixas Hanna Doutora em Psicologia – University of Wales, Reino Unido. Ítalo Siqueira de Castro Teixeira Graduação em Psicologia – Universidade de Fortaleza. Fábio Henrique Baia Doutor em Ciências do Comportamento –Universidade de Brasília. João Claudio Todorov Doutor em Psicologia – Arizona State University, Estados Unidos. Flávia Hauck Mestre em Ciências do Comportamento –Universidade de Brasília. João Henrique de Almeida Doutor em Psicologia – Universidade Federal de São Carlos. Hernando Borges Neves Filho Doutor em Psicologia Experimental – Universidade de São Paulo. Kennon A. Lattal Doutor em Psicologia Experimental e Clínica – University of Alabama, Estados Unidos. Hiroto Okouchi Doutor em Ciências do Comportamento – Hiroshima University, Japão. Isabella Guimarães Lemes Estudante de Graduação (Psicologia) – Universidade de Rio Verde. Lucas Ferraz Córdova Doutor em Ciências do Comportamento –Universidade de Brasília. Marcelo Borges Henriques Mestre em Psicologia – Pontifícia Universidade Católica de Goiás. v Márcio Borges Moreira Doutor em Ciências do Comportamento –Universidade de Brasília. Poliana Ferreira da Silva Estudante de Graduação (Psicologia) – Universidade de Rio Verde. Marco Vasconcellos Doutor em Psicologia – Purdue University , Estados Unidos. Rafaela Meireles Fontes Azevedo Mestre em Ciências do Comportamento – Universidade de Brasília. Maria Carolina Correa Martone Mestre em Psicologia Experimental – Pontifícia Universidade Católica de São Paulo Marília Pinheiro de Carvalho Doutora em Psicologia Básica – Universidade do Minho, Portugal. Paulo Guerra Soares Mestre em Análise do Comportamento – Universidade Estadual de Londrina. Peter Endemann Doutor em Psicologia Experimental – Universidade de São Paulo. vi William Ferreira Perez Doutor em Psicologia Experimental – Universidade de São Paulo. AGRADECIMENTOS “É preciso de uma aldeia inteira para criar uma criança”1. É verdade: muito trabalho, de muitas pessoas. Em relação à escrita de um artigo científico, Killeen e Pellón (2013) indicaram que também “É preciso de uma aldeia inteira para criar um artigo”2 (p.19): muito trabalho, certamente de muitas pessoas. O mesmo pode ser dito sobre a organização de um livro. Gostaríamos de agradecer a todas e a todos dessa “aldeia”, cujo trabalho permitiu que esse livro fosse criado. Agradecemos à cada autora e a cada autor dos capítulos que compõem esse livro. Vocês abraçaram o projeto e contribuíram de uma forma que o nosso breve agradecimento não consegue descrever e nunca será suficiente. Para vocês, especialmente, o nosso “Muito obrigado”. Agradecemos ao Prof. Alexandre Dittrich pela escolha da capa desse livro e pela escrita do texto que a acompanha. Cientistas são “artistas do mundo natural” e a experimentação é um caminho central de sua atividade. Agradecemos à Profa. Deisy das Graças de Souza por escrever o prefácio e apresentar o livro de forma tão clara à audiência para qual foi escrito. O conselho que ela dá para futuras e futuros analistas do comportamento é válido para todas e todos interessados no estudo científico do comportamento, mesmo para quem tem familiaridade e trabalha há anos com a experimentação. Agradecemos à equipe do Projeto de extensão UneDesign - Integração Universidade-Empresa do curso de Desenho Industrial com habilitação em Programação Visual, da Universidade do Norte do Paraná, coordenada pela Profa. Seila Cibele Sitta Preto, pelo trabalho cuidaIt takes a village to raise a child. “It takes a village to raise a paper”. Killeen, P. R., & Pellón, R. (2013). Adjuntive behaviors are operants. Learning & Behavior, 41, 1-24. 1 2 vii doso em cada etapa da preparação desse livro. Aos discentes Leandro Brasil Melo pelo desenvolvimento do projeto gráfico, e Lorena Shimizu pela diagramação e desenvolvimento projetual de capa. O trabalho foi feito como parte de um projeto de extensão, e retrata a importância da integração das atividades de ensino e pesquisa na relação entre a universidade e as comunidades nas quais está inserida. Por fim, agradecemos ao Prof. Márcio Borges Moreira, que acreditou no projeto e aceitou a tarefa de publicação de um livro gratuito e em formato eletrônico pela Editora do Instituto Walden4. É verdade: é preciso de uma aldeia para criar um livro! Paulo Guerra Soares João Henrique de Almeida3 Carlos Renato Xavier Cançado4 3 4 viii Apoio da FAPESP (Processo no: 2014/01874-7). Apoio CAPES (PNPD). PREFÁCIO ... even though laboratory methods are often devised not for practical teaching but for the study of fundamental behavioral processes, the techniques are then available for application outside the laboratory. Murray Sidman, 1994, P.534 Tomar conhecimento da edição deste livro me deixou particularmente entusiasmada. É sempre bom contar com material de qualidade como suporte para o ensino e, neste caso, vislumbrei a possibilidade de ter em mãos um material muito compatível com a maneira como gosto de trabalhar nas disciplinas que ministro para o curso de graduação em Psicologia. Segundo me relataram os organizadores, sua proposta era trazer ao leitor experimentos clássicos em análise do comportamento, relatados e interpretados por pesquisadores da área, com ênfase em suas contribuições para novas linhas de pesquisa. Gostei imediatamente da proposta e me lembrei de outras ocasiões em que tive oportunidade de explorar artigos de pesquisa como fontes para atividades de ensino, buscando propiciar ao aluno condições para o desenvolvimento de uma ampla gama de habilidades, incluindo a busca pelas origens de ideias, conceitos, procedimentos. No período em que estive na UnB, no início da década de 90, tive oportunidade de trabalhar com meu colega Jorge Mendes de Oliveira Castro, na disciplina Psicologia Geral e Experimental (PGE I), para alunos do primeiro semestre do curso de graduação em Psicologia. Discutimos muito as condições de entrada dos alunos no curso, incluindo as possíveis ideias preconcebidas sobre nossa disciplina, e a necessidade de colocá-los logo em contato com o que se estuda em Psicologia e, ao mesmo tempo, mantê-los motivados para ler e estudar o assunto. Concordamos muito rapidamente que, em ix vez de ler livros texto, os alunos poderiam aprender muito lendo artigos científicos, mais precisamente, relatos de pesquisa experimental, o que lhes permitiria ter contato com autores importantes da área e conhecer um pouco do desenvolvimento de nossa ciência. Tenho as melhores lembranças das horas e horas que passamos escolhendo os textos (claro que fizemos um levantamento 10 vezes maior do que seria possível abordar em uma disciplina de um semestre) e do entusiasmo com que trabalhamos naquela disciplina, em grande parte motivado pelos progressos dos alunos, evidenciados nas discussões em sala, em suas habilidades de ler e pensar, de utilizar o raciocínio científico, e de se dar conta de que cada experimento pode trazer uma nova contribuição, mas também pode ter limitações, e que identificar os limites é um caminho para novas ideias e novas possibilidades de investigação. Sentíamos que estávamos criando boas condições para o desenvolvimento de pelo menos alguns dos requisitos importantes no repertório de futuros psicólogos e, talvez, pesquisadores em psicologia. Retornando à UFSCar, tive oportunidade de fazer parte da equipe que planejou o curso de graduação em Psicologia, implantado em 1994. Novamente me coube uma disciplina introdutória e quando comentei sobre a experiência na disciplina da UNB, meu colega Júlio de Rose me apresentou o livro de Roger Hock: “Quarenta estudos que transformaram a Psicologia”. O livro organizava o material em 10 capítulos, cada capítulo apresentando quatro estudos clássicos. A organização apresenta uma característica que resolvia muitos dos problemas que eu encontrara antes, ao exigir de alunos de primeiro semestre a leitura de um estudo experimental em toda a complexidade de seu relato original: neste livro, cada estudo é apresentado de maneira resumida – isto é, retira detalhes e complexidade do texto, sem deixar de apresentar ao leitor as informações essenciais para a compreensão do x que foi feito e da justificativa para fazê-lo; além disso, o autor do livro apresenta o contexto em que cada investigação foi concebida e conduzida; e ao final do texto, apresenta, também, de maneira resumida, mas suficientemente informativa, as linhas de pesquisa e os desenvolvimentos subsequentes que derivaram daquele estudo seminal (isto é, oferece uma perspectiva histórica do desenvolvimento da psicologia, por meio do trabalho concreto de pesquisadores relevantes). Usei o livro por vários anos, enquanto ministrei a disciplina (fui depois substituída pelo Júlio, que continuou usando o “Hock”) e estou certa que o uso desse material, em suas sucessivas reedições, tem contribuído muito positivamente para iniciar o desenvolvimento das concepções do aluno sobre o que estuda a Psicologia – e sobre como essa ciência vem sendo, e poderá continuar sendo, construída. Experiência similar teve ocasião quando Edson Huziwara, fazendo pós-doutorado na UFSCar, se dispôs a oferecer uma turma da disciplina optativa do curso, denominada Fenômenos e Processos Psicológicos; fui formalmente responsável pela disciplina e estive presente em todas as aulas, mas todo o trabalho foi planejado e conduzido pelo Edson e pelo João Henrique de Almeida, um dos organizadores deste livro. Aquela disciplina do curso de Psicologia da UFSCar permite, a cada oferta, a especificação dos tópicos abordados e Edson e João propuseram que naquele semestre a disciplina tivesse por objetivo apresentar, de forma sucinta, a produção empírica (experimentos clássicos) sobre diversos processos comportamentais investigados pela análise experimental do comportamento e ensinar as habilidades necessárias para uma leitura competente de textos científicos. Os alunos eram de uma turma avançada e liam os artigos no original, os professores realizaram um excelente trabalho de preparar cuidadosamente cada estudo para apresentar em sala, destacando seus aspectos fundamenxi tais e apresentando pistas para que os alunos discutissem qualidades e limites da pesquisa em foco. Sou testemunha de que esta atividade funcionou como reforçador poderoso para a leitura prévia dos alunos, e, ao mesmo tempo, como modelo de leitura cuidadosa e crítica. Reconheço que ao relatar essas experiências estou falando de meu trabalho, em vez de falar sobre o livro que apresento aos leitores. Mas espero ter fornecido evidências do quanto aprecio o que encontrei nele: - O conteúdo é específico de análise do comportamento: trata-se, assim, de uma fonte organizada de informações que podem ser usadas no ensino de disciplinas da área. - A seleção de artigos relevantes, que deram origem a importantes desenvolvimentos na área, pode contribuir decisivamente para que o leitor compreenda a relevância da memória da investigação científica, a importância de se conhecer os clássicos e de se estabelecer relações entre o experimento original e a linha ou linhas de pesquisa geradas por ele e sua importância para o conhecimento atual em análise do comportamento. - A ênfase em estudos experimentais permite destacar aspectos metodológicos, as possibilidades e a importância de investigação rigorosa, os necessários limites (seja do ponto de vista do controle, seja do ponto de vista da validade interna e externa), as contribuições potenciais para a compreensão de processos comportamentais, as perguntas que deixaram de ser respondidas, ou que foram suscitadas pelos dados. Esse conjunto de aspectos representa uma rica oportunidade para subsidiar a avaliação crítica da pesquisa científica em análise do xii comportamento, e, o que é de extrema relevância para a sobrevivência das práticas científicas (investigação e intervenção) em análise do comportamento, despertar talentos e vocações para dar continuidade ao desenvolvimento da área. Por todos esses aspectos, avalio que este volume pode ser uma fonte inestimável para formação ou o aprimoramento de analistas do comportamento. Há algum tempo, em uma entrevista para a Associação Brasileira de Psicologia e Medicina Comportamental (ABPMC), a entrevistadora me perguntou que conselhos eu daria para a nova geração de analistas do comportamento. Embora desacredite no potencial de “conselhos” (sem outras condições críticas) para gerar ou manter comportamentos, arrisquei alguns palpites que talvez respondessem ao interesse de alguém. Penso que os palpites valem também para jovens analistas que busquem aprender com este livro, por isso tomo a liberdade de transcrever alguns pontos daquela fala: Não existe nada que você possa fazer bem feito, que não exija esforço, comprometimento, dedicação e um trabalho sistemático. Em nossa área, seja no estudo, na investigação, ou nas aplicações a problemas humanos, não dá para fazer um trabalho de qualquer jeito, não se pode fazê-lo rapidamente, nem superficialmente. Por isso, para quem quer se tornar um analista do comportamento competente, seja no desenvolvimento científico da área, seja no desenvolvimento profissional, o primeiro passo é dedicação. É preciso ler (ou melhor, estudar) relatos originais de pesquisa; é preciso ler muito, voltar às origens, ler os clássicos e, claro, ler bibliografia atualizada. Muitas vezes presencio meus alunos lendo – ou escrevendo sobre o que leram, e eles tendem a xiii assumir que o autor que estão lendo no momento foi o primeiro a falar daquele assunto, ou o que teve a ideia original de que trata a pesquisa. Muitas vezes, trata-se de conceitos elaborados há muito tempo, que são encontrados em Skinner (1931, 1938, 1953), Keller e Schoenfeld (1950), Ferster e Skinner (1957), Millenson (1967), Sidman (1960), mas eles citam o artigo mais recente que leram, como se fosse a fonte original. É preciso estar atualizado, acompanhar o desenvolvimento da área e para isto é preciso recorrer à literatura recente, mas também é preciso manter o registro, a memória ou a história dos conceitos e descobertas. Apesar de todas as exigências de referência de citação científica, muitas vezes vemos uma deturpação em relação às origens. Não é incomum encontrarmos, em 2016, um artigo citando um autor que publicou em 2015, como se este fosse a referência original de um determinado assunto. É muito importante estudar os trabalhos dos pioneiros (e se interessar por quem foram eles, sob que condições trabalharam, onde e quando viveram), ler e conhecer o que a área já produziu, ao mesmo tempo em se lê referências atualizadas. É preciso tentar dominar o conhecimento produzido na área, que não é pouco; quanto mais se conhece – os conteúdos e os caminhos que levaram a eles, mais o analista do comportamento disporá de instrumental teórico, conceitual e de procedimentos, para analisar e interpretar situações novas e para pensar, gerar novos estudos, ou planejar intervenções com embasamento cientifico. As facilidades de acesso são cada vez maiores, mas não podemos nos iludir com essa facilidade. É muito fácil acessar dezenas de artigos pela internet e poder abrir cada um deles com um simples toque. Mas não basta: faltam os passos seguintes: como é que se lê essa quantidade de material, de maneira funcional? Será preciso trabalhar muito, de forma disciplinada. Para quem quiser ter uma boa formação como analista do comportamento, existe muito conhecimento sedimentado para se aprender a trabalhar xiv e existem boas oportunidades de novos desenvolvimentos, mas para isso é preciso estudar, se dedicar, se comprometer. Este livro pode ser um bom começo. Neste primeiro volume da série foram selecionados estudos experimentais sobre condicionamento respondente; sobre o papel das consequências e parâmetros de reforço (atraso do reforço; contraste comportamental; comportamento de escolha, história comportamental, ressurgência); sobre controle de estímulos (processos atencionais, respostas de observação, responder por exclusão, eventos privados, resolução de problemas, Teoria das Molduras Relacionais); sobre comportamento social (cooperação, cultura) e comportamento verbal (correspondência verbal e não verbal; comportamento governado por regras); e sobre análise funcional. Todos eles deram origem a linhas de pesquisa produtivas, responsáveis por grande parte do estado atual da pesquisa em análise do comportamento. Os autores dos capítulos são investigadores nacionais e internacionais, que conhecem profundamente os estudos e seus autores e estão comprometidos com a difusão e o ensino de análise do comportamento. Por todos esses aspectos, estou certa de que o livro atende a uma necessidade importante em nossa área, e que se tornará um oportuno ponto de partida para iniciantes e uma excelente ocasião para revisão e atualização para os iniciados em análise do comportamento. Deisy G. de Souza Universidade Federal de São Carlos xv SOBRE A CAPA A ciência e a arte são as mais belas criações do comportamento humano. Elas demonstram, cada uma à sua maneira, nossa fascinante capacidade de transformar o mundo e de nos transformarmos ao fazêlo. O gentil convite feito por Carlos, João e Paulo para que eu escolhesse a imagem da capa do livro que você agora lê me confrontou com um desafio singular: ilustrar, com o auxílio da arte, o conteúdo de um livro científico. Minha tarefa certamente foi facilitada pelo fato de que a arte não nos compromete com interpretações “certas”. A arte é o campo da sugestão, da metáfora, do símbolo. Assim, me lancei à tarefa sob um vago controle temático, mas também me deixando levar pela beleza e pelo poder evocativo das imagens. A Osteographia, publicada pelo anatomista inglês William Cheselden em 1733, é uma das obras mais importantes da história da ilustração anatômica. Ela impressiona não apenas pela precisão, mas pela elegância. As criaturas humanas e não-humanas que ali aparecem não são meros auxílios da ciência, passivamente à disposição dos estudiosos: em tudo o que importa, elas parecem vivas, ativas, interagindo com seu entorno. O fato de serem apenas esqueletos dá às imagens seu impacto. Seres vivos reduzidos à sua dura estrutura têm fascinado a humanidade ao longo dos séculos. Caveiras e esqueletos nos lembram de nosso destino comum. A representação da morte como um esqueleto vivo é comum a várias culturas. xvi O que nos mostra que estão mortos é o fato de serem apenas esqueletos. O que nos mostra que estão vivos é o fato de interagirem com o mundo. Os esqueletos que nos assombram e nos encantam na tradição são a encarnação desencarnada da contradição: são mortos que vivem. Se neles pouco resta do que esperaríamos encontrar em um corpo vivo, o comportamento é seu único sinal de vida - e, como lembrava Skinner, a história do comportamento e a história da vida começam juntas. O esqueleto que está na capa deste livro nos lembra ainda que a vida é evolução - e que nós, seres vivos, estamos todos ligados por laços de parentesco. Trata-se de uma figura simiesca, que não obstante adota uma postura aparentemente “intencional” e verbal, tipicamente humana. É como se interagisse com outros de sua espécie, cuja presença a imagem permite apenas subentender. Filogênese, ontogênese e cultura estão todas na imagem - desde que nossa história nos permita encontrá-las. Assim como a Osteographia de Cheselden, que utilizou magistralmente a arte para fazer ciência, espero que também este livro possa mostrar, da capa à última página, quão fascinante é a jornada de conhecimento e autoconhecimento proporcionada pela investigação científica. Alexandre Dittrich Universidade Federal do Paraná xvii APRESENTAÇÃO Este livro foi idealizado a partir de uma paixão comum dos três organizadores: a Análise Experimental do Comportamento. A ideia geral consiste em apresentar, a estudantes de graduação, diversos temas de pesquisa em Análise do Comportamento por meio de experimentos clássicos. A análise experimental geralmente é considerada um terreno árido, com descrições metodológicas difíceis e um certo “desprendimento” das questões do dia a dia. Estes fatores, em nossa opinião, dificultam o contato e até mesmo o interesse de estudantes iniciantes pelo laboratório e pela pesquisa experimental sobre o comportamento. Buscando inspiração em livros de divulgação científica, como “Forty studies that changed Psychology” de Roger Hock, formatamos a ideia inicial do livro. Estas ideias nos levaram a uma série de convites a pesquisadores e pesquisadoras de diversas instituições brasileiras e internacionais para contribuírem com a obra. Convites aceitos, o livro começou a ganhar forma. Mais ideias foram surgindo, e foram tantos os temas escolhidos que acabamos tendo que dividir a obra em dois volumes. Depois de incontáveis reuniões que aproximaram Londrina, São Carlos e Brasília, conseguimos concretizar nosso objetivo. Em cada capítulo, autores e autoras discutem temas relevantes na Análise do Comportamento a partir da descrição de um experimento “clássico”. Clássico, aqui, não significa necessariamente o estudo mais antigo, mas aquele que é reconhecidamente uma influência importante naquela área de pesquisa, ou seja, que tenha servido de contexto para a produção de mais conhecimento científico. Assim, em cada capítulo, o experimento clássico serve como um pano de fundo para a apresentação do tema, e os textos foram escritos com uma linguagem leve e acessível, buscando, sempre que possível, uma ponte entre os procedimentos metodológicos e o contexto aplicado. xviii Esperamos que esta obra inspire estudantes (e futuros pesquisadores e pesquisadoras!) a se enveredarem pelos caminhos fascinantes da pesquisa experimental sobre o comportamento dos organismos. E que essa jornada seja para estes estudantes um pouco do que foi (e continua sendo) para nós: um caminho de muito trabalho e de muitos erros e acertos, mas, acima de tudo, um caminho muito gratificante e enriquecedor. Esperamos, também, que este material sirva como um apoio aos professores e professoras das disciplinas de Análise Experimental do Comportamento, como contexto para discussões sobre os temas de pesquisa que compõe os currículos destas disciplinas. Boa leitura! Paulo Guerra Soares João Henrique de Almeida Carlos Renato Xavier Cançado xix SUMÁRIO Capítulo I.............................................................................................24 Somos todos produtos da nossa história comportamental Paulo Guerra Soares, Carlos Eduardo Costa Capítulo II...........................................................................................36 O cheque está no correio: investigando como o reforço atrasado afeta o desempenho Kennon A. Lattal Capítulo III.........................................................................................49 Quando o passado retorna: ressurgência comportamental Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira Capítulo IV..........................................................................................64 Clarice Lispector, tempo e consequências: considerações sobre contraste comportamental João Cláudio Todorov, Rafaela M. Fontes Azevedo Capítulo V...........................................................................................78 Da frequência absoluta à frequência relativa como unidade de análise do comportamento Cristiano Coelho Capítulo VI.........................................................................................95 Prestaram atenção em tudo? Elenice S. Hanna, Márcio Borges Moreira xx Capítulo VII.....................................................................................109 A resposta de observação: o papel das respostas sensoriais para o estabelecimento da discriminação Peter Endemann, Candido V. B. B. Pessôa Capítulo VIII.....................................................................................123 Controle dos processos atencionais Edson Massayuki Huziwara, Candido V. B. B. Pessôa Capítulo IX.......................................................................................139 O responder controlado temporalmente: desdobramentos da pesquisa com a tarefa de bissecção Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado Capítulo X.........................................................................................158 Como você se sente? Hiroto Okouchi Capítulo XI........................................................................................171 “Esse não é um pitilics, então só pode ser aquele”: o responder por exclusão e a aprendizagem de repertórios verbais Adreia Schimidt Capítulo XII......................................................................................186 Paus e pedras podem machucar, mas palavras... também! - Teoria das molduras relacionais João Henrique de Almeida e William Ferreira Perez xxi Capítulo XIII....................................................................................205 Quando o mundo interage com o que é dito sobre o mundo: o comportamento governado por regras Carlos Eduardo Costa, Carlos Renato Xavier Cançado Capítulo XIV.....................................................................................222 A função do mentir em crianças: o controle operante na correspondência verbal Carlos Augusto de Medeiros, Lucas Ferraz Córdova Capítulo XV......................................................................................239 Do indivíduo ao grupo: simulações experimentais de relações sociais com animais não-humanos Marcelo Borges Henriques Capítulo XVI..................................................................................254 Metacontingências: investigação experimental da seleção cultural Fábio Henrique Baia, Alina Barboza Cabral Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva Capítulo XVII..................................................................................272 “Para com isso menino!”: análise funcional em problemas de comportamento André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira Capítulo XVII..................................................................................284 Recombinação de repertórios: criatividade e a integração de aprendizagens isoladas Hernando Borges Neves Filho xxii Capítulo XIX....................................................................................297 Controlar para conhecer Cristiano Valério dos Santos Capítulo XX......................................................................................310 The check is in the mail: examining how delayed reinforcement affects performance Kennon A. Lattal Capítulo XXI....................................................................................322 How do you feel? Hiroto Okouchi xxiii Paulo Guerra Soares, Carlos Eduardo Costa Somos todos produtos da nossa história comportamental Paulo Guerra Soares Universidade Norte do Paraná; Núcleo Evoluir Carlos Eduardo Costa Universidade Estadual de Londrina Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7(5), 383-385. “O hoje é apenas um furo no futuro, por onde o passado começa a jorrar” Raul Seixas e Marcelo Nova 24 Capítulo I | História Comportamental INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Uma das principais afirmações da teoria da evolução por seleção natural é que as gerações atuais de indivíduos de uma determinada espécie são produto de um constante processo de variação e seleção. Assim, ao longo da história de evolução de uma espécie, indivíduos com características menos adaptativas morreram, enquanto aqueles mais bem adaptados sobreviveram, passando seus genes às próximas gerações. É importante lembrar que mais ou menos adaptativa significa que, sob certos aspectos do ambiente, certas características favorecem mais certos indivíduos de uma espécie do que outras. Não há características intrinsecamente melhores do que outras. Aquelas cuja consequência seja maior chance de sobrevivência e procriação irão aumentar de frequência na espécie. Portanto, para explicar por que os indivíduos de uma espécie exibem alguma forma de comportamento típico (como espirros, bocejos, náuseas ou salivação, no caso do ser humano), é imprescindível uma análise da história de seleção dessa espécie. Este modelo de variação e seleção dos aspectos biológicos, proposto por Charles Darwin no seu livro Origem das Espécies (1859), é reconhecidamente uma das inspirações de B. F. Skinner na formulação do Behaviorismo Radical (Baum, 2006; Laurenti, 2009; Skinner, 1974; 1981). Para Skin- ner, o Behaviorismo Radical enfatiza o estudo do comportamento de cada indivíduo (e não apenas os padrões típicos de cada espécie). Assim, fazendo jus à analogia com a teoria da evolução de Darwin, o comportamento atual dos indivíduos é produto de um conjunto de relações entre o comportamento do indivíduo (selecionado na história individual) e o ambiente atual. Nesse sentido, Skinner afirma que “Coube a Darwin descobrir a ação seletiva do ambiente, assim como cabe a nós [behavioristas] completar o desenvolvimento da ciência do comportamento com uma análise da ação seletiva do meio”. (Skinner, 1974, p.60-61). Como funciona essa relação entre a ação do indivíduo e as variáveis ambientais? Skinner propõe que em determinadas circunstâncias, nos comportamos no mundo de diversas maneiras (variação) e uma ou algumas dessas maneiras de nos comportar produzem alterações no ambiente. Estas alterações podem produzir mudanças na probabilidade futura do comportamento (seleção). Se as consequências do comportamento forem reforçadoras, produzirão um aumento na probabilidade desse comportamento ocorrer sob circunstâncias semelhantes no futuro. Se as consequências forem punidoras, produzirão uma diminuição na probabilidade da ocorrência do comportamento. Neste último caso, o indivíduo pode se comportar em função da situação que indica que uma consequência nociva é provável e, assim, aprende também a evitar estas situações. Assim, cada indivíduo, ao 25 Paulo Guerra Soares, Carlos Eduardo Costa entrar em contato com experiências únicas ao longo da vida, vai aprendendo determinadas maneiras de agir a partir das consequências que esse comportamento produz. A noção de seleção do comportamento por consequências sugere que, para que possamos explicar os comportamentos dos indivíduos, é imprescindível uma análise da história comportamental de cada um (Aló, 2005; Chiesa, 1994; Costa, Cirino, Cançado & Soares, 2009; Freeman & Lattal, 1992; Skinner, 1974; Soares, Costa, Cançado & Cirino, 2013). Skinner já apontava que “uma análise do comportamento é (...) necessariamente ‘histórica’” (1974, p. 236), pois os comportamentos atuais são produto de uma história de seleção que ocorre ao longo da vida de cada indivíduo. Neste sentido, é relativamente seguro afirmar que pessoas que passaram por experiências diferentes ao longo da vida, quando expostas a situações parecidas no presente, se comportam de maneiras distintas. Contudo, o que se observa é que a grande maioria das explicações do senso comum negligencia a história comportamental na determinação do comportamento atual (Aló, 2005; Chiesa, 1994). Valendo-se de uma terminologia dualista/ mentalista, o senso comum explica o comportamento dos indivíduos recorrendo a conceitos como “personalidade” ou “caráter”. A pesquisa de Simonassi, Pires, Bergholz e Santos (1984), por exemplo, identificou que observadores que desconheciam 26 a história comportamental de crianças tendiam a explicar seu comportamento atual a partir de um viés mentalista. Por outro lado, quando os observadores conheciam a história comportamental das crianças, tenderam a leva-la em consideração na explicação do comportamento atual em detrimento das causas mentais. Assim, Skinner (1953/2003) afirmou que o “hábito de buscar dentro do organismo uma explicação do comportamento tende a obscurecer as variáveis que estão ao alcance de uma análise científica. Estas variáveis estão fora do organismo, em seu ambiente imediato e em sua história ambiental” (p. 33). A afirmação de Skinner (1953/2003) levanta a seguinte questão: Como podemos analisar cientificamente os efeitos da história ambiental sobre o comportamento atual? Sidman (1960) afirmou que, em um contexto experimental, a “melhor maneira de um experimentador especificar a história comportamental de um organismo, na medida em que é importante para um determinado problema, é construir deliberadamente essa história no organismo” (p. 290, itálico adicionado). Ou seja, o experimentador interessado no estudo da história comportamental deveria ser capaz de construir diferentes histórias para seus participantes no laboratório (Wanchisen, 1990). Porém, até meados da década de 1960 não havia, na literatura analítico-comportamental, um conjunto de dados sistemáticos que permitisse a análise do efeito Capítulo I | História Comportamental de diferentes contingências passadas sobre o comportamento atual. Nesse contexto, mais precisamente em 1964, foi publicado um dos primeiros estudos cujo objetivo era a análise do efeito de diferentes histórias comportamentais (construídas no laboratório, como sugerido por Sidman, 1960) sobre o comportamento atual. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método A pesquisa de Weiner (1964) era simples, porém engenhosa. O objetivo do estudo foi avaliar o efeito da exposição a diferentes contingências históricas sobre o comportamento atual. Como estratégia metodológica, foram arranjados esquemas de reforço, programações de contingência muito utilizadas em pesquisas experimentais em Análise do Comportamento, que permitem a seleção de padrões estáveis de comportamento (Ferster & Skinner, 1957; Lattal, 1991; Souza Júnior & Cirino, 2004). Os participantes da pesquisa foram seis enfermeiros de um hospital psiquiátrico. Eles se sentavam em frente a um monitor e a tarefa experimental consistia em pressionar um botão. As consequências para esse comportamento eram pontos que apareciam em um contador de pontos no monitor. Em cada sessão, os participantes também recebiam uma quantia fixa de dinheiro, que não era contingente ao seu desempenho. Os participantes foram distribuídos em dois grupos: durante a primeira fase da pesquisa (cons- trução da história), os participantes do Grupo 1 (n=3) foram expostos a um esquema de razão fixa (FR) 40 e os do Grupo 2 (n=3) a um esquema de reforçamento diferencial de baixas taxas (DRL) 20 segundos, por 10 sessões de 60 min. Para os participantes expostos ao FR, 100 pontos eram creditados no contador a cada 40 pressões ao botão. Para os participantes expostos ao DRL, cada resposta emitida após a passagem de 20 segundos da última resposta produzia 100 pontos no contador. Respostas emitidas antes do fim do intervalo reiniciavam o intervalo do DRL. Esquemas de FR, em geral, selecionam altas taxas de respostas, pois há uma relação direta entre taxa de respostas e taxa de reforços sob esse esquema. Por outro lado, o esquema DRL geralmente seleciona baixas taxas de respostas, pois respostas emitidas antes de terminado o intervalo programado produzem o reinício do intervalo. E este era exatamente o objetivo de Weiner nesta primeira fase do experimento: estabelecer duas linhas de base - ou duas histórias comportamentais diferentes - nas quais padrões de comportamento distintos (altas e baixas taxas de respostas) fossem selecionados. Após construir histórias comportamentais diferentes para cada grupo, era hora de testar o efeito da exposição a estas diferentes contingências sobre o comportamento atual, quando as contingências mudassem. Na segunda fase do experimento 27 Paulo Guerra Soares, Carlos Eduardo Costa (teste), os participantes de ambos os grupos foram expostos à um mesmo esquema de reforçamento de intervalo fixo (FI) 10 segundos por 10 sessões de 60 min e, depois, 10 sessões de 30 min. Sob o esquema de FI 10 s, a primeira resposta que ocorresse após o intervalo de 10 segundos produzia 100 pontos no contador. Respostas que ocorressem ao longo desse intervalo não tinham consequências programadas (diferente do que ocorria na fase anterior sob o esquema de DRL). Assim, no esquema de FI, não importa se o indivíduo responde em altas ou baixas taxas, pois ambos os padrões continuam a produzir pontos, desde que uma resposta ocorra após transcorrido o inter- valo do FI. Portanto, expor os participantes a este esquema de reforço na fase de teste permitiu observar se a exposição prévia ao FR ou ao DRL teria alguma influência no modo como eles se comportariam quando as contingências mudassem (ou seja, quando o FI estivesse em vigor). Resultados e discussão E foi exatamente o que aconteceu! A Figura 1 exibe os registros cumulativos dos participantes do Grupo 1 (S1, S2 e S3) e do Grupo 2 (S4, S5 e S6), durante os 15 últimos minutos da fase de teste (FI). A análise da Figura 1 permite constatar que, mesmo após Figura 1. Registros cumulativos dos 15 últimos minutos da fase de teste (após 15 horas de exposição ao FI) dos participantes da pesquisa de Weiner (1964). O painel superior exibe os registros dos participantes do Grupo 1 (história de FR) e o painel inferior exibe os registros dos participantes do Grupo 2 (história de DRL) (reproduzido com a permissão de John Wiley and Sons). 28 Capítulo I | História Comportamental 15 horas de exposição ao FI, os participantes que tinham sido expostos ao FR emitiam taxas de respostas mais altas quando comparadas às taxas de respostas dos participantes que tinham sido expostos ao DRL. A pesquisa de Weiner (1964) é interessante por demonstrar que, mesmo em um delineamento simples, no qual a resposta selecionada era pressionar um botão, o comportamento dos participantes no esquema de FI sofreu influências da história comportamental que foi construída no laboratório. Sobre estes resultados, Weiner afirmou que o “ponto importante é que a história de condicionamento deve ser considerada como um possível determinante do responder de humanos em FI” (p. 385). Mas é possível ir mais além, e supor que a história comportamental não seja apenas determinante do responder em FI, mas de qualquer comportamento, dentro e fora do laboratório. Se este for o caso, os resultados da pesquisa de Weiner (1964) permitem inferir (baseado em dados empíricos) que as experiências vivenciadas pelas pessoas ao longo de sua vida podem, sim, influenciar o comportamento presente. Os resultados apresentados por Weiner (1964) nos permitem ainda outras considerações. A Figura 2 abaixo foi construída a partir da Tabela 1 do artigo. O eixo y apresenta a taxa de respostas (R/min) em escala logarítmica e o eixo x exibe a média da taxa de respostas das três últimas sessões de his- tória (FR para S1, S2 e S3; DRL para S4, S5 e S6) e a taxa de respostas nas cinco últimas sessões do experimento. Observa-se na Figura 2 que a taxa de respostas nas cinco últimas sessões de FI dos participantes com história de FR foram sempre superiores às taxas de respostas dos participantes com história de DRL. Todavia, há que se considerar que houve diminuição na taxa de respostas dos participantes expostos a história de FR e aumento na taxa de respostas dos participantes com história de DRL, quando expostos ao FI. Durante as três últimas sessões de Figura 2. Taxa de respostas (R/min) em escala logarítmica na fase de construção da história experimental (Hist - FR para S1, S2 e S3; DRL para S4, S5 e S6) e nas cinco últimas sessões do experimento. Ver mais detalhes no texto. (Figura construída especialmente para este capítulo com dados apresentados em Weiner, 1964, p. 384, Tabela 1). exposição ao FR, os participantes S1 e S3 emitiram, em média, 412 e 240 respostas por minuto. Na última sessão de FI, eles emitiam 64 e 55 respostas por minuto, respectivamente. Ou seja, depois de 15 horas de exposição ao FI, houve uma redução na taxa de respostas de aproximadamente 85% para S1 e de 77% para S2, em relação à li29 Paulo Guerra Soares, Carlos Eduardo Costa nha de base. Uma análise parecida também pode ser realizada para os participantes S5 e S6, que foram expostos à história de DRL. Durante as três últimas sessões do DRL, S5 e S6 emitiam, em média, três respostas por minuto. A taxa de respostas na última sessão do FI foi de seis e nove respostas por minuto, respectivamente. Pode parecer pouca coisa, mas trata-se de um aumento na taxa de respostas de 100% para S5 e 200% para S6! DESDOBRAMENTOS Os resultados da pesquisa de Weiner (1964) sugerem evidências de que: (a) é essencial a análise da história de exposição a contingências passadas para a compreensão do comportamento atual, assim como proposto por Skinner (1981), em analogia à seleção natural; (b) que os efeitos da história comportamental podem ser estudados em laboratório, desde que haja controle sobre a construção da história comportamental dos indivíduos (Sidman, 1960; Wanchisen, 1990). Especular sobre as influências da história de vida sobre o comportamento presente pode parecer óbvio. Todavia, como apontado anteriormente, o senso comum frequentemente negligencia a história comportamental quando se propõe a explicar o porquê as pessoas se comportam da maneira como o fazem. Por exemplo, como um leigo, que não conhece a história compor30 tamental dos indivíduos, explicaria o desempenho dos participantes da pesquisa de Weiner (1964) durante a fase de teste? Assim como no estudo de Simonassi et al. (1984), provavelmente o leigo utilizaria conceitos mentalistas, como “ansiosas”, “hiperativas” (para os participantes com história de exposição ao FR) ou “preguiçosas”, “depressivas” (para aqueles com história de exposição ao DRL), ignorando completamente a história comportamental dos participantes! A partir da pesquisa de Weiner (1964), diversos estudos foram conduzidos para analisar os efeitos da história de exposição a diferentes contingências históricas sobre o comportamento atual, manipulando variáveis como controle de estímulos, reforçador empregado e custo da resposta, utilizando não-humanos (e.g. Cole, 2001; Doughty, Cirino, Mayfield, da Silva, Okouchi, & Lattal, 2005; Freeman & Lattal, 1992; LeFrancois & Metzger, 1993) e humanos (e.g. Costa, Banaco, Longarezi, Martins, Maciel, & Sudo, 2008; Costa, Soares & Ramos, 2012; Okouchi, 2003a; 2003b; Soares, Costa, Cançado & Cirino, 2013). As pesquisas em laboratório sobre história comportamental tiveram desdobramentos interessantes, também, para a aplicação da Análise do Comportamento (como na clínica comportamental). Neste contexto, Marçal (2013) ressalta que Capítulo I | História Comportamental “Por mais que um padrão comportamental esteja trazendo problemas a alguém, por mais que este alguém ses e especular com base em dados empíricos é mais do que muitas abordagens em Psicologia têm oferecido. esteja insatisfeito com sua forma de agir, tal comportamento foi reforçado no passado em um ou mais contextos” CONSIDERAÇÕES FINAIS (p. 41). Conhecer a história é conhecer o comportamento. Para que se possa compreender o comportamento atual do paciente, é imprescindível que se conheçam elementos de sua história de vida, e que estes elementos possam ser relacionados às contingências atuais. Portanto, para a condução de uma análise funcional do comportamento adequada, é necessária a análise sistemática da história do paciente. Todavia, é importante esclarecer alguns pontos. Em primeiro lugar, quando conversamos com um cliente não temos acesso a sua história. Temos acesso ao comportamento verbal que pode estar sob o controle da história, pode estar sob o controle da audiência (o terapeuta) ou ambos. Os estudos sobre história comportamental não nos dão uma ferramenta para a atuação aplicada da Análise do Comportamento. As pesquisas empíricas sobre história comportamental nos permitem fazer especulações mais bem fundamentadas (i.e., baseadas em dados empíricos), mas que não passam de especulações, até que a intervenção seja feita e, eventualmente, o comportamento mude na direção “esperada” (pelas especulações). Isso não é pouco! Levantar hipóte- A pesquisa de Weiner (1964) foi uma das primeiras tentativas de análise sistemática do efeito de histórias comportamentais no laboratório. Seus resultados ressaltam a importância do papel da história comportamental na determinação do comportamento atual. Ao constatar este fato, o analista do comportamento deve tomar cuidado com dois pontos. Primeiramente, a história comportamental – especialmente quando ela não é conhecida – não deve ser transformada em uma explicação genérica do comportamento ou, como ressalta Cirino (2001), em uma “lata de lixo” da Análise do Comportamento. Todo comportamento é explicado a partir das contingências às quais o indivíduo foi exposto, mas para lançar mão desta explicação histórica o analista do comportamento deve conhecer a história e quais elementos desta história possuem relação com seu comportamento atual. Em segundo lugar, é importante não atribuir à história comportamental um efeito definitivo e imutável sobre o comportamento atual (cf. Costa, Cirino, Cançado & Soares, 2009). Ainda que a explicação Behaviorista Radical seja essencialmente histórica, não podemos negligenciar o papel das contingências presentes. Uma análise 31 Paulo Guerra Soares, Carlos Eduardo Costa cautelosa dos resultados de Weiner (1964) ajuda a sustentar esta conclusão. Dois dos três participantes expostos à história de FR emitiram, na última sessão de FI, uma taxa de respostas mais baixa em relação à linha de base (Ver Figura 2, neste capítulo). Por isso, procuramos sempre lembrar: somos produtos da nossa história, mas não escravos dela! Essas análises demonstram que, definitivamente, não se pode negligenciar a contingência presente. A contingência de FI 10 s, programada por Weiner (1964) durante a fase teste, estabelece um desempenho “ideal” de seis respostas por minuto (pois uma resposta a cada 10 segundos produz reforço). Uma taxa média de respostas como as de S1 e S2 garantiam que muitos pontos fossem produzidos durante o FR, mas a grande maioria dessas respostas não produzia consequências programadas durante o FI, o que estabelece uma diminuição na taxa de respostas como algo desejável. Durante o DRL, uma taxa média de três respostas por minuto (S4 e S5) garantia que os reforços continuassem a ser produzidos e que poucas perdas ocorressem. Contudo, respostas emitidas durante o intervalo do FI não reiniciavam o intervalo como no DRL, o que estabelece um aumento na taxa de respostas como algo desejável. Os resultados de pesquisas posteriores sobre história comportamental (e.g., Freeman & Lattal, 1992; Soares et al., 2013) indicaram que o comportamento é produto da história, mas, gradualmente, fica sob controle das contin32 gências presentes. Espera-se que o leitor possa ter compreendido a importância da consideração dos eventos históricos sobre o comportamento atual e como o fenômeno pode ser estudado em laboratório. Dessa forma, destaca-se um modelo causal (Skinner, 1981) que é uma alternativa a qualquer tipo de explicação mentalista/dualista. Quando queremos entender – e modificar – o comportamento de um indivíduo, o primeiro passo, sem dúvida, é conhecer a sua história comportamental! PARA SABER MAIS Weiner (1969). Conjunto de cinco experimentos com humanos nos quais Weiner explora diferentes estratégias na construção da história comportamental. Os delineamentos apresentados são em grupos ou com a exposição do mesmo participante a diferentes esquemas de reforço em fases sucessivas. Em linhas gerais, o artigo investiga os determinantes do comportamento humano em um esquema de FI. O desempenho de humanos neste esquema de reforço foi a base de muita controvérsia sobre a diferença de humanos e não humanos se comportamento em esquemas de reforço. A ênfase de Weiner, é claro, é na importância da história comportamental. Freeman & Lattal (1992). Avaliação dos efeitos da história sobre o comportamento Capítulo I | História Comportamental atual de pombos usando um delineamento no qual o sujeito é seu próprio controle (conhecido como Delineamento Experimental de Caso Único ou delineamento intrasujeito). Nessa pesquisa, o mesmo organismo foi exposto a duas histórias comportamentais de maneira relativamente simultânea, sob diferentes controles de estímulo. O resultado geral, apontou que a história exerce efeito sobre o comportamento atual, mas que esse efeito é transitório. REFERÊNCIAS Okouchi (2003b). Também utilizando um delineamento intrassujeito (esquemas de reforçamento múltiplo), com humanos, a pesquisa de Okouchi apontou que os efeitos da história ficam sob o controle de estímulos e que esses efeitos podem se generalizar para outras situações semelhantes no presente. Chiesa, M. (1994). Radical behaviorism: The philosophy and the Science. Boston: Autors Cooperative. Soares, Costa, Cançado, & Cirino (2013). Replicação sistemática da pesquisa de Freeman e Lattal (1992) com humanos. Os resultados corroboram o de outras pesquisas sugerindo que os efeitos da história ficam sob o controle de estímulos; são transitórios (embora possam ser de longa duração) e que a regularidade nos resultados de pesquisas com humanos em esquemas de reforçamento depende do controle experimental, não requerendo, portanto, mudanças no modelo de causalidade quando falamos do comportamento humano e não humano. Aló, R. M. (2005). História de reforçamento. In J. Abreu-Rodrigues & M. R. Ribeiro (Eds.). Análise do comportamento: Pesquisa, teoria e aplicação (pp. 45-62). Porto Alegre: Artmed. Baum, W. M. (2006). Compreender o Behaviorismo: comportamento, cultura e evolução. Porto Alegre: ArtMed. Cirino, S. D. (2001). Detecção da história de reforçamento: Problemas metodológicos para lidar com a história passada. In H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz & M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol 8. Expondo a variabilidade (pp. 137-147). Santo André: ESETec. Cole, M. R. (2001). The long term effect of high and low rate responding histories on fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 75, 43-54. Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo, C. H. (2008). Tipo de reforçador como uma variável moduladora dos efeitos de história em humanos. Psicologia: Teoria e Pesquisa, 24, 251-262. 33 Paulo Guerra Soares, Carlos Eduardo Costa Costa, C. E., Cirino, S. D., Cançado, C. R. X., & Soares, P. G. (2009). Polêmicas sobre história comportamental: identificação de seus efeitos e sua duração. Psicologia: Reflexão e Crítica, 22, 317-326. LeFrancois J. R, & Metzger B. (1993). Low-response-rate conditioning history and fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 59, 543– 549. Costa, C. E., Soares, P. G., & Ramos, M. N. (2012). Controle de estímulos e história comportamental: uma replicação de Freeman e Lattal (1992). Temas em Psicologia, 20, 273-288. Marçal, J. V. S. (2013). Behaviorismo radical e prática clínica. In A. K. C. R. de-Farias (Org.), Análise Comportamental Clínica (pp. 30-48). Porto Alegre: Artmed. Doughty, A. H., Cirino, S. D., Mayfield, K. H., Da Silva, S. P., Okouchi, H., & Lattal, K. A. (2005). Effects of behavioral history on resistance to change. The Psychological Record, 55, 315-330. Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79, 49-64. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton. Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the Experimental Analysis of Behavior, 80, 173186. Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57, 5-15. Sidman, M. (1960). Tactics of scientific research. New York: Basic Books. Lattal, K. A. (1991). Scheduling positive reinforcers. In I. H. Iversen & K. A. Lattal (Eds.), Experimental Analysis of Behavior, Part 1 (pp. 87-134). New York, NY: Elsevier Science. Laurenti, C. (2009). Criatividade, liberdade e dignidade: impactos do darwinismo no behaviorismo radical. Scientiae Studia, 7, 251-269. 34 Simonassi, L. E., Pires, M. C. T., Bergholz, M. B., & Santos, A. C. G. (1984). Causação no comportamento humano: acesso à história passada como determinantes na explicação do comportamento humano. Psicologia: Ciência e Profissão, 4, 16-23. Skinner, B. F. (1974). About behaviorism. New York: Vintage Books. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. Capítulo I | História Comportamental Skinner, B. F. (2003). Ciência e Comportamento Humano. São Paulo: Martins Fontes (Originalmente publicado em 1953). Soares, P. G., Costa, C. E., Cançado, C. R. X., & Cirino, S. D. (2013). Controle de estímulos e história comportamental em humanos. Psicologia: Reflexão e Crítica, 26, p. 357-366. Souza Júnior, E. J., & Cirino, S. D. (2004) Esquemas de reforçamento. In C. E. Costa, J. C. Luzia, & H. H. N. Sant’Anna (Orgs.), Primeiros Passos em análise do comportamento e cognição. Vol. 2 (pp. 31-42). Santo André: ESETec. Wanchisen, B. A. (1990). Forgetting the lessons of history. The Behavior Analyst, 13, 31-37. Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7, 383-385. Weiner, H. (1969). Controling human fixedinterval performance. Journal of the Experimental Analysis of Behavior, 12, 349-373. 35 Kennon A. Lattal O cheque está no correio1, 2: investigando como o reforço atrasado afeta o desempenho Kennon A. Lattal West Virginia University Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. “… um atraso do reforço não é um parâmetro estático no efeito de um reforço sobre o comportamento” (C. B. Ferster, 1953) 36 Capítulo II | Atraso do Reforço INTRODUÇÃO A ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Atraso do reforço, mesmo em 1964, era uma questão de interesse de longa data na Psicologia da Aprendizagem (e.g., Kimble, 1961; Renner, 1964). Thorndike (1911) preparou o palco para investigações futuras, quando afirmou que “as respostas que eram acompanhadas ou seguidas de perto pela satisfação do animal” (p. 244) seriam fortalecidas. Foi deixado para outros explorarem os limites e as implicações da “proximidade” temporal para a relação resposta-reforço. O tema geral foi explorado por todos os principais teóricos da aprendizagem que sucederam Thorndike. Guthrie (1935) enfatizou a importância fundamental da contiguidade temporal entre eventos para a aprendizagem, mas ele nem era um teórico do reforçamento! Hull (1943) discutiu extensamente o problema do atraso do reforço em seu livro Princípios do Comportamento (Principles of Behavior), com ênfase especial nos mecanismos responsáveis pela manutenção do comportamento sob condições de atraso do reforço (ver também Spence, 1947). O atraso do reforço também aparece como um problema de pesquisa no Tradução realizada por João Henrique de Almeida, Paulo Guerra Soares e Carlos Renato Xavier Cançado. O primeiro tradutor é bolsista de pós-doutorado FAPESP processo número 2014/01874-7. 1 Nota de tradução: “The check is in the mail” é uma expressão utilizada para indicar a um credor que um pagamento (ainda não realizado) será feito em breve. É uma situação em que o atraso de um reforço é, necessariamente, sinalizado (i.e., o pagamento ainda não foi recebido e seu recebimento é sinalizado pela expressão “o cheque está no correio”). livro de Skinner (1938) O Comportamento dos Organismos. Diferentemente da tentativa de Hull de inferir mecanismos teóricos subjacentes ao gradiente de atrasos do reforço, a análise de Skinner foi, previsivelmente, mais empírica. Os experimentos em que foram impostos um atraso temporal entre a resposta que produz o reforço e a entrega desse reforço são descritos em dois momentos em O Coportamento dos Organismos. Os atrasos investigados por Skinner (1938) foram não-sinalizados, isto é, não houve mudança de estímulo que acompanhasse o intervalo do atraso. No primeiro experimento (descrito nas pp. 73-74), uma resposta liberava “um pêndulo que acionava o comedouro no final do intervalo desejado”. Skinner (Figura 6, p. 73) mostrou os dados de aquisição de oito ratos usando atrasos de 1-4 s com diferentes pares de ratos, e, com uma exceção, notou que foram comparáveis aos de aquisição com reforço imediato. Não está claro se estes atrasos eram reiniciados se as respostas subsequentes ocorressem durante o intervalo do atraso, mas parece que eles não foram, isto é, os atrasos foram não resetáveis3 (cf. Lattal & Gleeson, 1990). Ele afirmou que “[um] novo intervalo deve ser iniciado [quando ocorre uma segunda resposta] ou a segunda resposta será reforçada rápido demais, mas isto significa que a pri- 2 Nota de tradução: os termos “signaled”, “unsignaled”, “resetting” e “nonresetting” que qualificam atrasos do reforço foram traduzidos, respectivamente, como “sinalizados”, “não sinalizados”, “resetáveis” e “não resetáveis”. 3 37 Kennon A. Lattal meira resposta não seria reforçada” (p. 73). Seus comentários subsequentes sugeriram que ele não resolveu este problema neste primeiro experimento. Um pouco mais tarde no livro ele descreveu outros dois experimentos envolvendo atraso do reforço. Ele começou repetindo o problema do procedimento já mencionado anteriormente: “Nenhum planejamento foi feito para evitar a possivel coincidência de uma segunda resposta com um reforço atrasado” (Skinner, 1938, p. 138), tornando assim mais provável que o atraso obtido seria menor do que o atraso programado. Ele também observou uma segunda dificuldade, relacionada com os ratos que mantinham a barra pressionada. O atraso começou com uma pressão a barra, mas às vezes a barra continuava a ser pressionada durante o atraso e era liberada no final do intervalo, levando Skinner a questionar se isso resultaria em reforço imediato ou atrasado. O equipamento utilizado neste experimento foi o mesmo utilizado no experimento descrito acima mas, no entanto, ele apontou uma mudança: “o equipamento tem esta propriedade importante: se uma segunda resposta é feita durante o intervalo do atraso, a contagem do tempo recomeça, de modo que um intervalo completo deve decorrer novamente antes que o reforço ocorra” (p 139. ). Assim, em vez de um atraso não resetável, neste experimento os atrasos eram resetáveis, isto é , o intervalo do atraso era reiniciado para cada resposta após aquela que iniciou o atraso. Utilizando este 38 procedimento, os ratos foram condicionados “da maneira usual” (p 140; presumivelmente Skinner queria dizer com reforço imediato) para responder, por fim, em um esquema intervalo fixo (FI) 5 min. Após este treino, atrasos de 2, 4, 6 ou 8 s estavam em vigor com diferentes ratos por três sessões. As taxas de resposta foram reduzidas quando os atrasos estavam em vigor, sendo que com os dois atrasos mais curtos o responder foi menos reduzido em comparação aos dois mais longos. Em um experimento final sobre atraso do reforço, Skinner analisou os efeitos de várias mudanças no treino e na implementação dos atrasos. O principal desenvolvimento susequente na análise experimental do atraso do reforço foi a pesquisa de Ferster (1953). A maioria dos teóricos de aprendizagem, incluindo Skinner, focaram os efeitos prejudiciais do atraso do reforço sobre a aprendizagem e o desempenho. Ferster inverteu a questão e perguntou se seria possível manter o comportamento apesar da presença de um atraso entre o reforço e a resposta que o produziu. Ele conduziu uma série de experimentos com pombos em que ele primeiro mantinha a resposta de bicar (bicar um pequeno disco de plástico) com esquemas de reforço intervalo variável (VI). Com essa linha de base, em seu primeiro e segundo experimentos, atrasos sinalizados por blackouts4 da câmara experimental ocorreram Nota de tradução: Termo mantido como no original. O termo é utilizado para descrever situações em que as luzes da câmara experimental, e até mesmo aquelas que iluminam os discos de resposta, são apagadas. 4 Capítulo II | Atraso do Reforço entre o reforço e a resposta que o produziu. Os blackouts foram utilizados “para evitar S de respondesse” (p. 219), aproveitando-se do fato de que pombos normalmente não bicam os discos de resposta quando a caixa e o disco estão apagados. Claro, apagar as luzes da caixa era uma consequência imediata da resposta, fazendo com que o blackout funcionasse como um estímulo, em última análise correlacionado com a liberação do reforço. Como resultado, o atraso do reforço covariou com a potencial função reforçadora condicionada do blackout. Esta covariação permite questionar esse experimento, e todos os experimentos envolvendo atrasos sinalizados do reforço, como um teste dos efeitos de um atraso do reforço”puro” sobre o responder. Em seu primeiro experimento, Ferster observou que atrasos de 60 s causaram uma “pequena queda” na taxas de respostas, mas sob atrasos de 120 s, a taxa de respostas caiu para cerca da metade de seu valor quando o reforços imediatos eram utilizados. Em seu segundo experimento, Ferster tentou manter altas taxas de resposta introduzindo os atrasos gradualmente, aumentando a sua duração de 1 a 60 s ao longo de um período de treino de 90 hr. Ele relatou que “os três Ss que mantiveram as taxas normais de resposta sob 60 s de atraso foram mantidos no mesmo procedimento por várias centenas de horas cada. Eles não exibiram nenhuma tendência de desaceleração” (p. 222). O responder do quarto pombo não foi mantido, de acordo com Ferster, porque os atrasos “foram aumentados muito rapidamente.” (p. 222). Ele não apresentou dados quantitativos na descrição de seus experimentos, baseando-se, ao invés disso, em descrições verbais do que aconteceu, apoiadas apenas por alguns registros cumulativos dos desempenhos dos pombos. Estas duas linhas de pesquisa (Skinner, 1938; e Ferster, 1953) fornecem o contexto para o tema deste capítulo: o experimento de Azzi, Fix, Rocha e Silva e Keller (1964). Uma parte importante da história por trás do experimento de Azzi et al. é caso de amor de Fred Keller com o Brasil, que começou com a sua chegada como Fulbright Teaching Fellow na Universidade de São Paulo no início de 1961. Foi nomeado como seu assistente de pesquisa Rodolpho Azzi, que aparece com Keller e outros pesquisadores e pesquisadoras do Brasil na Figura 1. Sobre Azzi, Keller (2008) afirmou: “Ele rapidamente se tornou meu conselheiro e guia, ele meatualizava com tudo o que eu deveria saber sobre os meus alunos, membros do corpo docente e funcionários da administração. Ele me ajudou a responder a perguntas, escrever relatórios, e avaliar o progresso dos meus alunos. Ele me preparou para reuniões importantes, me informava sobre novos desenvolvimentos, e me protegeu de incômodos de qualquer tipo.” (p. 248) 39 Kennon A. Lattal Experimental Analysis of Behavior” (Keller, 2008, p. 250). Figura 1. Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina Martuscelli Bori, e Andrés Aguirre (da esquerda para a direita) com equipamentos, Dezembro de 1961. Logo depois que Keller começou a lecionar, ele recebeu uma entrega de equipamento de pesquisa que ele havia adquirido da compania Grason-Stadler em Waltham, Massachussetts. Ele se lembrou de que o equipamento “... não veio com as instruções, por isso tivemos de determinar como funcionava por tentativa e erro. Rodolfo [sic] [Azzi] e eu, juntamente com Mario Guidi, um estudante em nosso curso, trabalhamos durante dias antes de finalmente descobrirmos como automatizar um estudo longo sobre os efeitos de diferentes atrasos do reforço sobre a resposta de pressionar a barra de três ratos brancos (nomeados de Alpha, Beta e Gamma por Rodolfo [sic]). Os resultados foram publicados mais tarde no Journal of the 40 Podemos apenas especular sobre o porquê atraso do reforço foi o tema da primeira pesquisa publicada no Journal of the Experimental Analysis of Behavior com um primeiro autor brasileiro (Azzi). Vamos voltar para o segundo experimento relatado por Skinner com atraso de reforço em O Comportamento dos Organismos. Lembre-se que ele usou um procedimento de atraso resetável, em que cada resposta que ocorresse após aquela que deu início ao atraso reiniciava o intervalo do atraso. Ele usou um procedimento semelhante para reduzir o responder em altas taxas [“nenhuma resposta foi reforçada se fosse precedida, no prazo de quinze segundos, por outra resposta” (p. 306)], dando assim origem ao esquema de reforçamento diferencial de taxas baixas (DRL). Wilson e Keller (1953), posteriormente, estudaram os efeitos de esquemas DRL sobre a pressão à barra de ratos sob uma série de valores do “atraso” (i.e., os valores do DRL). O experimento Wilson e Keller nasceu de uma demonstração inicial do que era basicamente um esquema de reforçamento diferencial de outros comportamentos (DRO), em que o início de um período de SD ocorreu somente se não houvesse resposta no período S-delta imediatamente anterior por um período de tempo especificado (cf. Skinner, 1938, p. 161). Uma contingência de atraso de reforço resetável é essencialmente um esquema DRL sem a resposta requerida no fim do intervalo, Capítulo II | Atraso do Reforço e um esquema DRO é essencialmente um procedimento de atraso resetável, mas sem a exigência de uma resposta para iniciar cada intervalo do DRO (os reforços ocorrem desde que a resposta alvo não ocorra; se uma resposta alvo ocorrer, ela reinicia o intervalo do DRO). Combine todas essas ideias, adicione o fato de que Ferster (um dos alunos de doutorado de Keller em Columbia) tinha estudado previamente os efeitos de atrasos sinalizados do reforço e, voilà, os procedimentos utilizados por Azzi et al. (1964) emergem. Não podemos saber com precisão como a ideia para o experimento foi desenvolvida mas, certamente, e sem surpresa, pode ser intimamente ligada a alguns dos trabalhos anteriores de Keller e seus alunos na Universidade de Columbia. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Azzi et al. (1964) buscaram fazer duas coisas: (a) investigar o responder operante sob condições em que o intervalo entre o reforçador e a resposta que o produzia era variado e (b) comparar condições em que o atraso fosse acompanhado por uma mudança nos estímulos (um estímulo que o sinalizasse) ou ocorresse sem qualquer mudança durante o intervalo do atraso (não sinalizado). Assim, o experimento era basicamente uma comparação de duas condições diferentes – atrasos do reforço não sinalizados e sinalizados – que tinham sido observados em experimentos diferentes conduzidos, respectivamente, por Skinner (1938) e Ferster (1953). Para isso, três ratos foram incialmente treinados a pressionar uma barra em um esquema de razão fixa (FR) 1, em que o reforçado era acesso à água. Parece razoável assumir que neste tempo nem pelotas de comida usadas com os ratos em muitos dos experimentos de Skinner e outros, nem tão pouco os meios para liberar essas pelotas – i.e., um comedouro – estavam disponíveis no Brasil. Água era fácil de obter e Keller tinha trazido consigo o que ele chamou de um “Brenner dipper”5 para liberação de água como reforços. Após o treino inicial, “dentro de uma câmara com a iluminação reduzida, cada [rato] foi exposto sucessivamente a atrasos do reforço de 1; 3; 5; 7,5; 10; 15; e 20 s[egundos], nesta ordem, com um total de 150 reforços em cada atraso” (Azzi et al., 1964, p. 159). O esquema de reforço então era, tecnicamente falando, um tandem FR 1 DRO t-s, em que t correspondia a um dos valores de atraso apresentados acima. Um esquema tandem (a palavra latina para “um logo após o outro”) é idêntico a um esquema de reforço encadeado em que dois ou mais componentes do esquema precisam ser finalizados em uma sequência fixa para que o reforço ocorra; no entanto, em um esquema encadeado cada componente é associado com um estímulo diferente, Nota de tradução: Um dipper é uma espécie de bebedouro; o equipamento geralmente consiste em uma haste com um recipiente côncavo na ponta que, quando mergulhado em um líquido, retém parte do mesmo. O líquido então pode ser apresentado ao animal movimentando-se a haste até alguma parte da câmara experimental. 5 41 Kennon A. Lattal mas no esquema tandem o estímulo associado com cada componente é idêntico. No procedimento de Azzi et al. (1964), cada atraso reiniciava se uma resposta ocorresse durante o intervalo do atraso (um atraso resetável), e não havia nenhuma mudança no estímulo durante o período de atraso. Em seguida, foram realizadas várias manipulações das durações do atraso para dos dois dos ratos. O terceiro rato aparentemente foi exposto somente a um esquema DRL 20 s com reforços imediatos. Assim como na primeira, na segunda parte do experimento o esquema de reforço em vigor tecnicamente era um tandem FR1 DRO ts, em que t era 20 por dez dias, seguido por seis dias com t=30s. Durante a metade de cada sessão, “cada animal trabalhou em uma câmara com a iluminação reduzida” (p.160). Durante a outra metade, no entanto, “ausência de iluminação (escuridão) estava em vigor durante cada intervalo do atraso… cada vez que uma resposta de pressão à barra ocorria, a luz da caixa era desligada (p.160, itálicos originais) e não voltava a ser ligada até que o reforço tivesse sido liberado. Pressões à barra na câmara sem iluminação aumentavam o período sem iluminação até que a duração do atraso terminasse e o reforço fosse liberado. Assim, na segunda parte do experimento, foram comparados um intervalo do atraso correlacionado com a presença e com a ausência de uma mudança nos estímulos. 42 Resultados e Discussão Houve dois achados principais. O responder mantido sob um esquema tandem FR1 DRO ts foi uma função negativamente desacelerada da duração do atraso. Ou seja, a taxa de respostas caiu precipitadamente quando o atraso aumentou de 1 a 10 s, mas atingiu a assíntota naquele ponto, não caindo mais quando aos atrasos duravam 15 ou 20 s. Essa relação é chamada de gradiente de atraso do reforço, e é característica da relação entre as medidas de uma resposta e a duração do atraso em uma ampla variedade de atrasos do reforço e parâmetros do esquema de reforço (cf. Lattal, 2010). Escurecer a câmara durante o atraso “produziu um efeito considerável, regularizando e aumentando a taxa de respostas [relativo aquela observada na condição de atraso não sinalizado] em quase todos os casos” (Azzi et al., 1964, p. 160). A discussão considerou o papel do comportamento mediador em manter o responder durante o atraso, uma observação feita anteriormente por Ferster (1953). No que subsequentemente se tornou uma análise padrão, a mudança de estímulos (em atrasos sinalizados dos reforços) é entendida como um reforçador condicionado que mantém as respostas que a produziram. Isto ainda é uma interpretação comum do papel do estímulo que sinaliza o atraso em procedimentos de atrasos sinalizados do reforço. Essa interpretação, no entanto, tem sido questionada recentemente interpretando-se a mudança de estímulos como tendo Capítulo II | Atraso do Reforço função de ligação ou marcação do atraso (e.g., Williams, 1991), ao invés de fortalecer o comportamento que a precede. DESDOBRAMENTOS Ambos os resultados do experimento qualificam Azzi et al. (1964) como um experimento seminal no estudo do atraso do reforço. Os gradientes de atraso do reforço apresentados por Azzi et al. (1964) tem sido replicados quando diferentes esquemas de reforço têm sido usados para manter o responder (Elcoro & Lattal, 2011, FI; Jarmolowicz & Lattal, 2013, FR; Richards, 1981, DRL e VI; Sizemore & Lattal, 1978, VI) e com uma variação mais ampla de valores de atraso (Pierce, Hanford, & Zimmerman, 1972; Richards, 1981; Sizemore & Lattal, 1978). Azzi et al. também anteciparam várias comparações subsequentes de atraso do reforço sinalizado e não sinalizado, com mais ou menos os mesmos resultados: atrasos sinalizados mantem um responder mais robusto do que os não sinalizados (Richards, 1981). Uma característica particularmente interessante de Azzi et al. é que as comparações dos atrasos do reforço sinalizados e não sinalizados foram intrassujeitos. Eles são os primeiros a comparar simultaneamente (intrassessão) os efeitos dos atrasos do reforço sinalizados e não sinalizados (cf. Lattal, 1984; Lattal & Ziegler, 1982; Richards, 1981). Muito depois de Azzi et al., Reilly e Lattal (2004) desenvolveram um método para obter gradientes de atraso do reforço intrassujeitos durante uma única sessão. Eles mantiveram o responder sob um esquema VI e, no início de cada sessão, programaram um atraso curto antes que um reforço fosse disponibilizado. Cada reforço subsequente foi disponibilizado após um atraso progressivamente maior. O experimento de Azzi et al. (1964) foi conduzido na tradição da Universidade de Columbia de conduzir análises paramétricas sistemáticas das variáveis controladoras do comportamento. Nesse caso, as durações do atraso foram manipuladas em condições sucessivas. Como não havia um retorno à linha de base entre os aumentos sucessivos nos valores dos atrasos, atrasos subsequentes eram impostos sob taxas variáveis de respostas entre manipulações, com efeitos desconhecidos sobre o gradiente de atraso do reforço. Esses gradientes de atraso do reforço, no entanto, são um tanto similares em sua forma aqueles obtidos com pressões à barra de ratos ou bicar de disco de pombos mantidos sob outros esquemas de reforço (Elcoro & Lattal, 2011; Pierce, et al., 1972; Richards, 1981; Sizemore & Lattal, 1978), sugerindo que a taxa de respostas na linha de base pode ter um papel menos importante na forma do gradiente do que o valor do atraso em si. Uma potencial variável estranha no experimento foi a taxa de reforços. Como tantos outros experimentos iniciais envolvendo atrasos do reforço, a taxa de reforços sob cada valor de atraso não foi relatada 43 Kennon A. Lattal por Azzi et al. (1964). É quase certo que as taxas de reforço diferiram quando os atrasos foram aumentados na primeira parte do experimento e na presença e na ausência de um estímulo na segunda parte. Pesquisas posteriores, no entanto, mostraram que diferenças na taxa de reforços geralmente não explicavam as diferenças nas taxas de resposta observadas quando durações de atraso são alteradas (Lattal, 1982; Richards, 1981; Sizemore & Lattal, 1978). Lattal e Gleeson (1990) utilizaram um procedimento semelhante aos de Skinner (1938) e Azzi et al. (1964) para investigar a aquisição de responder por ratos e pombos experimentalmente ingênuos sob atrasos do reforço não sinalizados e resetáveis e não resetáveis quando a resposta operante não havia sido modelada ou treinada de alguma forma, mas deixada para se desenvolver sem qualquer intervenção por parte dos investigadores. Responder robusto se desenvolveu sob estas condições, atestando o poder de reforço atrasado no desenvolvimento e manutenção comportamento operante. Esta é outra maneira de dizer que o reforço imediato não é necessário para que a aprendizagem ocorra. Dito isto, no entanto, o reforço imediato resulta em um responder muito mais robusto. É uma questão em aberto se a aquisição de respostas é “mais rápida” com reforços imediatos vs. atrasados das respostas. CONSIDERAÇÕES FINAIS O atraso do reforço é um dos principais parâmetros que afetam a eficácia dos reforços no desenvolvimento e na manutenção do comportamento (Kimble, 1961). Por esta razão, o seu papel, tanto sozinho como em combinação com outros parâmetros do reforço, tal como magnitude dos reforços, foi investigado extensivamente. Um dos resultados dessas análises de interações é o desconto do atraso, em que sistematicamente aumentar atrasos do reforço para reforços de maior magnitude ou probabilidade enquanto o atraso para outro reforço de menor magnitude ou probabilidade é fixo permite determinar, entre outras coisas, o ponto de indiferença em que uma das duas alternativas é igualmente provável de ser escolhida (ver Green, Myerson, & Vanderveldt de 2014, para um resumo recente destes resultados). Estudos sobre desconto do atraso oferecem insights sobre como diferentes combinações de parâmetros de reforço podem ser dimensionados. Da mesma forma, o atraso do reforço (às vezes também chamado de “gratificação” em experimentos não analítico-comportamentais sobre o fenômeno) desempenha um papel importante no desenvolvimento de estratégias de auto-gerenciamento ou de auto-controle. Na verdade, a base desta área de pesquisa e aplicação é a análise experimental de atraso do reforço. Uma outra área em que as pesquisas sobre atraso do reforço tem sido impor- 44 Capítulo II | Atraso do Reforço tantes é o estudo do reforço condicionado. Uma teoria fundamental sobre esse tipo reforço é a teoria da redução do atraso (delay reduction theory), que sugere que estímulos funcionam como reforçadores na medida em que eles indicam uma redução do tempo de acesso ao reforço primário (Fantino, 1977). As lições do atraso do reforço não foram perdidas na análise do comportamento aplicada, onde a importância da imediaticidade do reforço seguindo o comportamento apropriado continua, com razão, sendo enfatizada. Embora reforço imediato possa ser o ideal no tratamento e na gestão do comportamento humano de maneira geral, muitos comportamentos humanos são mantidos apesar de seus reforços serem atrasados a partir das respostas que os produzem. A pesquisa básica sobre atraso do reforço sugere uma série de condições sob as quais os atrasos reduzirão (e.g., atrasos mais longos ou não sinalizados) ou não (e.g., atrasos mais mais curtos ou sinalizados) o responder, mas poucas pesquisas aplicadas tem sido realizadas para expandir estes resultados e investigar como eles podem estar relacionados a programas de tratamento (mas cf. Stromer, McComas, & Rehfeldt, 2000). Uma questão particularmente importante e não resolvida na análise do atraso do reforço com humanos tanto na pesquisa como em contextos aplicados é a questão da mediação do comportamento durante os atrasos pelo comportamento verbal. Ambos Ferster (1953) e Azzi et al. (1964) sugeriram que o comportamento é mantido durante os atrasos do reforço na medida em que certos padrões de comportamento estereotipado surjem durante o atraso, o que resultaria numa cadeia de comportamento desenvolvendo de tal modo que a resposta que inicia o atraso é seguida por algum padrão regular de comportamento (não necessário mas mantido por reforço acidental) que termina contiguamente com reforço. Tais cadeias supersticiosas, assim, garantiriam uma “conexão” entre a resposta operante inicial e o reforço no final do atraso. Tem sido sugerido que o comportamento verbal de humanos pode também mediar os atrasos. Algo que uma pessoa faz agora pode não ter um efeito em uma hora, em um dia, ou até mais, mas os dois eventos permanecem conectados e a pessoa continua a se engajar no comportamento que tem o reforço atrasado. Talvez isso esteja relacionado a coisas que ou a pessoa diz a si mesmo ou outras pessoas a durante o intervalo do atraso. Ou talvez não. Alguns críticos contemporâneos de tais interpretações do atraso do reforço baseadas em contiguidade têm sugerido que a proximidade temporal entre a resposta e reforço desempenha um papel relativamente menor na aquisição e manutenção de responder em comparação ao fato de que existe uma correlação geral entre a taxa de respostas e os reforços que resultam, imediatamente ou após atrasos (ver Baum, 1973). O experimento de Lattal e Gleeson (1990) descrito acima ilustra que 45 Kennon A. Lattal a aprendizagem pode ocorrer quando há apenas uma correlação entre a resposta e o reforço, mas não a contiguidade resposta-reforço. Este último ponto levanta uma questão mais ampla, sem resposta ainda, sobre se os reforços que ocorrem após um atraso são mais bem caracterizados como atrasados em relação à respostas específicas ou se são correlacionados com grupos de respostas organizadas como taxas de resposta ou tempo alocado à respostas de topografias particulares. Um último ponto, mas não menos importante, é que a partir de uma perspectiva histórica o experimento é importante porque é o primeiro de muitos relatos de pesquisa por analistas do comportamento brasileiros a ser publicado no Journal of the Experimental Analysis of Behavior. PARA SABER MAIS Commons, Mazur, Nevin, & Rachlin (1987). É um volume editado que apresenta uma série de perspectivas sobre o uso e as implicações do atraso do reforço para a compreensão do processo de reforçamento. Lattal (2010). fez uma revisão sobre a pesquisa básica sobre atraso do reforço conduzida na tradição analítico-comportamental de Skinner até o momento da publicação de sua revisão. Renner (1964). é uma importante revisão 46 inicial sobre atraso do reforço a partir de uma perspectiva mais ampla das teorias da aprendizagem sobre o tema. Stromer, McComas, & Rehfeldt (2000). consideraram algumas implicações aplicadas de pesquisas sobre atraso do reforço. Tarpy & Sawabini (1974). analisaram criticamente pesquisas sobre atraso do reforço conduzidas desde a publicação da revisão de Renner até a sua própria. REFERÊNCIAS Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental Analysis of Behavior, 20, 137-153. Commons, M. L., Mazur, J., Nevin, J. A., & Rachlin, H. (Eds.) (1987). Quantitative studies of operant behavior: The effect of delay and of intervening events on reinforcement value. New York: Erlbaum. Elcoro, M., & Lattal, K. A. (2011). Effects of unsignaled delays of reinforcement on fixed-interval schedule performance. Behavioural Processes, 88, 47-52. Capítulo II | Atraso do Reforço Fantino (1977). Conditioned reinforcement, choice, and information. In W. K. Honig & J.E.R. Staddon (Eds.), Handbook of operant behavior (pp. 326-339). New York: Prentice Hall. Ferster, C. B. (1953). Sustained behavior under delayed reinforcement. Journal of Experimental Psychology, 45, 218-224. Green, L., Myerson, J., & Vanderveldt, A. (2014). Delay and probability discounting. In F. K. McSweeney & E. S. Murphy (Eds.), The Wiley Blackwell handbook of operant and classical conditioning. Oxford: John Wiley & Sons. Guthrie, E. R. (1935). The psychology of learning. New York: Harper. Hull, C. L. (1943). Principles of Behavior. New York: Appleton-Century Crofts. Jarmolowicz, D. P., & Lattal, K. A. (2013). Delay of reinforcement and fixed-ratio performance. Journal of the Experimental Analysis of Behavior, 100, 370-395. Keller, F. S. (2008). At my own pace: The autobiography of Fred S. Keller. Cornwall on Hudson: Sloan Publishing. Kimble, G. A. (1961). Hilgard and Marquis’ Conditioning and Learning. New York: Appleton Century Crofts. layed reinforcement. Journal of the Experimental Analysis of Behavior, 42, 239-253. Lattal, K.A. (2010). Delayed reinforcement of operant behavior. Journal of the Experimental Analysis of Behavior, 93, 129-139. Lattal, K. A., & Gleeson, S. (1990). Response acquisition with delayed reinforcement. Journal of Experimental Psychology: Animal Behavior Processes, 16, 27-39. Lattal, K. A., & Ziegler, D. R. (1982). Briefly delayed reinforcement: An interresponse time analysis. Journal of the Experimental Analysis of Behavior, 37, 407-416. Pierce, C. H., Hanford, P. V., & Zimmerman, J. (1972). Effects of different delay of reinforcement procedures on variable-interval responding. Journal of the Experimental Analysis of Behavior, 18, 141-146. Renner, K. E. (1964). Delay of reinforcement: A historical review. Psychological Review, 61, 341-361. Reilly, M.P., & Lattal, K.A. (2004). Progressive delays to reinforcement. Journal of the Experimental Analysis of Behavior, 82, 2135. Richards, R. W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis of Behavior, 35, 145-152. Lattal, K. A. (1984). Signal functions in de47 Kennon A. Lattal Sizemore, O. J., & Lattal, K. A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30, 169-175. Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York: Appleton Century Crofts. Spence, K. W. (1947). The role of secondary reinforcement in delayed reward learning. Psychological Review, 54, 1-8. Stromer, R, McComas, J. J., & Rehfeldt, R. A. (2000). Designing interventions that include delayed reinforcement: Implications of recent laboratory research. Journal of Applied Behavior Analysis, 33, 359-371. Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: A selective review of the past decade. Psychological Bulletin, 81, 984-987. Thorndike, E. L. (1911). Animal intelligence. New York: MacMillan. Williams, B. A. (1991). Marking and bridging versus conditioned reinforcement. Animal Learning and Behavior, 19, 264-269. Wilson, M. P., & Keller, F. S. (1953). On the selective reinforcement of spaced responses. Journal of Comparative and Physiological Psychology, 46, 190-193. 48 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira Quando o passado retorna: ressurgência comportamental Carlos Renato Xavier Cançado Flávia Hauck Ítalo S. C. Teixeira Universidade de Brasília Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour Analysis Letters, 3, 391-397. A fênix é uma ave da Arábia (...). Quando percebe que envelheceu, constrói uma fogueira para si (...) e encarando os raios do sol nascente, acende o fogo e o nutre batendo suas asas, e ressurge de suas próprias cinzas. (Isidoro de Sevilha, Etymologiae, Livro 12, 7:22) 49 Capítulo III | Ressurgência Comportamental INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO É bem provável que você tenha se encontrado em uma situação em que teve que resolver um problema como, por exemplo, responder corretamente a um exercício de cálculo, abrir uma porta emperrada, ou escrever um texto sobre um tema com o qual você tem pouca familiaridade. Você “não sabe o que fazer”. Um problema pode ser apenas uma situação em que seu comportamento não modifica o ambiente de maneira eficiente, isto é, seu comportamento não produz consequências. É o que os analistas do comportamento chamam de extinção. Além da redução na frequência de determinadas respostas, um outro efeito da extinção é o aumento na variabilidade da topografia das respostas (Antonitis, 1951). Você tenta fazer coisas diferentes, comportar-se de outras maneiras para tentar resolver o problema. Parte do que você faz nesse momento é, comumente, algo bem parecido com o que você fez no passado (talvez mesmo em um passado remoto) e que, nesse passado, “deu certo”. É parte de sua história comportamental. É sobre essa variação comportamental que o ambiente irá operar, selecionando o que é usualmente descrito como a “solução do problema”, possivelmente um “comportamento novo” ou “criativo” (Epstein, 1996; ver especialmente, Skinner, 1981, 1984). Em situações nas quais comportamentos atuais deixam de produzir consequências, comportamentos previamente reforçados tendem a recorrer, um fenômeno que analistas do comportamento denominam de ressurgência (Epstein, 1983, 1985). Embora a ressurgência tivesse sido descrita anteriormente na literatura científica (e.g., Carey, 1951; Leitenberg, Rawson & Bath, 1970; Leitenberg, Rawson & Mulick, 1975; ver Epstein, 2015), o estudo sistemático desse fenômeno intensificou-se nos anos 1980, especialmente após a publicação do artigo de Epstein (1983), cujo experimento é descrito nesse capítulo. Nesse artigo, Epstein usa um termo específico para descrever a recorrência de comportamentos previamente reforçados durante a extinção de outros comportamentos (i.e., ressurgência; ver também Epstein & Skinner, 1980), define o fenômeno, descreve um procedimento para sua análise experimental, e levanta diversas questões de pesquisa que serviram de base para a condução de experimentos sobre a ressurgência desde então (ver Lattal & St Peter Pipkin, 2009; e Pontes & Abreu-Rodrigues, 2015, para revisões da literatura). No início de seu artigo, Epstein (1983) define a ressurgência da seguinte maneira: “Quando, numa dada situação, um comportamento reforçado recentemente deixa de ser reforçado, comportamentos anteriormente reforçados em condições semelhantes tendem a recorrer” (p. 391; itálicos adicionados). Essa definição pode parecer 50 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira geral demais, algo que talvez pudesse ter sido descrito por meio da observação casual do comportamento no cotidiano, sem recorrer a equipamentos especiais, sem conduzir experimentos, e sequer pensar em ir ao laboratório. Por quê recorrer a uma situação simplificada no laboratório quando o fenômeno pode ser observado no comportamento de humanos e não humanos em ambientes não laboratoriais? Mas é exatamente essa simplificação do laboratório em relação a ambientes não laboratoriais, conduzida por meio do controle experimental de variáveis, que queremos quando nosso objetivo é descrever princípios comportamentais. A análise experimental permite uma descrição mais precisa do fenômeno investigado e dos fatores que o levam a ocorrer (i.e., suas variáveis de controle). Se você conhece as variáveis que determinam um fenômeno, pode prevê-lo com maior precisão se você sabe que essas variáveis estão em vigor. Além disso, se você pode manipular essas variáveis, pode fazer com que o fenômeno ocorra ou deixe de ocorrer (Skinner, 2003/1953). É essa a principal função de uma análise experimental do comportamento e não seria diferente em relação ao estudo da ressurgência. Vejamos, então, como foi a análise experimental da ressurgência conduzida por Epstein. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo de Epstein (1983) era ana51 lisar experimentalmente a ressurgência, isto é, a recorrência de comportamentos previamente reforçados quando comportamentos atuais deixavam de ser reforçados. Metodologicamente, seria necessário que uma resposta específica (a resposta alvo) fosse inicialmente reforçada. Em uma segunda fase, a resposta alvo deixaria de produzir reforços e uma outra resposta (a resposta alternativa) seria reforçada. Em uma terceira fase, a resposta alvo continua a não produzir reforços e a ressurgência dessa resposta poderia ser verificada quando a resposta alternativa deixasse de produzir reforços. Na literatura experimental, o procedimento para o estudo da ressurgência é descrito comumente como um “procedimento de três fases” e a primeira, a segunda e a terceira fases do procedimento são denominadas fases de Treino, Eliminação (ou Reforçamento Alternativo) e Teste, respectivamente. Embora Epstein não tenha feito uso desses termos, eles serão utilizados nesse capítulo para descrever as fases de seu procedimento. Independente dos nomes que demos ao procedimento e às fases experimentais, o que deve ser destacado é que Epstein (1983) precisou construir, em laboratório, uma história comportamental remota (i.e., a resposta alvo foi reforçada), uma história comportamental recente (i.e., a resposta alvo deixou de ser reforçada e apenas a resposta alternativa passou a produzir reforços) e também modificar o ambiente de seus sujeitos em um teste (i.e., a resposta Capítulo III | Ressurgência Comportamental alternativa também deixou de produzir reforços) para verificar se, e como, a ressurgência das respostas alvo ocorreria. O experimento foi conduzido com seis pombos, experimentalmente ingênuos, mantidos a 80% de seu peso livre por meio de um regime de privação de comida. Como os experimentos sobre ressurgência são experimentos sobre os efeitos de uma história remota sobre o comportamento atual, o fato de os pombos terem sido experimentalmente ingênuos foi um aspecto importante de controle experimental. Os resultados poderiam ser diferentes (ou mesmo de difícil interpretação) se os pombos já tivessem uma determinada história no ambiente experimental escolhido por Epstein. O procedimento de privação de comida é uma operação estabelecedora ou motivadora (Miguel, 2000; ver também Laraway, Snycerski, Michael & Poling, 2003), necessária para estabelecer o acesso à comida no ambiente experimental como consequência e permitir que determinadas respostas sejam selecionadas e mantidas durante o experimento. O equipamento utilizado no experimento foi uma câmara de condicionamento operante para pombos (as sessões experimentais eram conduzidas com cada pombo individualmente). Um dos painéis da câmara continha dois discos de resposta, localizados à direita e à esquerda no painel e separados por 12 cm, e um comedouro localizado entre os discos (os discos de resposta usualmente são de plástico e têm 2 cm de diâmetro; respostas de bicar o disco fecham um circuito elétrico que permite o registro automático das respostas). Quando acionado, o comedouro dava acesso a grãos por 3 s (i.e., reforços). Em cada fase do experimento, descritas a seguir, as sessões experimentais duravam 60 min e o registro das respostas foi feito por meio de um microcomputador, de registradores cumulativos, e também de filmagens das sessões experimentais feitas com uma câmera de vídeo. Fase de Treino: o objetivo dessa fase foi estabelecer a resposta alvo. Para três pombos, a resposta alvo consistiu em bicar o disco da direita e, para os outros três, o disco da esquerda. A resposta alvo foi mantida sob um esquema de reforçamento intervalo variável (VI) 60 s. Sob esse esquema, a primeira resposta após um intervalo médio de 60 s produz reforços (os intervalos entre reforços variam e sua média é igual a 60 s; os intervalos são selecionados aleatoriamente em uma sessão). Esse esquema produz uma taxa de respostas moderada e constante e, por essa razão, é muito usado para o estabelecimento de linhas de base comportamentais em análise experimental do comportamento. Essa fase teve a duração de 15 a 49 sessões, entre pombos, e terminou quando a taxa de respostas de cada pombo fosse estável (embora Epstein, 1983, não defina precisamente seu critério de estabilidade, comumente exige-se que os sujeitos sejam expostos às condições por um número mínimo de sessões e que não haja 52 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira tendências crescentes ou decrescentes na taxa de respostas por algumas sessões consecutivas). Fase de Eliminação: o objetivo dessa fase foi reduzir a frequência da resposta alvo e reforçar uma resposta alternativa. Na etapa inicial dessa fase, para cada pombo, a resposta alvo deixou de produzir reforços (i.e., extinção estava em vigor). O número de sessões em que a resposta alvo esteve em extinção variou para cada pombo, entre uma e 12 sessões. A etapa final dessa fase ocorreu em uma sessão de 60 min. Nessa sessão, o procedimento de extinção da resposta alvo esteve em vigor por pelo menos 30 min e até que nenhuma resposta alvo ocorresse por 10 min consecutivos, para cada pombo. Então, foi reforçada uma resposta alternativa cuja topografia era incompatível com bicar o disco. A topografia da resposta alternativa variou entre pombos: para um pombo, por exemplo, a resposta alternativa consistiu em virar para a esquerda; para outro pombo, em abaixar a cabeça; para outro, em levantar a asa. A resposta alternativa foi reforçada 20 vezes em um esquema de razão fixa (FR) 1. Sob esse esquema cada ocorrência da resposta alternativa produzia o reforço. Após a produção de 20 reforços pela resposta alternativa, ainda nessa mesma sessão, teve início a fase de Teste. Fase de Teste: nessa fase, para cada pombo, os reforços para a resposta alternativa foram descontinuados. É importante 53 destacar que, durante essa fase, a resposta alvo também não produzia reforços. Essa fase esteve em vigor até o término da sessão de 60 min e teve a duração de aproximadamente 10 min para cada pombo. Ressurgência seria evidenciada caso ocorresse um aumento na frequência da resposta alvo na fase de Teste em relação à frequência dessa mesma resposta na etapa final da fase de Eliminação. Mas vejamos alguns aspectos do procedimento de Epstein (1983) que qualificam (em seu experimento, e em qualquer experimento sobre ressurgência) a descrição de um aumento na frequência de respostas alvo durante a fase de Teste como ressurgência. Aspectos do controle experimental: vale destacar alguns aspectos importantes de controle experimental adotados por Epstein (1983). Lembre-se que a câmara de condicionamento operante tinha dois discos de resposta. Bicar um desses discos foi definido como a resposta alvo. Respostas de bicar o outro disco nunca produziram reforços durante o experimento, mas foram registradas e serviram como respostas controle. A comparação da frequência de respostas alvo e respostas controle na fase de Teste permite diferenciar a ressurgência da variabilidade no comportamento induzida pela extinção. Sem o registro de uma resposta controle, um aumento na frequência da resposta alvo na fase de Teste, que seria descrita como ressurgência, poderia simplesmente ser um exemplo de variabilida- Capítulo III | Ressurgência Comportamental de induzida pela extinção. No entanto, se o aumento na frequência da resposta alvo na fase de Teste fosse maior do que a frequência da resposta controle, isso seria evidência de que a ressurgência é função da história de reforçamento estabelecida na fase de Treino e não apenas induzida pela extinção. Portanto, a ressurgência é definida operacionalmente no experimento de Epstein como um aumento na frequência da resposta alvo durante a fase de Teste (i.e., em relação à frequência dessa mesma resposta durante a etapa final da fase de Eliminação) que fosse maior do que a frequência da resposta controle nessa mesma fase. Um outro aspecto de controle experimental importante do experimento de Epstein (1983) é o fato de a etapa final da fase de Eliminação e a fase de Teste terem sido conduzidas na mesma sessão. Quando uma resposta está em extinção, é comum observarmos um fenômeno de recorrência chamado de recuperação espontânea (descrito por Pavlov, e.g., Pavlov, 1927, no estudo da extinção respondente; o fenômeno é também observado na extinção operante). A recuperação espontânea caracteriza-se por um aumento na frequência de respostas no início de uma sessão de extinção em relação a frequência dessas respostas no final da sessão de extinção imediatamente anterior. Portanto, se a transição entre a fase de Eliminação e a fase de Teste ocorresse entre sessões no experimento de Epstein, não teríamos como dissociar a eventual ressurgência da resposta alvo no início da fase de Teste do fenômeno de recuperação espontânea (lembre-se que a resposta alvo estava em extinção durante toda a fase de Eliminação, e também durante a fase de Teste). Como a transição entre as fases de Eliminação e Teste no experimento de Epstein ocorreu na mesma sessão, um aumento na frequência da resposta alvo no Teste seria mais precisamente descrito como ressurgência e não como recuperação espontânea. Finalmente, vale apontar que Epstein (1983) conduziu a extinção da resposta alvo, na fase de Eliminação, antes do reforçamento da resposta alternativa (e.g., Bruzek, Thompson & Peters, 2009; Lieving & Lattal, 2003). Isso foi feito para garantir que a frequência da resposta alvo era baixa quando as respostas alternativas fossem reforçadas. No entanto, são comuns experimentos sobre ressurgência nos quais a extinção da resposta alvo e o reforçamento da resposta alternativa ocorrem simultaneamente na fase de Eliminação (e.g., Cançado & Lattal, 2011; da Silva, Maxwell & Lattal, 2008; Podlesnik, Gimenez-Gomez & Shahan, 2006). Resultados e Discussão Como apontado anteriormente, o número de sessões na fase de Treino e na etapa inicial da fase de Eliminação variou entre pombos. Na fase de Treino, entre pombos, de 11 a 49 sessões foram conduzidas; na etapa inicial da fase de Eliminação, de 1 a 12 sessões foram conduzidas. 54 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira Infelizmente, Epstein (1983) não apresentou dados da fase de Treino. Como essa fase foi conduzida até que a taxa de respostas alvo de cada pombo fosse estável, temos que assumir que foi isso o que aconteceu. A taxa de respostas alvo, para cada pombo, estava próxima de zero quando teve início o reforçamento das respostas alternativas. Assim, Epstein demonstrou que a exposição à extinção durante a etapa inicial da fase de Eliminação reduziu consideravelmente a taxa de respostas alvo antes que as respostas alternativas começassem a ser reforçadas. Na etapa final da fase de Eliminação, a taxa de respostas alternativas aumentou para cada pombo e a taxa de respostas alvo permaneceu próxima de zero. Finalmente, quando os reforços para respostas alternativas foram descontinuados na fase de Teste, a frequência dessas respostas diminuiu e observou-se um aumento na ocorrência da resposta alvo para cada pombo. Isto é, a ressurgência de uma resposta previamente reforçada ocorreu quando a resposta alternativa estava em extinção. A magnitude da ressurgência (i.e., o quanto a taxa de respostas aumentou na fase de Teste em relação à fase de Eliminação) variou entre os pombos e aparentemente não foi influenciada pelo número de sessões conduzidas nas fases de Treino e Eliminação. A condução da etapa final da fase de Eliminação e da fase de Teste em uma mesma sessão (Epstein, 1983) permite afirmar 55 que o aumento na frequência de respostas alvo durante a fase de Teste não foi um exemplo de recuperação espontânea. Além disso, o registro das respostas controle permite afirmar que esse aumento na frequência de respostas alvo durante a fase de Teste não pode ser descrito simplesmente como variabilidade no comportamento induzida pela extinção. Para cada pombo, o aumento na frequência da resposta alvo na fase de Teste foi maior do que a frequência de respostas controle nessa mesma fase (apenas um pombo emitiu uma resposta controle na fase de Teste). Portanto, podemos afirmar que a ressurgência é produto da história remota de reforçamento estabelecida na fase de Treino. O fato de a resposta alvo e a resposta controle terem topografias semelhantes (ambas são respostas de bicar um disco, e os discos estavam próximos um do outro na câmara de condicionamento) torna esse aspecto do procedimento ainda mais relevante e ressalta a importância da história do organismo em determinar qual comportamento irá ocorrer (ou recorrer) quando a extinção estiver em vigor. Epstein (1983) destaca, contudo, que a condução da etapa final da fase de Eliminação e da fase de Teste em uma mesma sessão tem implicações para interpretarmos seus resultados. Nesse contexto, ele faz referência a outro fenômeno de recorrência, o restabelecimento (Reid, 1958; Franks & Lattal, 1976). O restabelecimento é a recorrência de respostas previamente reforçadas quando, em uma fase de Teste, a resposta Capítulo III | Ressurgência Comportamental alvo está em extinção, mas os reforços são apresentados independentemente das respostas do organismo. O restabelecimento evidencia o controle discriminativo do próprio reforço como variável que influencia a recorrência de respostas. No experimento de Epstein, a etapa final da fase de Eliminação foi conduzida por um período relativamente curto (o tempo necessário para a emissão de 20 respostas alternativas), na mesma sessão em que, posteriormente, a fase de Teste foi conduzida. É possível, portanto, que a ressurgência observada para cada pombo nesse experimento tenha sido parcialmente induzida pela ocorrência de reforços na etapa final da fase de Eliminação (lembre-se que 3 s de acesso a grãos serviram como reforços para as respostas alvo, na fase de Treino, e para as respostas alternativas, na fase de Eliminação). No entanto, vale ressaltar que, para cada pombo, a ressurgência foi observada no experimento de Epstein apenas quando os reforços para a resposta alternativa foram descontinuados, e não enquanto esses reforços estavam sendo produzidos. Além disso, experimentos subsequentes demonstraram que a ressurgência ocorre mesmo quando a fase de Eliminação é conduzida por várias sessões de duração mais longa do que aquela programada por Epstein (e.g., Lieving & Lattal, 2003; Podlesnik et al., 2006; Podlesnik & Shahan, 2009) e quando a transição entre as fases de Eliminação e Teste ocorre não na mesma sessão, mas entre sessões. Nesse último caso, não há reforços disponíveis para qualquer resposta durante toda a fase de Teste. DESDOBRAMENTOS A beleza de uma ciência experimental é que os resultados de um experimento respondem algumas perguntas, mas levantam uma série de novas perguntas que requerem estudos adicionais. Ao discutir seus resultados, Epstein (1983) afirmou que muitas variáveis poderiam influenciar a ressurgência como, por exemplo, os esquemas de reforçamento que mantêm a resposta alvo e a resposta alternativa, o tipo e a magnitude dos reforços que mantêm essas respostas, a duração das fases de Treino e de Eliminação (i.e., o tempo em que respostas alvo e alternativa são reforçadas) e também as condições em que a resposta alvo foi extinta (i.e., o número de sessões) e a taxa de respostas alvo antes do reforçamento da resposta alternativa. Além disso, ele sugeriu que o fenômeno da ressurgência estaria possivelmente envolvido no que chamamos de criatividade e de resolução de problemas. Com essas afirmações, Epstein levantou uma série de questões que poderiam ser experimentalmente investigadas e ressaltou a utilidade do conhecimento sobre o fenômeno da ressurgência para a análise de outros padrões comportamentais. Os resultados de Epstein (1983) têm sido replicados em diversos laboratórios desde então, com diferentes espécies (e.g., ratos, Podlesnik et al., 2006; humanos, Wil56 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira son & Hayes, 1996; peixes, da Silva, Cançado & Lattal, 2014) e com algumas modificações do procedimento descrito pelo autor (ver Pontes e Abreu-Rodrigues, 2015). As variáveis que possivelmente influenciariam a ressurgência, indicadas por Epstein e descritas anteriormente, vêm sendo estudadas sistematicamente desde então. Diferente do que indicaram os resultados de seu experimento (Epstein, 1983), alguns estudos sugerem que o número de sessões na fase de Treino pode influenciar a magnitude da ressurgência. Ressurgência de maior magnitude tende a ocorrer quando a fase de Treino é conduzida por um número maior de sessões (e.g., Bruzek et al., 2009; Doughty, Cash, Finch, Holloway & Wallington, 2010). No entanto, resultados inconsistentes entre estudos têm sido obtidos quando a duração da fase de Eliminação é manipulada. Em alguns estudos, a magnitude da ressurgência foi maior quando a duração da fase de Eliminação foi menor (e.g., Leitenberg, et al., 1975; ver também Sweeney & Shahan, 2013b). Em outros estudos, a duração da fase de Eliminação não influenciou a magnitude da ressurgência (e.g., Lieving & Lattal, 2003, Winterbauer, Lucke & Bouton, 2013). Hoje sabemos que a ressurgência é um fenômeno replicável interssujeitos e também intrassujeitos (i.e., após a exposição repetida dos mesmos sujeitos ao procedimento de três fases; e.g., Cançado & Lattal, 2011; Lieving & Lattal, 2003). Além disso, sabemos que a magnitude da ressur57 gência é influenciada pela taxa de reforços em vigor nas fases de Treino (Podlesnik & Shahan, 2009, 2010) e Eliminação (Cançado, Abreu-Rodrigues & Aló, 2015; Sweeney & Shahan, 2013a). Em geral, taxas altas de reforços nessas duas fases produzem ressurgência de maior magnitude do que taxas baixas de reforços. Temos também evidências que unidades comportamentais mais complexas, como diferentes padrões temporais de resposta (Cançado & Lattal, 2011) e sequências espaciais de respostas (Sánchez-Carrasco & Nieto, 2005; Reed & Morgan, 2006) ressurgem assim como respostas discretas como bicar um disco, pressionar uma barra ou um botão de respostas. Esse último achado pode ser relevante para interpretar resultados de alguns estudos que mostram que ressurgência de maior magnitude é observada quando, na fase de Treino, a resposta alvo ocorre em taxas altas do que quando ocorre em taxas baixas (da Silva, et al., 2008; Reed & Morgan, 2007). O que esses últimos resultados podem indicar é a ressurgência de padrões diferentes de respostas (i.e., taxas altas e taxas baixas) estabelecidos na fase de Treino. Por fim, vale ressaltar que a ressurgência de respostas mantidas por contingências de reforçamento negativo (ao invés de contingências de reforçamento positivo, como no experimento de Epstein) tem sido demonstrada com humanos no laboratório (Bruzek et al., 2009; Alessandri, Lattal & Cançado, 2015) e em ambientes não laboratoriais (e.g., Volkert, Lerman, Call & Trosclair-Lasserre, 2009). Capítulo III | Ressurgência Comportamental Epstein (1983) destacou a relevância do fenômeno da ressurgência para a análise de fenômenos como a criatividade e a resolução de problemas (ver também Epstein, 1996). Mas a ressurgência pode ser relevante também para compreender outros fenômenos, como, por exemplo, a recaída (e.g., de comportamentos mantidos por drogas, Podlesnik et al., 2006; ou de outros comportamentos de relevância aplicada; Lieving, Hagopian, Long & O’Connor, 2004; ver também, Bouton, 2011; Podlesnik & Kelley, 2015; e St Peter, 2015). Se você pensar no procedimento de três fases para o estudo da ressurgência, verá que o procedimento se adequa bem como um modelo experimental para o estudo da recaída. No laboratório com não humanos, por exemplo, podemos reforçar as respostas alvo com drogas na fase de Treino (e.g., álcool, Podlesnik et al.; ou cocaína Quick, Pyszczynski, Colston & Shahan, 2011) e as respostas alternativas com comida, na fase de Eliminação (a fase de Teste consistiria, assim como no estudo de Epstein, em descontinuar a comida que mantém as respostas alternativas). Em contextos aplicados, a resposta alvo pode ser um comportamento problema cuja frequência temos interesse em reduzir (e.g., agressão, autoagressão, abuso de drogas e outras substâncias) e respostas alternativas são comumente aquelas mais apropriadas para o contexto em que vive o participante e que resultam de uma intervenção comportamental como reforçamento diferencial de respostas alternativas (Marsteller & St Peter, 2014; Volkert et al., 2009). Recentemente, esforços de pesquisadores e pesquisadoras em contextos laboratoriais e não laboratoriais têm produzido achados interessantes sobre a ressurgência. Esses achados não apenas aumentam nosso conhecimento sobre o fenômeno, mas servem como base para lidar com o fenômeno nos mais diversos contextos. Considerando-se a data de publicação do experimento de Epstein (1983), a área de pesquisas sobre ressurgência é relativamente jovem. A ressurgência é um tema desafiador – é um fenômeno transitório (Sidman, 1960) e, como qualquer fenômeno transitório, exige esforço de pesquisadores e pesquisadoras na elaboração das melhores condições para seu estudo. Análises experimentais sistemáticas dos efeitos de variáveis de controle já conhecidas sobre a ressurgência são interessantes e necessárias. Ao conduzirmos tais análises, certamente descobriremos novas variáveis de controle e relações entre essas variáveis na determinação da ressurgência. CONSIDERAÇÕES FINAIS Por quê estudar a ressurgência, ou a recorrência do comportamento de maneira geral, é interessante? Primeiramente, trata-se de um fenômeno natural e seu estudo, por si só, se justifica. Além disso, é útil conhecer suas variáveis de controle para alterar sua probabilidade de ocorrência onde quer que isso seja necessário. Há contextos em que a recorrência de comportamentos 58 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira é indesejável, mas ocorrem mesmo assim (e.g., a recorrência de comportamentos-problema e a recaída). Há outros contextos em que seria desejável e pode não ocorrer (e.g., em contextos de resolução de problemas e quando temos interesse no estabelecimento de comportamentos novos). e em que grau o fenômeno será observado. Essa é uma tarefa que aguarda aqueles interessados na ressurgência e na recorrência de comportamentos em geral. No início de seu artigo, Epstein (1983) afirma que o fato que comportamentos previamente reforçados tendem a recorrer quando comportamentos atuais deixam de produzir reforços (i.e., ressurgência) teria “um potencial de aplicação amplo” (p. 391). Talvez apenas recentemente, dado o acumulo de evidências experimentais sobre o fenômeno, tenhamos passado a explorar mais as implicações do estudo da ressurgência para uma análise experimental do comportamento e para a aplicação dos princípios comportamentais em contextos não laboratoriais. Durante aproximadamente 20 anos, desde a publicação do trabalho de Epstein até a publicação de uma série de experimentos conduzidos por Lieving e Lattal (2003), estudos sobre a ressurgência foram escassos e envolveram comumente a análise de condições em que o fenômeno ocorre ou não (ver Pontes & Abreu-Rodrigues, 2015). Recentemente, contudo, análises experimentais sistemáticas têm sido direcionadas à descrição de variáveis que alteram não apenas a ocorrência da ressurgência, mas também sua magnitude. Um maior refinamento experimental permite descrever não apenas quando o fenômeno irá ocorrer, mas também especificar como Lieving & Lattal (2003). Série de quatro experimentos conduzidos com pombos. Uma das primeiras análises experimentais sistemáticas sobre a ressurgência conduzida após a publicação do experimento de Epstein (1983). 59 PARA SABER MAIS Podlesnik, Gimenez-Gomez, & Shahan (2006). Experimento conduzido com ratos sobre a ressurgência de comportamentos previamente mantidos por álcool. Os autores apresentam nesse artigo o procedimento para o estudo da ressurgência como um modelo experimental da recaída. Podlesnik & Shahan (2009). Nesse artigo, os efeitos sobre a ressurgência de taxas de reforços diferenciais na fase de Treino (assim como sobre outros fenômenos de recorrência, como o restabelecimento e a renovação) são avaliados. Os autores propõem uma relação entre as variáveis que determinam a ressurgência (e a recorrência em geral) e a resistência do comportamento à mudança. Bruzek, Thompson, & Peters (2009). Em dois experimentos conduzidos com humanos, a ressurgência de comportamentos Capítulo III | Ressurgência Comportamental mantidos previamente por contingências de reforçamento negativo (fuga) foi estudada. Cançado, Abreu-Rodrigues, & Aló (2015). Em dois experimentos conduzidos com ratos, os efeitos sobre a ressurgência de taxa de reforços diferenciais na fase de Eliminação foram avaliados parametricamente. REFERÊNCIAS Alessandri, J., Lattal, K. A., & Cançado, C. R. X. (2015). The recurrence of negatively reinforced responding of humans. Journal of the Experimental Analysis of Behavior, 104, 211–222. Antonitis, J. J. (1951). Response variability in the white rat during conditioning, extinction, and reconditioning. Journal of Experimental Psychology, 42, 273-281. Bouton, M. E. (2011). Learning and the persistence of appetite: Extinction and the motivation to eat and overeat. Physiology & Behavior, 103, 51–58. Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregiving responses. Journal of the Experimental Analysis of Behavior, 92, 327-343. Cançado, C. R. X., Abreu-Rodrigues, J., & Aló, R. M. (2015). Reinforcement rate and resurgence: A parametric analysis. Revista Mexicana de Análisis de la Conducta, 41, 84-115. Cançado, C. R. X., & Lattal, K. A. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis of Behavior, 95, 271-287. Carey, J. P. (1951). Reinstatement of previously learned responses under conditions of extinction: A study of “regression” [Abstract]. American Psychologist, 6, 284. da Silva, S. P., Cançado, C. R. X., & Lattal, K. A. (2014). Resurgence in Siamese fighting fish, Betta splendens. Behavioural Processes, 103, 315-319. da Silva, S. P., Maxwell, M. E., & Lattal, K. A. (2008). Concurrent resurgence and behavioral history. Journal of the Experimental Analysis of Behaviour, 90, 313-331. Doughty, A. H., Cash, J. D., Finch, E. A., Holloway, C., & Wallington, L. K. (2010). Effects of training history on resurgence in humans. Behavioural Processes, 83, 340343. Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour Analysis Letter, 3, 391–397. Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and possible applications. The Psychological Record, 35, 143-153. 60 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira Epstein, R. (1996). Cognition, creativity & behavior: Selected essays. Westport, CT: Praeger Epstein, R. (2015). On the rediscovery of the principle of resurgence. Revista Mexicana de Análisis de la Conducta, 41, 19-43. Epstein, R., & Skinner, B. F. (1980). Resurgence of responding after the cessation of response-independent reinforcement. Proceedings of the National Academy of Sciences of the United States of America, 77, 62516253. Franks, G. J, & Lattal, K. A. (1976). Antecedent reinforcement schedule training and operant response reinstatement in rats. Animal Learning & Behavior, 4, 374-378. Laraway, S., Snycerski, S., Michael, J., & Poling, A. (2003). Motivating operations and terms to describe them: Some further refinements. Journal of Applied Behavior Analysis, 36, 407-414. Lattal, K. A., & St. Peter Pipkin, C. (2009). Resurgence of previously reinforced responding: Research and application. The Behavior Analyst Today, 10, 254-266. Leitenberg, H., Rawson, R. A., & Bath, K. B. (1970). Reinforcement of competing behavior during extinction. Science, 169, 301303. 61 Leitenberg, H., Rawson, R. A., & Mulick, J. A. (1975). Extinction and reinforcement of alternative behavior. Journal of Comparative and Physiological Psychology, 88, 640652. Lieving, G. A., Hagopian, L. P., Long, E. S., & O’Connor, J. (2004). Response-class hierarchies and resurgence of severe problem behavior. The Psychological Record, 54, 621–634. Lieving, G. A, & Lattal, K. A. (2003). Recency, repeatability, and reinforcer retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233. Marsteller, T. M., & St Peter, C. C. (2014). Effects of fixed-time reinforcement schedules on resurgence of problem behavior. Journal of Applied Behavior Analysis, 47, 455-469. Miguel, C. F. (2000). O conceito de operação estabelecedora na análise do comportamento. Psicologia: Teoria e Pesquisa, 16, 259-267. Pavlov, I. P. (1927). Conditioned reflexes: An investigation of the physiological activity of the cerebral cortex. Londres: Oxford University Press. Podlesnik, C. A, Jimenez-Gomez, C., & Shahan, T. A. (2006). Resurgence of alcohol seeking produced by discontinuing non-drug reinforcement as an animal model of Capítulo III | Ressurgência Comportamental drug relapse. Behavioural Pharmacology, 17, 369-374. Podlesnik, C. A, & Kelley, M. E. (2015). Translational research on the relapse of operant behavior. Revista Mexicana de Análisis de la Conducta, 41, 226-251. Podlesnik, C. A, & Shahan, T. A. (2009). Behavioral momentum and relapse of extinguished operant responding. Learning & Behavior, 37, 357-364. Podlesnik, C. A., & Shahan, T. A. (2010). Extinction, relapse, and behavioral momentum. Behavioural Processes, 84, 400-411. Pontes, T. R. N., & Abreu-Rodrigues, J. (2015). Ressurgência comportamental: Uma revisão. Acta Comportamentalia, 23, 339-353. Quick, S. L., Pyszczynski, A. D., Colston, K. A., & Shahan, T. A. (2011). Loss of alternative non-drug reinforcement induces relapse of cocaine-seeking in rats: Role of dopamine D(1) receptors. Neuropsychopharmacology, 36, 1015–1020. Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307315. Reed, P., & Morgan, T. a. (2007). Resurgence of behavior during extinction depends on previous rate of response. Learning & Beha- vior, 35, 106–114. Reid, R. L. (1958). The role of the reinforcer as a stimulus. British Journal of Psychology, 49, 202-209. Sánchez-Carrasco, L., & Nieto, J. (2005). Resurgence of three-response sequences in rats. Revista Mexicana de Análisis de la Conducta, 31, 215–226. Sidman, M. (1960). Tactics of scientific research: Evaluating experimental data in psychology. Boston: Authors Cooperative, Inc. Skinner, B. F. (2003). Ciência e Comportamento Humano. (J. C. Todorov & R. Azzi, Trad.). São Paulo: Martins Fontes (original publicado em 1953). Skinner, B. F. (1984). An operant analysis of problem solving. Behavioral and Brain Sciences, 7, 583-613. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501–504. St Peter, C. C. (2015). Six reasons why applied behavior analysts should know about resurgence. Revista Mexicana de Análisis de la Conducta, 41, 252–268. Sweeney, M. M., & Shahan, T. A. (2013a). Effects of high, low, and thinning rates of alternative reinforcement on response elimination and resurgence. Journal of the Experimental Analysis of Behavior, 100, 10262 Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira 116. Sweeney, M. M., & Shahan, T. A. (2013b). Behavioral momentum and resurgence : Effects of time in extinction and repeated resurgence tests. Learning & Behavior, 41, 414-424. Volkert, V. M., Lerman, D. C., Call, N. A., & Trosclair-Lasserre, N. (2009). An evaluation of resurgence during treatment with functional communication training. Journal of Applied Behavior Analysis, 42, 145-160. Wilson, K. G., & Hayes, S. C. (1996). Resurgence of derived stimulus relations. Journal of the Experimental Analysis of Behavior, 66, 267-281. Winterbauer, N. E., Lucke, S., & Bouton, M. E. (2013). Some factors modulating the strength of resurgence after extinction of an instrumental behavior. Learning and Motivation, 44, 60-71. 63 João Cláudio Todorov, Rafaela M. Fontes Azevedo Clarice Lispector, tempo e consequências: considerações sobre contraste comportamental João Cláudio Todorov Rafaela M. Fontes Azevedo Universidade de Brasília Reynolds, G. S. (1961). Behavioral contrast. Journal of the Experimental Analysis Behavior, 4, 57-71. “Observo em mim mesma as mudanças de estação: eu claramente mudo com elas” Clarice Lispector 64 Capítulo IV | Contraste Comportamental INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A noção de que o comportamento é selecionado por suas consequências é antiga, anterior a Thorndike (e.g., 1911, 1927). Skinner (1957/1978) inicia seu livro sobre comportamento verbal com uma frase de impacto: “Os homens agem sobre o mundo, modificam-no e, por sua vez são modificados pelas consequências de sua ação” (p.15). Consequências parecem ser a marca registrada da Análise do Comportamento, como demonstram alguns livros recentes (Biglan, 2015; Madden, 2013; McSweeney & Murphy, 2014a; Schneider, 2012). Mas consequências não seguem comportamentos no vácuo. O contexto no qual o comportamento ocorre também é relevante (Skinner, 1953/2003). Skinner (1938) afirmou que, embora a resposta possa ocorrer em diversas situações, apenas em parte dessas situações a sua emissão será efetiva em produzir reforços. Assim, o contexto no qual o comportamento ocorre (i.e., eventos antecedentes ao comportamento) acaba exercendo funções muito importantes por sinalizar quando e quais tipos de consequências estarão disponíveis. Em função disso, o comportamento operante deve ser sempre compreendido a partir da contingência tríplice: Eventos que antecedem o comportamento (estímulos discriminativos), o próprio comportamento, e as consequências que seguem a sua emissão (reforço ou punição; e.g., Skinner, 1938, 1953/2003). Os estímulos discriminativos (SD) podem ser qualquer variável presente no contexto atual do indivíduo. São estímulos que sinalizam a disponibilidade da consequência e dão “dicas” sobre a probabilidade de o comportamento ser ou não reforçado ou punido. Quando determinadas consequências estão disponíveis apenas para respostas emitidas em um determinado contexto (na presença de determinado SD) e quando o indivíduo passa a responder apenas nesse contexto, dizemos que o responder é discriminado (Skinner, 1938). Porém, para sabermos se o responder é discriminado ou não é preciso que haja pelo menos dois contextos correlacionados diferencialmente com a produção da consequência (e.g. contextos diferentes que sinalizam a presença de tipos de consequências diferentes, ou que sinalizam presença vs. ausência de consequências, ou mesmo que sinalizam diferentes relações entre a emissão da resposta e a apresentação do reforço). Ao observarmos mudanças no comportamento do indivíduo em função de mudanças nos estímulos antecedentes poderemos afirmar que há controle discriminativo, isto é, que o comportamento está sob o controle de estímulos (Catania, 1999). Controle discriminativo, portanto, se refere à influência que o contexto exerce sobre o comportamento (Moreira & Medeiros, 2007) e, para estuda-lo é preciso treinar o comportamento em contextos diferentes 65 João Cláudio Todorov, Rafaela M. Fontes Azevedo (na presença de estímulos distintos). Isto é, é preciso expor o indivíduo a situações nas quais a disponibilidade da consequência é diferencialmente correlacionada a diferentes estímulos antecedentes. Por isso, o esquema mais tradicionalmente utilizado para investigar controle discriminativo tem sido o esquema múltiplo. Esquemas de reforçamento ou punição são relações condicionais entre o comportamento dos organismos e eventos no ambiente e são geralmente utilizados como variáveis independentes na Análise do Comportamento (Ferster & Skinner, 1957). Assim, ao estabelecer um esquema de reforçamento se estabelece uma relação “se, então” que indicará quais as condições (e.g. número de respostas, intervalo de tempo necessário entre as respostas, etc.) para a apresentação da consequência. Por exemplo, em um esquema de razão fixa se estabelece um número fixo de respostas que deve ser emitido pelo organismo para que a consequência seja apresentada. Em um esquema de reforçamento, geralmente se estabelece também uma relação condicional com o estímulo antecedente. Assim, a relação entre a resposta e a consequência depende do estímulo antecedente presente no momento: se na situação A o comportamento B ocorrer, então a consequência C será apresentada (Todorov, 2002, 2012). Como indicado anteriormente, um esquema comumente utilizado para demonstrar o controle estabelecido pelos estí66 mulos antecedentes é o esquema múltiplo. Em um esquema múltiplo, dois ou mais esquemas de reforçamento são correlacionados a diferentes estímulos antecedentes. Cada um desses esquemas de reforçamento correlacionados a diferentes estímulos antecedentes compõe o que se chama de componente (Ferster & Skinner, 1957). Em um experimento de laboratório com animais não-humanos podemos ter, por exemplo, um esquema múltiplo com dois componentes: em um sempre há uma luz acesa e a emissão da resposta é sempre seguida por comida e no outro não há luz e a resposta nunca é seguida por comida. Têm-se, assim, dois contextos diferentes (presença vs. ausência de luz) correlacionados com esquemas diferentes (reforço vs. extinção). Pode-se afirmar que o responder é discriminado, nesse exemplo, se o organismo responde mais na presença da luz do que na sua ausência. Embora no treino discriminativo simples seja comum a utilização de alternação de estímulos antecedentes correlacionados a reforço e extinção (e.g. Hanson, 1959; Skinner, 1938; Smith & Hoy, 1954), geralmente os experimentos com esquemas múltiplos utilizam dois ou mais componentes nos quais diferentes esquemas de reforçamento (e.g. razão fixa ou variável, intervalo fixo ou variável) estão em vigor, sendo cada um sinalizado por um estímulo antecedente diferente, porém, correlacionados a tipos semelhantes de consequências (Ferster & Skinner, 1957). Por exemplo, po- Capítulo IV | Contraste Comportamental demos ter um esquema múltiplo com dois componentes programados da seguinte forma: em um componente há sempre um tom e a consequência é produzida a partir de um esquema de razão fixa (a cada X respostas, a comida é apresentada) e no outro componente o tom está sempre ausente e a consequência é produzida a partir de um esquema de intervalo fixo (a comida é apresentada para a primeira resposta emitida após X min). Nesse caso, pode-se afirmar que o responder é discriminado se for observado que a taxa e o padrão de respostas são diferenciados entre os componentes. Uma das utilidades do esquema múltiplo é, então, demonstrar como o comportamento muda em função de mudanças no contexto, dado que as mudanças no contexto sinalizam mudanças nas contingências em vigor. Herrnstein e Brady (1958) afirmaram que o esquema múltiplo pode ser uma boa ferramenta para comparações intrassujeitos dentro de uma mesma sessão em função da independência entre o desempenho nos componentes. Porém, em diversos experimentos (inclusive no experimento de Herrnstein & Brady) tornou-se evidente que os desempenhos entre os componentes podem não ser independentes, isto é, o que ocorre em um dos componentes de um esquema múltiplo pode influenciar o comportamento que ocorre no outro componente. À mudança do comportamento em um contexto (SD) em função de alterações nas condições em vigor em outro contexto (diferente SD) chama-se interação (Reynolds, 1961b). Essa interação entre os componentes do esquema múltiplo pode ser estudada alterando-se as condições em um componente enquanto as condições no outro componente são mantidas constantes. Assim, o objetivo ao se estudar a interação é observar como mudanças nas condições de um contexto afetam o comportamento em outro contexto inalterado. Diversos experimentos foram realizados para investigar essa interação entre componentes (e.g. Findley, 1958, Herrick, Myers & Korotkin, 1959, Reynolds, 1961b, 1961c) e o que se observou é que alterações que diminuem a taxa de respostas em um componente (e.g., extinção) geralmente produzem aumentos na taxa de respostas no componente inalterado. Além disso, alterações que aumentam a taxa de respostas em um componente produzem diminuições na taxa de respostas no componente inalterado. A esse efeito de interação foi dado o nome de contraste comportamental (contraste positivo, no primeiro caso, e contraste negativo no segundo). Assim, contraste comportamental se refere a uma mudança na taxa de respostas na presença de um estímulo que é oposta à mudança na taxa de respostas na presença de outro estímulo (Reynolds, 1961a). Embora o contraste seja um efeito comumente observado durante a formação de uma discriminação entre dois ou mais estímulos (e.g., quando um deles é correlacionado ao reforço e o outro a extinção), 67 João Cláudio Todorov, Rafaela M. Fontes Azevedo o contraste ocorre também em condições em que há reforço programado na presença de ambos os estímulos, porém com variações na taxa de reforços entre eles. Findley (1958), por exemplo, relatou que a taxa de respostas em um componente, um esquema de intervalo variável (VI) 6 min, aumentou quando no outro componente, um VI maior do que 6 min programava uma menor taxa de reforços em relação ao VI 6 min. ços e taxa de respostas pudessem ser experimentalmente isoladas para observar como cada variável influenciava o contraste e assim, poder verificar se o fenômeno era função de mudanças na taxa de reforços ou na taxa de respostas. Reynolds encontrou uma solução relativamente simples e interessante para responder a sua pergunta: Diminuir a taxa de respostas sem alterar a taxa de reforços. Porém, até a década de 1960, o que se observava nos experimentos realizados sobre contraste (e.g. Herrick, et al., 1959; Reynolds, 1961b) era que a taxa de respostas covariava consistentemente com a taxa de reforços (i.e., diminuições na taxa de reforços eram seguidas de diminuições na taxa de respostas e aumentos na taxa de reforços eram seguidos por aumentos na taxa de respostas) e não se sabia dizer qual das duas variáveis era responsável pelo contraste comportamental. Permanecia então a questão: A taxa de respostas no componente inalterado aumenta porque a taxa de respostas do segundo componente diminui ou porque a taxa de reforços do segundo componente diminui? Por isso, em 1961, Reynolds resolveu conduzir um estudo para responder a essa questão. Para isso, Reynolds (1961a) utilizou quatro pombos e uma caixa operante com um disco que poderia ser iluminado por quatro cores diferentes. Durante o experimento, cada pombo era colocado na câmara experimental e respostas de bicar o disco produziam acesso a comida. Reynolds dividiu o seu estudo em quatro procedimentos subdivididos em várias fases. Em cada procedimento havia um esquema múltiplo com dois componentes e, em cada componente, o disco era iluminado por uma cor diferente (SD). Diversos tipos de alterações foram feitas em um dos componentes do múltiplo a fim de verificar quais variações nesse componente levariam a mudanças na taxa de respostas no outro componente, que permanecia inalterado ao longo das fases. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método A proposta de Reynolds (1961a) foi conduzir um estudo no qual taxa de refor68 Em todos os procedimentos, inicialmente, um VI 3 min esteve em vigor em cada componente do múltiplo. Isto é, em média, a primeira resposta após 3 min produzia o reforço. Cada componente ficava em vigor por 3 min e eram apresentados de Capítulo IV | Contraste Comportamental maneira alternada. Em cada sessão, cada componente era apresentado 30 vezes. Os procedimentos variaram em relação às alterações realizadas em um dos componentes, sendo no primeiro sempre mantido um VI 3 min (de agora em diante, chamaremos o componente mantido com o VI 3 min de componente constante e o componente no qual as manipulações foram realizadas de componente alterado). No Procedimento I, para o componente alterado foi programado um timeout em umas das fases (todas as luzes da caixa operante eram apagadas e não havia apresentação de reforço para nenhuma das respostas emitidas) e extinção em outra fase (o estímulo continuava a ser apresentado, porém, não havia apresentação do reforço). No Procedimento II, para o componente alterado, foi programado um esquema de reforçamento diferencial de outros comportamentos (DRO¹) 50 ou 75 s para uma das fases e extinção para outra. A programação do DRO no Procedimento II teve como objetivo garantir que a taxa de respostas diminuísse sem que houvesse uma redução na taxa de reforços, dado que sempre que os pombos não respondessem (por 50 ou 75 s) o reforço seria apresentado. A ordem de mudança para DRO ou extinção, no componente alterado, foi contrabalanceada entre os pombos (i.e., para alguns pombos o Em um DRO, o reforço só é apresentado se o organismo cumprir o intervalo estabelecido sem emitir determinada resposta. No presente experimento, caso o pombo passasse 50 ou 75 s sem bicar o disco a comida era apresentada. 1 componente foi alterado para o DRO e só depois para extinção e para outros pombos a ordem de alteração foi inversa). O Procedimento III foi uma combinação dos dois procedimentos anteriores e a manipulação feita no componente alterado foi uma combinação do timeout com o DRO, ou seja, todas as luzes da caixa experimental eram apagadas e reforços eram produzidos se os pombos não respondessem durante o intervalo do DRO. Um procedimento adicional foi realizado para controlar o efeito do aumento na taxa de reforços sob o DRO e, para isso, ao final da última sessão do Procedimento III, aumentou-se o peso dos animais (i.e., diminuiu-se a privação) e, então, no dia seguinte os animais foram novamente expostos às mesmas condições que haviam sido programadas no Procedimento II, no qual para o componente alterado foi programado um DRO em uma fase, e extinção na fase seguinte. As manipulações realizadas por Reynolds (1961a) possibilitaram a comparação de condições nas quais a diminuição da taxa de respostas estava correlacionada à diminuição na taxa de reforços (i.e., alterando o segundo componente para extinção ou timeout) e condições nas quais a diminuição da taxa de respostas não estava correlacionada à diminuição na taxa de reforços (i.e., alterando o segundo componente para um DRO). Dessa forma, foi possível isolar experimentalmente os efeitos da taxa de respostas e da taxa de reforços sobre o contraste comportamental. Se o contraste 69 João Cláudio Todorov, Rafaela M. Fontes Azevedo dependesse de variações apenas na taxa de respostas, em todas as condições o contraste deveria ocorrer, já que em todas haveria uma redução da taxa de resposta no componente alterado. Porém, se é a alteração na taxa de reforços a variável relevante, então, o contraste só deveria ocorrer nas condições nas quais houvesse variação da taxa de reforços no componente alterado (i.e., nas condições em que foram programados timeout ou extinção) e não deveria ocorrer nas condições em que o DRO estava em vigor (i.e., a taxa de reforços nessa condição não era alterada). Portanto, se a taxa de respostas no componente constante aumentasse quando mudanças fossem feitas no componente alterado em todas as condições, a taxa de respostas poderia ser entendida como variável mais relevante. No entanto, se a taxa de respostas do componente constante só variasse nas condições em que houve mudanças na taxa de reforços no componente alterado, então a taxa de reforços seria a principal variável determinante do contraste. Resultados e Discussão Os resultados indicaram que alterações na taxa de reforços, e não na taxa de respostas, em um dos componentes do múltiplo é a variável que determina o contraste comportamental (Reynolds, 1961a). Tanto timeout quanto extinção no componente alterado produziram aumentos na taxa de respostas do componente constante. Porém, quando o DRO estava em vigor no 70 componente alterado, combinado ou não com timeout, aumentos na taxa de respostas do componente constante (independente do peso corporal dos pombos) não foram observados. De maneira geral, o contraste foi observado nas condições onde não havia reforços em um componente (timeout e extinção), mas não foi observado quando havia reforço disponível nesse componente, embora a taxa de respostas durante o componente alterado tenha diminuído em todas as condições. Reynolds (1961a) propôs duas explicações para a não ocorrência do contraste nas condições em que um DRO estava em vigor no componente alterado. Uma explicação é que o contraste pode não ter acontecido porque, sob o DRO, pausas (i.e., não bicar o disco) foram reforçadas e isso pode ter induzido a ocorrência de pausas também no componente constante, em que o VI 3 min continuava em vigor. Uma outra explicação é que o contraste poderia não ter ocorrido porque a diminuição na taxa de reforços, e não de respostas, é a condição necessária para a ocorrência do contraste e, dessa forma, o DRO eliminou este efeito uma vez que não houve redução na taxa de reforços sob esse esquema, como indicado anteriormente. Como o aumento da taxa de respostas foi imediato no componente constante (VI 3 min) quando o DRO foi suspenso no componente alterado (i.e., quando extinção estava em vigor nesse componente), Rey- Capítulo IV | Contraste Comportamental nolds (1961a) afirmou que a taxa de reforços é a variável mais relevante para a ocorrência do contraste. Para Reynolds, é a alteração na frequência relativa de reforços (i.e., a frequência de reforços na presença de um estímulo em relação à frequência de reforços na presença de ambos os estímulos) que causa as alterações na taxa de respostas que descrevemos como contraste. DESDOBRAMENTOS O experimento de Reynolds (1961a) sugere que as consequências que são programadas em um contexto afetam não só o que fazemos naquele contexto, mas também o que fazemos em outros contextos. Portanto, o que um organismo faz em uma situação depende não só das consequências disponíveis naquela situação, mas também das consequências disponíveis em situações diferentes (ver também Herrnstein, 1961, 1970). Assim, para que seja possível compreender o que um indivíduo faz em um determinado contexto muitas vezes será preciso observar também o que ele faz em outras situações e que tipos de consequências ele tem disponível de uma maneira geral e não apenas em uma determinada ocasião. É preciso, então, adotar uma perspectiva relativa e entender que a função de um estímulo pode ser não só a de sinalizar as consequências disponíveis naquele contexto, mas as consequências disponíveis naquele contexto em relação a todos os outros. A partir da pesquisa de Reynolds (1961a) muitas outras investigações foram realizadas a fim de verificar o efeito da taxa de reforços sobre a ocorrência e a magnitude do contraste, principalmente com o objetivo de responder se a taxa de reforços seria a única variável responsável pela ocorrência do contraste, se seria a variável principal, e que outras variáveis e explicações seriam possíveis. Experimentos manipulando diversos tipos de esquemas em um dos componentes, para produzir diferentes taxas de respostas sem alterar as taxas de reforços entre os componentes foram realizados, corroborando a ideia de que a taxa de reforços é realmente mais relevante do que a taxa de respostas na determinação do contraste (e.g. Bloomfield, 1967; Nevin, 1968; Reynolds, 1961d; Zuriff, 1970). Dado, então, que a taxa relativa de reforços é uma variável relevante para a ocorrência do contraste, também foram estabelecidas relações entre contraste e a Lei da Igualação (e.g. McLean & White, 1983; Williams & Wixted, 1986). A Lei da Igualação prediz que em situações de escolha (i.e. esquemas concorrentes, nos quais os dois componentes são apresentados simultaneamente e o organismo deve escolher responder em ou outro componente) a taxa de respostas se igualará à taxa de reforços disponíveis. Assim, situações de escolha caracteriza71 João Cláudio Todorov, Rafaela M. Fontes Azevedo riam o caso mais evidente de interação, já que a maneira como eu me comporto em relação a uma das opções necessariamente afetará o meu comportamento em relação à outra opção, dado que ambas as respostas não podem ser emitidas ao mesmo tempo. Assim como a distribuição de respostas em esquemas concorrentes é função da distribuição dos reforços entre os componentes, essa interação também parece ocorrer mesmo quando as opções são apresentadas de maneira sucessiva, e não simultânea, como é o caso dos procedimentos para o estudo do contraste (i.e., esquemas múltiplos). Em ambos os casos, então, temos evidencia de como a distribuição de reforços pode afetar a distribuição das respostas. Outra variável que parece afetar a ocorrência do contraste é a duração dos componentes, e muitos estudos foram conduzidos a fim de se investigar essa relação. De maneira geral, observa-se que a magnitude do contraste é maior quanto menor for a duração do componente (e.g. Charman & Davison, 1982; Hinson, Malone, McNally & Rowe, 1978; Shimp & Wheatley, 1971; Todorov, 1972). O estudo de Reynolds (1961a) foi um primeiro passo para uma compreensão mais precisa sobre a ocorrência do contraste, pois foi o primeiro a isolar os efeitos de taxa de respostas e de reforços. Embora seus resultados tenham indicado a taxa relativa de reforços como a principal variável responsável pela ocorrência do con72 traste, desde então diversas investigações tem sido conduzidas a fim de se chegar a um entendimento mais claro e a uma descrição mais acurada desse fenômeno (ver Freeman, 1971; e Williams, 1983). CONSIDERAÇÕES FINAIS A conclusão de que é alteração da taxa de reforços que produz a ocorrência do contraste, entretanto, deve ser considerada com cautela. Reynolds e Limpo (1968), por exemplo, conduziram um experimento utilizando um esquema de reforçamento diferencial de taxas baixas (DRL) e observaram que a taxa de respostas do componente constante aumenta, apesar da taxa relativa de reforços diminuir em relação à linha de base. Embora alterações na taxa relativa de reforços pareçam estar diretamente relacionadas à ocorrência do contraste, sendo replicada em diversos trabalhos (e.g. Catania, 1961; Reynolds, 1963; Wilton & Gay, 1969), essa pode não ser a única variável de controle (e.g. Davison & Ferguson, 1978; Wilkie 1977; Williams, 1980). O mais importante a ser considerado na literatura sobre contraste e sobre o trabalho de Reynolds (1961a), especificamente, é o papel que outros contextos (passados e futuros) exercem sobre o que acontece no momento atual. Trabalhos publicados nos anos 1960 e 1970 foram decisivos para determinar o Capítulo IV | Contraste Comportamental progresso da Análise do Comportamento nessa questão, destacando a função do contexto na determinação do comportamento e demonstrando que diversos aspectos do contexto exercem controle sobre o comportamento dos organismos. Esses diversos aspectos devem, então, ser considerados ao se analisar o que um organismo faz agora e por quê faz. Para compreender o comportamento atual de um organismo é preciso levar em conta que seu comportamento é influenciado não só pela contingência a qual está exposto, mas também pelo que mais está acontecendo no ambiente naquele momento, ou seja, todas as demais contingências disponíveis que concorrem simultaneamente. Assim, para entender o que o indivíduo faz precisamos analisar todas as outras opções do que ele poderia estar fazendo e todas as consequências programadas para esses comportamentos concorrentes (Herrnstein, 1961, 1970). O comportamento atual pode ser influenciado ainda por sinais do que vai acontecer no futuro muito próximo (Reynolds, 1961a, 1961b, 1961c; Reynolds & Limpo, 1968) e também do que já ocorreu no passado, e assim, a ordem de ocorrência dos eventos (o que o indivíduo acabou de fazer e o que ele vai fazer em seguida) pode controlar também o seu comportamento atual (e.g. Catania & Gill, 1964; Nevin & Shettleworth, 1966; Terrace, 1966a). Dessa forma, ao analisarmos o papel do contexto é preciso compreendê-lo de modo amplo e dinâmico, tendo em vista circunstâncias e variáveis passadas, presentes e futuras que podem atuar no controle do comportamento atual de um organismo. Essa noção de interação entre diferentes contextos pode ser especialmente relevante no contexto aplicado e principalmente no tratamento de comportamentos problema. Gross e Drabman (1981) fizeram uma revisão de estudos sobre contraste comportamental realizados com humanos que demonstram a ocorrência do fenômeno. Uma das evidências que se tem é de que, embora alguns tratamentos sejam eficazes em reduzir o comportamento problema em determinados contextos, esse mesmo comportamento pode aumentar de frequência em outros contextos não correlacionados ao tratamento (e.g. redução de comportamentos inapropriados em casa, mas aumento desses mesmos comportamentos na escola), caracterizando assim um efeito de contraste comportamental. Então, ao se pensar em intervenções comportamentais é preciso sempre lembrar que os contextos não podem ser compreendidos de maneira isolada e que alterações em um contexto podem acarretar mudanças comportamentais em outros contextos aparentemente não correlacionados. PARA SABER MAIS Terrace (1966b). Investigou se o uso de um treino de discriminação mais extenso e utilizando um procedimento de aprendizagem 73 João Cláudio Todorov, Rafaela M. Fontes Azevedo sem erros pode eliminar o contraste comportamental. in two multiple schedules. Journal of the Experimental Analysis of Behavior, 10, 151158. Henke, Allen, & Davison (1972). Investigaram a função da amídala cerebelosa na ocorrência de contraste, demonstrando diferenças entre ratos com a região lesionada e ratos sem lesões na região. Catania, A. C. (1961). Behavioral contrast in a multiple and concurrent schedule of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 335-342. Koegel, Egel, & Williams (1980). Examinaram a ocorrência de contraste em intervenções comportamentais com crianças com diagnóstico de autismo. Catania, C.A. (1999). Aprendizagem: comportamento, linguagem e cognição. (Trad. Deisy das Graça de Souza). Porto Alegre: Artmed. Killeen (2014). Propôs uma nova teoria explicativa para a ocorrência do contraste. Catania, A. C., & Gill, C. A. (1964). Inhibition and behavioral contrast. Psychonomic Science, 1, 257-258. Boyle (2015). Realizou uma investigação translacional sobre contraste comportamental, avaliando a influência da ordem dos contextos e de efeitos intrassessão em adultos com deficiência intelectual. REFERÊNCIAS Biglan, A. (2015). The nurture effect. Oakland, CA: New Harbinger Publications. Boyle, M. A. (2015). A Translational Investigation of Positive and Negative Behavioral Contrast (Tese de Doutorado). Utah State University, Logan. Retirada de All Graduate Theses and Dissertations. (Paper 4234). Bloomfield, T. M. (1967). Behavioral contrast and relative reinforcement frequency 74 Charman, L., & Davison, M. (1982). On the effects of component durations and component reinforcement rates in multiple schedules. Journal of the Experimental Analysis of Behavior, 37, 417–439. Davison, M., & Ferguson, A. (1978). The effects of different component response requirements in multiple and concurrent schedules. Journal of the Experimental Analysis of Behavior, 29, 283–295. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, Capítulo IV | Contraste Comportamental 123-144. Gross, A. M., & Drabman, R. S. (1981). Behavioral contrast and behavioral therapy. Behavior Therapy, 12, 231-246. Hanson, H. M. (1959). Effects of discrimination training on stimulus generalization. Journal of Experimental Psychology, 58, 321-334. Henke, P. G., Allen, J. D., & Davison, C. (1972). Effect of lesions in the amygdala on behavioral contrast. Physiology and Behavior, 8,173-176. Herrick R. M., Myers J. L., & Korotkin A. L. (1959). Changes in Sd and Sdelta rates during the development of an operant discrimination. Journal of Comparative and Physiological Psychology, 52, 359–363. Herrnstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267-272. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243–266. Herrnstein, R. J., & Brady, J. V. (1958). Interactions among components of a multiple schedule. Journal of Experimental Analysis of Behavior, 1, 293-301. Hinson, J. M., Malone, J. C., McNally, K. A., & Rowe, D. W. (1978). Effects of component length and of the transitions among components in multiple schedules. Journal of the Experimental Analysis of Behavior, 29, 3-16. Killeen, P. R. (2014). A theory of behavioral contrast. Journal of the Experimental Analysis of Behavior, 102, 363-390. Koegel, R. L., Egel, A. L., & Williams, J. A. (1980). Behavioral contrast and generalization across settings in the treatment of autistic children. Journal of Experimental Child Psychology, 30, 422-437. Madden, G. J. (2013). APA handbook of behavior analysis. Washington, DC: American Psychological Association. McLean, A. P., & White, K. G. (1983). Temporal constraint on choice: Sensitivity and bias in multiple schedules. Journal of the Experimental Analysis of Behavior, 39, 405426. McSweeney, F. K., & Murphy, E. S. (Eds.). (2014). The Wiley-Blackwell handbook of operant and classical conditioning. Oxford: John Wiley & Sons. Moreira, M. B., & Medeiros, C. A. (2007). Princípios Básicos de Análise do Comportamento. Porto Alegre: Artmed. Nevin, J. A. (1968). Differential reinforcement and stimulus control of not respon75 João Cláudio Todorov, Rafaela M. Fontes Azevedo ding. Journal of the Experimental Analysis of Behavior, 11, 715-726. Schneider, S. C. (2012). The science of consequences. New York: Prometheus Books. Nevin, J. A., & Shettleworth, S. J. (1966). An analysis of contrast effects in multiple schedules. Journal of the Experimental Analysis of Behavior, 9, 305-315. Shimp, C. P., & Wheatley, K. L. (1971). Matching to relative reinforcement frequency in multiple schedules with a short component duration. Journal of the Experimental Analysis of Behavior, 15, 205-210. Reynolds, G. S. (1961a). Behavioral contrast. Journal of the Experimental Analysis Behavior, 4, 57-71. Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York: Appleton-Century-Crofts. Reynolds, G. S. (1961b). An analysis of interactions in a multiple schedule. Journal of the Experimental Analysis of Behavior, 4, 107-117. Skinner, B. F. (1978). O comportamento verbal. São Paulo: Cultrix (Obra original publicada em 1957). Reynolds, G. S. (1961c). Contrast, generalization and the process of discrimination. Journal of the Experimental Analysis of Behavior, 4, 289-294. Skinner, B. F. (2003). Ciência e comportamento humano (11ª ed.). (Trad. de J. C. Todorov e R. Azzi). São Paulo: Martins Fontes. (Obra original publicada em 1953). Reynolds, G. S. (1961d). Relativity of response rate and reinforcement frequency in a multiple schedule. Journal of the Experimental Analysis of Behavior, 4, 179-184. Smith, M. H., & Hoy, W. J. (1954). Rate of response during operant discrimination. Journal of Experimental Psychology, 48, 259–264. Reynolds, G. S. (1963). Some limitations on behavioral contrast and induction during successive discrimination. Journal of the Experimental Analysis of Behavior, 6, 131139. Terrace, H. S. (1966a). Stimulus control. In W. K. Honing (Ed.). Operant behavior: Areas of research and application. New York: Appleton-Century-Crofts. Reynolds, G. S., & Limpo, A. J. (1968). On some causes of behavioral contrast. Journal of the Experimental Analysis of Behavior, 11, 543-547. 76 Terrace, H. S. (1966b). Behavioral contrast and the peak shift: Effects of extended discrimination training. Journal of the Experimental Analysis of Behavior, 9, 613-617. Capítulo IV | Contraste Comportamental Thorndike, E. L. (1911). Animal intelligence. New York: Macmillan. the Experimental Analysis of Behavior, 45, 47-62. Thorndike, E. L. (1927). The law of effect. The American Journal of Psychology, 39, 212-222. Wilton, R. N., & Gay, R. A. (1969). Behavioral contrast in one component of a multiple schedule as a function of the reinforcement conditions operating in the following component. Journal of the Experimental Analysis of Behavior, 12, 239-246. Todorov, J. C. (1972). Component duration and relative response rates in multiple schedules. Journal of the Experimental Analysis of Behavior, 17, 45-49. Todorov, J. C. (2002). A evolução do conceito de operante. Psicologia: Teoria e Pesquisa, 18, 123-127. Zuriff, G. E. (1970). A comparison of variable-ratio and variable-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 13, 369-374. Todorov, J. C, (2012). Metacontingências e a análise comportamental de práticas culturais. Clínica e Cultura, 1, 36-45. Wilkie, D. M. (1977). Behavioral contrast produced by a signaled decrease in local rate of reinforcement. Learning and Motivation, 8, 182-193. Williams, B. A. (1980). Contrast, signaled reinforcement, and the relative law of effect. American Journal of Psychology, 93, 617-629. Williams, B. A. (1983). Another look at contrast in multiple schedules. Journal of the Experimental Analysis of Behavior, 39, 345284. Williams, B. A., & Wixted, J. T. (1986). An equation for behavioral contrast. Journal of 77 Cristiano Coelho Da frequência absoluta à frequência relativa como unidade de análise do comportamento Cristiano Coelho Pontifícia Universidade Católica de Goiás Herrnstein, R. J. (1961). Relative and Absolute Strength of Response as a Function of Frequency of Reinforcement. Journal of the Experimental Analysis of Behavior, 4(3), 267-272. “Você não veio aqui para fazer a escolha. Você já a fez. Você está aqui para tentar entender porque fez essa escolha” O Oráculo (The Matrix Reloaded, Irmãos Wachowski) 78 Capítulo V | Escolha INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Skinner (1950) deu os primeiros passos para uma compreensão do estudo do comportamento de escolha na Análise do Comportamento ao propor que responder a um dentre dois estímulos é escolha, não o resultado desta escolha (como propõe o senso comum). Já preferência seria uma medida do número de respostas em uma alternativa em relação à outra, relacionando-se à alternação de respostas a cada estímulo disponível. Dessa forma, em vez de tomar a escolha como um processo inferido pré-comportamental, visão característica de concepções que baseavam suas explicações em processos mentais vigentes à época, Skinner focou na a emissão de respostas como a escolha em si. Com isso, caracterizou-a como um padrão comportamental mais amplo, relacionado a outras variáveis que não os supostos processos decisórios internos. Podemos dizer que bicar um dentre dois discos disponíveis, estudar em vez de ir para a festa na véspera da prova ou dizer “te amo” quando solicitado pela namorada em vez de dizer que quer terminar, seriam as escolhas e não os produtos da escolha. Adicionalmente, bicar mais vezes um disco que outro, ir mais vezes à balada que estudar na véspera da prova e dizer mais “te amo” ilustrariam as preferências por cada uma dessas alternativas, e estariam rela- cionadas às suas respectivas consequências. Essa formulação apresentou avanços na compreensão do controle do comportamento operante, mas ainda se concentrou na consequenciação direta de cada resposta independentemente das consequências para respostas alternativas. No exemplo do pombo acima, as respostas a cada disco eram vistas como influenciadas apenas por seus próprios reforços, sem uma influência direta pelos reforços disponíveis para outras alternativas. Isso teria como implicação que, ao aumentar a frequência de reforços em um dos discos, a taxa absoluta de respostas a esse disco aumentaria, sem interferir na taxa de respostas ao outro disco. Mesmo assim, Skinner antecipou a noção de igualação ao obter uma proporcionalidade nas taxas absolutas de respostas entre dois esquemas, conforme suas respectivas taxas absolutas de reforços. Condições que envolviam essas situações foram exploradas de forma sistemática posteriormente por Ferster e Skinner (1957) em experimentos sobre o comportamento em esquemas concorrentes, nos quais dois (ou mais) esquemas de reforçamento permanecem em vigor simultaneamente para diferentes respostas incompatíveis de serem emitidas ao mesmo tempo. Em arranjos experimentais de esquemas concorrentes, cada esquema é vinculado a diferentes operandos que diferem com relação à posição (como dois discos ou duas barras), cor ou outra propriedade, e permitem a mensuração das taxas e distribuições 79 Cristiano Coelho das diferentes respostas ao longo do tempo. Podemos ter dois discos em uma parede da caixa experimental dispostos lado a lado, cada um iluminado por uma cor; respostas a um dos discos podem ser reforçadas intermitentemente a cada 30 segundos e respostas ao outro disco podem ser reforçadas a cada 60 segundos, por exemplo, e as duas respostas não podem ser emitidas ao mesmo tempo. Esse procedimento, que passou a ser o padrão no estudo de escolha, capta a noção básica de Skinner (1950). Os estudos anteriores a Herrnstein (1961) concentraram-se nas análises da suspensão dessas consequências sobre respostas concorrentes e dos efeitos de consequências, que mostravam regularidades nos padrões e distribuição de respostas: Ferster e Skinner (1957) investigaram sistematicamente em várias condições que as respostas em esquemas concorrentes com dois operandos localmente separados apresentavam os mesmos padrões obtidos em esquemas simples; Findley (1958) estendeu esses achados para situações experimentais com os dois esquemas associados ao mesmo operando, sinalizado por cores diferentes de acordo com o esquema no qual o pombo respondia, e as cores e o respectivo esquema modificados quando o pombo emitia uma resposta em um disco de mudança. De acordo com Davison (2012), estes trabalhos iniciais estavam preocupados em descrever essas regularidades em vez de se aprofundarem em medidas quantitativas. A busca por descrições quantitativas 80 começou a se desenvolver com Herrnstein (1958) ao propor que devido às respostas em esquemas concorrentes serem incompatíveis, haveria “a possibilidade de estudar escolha como um processo comportamental” (p. 35). De acordo com ele, porém, o desenvolvimento da área carecia de dados que explicitassem como a disponibilização de consequências para respostas incompatíveis levaria à semelhança na proporcionalidade entre os reforços obtidos e respostas emitidas nas duas alternativas que os dados sugeriam, isto é, como uma alternativa com uma frequência de reforços duas vezes maior que a outra levava a um responder duas vezes maior naquela alternativa. Herrnstein (1958) obteve dados de distribuição de respostas entre dois esquemas concorrentes de razão fixa (FR), com três pombos. Nesse experimento, de um total de 40 respostas a serem emitidas para cada reforço, foi manipulado o número de respostas necessárias em cada disco para a liberação do reforço em diferentes condições. A proporção de respostas nas alternativas se aproximou das proporções programadas pelos esquemas de razão, mas a proporção de reforços obtidos variou de maneira irregular quando a obtenção do reforço dependida da emissão de uma resposta no esquema alternativo após serem emitidas as respostas definidas no outro esquema. Ao controlar sistematicamente a distribuição de reforços, Herrnstein obteve proporções de respostas semelhantes à de reforços obtidos. Apesar da noção de esco- Capítulo V | Escolha lha como comportamento não estar particularmente traçada naquele trabalho, estava aberta a porta para o desenvolvimento de um modelo quantitativo do estudo do comportamento de escolha a partir da noção de igualação. Um dos grandes diferenciais de Herrnstein (1961) foi investigar essas relações de maneira sistemática, fornecendo sustentação empírica para a análise dos efeitos da frequência relativa de reforços sobre a distribuição de respostas. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo do trabalho de Herrnstein (1961) foi estudar de forma paramétrica e descrever quantitativamente o efeito da frequência relativa de reforços em esquemas concorrentes sobre as taxas de respostas em cada componente do esquema e as taxas relativas entre os dois esquemas. Em um estudo paramétrico, a variável independente (e.g., frequência relativa de reforços) é manipulada em diferentes valores permitindo que sejam obtidas diversas medidas da variável dependente (e.g., frequência relativa de respostas), possibilitando o acesso a uma maior amplitude da relação funcional, ou seja, como a variável dependente se modifica com diversos valores da variável independente. Para tanto, três pombos foram mantidos a 80% de seus pesos com acesso livre a alimento. O experimento foi realizado em uma caixa de condicionamento operante com dois discos de respostas lo- calizados em uma das paredes da caixa. Os discos podiam ser iluminados com as cores vermelho (A - disco da esquerda) e branco (B - disco da direita) e ficavam a uma mesma distância do comedouro, que ficava centralizado na mesma parede dos discos. O experimento iniciou-se com um treino preliminar em duas sessões que terminavam após 60 reforços, no qual eram reforçadas respostas no disco diferente daquele para o qual havia sido disponibilizado o último reforço, de acordo com um esquema concorrente de reforço contínuo (CONC CRF - CRF). Este treino visou garantir uma distribuição de respostas similar e a alternância entre os dois discos, de forma a garantir um mesmo contato com as alternativas concorrentes em vigor. Posteriormente, Herrnstein (1961) programou reforços para duas respostas disponibilizados independentemente de acordo com esquemas de reforço de intervalo variável (CONC VI - VI), nos quais a liberação de reforços em um esquema não interferia na liberação de reforços da outra alternativa. O uso de esquemas de intervalo variável, nos quais o reforço é disponibilizado para a primeira resposta após a passagem de um tempo que varia em torno de uma média, justificou-se por ser um esquema que, ao ser modificado, leva a consistentes alterações na taxa de respostas. Os dois esquemas vigoravam ao mesmo tempo, sem interferência entre si, e os intervalos programados para cada um deles vigoravam mesmo quando o pombo respondia no outro esquema, porém um 81 Cristiano Coelho reforço disponível em um dos esquemas só era liberado quando o sujeito respondia nesse esquema. Assim, em um dado momento poderia haver reforço disponível em ambos os esquemas, em apenas um deles ou em nenhum dos dois. Herrnstein (1961) utilizou dois pares de esquemas que em conjunto programavam um reforço a cada 1,5 minutos em todas as condições. Este controle experimental foi importante para garantir que as medidas de respostas se relacionassem às frequências relativas de reforços dos dois esquemas e não a possíveis diferenças nas taxas totais de reforços entre as condições. Em seu trabalho, os valores dos VIs foram: VI 3 min – VI 3 min; VI 2,25 min – VI 4,5 min; VI 1,8 min – VI 9 min; e VI 1,5 min – Extinção. Esses pares de esquemas foram alternados entre os dois discos (A e B), de forma que havia condições em que o disco A ora tinha VIs menores (maior frequência de reforços), ora VIs maiores (menor frequência de reforços) que o disco B, além da condição VI 3 min – VI 3 min, em que foi programada uma mesma frequência de reforços para os dois discos. Os sujeitos foram expostos a todas essas condições e em ordens diferentes, visando reduzir efeitos derivados da ordem de exposição. É importante ressaltar que cada condição foi realizada por um número de sessões até que a emissão de respostas se estabilizasse ao longo de cinco sessões; só então uma nova condição era iniciada. Herrnstein (1961) usou, em algumas 82 condições, um procedimento que evitava que respostas de alternar entre os dois esquemas fossem reforçadas acidentalmente, o atraso para respostas de mudança (changeover delay, COD). Como ele funciona? Sem o COD, quando o pombo estivesse bicando em um disco e houvesse reforço disponível para respostas no disco alternativo, a primeira resposta nesse disco alternativo seria reforçada. Isso pode reforçar não respostas a um disco específico, mas o padrão de alternação entre os discos (i.e., responder em um disco e responder no outro e, assim, sucessivamente) independente das modificações na taxa relativa de reforços. O COD tem como função evitar que isso aconteça. Vamos supor que em um determinado momento houvesse reforço disponível para respostas no disco B e o pombo estivesse respondendo no disco A. Ao alternar para o disco B e obter o reforço disponível nesse disco, ele precisaria permanecer respondendo no disco B pelo menos pelo tempo definido no COD (que foi de 1,5 s. no experimento) para que um reforço fosse liberado. Resultados e discussão Herrnstein (1961) registrou o número de reforços obtidos e respostas emitidas em cada disco, para cada condição. Esses dados possibilitaram diversas análises sobre os efeitos das alterações na frequência de reforços sobre a regularidade e, principalmente (no caso de Herrnstein), a aspectos quantitativos do comportamento. Mais especificamente, se o aumento na taxa de Capítulo V | Escolha reforço de uma alternativa e a consequente redução na taxa de reforço para a outra alternativa levariam a aumentos (e reduções) nas taxas de respostas, bem como a extensão dessas alterações em função dos esquemas do par concorrente. Para isso, em cada condição, além das frequências absolutas de reforços e respostas em cada um dos discos A e B, foram calculadas a frequência relativa de reforços obtidos (proporcionalmente o número de reforços obtidos no disco A em relação ao total de reforços obtidos nos dois discos, A e B) e a porcentagem de respostas emitidas (total de respostas emitidas no disco A dividido pelo total de respostas emitidas nos discos A e B), considerando as cinco sessões finais, com o comportamento estável. Como a frequência relativa de reforços variou entre as condições, esses cálculos possibilitaram verificar como se alteraria a distribuição de respostas entre os dois discos. De maneira direta, Herrnstein investigou se a proporção de respostas se igualaria à frequência relativa de reforços, descrita pela equação: (1), na qual R e r são número de respostas e reforços, respectivamente, e 1 e 2 correspondem às alternativas. Essa equação expressa que as respostas na alternativa 1 divididas pelo total de respostas nas duas alternativas (1 e 2) tendem a igualar o total de reforços obtidos na alternativa 1 divididos pelo total de reforços obtidos nas duas alternativas¹. As porcentagens de respostas se aproximaram da porcentagem de reforços obtidos nas respectivas condições, ou seja, a frequência relativa de respostas tendeu a igualar a frequência relativa de reforços, nas condições em que se utilizou o COD (que reduziu a taxa de alternação e, consequentemente, aumentou o controle pelas contingências de cada esquema) e os desvios de uma igualação perfeita não apresentaram tendência sistemática da previsão teórica de igualação. Este achado submeteu pela primeira vez a teste quantitativo a noção de distribuição de respostas como função da distribuição de reforços baseada no princípio de que a alteração na frequência de reforços de uma fonte influencia as respostas sob controle de outra fonte de reforços. Essa influência relaciona-se a outro achado fundamental obtido por Herrnstein (1961) e que se constitui um dos pressupostos para a relação de igualação: a taxa de respostas apresentou uma relação linear (crescente e contínua) com a taxa de reforços obtidos em cada alternativa e que as taxas de respostas nos dois discos foram semelhantes na condição CONC VI 3 min - VI 3 min, quando foi programada a mesma taxa de reforço nos dois discos. Assim, o total de respostas nos dois discos em cada condição ficou constante ou apresentou pequenas variações assistemáticas. E por que essas Em seu trabalho, Herrnstein (1961) utilizou P (para bicadas - pecking) em vez de R e E (para comer – eating) em vez de r. No presente trabalho, a escolha de nomenclatura diferente do trabalho original deriva do fato de ter se tornado uma das mais usadas na área. 1 83 Cristiano Coelho variações são compatíveis com o princípio de igualação? O aumento linear nas taxas de respostas com o aumento da frequência absoluta de reforços foi descrito a partir da relação p = ke, sendo p a frequência de bicadas (respostas), e a frequência de comer (reforços) e k uma constante, compatível com a noção de fortalecimento da resposta proposta por Skinner (1938, p.130, citado por Herrnstein, 1961, p. 270) de que há uma constância entre a quantidade de reforços obtidos e respostas emitidas em extinção. Apesar de Skinner posteriormente abandonar a noção de constância entre essas medidas, a equação continuou como uma proposta de fortalecimento de respostas baseada em um crescimento linear até atingir o máximo de respostas possíveis. Para Herrnstein (1961), essa relação seria a única compatível com a igualação. E por que isso é tão importante para apreciarmos os resultados de Herrnstein? Porque ao ser aplicado a esquemas concorrentes, envolve um pressuposto fundamental: de que há um limite máximo de emissão de respostas e, assim, o aumento na taxa de uma resposta (conforme o aumento na taxa de reforço) é necessariamente acompanhado pela redução nas demais respostas. Ao revermos a descrição dos dados de taxas de respostas acima, quando os dois esquemas eram iguais (VI 3 min – VI 3 min) as taxas de respostas se assemelharam e, para cada um dos demais esquemas com VIs diferentes, os pombos responderam no VI com maior frequência de reforço e a soma das respostas nos dois esquemas permaneceram constantes, ou 84 sem alterações sistemáticas entre diferentes condições. DESDOBRAMENTOS A importância do experimento de Herrnstein (1961) foi exatamente estabelecer um procedimento no qual era possível se relacionar medidas quantitativas de frequências absolutas e relativas de respostas a dois discos à frequência relativa de reforços. A relação de igualdade entre as frequências relativas de reforços e as frequências relativas de respostas expressa na Equação 1 foi então o primeiro grande passo para a chamada “Lei da Igualação” (Herrnstein, 1970), que expressa, em linhas gerais, que a distribuição de respostas entre alternativas tende a igualar a distribuição de reforços obtidos nas respectivas alternativas. Além disso, dela deriva a ideia de que quando essa distribuição de reforços é alterada em alguma direção, a distribuição de respostas tenderá a se alterar na mesma medida. Assim, se duas fontes de reforços fornecem a mesma frequência de reforços, as respostas tenderão a se distribuir em torno de 50% para cada alternativa; se uma das fontes passa a fornecer uma frequência quatro vezes maior que a outra, de forma que 80% dos reforços passam a ser obtidos nessa fonte, a Lei da Igualação prevê que o organismo passará a emitir em torno de quatro vezes mais respostas nessa alternativa, conforme previsto na igualação perfeita (ou estrita) de Herrnstein (Equação 1). Capítulo V | Escolha Os trabalhos que se iniciaram com o experimento de Herrnstein (1961) passaram a fornecer dados sistemáticos que foram gradativamente demonstrando que um comportamento é influenciado não apenas por suas consequências, mas também pelos reforços disponíveis no ambiente para respostas alternativas e culminaram na concepção de que escolha é comportamento e todo comportamento envolve escolha² (Herrnstein, 1970). Dois pressupostos quantitativos básicos propostos por Herrnstein (1970), em decorrência dos dados que passaram a ser sistematizados em Herrnstein (1961), relacionavam as respostas e os reforços disponíveis para diferentes respostas em uma dada situação (Baum, 2010; Davison, 2012; De Villiers & Herrnstein, 1976). Primeiramente, considerando-se o conjunto de respostas nesta dada situação, há um máximo de respostas incompatíveis possíveis de serem emitidas (k) que se mantém constante nessa situação. O outro pressupõe que esse total de respostas é alocado entre diferentes fontes reforçadoras conforme suas respectivas proporções de reforços. Contudo, Herrnstein (1961) considerava que o auA sugestão inicial de Herrnstein levou a questionamentos acerca de sua amplitude, por ser inicialmente entendida como relacionada a comportamentos operantes e respondentes e por se questionar a sua aplicabilidade em situações nas quais a escolha é “praticamente” nula, como, por exemplo, uma pessoa sendo ameaçada com uma arma para abrir seu cofre. Com relação ao primeiro, os relatos encontrados restringem-se a comportamento operante. Quanto ao segundo, a situação envolveria uma altíssima magnitude de reforço (negativo, no caso) para a resposta de ceder à ameaça, em contraposição a uma ínfima magnitude para rebater as ameaças, de forma que a resposta (muito) mais provável estaria sob controle das magnitudes relativas de ambas as respostas. Dessa forma, a menção a respostas no presente texto será referente a operantes. 2 mento linear das taxas de respostas deveria ser obtido com o aumento das taxas absolutas de reforços também em situações que investigavam respostas em esquemas simples. Ao se deparar com dados que contrariaram essa suposição (e.g. Catania & Reynolds, 1968) e mostravam que o aumento da taxa de respostas com o aumento da taxa de reforços caracterizava-se por unidades cada vez menores (quanto mais reforços por minuto eram providos, menor o aumento na taxa de respostas), Herrnstein (1970) ponderou que mesmo em um esquema simples outras fontes de reforço (mesmo não controladas pelo experimentador) estariam em vigor, concorrendo com o esquema programado pelo experimentador. Em termos matemáticos, essa relação pode ser aplicada a uma única resposta R1 reforçada com uma frequência absoluta r1, em que devem ser considerados os reforços para outros comportamentos incompatíveis (ro), relação essa expressa na Equação 2, que ficou conhecida como a hipérbole de Herrnstein, por dar conta dos efeitos cada vez menores do aumento da taxa absoluta de reforços sobre a taxa absoluta de respostas: (2). As previsões derivadas desse modelo são que: a taxa de R1 pode variar de zero até se aproximar do máximo k, conforme a relação entre seus reforços (r1) e os outros reforços (ro) para as respostas concorrentes; quanto maior a frequência de reforços para R1 em relação aos reforços disponíveis para 85 Cristiano Coelho outras respostas, maior a frequência de R1; à medida que o ambiente passa a prover mais reforços para outras respostas, a frequência de R1 diminui; o aumento da frequência absoluta de R1 é cada vez menor à medida que se aumenta a frequência absoluta de reforços. Para exemplificar a relação acima, vamos supor uma situação hipotética na qual o total de reforços para outros comportamentos é constante ao longo de diferentes condições. Em uma condição o experimentador programa um esquema que fornece 10 reforços por hora e, hipoteticamente, o organismo emite 50 respostas por minuto. Ao alterarmos a condição e aumentar em 10 os reforços por hora (fornecendo então 20 reforços por hora), possivelmente as respostas aumentarão para 100 por minuto (50 respostas a mais). Se aumentarmos mais 10 reforços por hora em uma nova condição (que passa a fornecer 30 reforços por hora), as respostas apresentarão um aumento menor, digamos 40 respostas por minuto a mais, e o organismo passará a emitir 140 respostas por minuto. Caso uma nova condição programe mais 10 reforços por hora, o aumento no número de respostas será de 30, por exemplo, e assim por diante, até que atinja o máximo de respostas, e então o aumento na taxa absoluta de reforços não produzirá aumentos nas taxas de respostas. Como podemos ver, a cada condição o aumento na taxa de reforço foi constante (de 10 em 10), mas o aumento na taxa de respostas foi cada vez menor (50, 40, 30...), obten86 do-se 50, 100, 140, 170 até atingir o máximo. Esse efeito das taxas de reforços sobre a taxa de respostas, porém, não apenas é totalmente compatível com a igualação, mas acaba sendo fundamental para que ela ocorra, pois acaba mostrando que as alterações nas condições estão alterando a frequência de reforços programados pelo experimentador relativamente aos outros reforços providos pelo ambiente (Ro), que permaneceram constantes ao longo das diferentes condições no nosso exemplo. Se hipoteticamente os outros reforços tiverem uma taxa de 10 por hora na primeira condição, igual ao programado pelo experimentador, o organismo alocará metade do tempo respondendo ao esquema programado e metade do tempo realizando as outras atividades. Vamos considerar agora duas situações com esquemas concorrentes. Em uma temos dois esquemas de intervalo variável de 30 segundos, e na outra, dois esquemas de intervalo variável de 1 minuto, cada um associado a um disco de respostas. Nas duas situações, a taxa total de reforços é diferente, considerando os dois esquemas: a primeira com 120 reforços por hora e a segunda com 60 reforços por hora. Assim, o total de respostas emitidas nos dois discos na primeira situação seria maior que na segunda, visto que teria uma maior taxa absoluta de reforços. Porém, como em ambas as situações os esquemas componentes dos respectivos pares concorrentes são iguais, com metade Capítulo V | Escolha dos reforços a serem obtidos em cada fonte, a igualação prevê que o organismo distribuiria igualmente suas respostas às duas fontes, pois o que importa para a igualação são os valores relativos dos reforços e não os absolutos. Mas você pode perguntar: e os outros reforços não alterariam essa relação? Não! De acordo com a hipérbole de Herrnstein, além dos esquemas programados pelo experimentador, o organismo também gastaria tempo emitindo respostas que são controladas pelos outros reforços disponíveis nessa situação. Contudo, como os outros reforços estão constantes nessa condição, eles interfeririam da mesma maneira (ou igualmente) nas respostas aos dois esquemas e, assim, seus efeitos se anulariam matematicamente. de respostas R1 aumenta, mas a emissão de outras respostas alternativas diminui, devido a um máximo de respostas possíveis de serem emitidas. O artigo de Herrnstein (1961) foi um marco no estudo do comportamento de escolha ao prover dados sistemáticos e quantificação de duas alternativas de respostas, realizando manipulações paramétricas da taxa relativa de reforços em esquemas concorrentes de intervalo variável (CONC VI - VI) e mostrando que as alterações nessa taxa relativa de reforços eram acompanhadas de alterações similares na taxa relativa de resposta, desenvolvendo o princípio de igualação. Em termos quantitativos, se aplicarmos a Equação 2 a duas respostas concorrentes, R1 e R2, obtemos a Equação 1³ proposta por Herrnstein (1961). Essas previsões atualmente podem parecer simples, mas precisamos considerar que àquela época o diferencial foi mostrar que a frequência de R1 não dependia apenas dos reforços produzidos por ela. Porém, isso não é tudo. Se R1 depende de sua taxa de reforços e dos reforços para outras respostas alternativas e, consequentemente, as outras respostas são controladas pelos seus próprios reforços e pela taxa de reforços de R1, há uma interdependência entre a contingência em vigor para R1 e as contingências sob as quais estão as outras respostas possíveis de serem emitidas na mesma situação e incompatíveis com R1. Dessa forma, ao se aumentar a taxa de reforços para R1 relativamente aos reforços de outros comportamentos, não só a taxa A concepção de Herrnstein (1961) foi tão importante que, após sua publicação, a Análise do Comportamento passou a desenvolver diversos trabalhos quantitativos, não apenas para o estudo de escolha, mas na busca de relações quantitativas entre o comportamento e suas consequências, avaliando também a asserção de Herrnstein (1970) de que escolha é comportamento (e vice-versa). Passamos então a ter uma gama de estudos que tentavam avaliar a generalidade da Lei da Igualação e extensão para outros parâmetros do reforço, como atraso e magnitude (e.g. Rachlin & Baum, 1969; Há um conjunto de transformações para se chegar a essa formulação, fora do âmbito do presente trabalho. De forma resumida, tanto k quanto ro saem da Equação 1 porque ao interagirem da mesma forma com R1 e R2, seus efeitos são matematicamente “anulados”. 3 87 Cristiano Coelho Logue, 1988; Logue & Chavarro, 1987; Todorov, 1973), arranjos experimentais, como a função do COD e efeito da frequência absoluta de reforços (e.g. Shull & Pliskoff, 1967; Todorov, Coelho & Beckert, 1993), efeitos da história (e.g. Todorov, Oliveira-Castro, Hanna, Bittencourt de Sá & Barreto, 1983), apenas para mencionar alguns poucos exemplos. Pesquisas mostraram também que a relação de igualação se aplicava para medidas de alocação de tempo (e.g. Baum, 1975; Baum & Rachlin, 1969). A aplicabilidade da proposta de Herrnstein para o estudo e intervenção sobre o comportamento humano também foi testada (e.g. Bradshaw & Szabadi, 1978; Logue, 1988; Neef, Mace, Shea & Shade, 1992; Pierce & Epling, 1983). Baum (1974, 1979) observou os dados de alguns estudos indicavam dois desvios sistemáticos da igualação encontrados empiricamente. Um desvio foi chamado de viés, uma persistência a apresentar uma preferência por uma alternativa derivada de aspectos não relacionados à distribuição de reforços. Essa preferência por uma alternativa pode ser derivada de diferenças na força necessária para acionar o lócus de respostas, diferenças qualitativas nas respostas em cada esquema (bicar x acionar um pedal), diferenças na iluminação dos discos, dentre outros. O outro desvio, chamado de sensibilidade, ocorre quando a distribuição de respostas não se modifica de maneira estrita conforme a alteração nas relações entre os reforços obtidos nos esquemas concorrentes. Conforme pontua88 mos ao início deste tópico, para Herrnstein (1961), a igualação implica que uma variação na frequência relativa de reforços deve ser acompanhada da mesma variação na frequência relativa de respostas: se em uma fonte é obtida três vezes mais reforços que a alternativa, para igualar o organismo emitiria três vezes mais respostas, por exemplo. Além disso, ao se dobrar a frequência relativa de reforços para essa mesma alternativa, a frequência relativa de respostas também dobraria. Porém, Baum (1979) realizou uma revisão de 23 estudos e observou dados nos quais quando a distribuição de reforços era alterada em uma certa medida produzia variações menores e, em outras, variações maiores na distribuição de respostas, as quais Baum denominou de “subigualação” e “sobreigualação”, respectivamente. Diversos trabalhos (e.g. Baum, 1974, 1979; Rachlin & Baum, 1969) estenderam a proposta de Herrnstein (1961, 1970). Ao buscar sistematizar os dados sobre igualação envolvendo os diferentes parâmetros do reforço, Baum (1974) desenvolveu a Lei Generalizada da Igualação. Porém, derivou uma equação baseada na relação entre razões de respostas (respostas emitidas em uma alternativa dividida pelas respostas emitidas na outra alternativa) e razões de reforços (reforços obtidos em uma alternativa dividido pelos reforços obtidos na outra alternativa). O uso de medidas de razão descrevia melhor as distribuições de reforços e respostas por terem uma amplitude maior que proporção ou porcentagem, que tem seu limite Capítulo V | Escolha de 0 a 1 e 0% a 100%, respectivamente. Essa relação é expressa na Equação 3: (3), sendo a e b os parâmetros obtidos empiricamente, relacionados ao viés e sensibilidade. Quando se encontra uma sensibilidade perfeita e ausência de viés, a equação de Baum expressa a igualação estrita de Herrnstein. A mesma relação pode ser aplicada quando são manipuladas as magnitudes e/ ou atrasos. Quando os três parâmetros são manipulados em um mesmo experimento, é possível se calcular as sensibilidades às variações de cada um deles. Pierce e Epling (1983) avaliaram a generalidade da Lei da Igualação para a descrição do comportamento humano e sugerem que os resultados com humanos seriam compatíveis com a igualação. Além disso, observaram que pesquisas com humanos que não encontraram dados sistemáticos compatíveis com a igualação (e.g. Oscar-Berman, Heyman, Bonner & Ryder, 1980) apresentavam especificidades metodológicas que não permitiriam uma adequada análise da igualação. Em primeiro lugar, esses experimentos com humanos geralmente utilizaram poucas sessões e dados de comportamento sem o controle já estabelecido pela contingência, ou seja, dados de transição, ao passo que a lei se dirige a dados de distribuição de respostas em estado estável. A discussão levantada por Pierce e Epling (1983) mostra alguns dos cuidados necessários para se falar em igualação e sua aplicabilidade ao comportamento humano, em concordância com os pressupostos desenvolvidos por Herrnstein (1961, 1964, 1970) e compatível com a literatura. Dois exemplos da aplicabilidade da igualação com humanos em contextos diferentes podem contribuir para que visualizemos a extensão dos efeitos de Herrnstein (1961). Bradshaw e Szabadi (1976) realizaram uma investigação, ao longo de seis meses, com uma pessoa diagnosticada como maníaca depressiva. No experimento, diferentes operandos estavam associados com diferentes VIs, que foram utilizados para manipular a taxa de reforço, testando uma função derivada da Equação 1 acima. Essa mensuração, realizada em situações com diferenças de “humor” (normal, depressivo, maníaco), mostrou que a taxa de respostas aumentava com aumentos na taxa de reforço na forma prevista pela Equação 1, atingindo o máximo k. Contudo, conforme o “humor”, o máximo de respostas emitidas diferiu, com taxas máximas mais altas obtidas em quando o paciente estava maníaco, e as mais baixas quando estava depressivo. Neef, Mace, Shea e Shade (1992) avaliaram a Lei da Igualação em um contexto educacional com reforçadores de mesma “qualidade” e “qualidade” diferente. Três estudantes especiais tiveram que resolver problemas matemáticos apresentados 89 Cristiano Coelho concorrentemente e com reforços de acordo com esquemas de VI. Na condição com reforços qualitativamente semelhantes, o tempo alocado a cada esquema variou conforme previsto na igualação. Um dado interessante foi que os autores não obtiveram igualação com reforços qualitativamente diferentes. De fato, a proposta de igualação, tal como proposta por Herrnstein, se adequa a escolha com mesmos reforçadores. A ideia de igualação repercutiu também no desenvolvimento dos trabalhos sobre escolhas entre reforçadores com diferentes atrasos e magnitudes, desenvolvidos na área de autocontrole (e.g. Mazur, 1987; Rachlin & Green, 1972). A noção básica para essa extensão foi a Lei Generalizada da Igualação, com a demonstração de que a distribuição de respostas é alterada conforme os pressupostos básicos da ideia de Herrnstein (1961) quando são manipulados atraso e magnitude de reforço. Além disso, análises quantitativas da perda de valor reforçador de consequências atrasadas mostraram-se compatíveis com a equação de igualação (Ainslie & Haslam, 1992) ao serem aplicadas ao estudo do comportamento de não humanos (e.g. Mazur, 1995) e humanos (e.g. Coelho, Hanna & Todorov, 2003; Rachlin, Raineri & Cross, 1991). A Lei da Igualação, tal como proposta por Herrnstein (1961), se adequa a escolha com mesmos reforçadores. Propostas posteriores (e.g. Rachlin, 1989) tentaram interpretar o parâmetro de sensibilidade da Lei 90 Generalizada da Igualação como o nível de semelhança funcional ou de complementariedade entre os reforços disponibilizados pelas duas fontes. Em alguns casos, essa interpretação prevê que a diminuição de uma frequência de reforços levaria à diminuição nas duas respostas concorrentes e permite descrever adequadamente as alterações na distribuição de respostas. Mas essa é outra longa história4! CONSIDERAÇÕES FINAIS Sem dúvida, a contribuição mais clara de Herrnstein (1961) foi sua proposta de estabelecer relações quantitativas precisas entre comportamento e suas consequências. Essas relações não só validam, mas principalmente, acrescentam-se aos achados sobre a regularidade dessas relações. Ao longo de seus estudos, Herrnstein procurou aprofundar essas relações, focando nos efeitos das consequências e questionando princípios de racionalidade, sistematizados em uma compilação de textos finalizada após sua morte (Herrnstein, Rachlin & Laibson, 1997). Essa compilação de textos mostra como as pesquisas realizadas por ele iniciadas a partir de Herrnstein (1961) foram indicando as falhas nas previsões da Psicologia e da Economia baseadas Algumas referências a respeito, além de Rachlin (1989): Rachlin, H., Kagel, J. H., & Battalio, R. C. (1980). Substitutability in time allocation. Psychological Review, 87(4), 355. Rachlin, H., Green, L., Kagel, J. H., & Battalio, R. C. (1976). Economic demand theory and psychological studies of choice. Psychology of Learning and Motivation, 10, 129-154. 4 Capítulo V | Escolha no pressuposto de que as escolhas visam o máximo de resultados. Esses dados mostram a igualação na base da dinâmica das escolhas. E há muito mais para buscarmos e satisfazer nossa curiosidade. Os números? Eles não são o comportamento em si, apenas uma forma (dentre as diversas) de descrevê-lo e permitir-nos conhecer de uma maneira mais precisa as regularidades do comportamento. Considero que para além da quantificação, o pressuposto de que nosso comportamento é afetado também pelas contingências concorrentes é uma das grandes contribuições da sistematização dessa área. Ela permeia direta ou indiretamente intervenções que passaram a ser adotadas em diferentes contextos, nos quais fomos deixando de punir comportamentos-problema e passamos a reforçar comportamentos socialmente desejáveis. Diferentes formas de intervenção baseadas em reforço diferencial e até a noção de reforço para comportamentos clinicamente relevantes tipo 2 (CRB2) na Psicoterapia Analítica Funcional (Kohlenbergh & Tsai, 2001) tem embutidas noções que se aproximam daquela investigada a partir do experimento de Herrnstein (1961). Podemos ilustrar sua repercussão pelo fato de que Herrnstein (1961), juntamente com outro trabalho clássico sobre escolha (Herrnstein, 1970) foi um dos cinco trabalhos publicados no Journal of the Experimental Analysis of Behavior (JEAB) mais citados no Journal of Applied Behavior Analysis (JABA) entre 1983 e 2003 (Elliot e cols., 2005). Ao lado do artigo seminal de Michael (1982) sobre operações estabelecedoras, a Lei da Igualação permaneceu como um dos principais tópicos de interesse na área aplicada. Conforme Elliot e cols. (p. 560) “Claramente, igualação e operações estabelecedoras são tópicos de contínuo interesse para analistas aplicados do comportamento e devem ser abrangidos em programas de treinamento. Igualação e operações estabelecedoras tem provado ser úteis em conceituar e tratar uma amplitude de comportamentos-problema”. PARA SABER MAIS Baum (2010). Descreve um tutorial baseado na igualação como alocação de tempo entre atividades. No texto são discutidos aspectos referentes à Borges, Todorov, & Simonassi (2006). Descreve experimentos com diferentes manipulações, mostrando como as condições para a obtenção de igualação com humanos dependem da programação experimental. Garcia-Mijares & Silva (1999). Apresenta de forma didática as noções de igualação. Madden & Perone (1999). Avaliaram a Lei Generalizada da Igualação e, mais especificamente, a sensibilidade comportamental. Os dados mostraram que a sensibilidade foi 91 Cristiano Coelho maior quando havia uma resposta de observação. Todorov, Coelho, & Beckert (1993). Realizaram um conjunto de experimentos com pombos, nos quais variaram a frequência relativa e frequência absoluta de reforços. Os dados reforçam que o pressuposto de que a igualação depende somente da frequência relativa de reforços e da função do COD na separação das respostas aos esquemas. REFERÊNCIAS Ainslie, G., & Haslam, N. (1992). Hyperbolic discounting. In G. Loewenstein & J. Elster, J. (Eds.), Choice over time. New York: Russell Sage Foundation. Baum, W. M. (1974). On two types of deviation from the matching law: Bias and undermatching. Journal of The Experimental Analysis of Behavior, 22, 231-242. Baum, W. M. (1975). Time allocation in human vigilance. Journal of the Experimental Analysis of Behavior, 23, 45-53. Baum, W. M. (1979). Matching, undermatching, and overmatching in studies of choice. Journal of the Experimental Analysis of Behavior, 32, 269-281. Baum, W. M. (2010). Dynamics of choice: A tutorial. Journal of the Experimental Analy92 sis of Behavior, 94, 161-174. Baum, W. M., & Rachlin, H. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior, 12, 861-874. Borges, F. S., Todorov, J. C., & Simonassi, L. E. (2006). Comportamento humano em esquemas concorrentes: escolha como uma questão de procedimento. Revista Brasileira de Terapia Comportamental e Cognitiva,8, 13-24. Bradshaw, C. M., & Szabadi, E. (1978). Changes in operant behavior in a manic-depressive patient. Behavior Therapy, 9, 950-954. Catania, A. C., & Reynolds, G. S. (1968). A quantitative analysis of the responding maintained by interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 11, 327-383. Coelho, C., Hanna, E. S., & Todorov, J. C. (2003). Magnitude, atraso e probabilidade de reforço em situações hipotéticas de risco. Psicologia: Teoria e Pesquisa, 19, 269-278. Davison, M. (2012). The matching law (Edição revisada de Davison, M., & McCarthy, D. (1988). The matching law: A research review. Hillsdale, NJ: Lawrence Erlbaum Associates). De Villiers, P. A., & Herrnstein, R. J. (1976). Toward a law of response strength. Psychological Bulletin, 83, 1131. Capítulo V | Escolha Elliott, A. J., Morgan, K., Fuqua, R. W., Ehrhardt, K., & Poling, A. (2005). Self- and cross-citations in the Journal of Applied Behavior Analysis and the Journal of the Experimental Analysis of Behavior: 1993– 2003. Journal of Applied Behavior Analysis, 38, 559-563. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Ferster, C. & Skinner (1957). Schedules of reinforcement. New York: Appleton Century-Crofts. Kohlenberg, R. J., & Tsai, M. (2001). Psicoterapia Analítica Funcional. São Paulo: ESETEC. Herrnstein, R. J., (1997). The matching law: Papers in psychology and economics. Cambridge: Harvard University Press. Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, 123-144. Logue, A. W., & Chavarro, A. (1987). Effect on choice of absolute and relative values of reinforcer delay, amount, and frequency. Journal of Experimental Psychology: Animal Behavior Processes, 13, 280. Garcia-Mijares, M., & Silva, M. T. A. (1999). Introdução à teoria da igualação. Sobre comportamento e cognição, 4, 40-53. Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral and Brain Sciences, 11, 665-679. Herrnstein, R. J. (1958). Some factors influencing behavior in a two-response situation. Transactions of the New York Academy of Sciences, 21, 35-45. Madden, G. J., & Perone, M. (1999). Human sensitivity to concurrent schedules of reinforcement: Effects of observing schedule-correlated stimuli. Journal of the Experimental Analysis of Behavior, 71, 303-318. Herrnstein, R. J. (1961). Relative and Absolute strength of Response as a Function of Frequency of Reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267272. Herrnstein, R. J. (1964). Secondary reinforcement and rate of primary reinforcement. Journal of the Experimental Analysis of Behavior, 7, 27-36. Mazur, J. E. (1987). An adjusting procedure for studying delayed reinforcement. In M. L. Commons, J. E. Mazur, & J. A. Nevin (Eds.), Quantitative Analysis of Behavior: Vol 5. The effect of delay and intervening events on reinforcement value. Hillsdale, NJ: Lawrence Erlbaum. (pp. 55-73). Mazur, J. E. (1995). Conditioned reinforcement and choice with delayed and uncer93 Cristiano Coelho tain primary reinforcers. Journal of the Experimental Analysis of behavior, 63, 139-150. Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37, 149-155. Neef, N. A., Mace, F. C., Shea, M. C., & Shade, D. (1992). Effects of reinforcer rate and reinforcer quality on time allocation: Extensions of matching theory to educational settings. Journal of Applied Behavior Analysis, 25, 691-699. Oscar-Berman, M., Heyman, G. M., Bonner, R. T., & Ryder, J. (1980). Human neuropsychology: Some differences between Korsakoff and normal operant performance. Psychological Research, 41, 235-247. Pierce, W. D., & Epling, W. F. (1983). Choice, matching, and human behavior: A review of the literature. The Behavior Analyst, 6, 57. Rachlin, H. (1989). Judgment, decision, and choice: A cognitive/behavioral synthesis. New York: WH Freeman/Times Books/ Henry Holt & Co. Rachlin, H., & Baum, W. M. (1969). Response rate as a function of amount of reinforcement for a signalled concurrent response. Journal of the Experimental Analysis of Behavior, 12, 11-16. Rachlin, H., & Green, L. (1972). Commit94 ment, Choice and self-control. Journal of the Experimental Analysis of Behavior, 17, 15-22. Rachlin, H., Raineri, A., & Cross, D. (1991). Subjective probability and delay. Journal of the Experimental Analysis of Behavior, 55, 233-244. Shull, R. L., & Pliskoff, S. S. (1967). Changeover delay and concurrent schedules: Some effects on relative performance measures. Journal of the Experimental Analysis of Behavior, 10, 517-527. Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193-216. Todorov, J. C. (1973). Interaction of frequency and magnitude of reinforcement on concurrent performances. Journal of the Experimental Analysis of Behavior, 19, 451-458. Todorov, J. C., Oliveira-Castro, J. M., Hanna, E. S., Bittencourt de Sá, M. C. N., & Barreto, M. D. Q. (1983). Choice, experience, and the generalized matching law. Journal of the Experimental Analysis of Behavior, 40, 99111. Todorov, J. C., Coelho, C., & Beckert, M. E. (1993). Efeito da frequência absoluta de reforços em situação de escolha: um teste do pressuposto da relatividade na lei generalizada de igualação. Psicologia: Teoria e Pesquisa, 9, 227-42. Elenice S. Hanna, Márcio Borges Moreira Prestaram atenção em tudo? Elenice S. Hanna Universidade de Brasília Márcio Borges Moreira Centro Universitário de Brasília; Instituto Walden4 Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis of Behavior, 4, 203-208. “Da mesma forma que podemos atentar para um objeto sem olhar para ele, assim também podemos olhar para um objeto sem prestar-lhe atenção” Skinner (1953/2003, p. 138) 95 Capítulo VI | Atenção INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Ao perguntar para várias pessoas que foram à mesma sala de cinema no mesmo horário, o que lhes chamou mais atenção, respostas variadas apareceriam. Alguns incluiriam no relato determinados personagens, suas personalidades ou as interações entre eles. Outros falariam dos cenários, cidades ou construções. Poderíamos ainda encontrar aqueles que focam seus relatos nas cenas de suspense, na forma como foram produzidas, na iluminação ou nos aspectos negativos. Uma pessoa menos atenta ao filme, como o dono do cinema, poderia ainda ter se interessado pelo número de pessoas que havia na sala e no que elas estavam consumindo. Em situações cotidianas nem sempre o comportamento de uma pessoa fica, do ponto de vista de um observador externo (o diretor do filme, por exemplo) ou do próprio indivíduo, sob controle dos mesmos estímulos que antecedem ou que estão presentes quando um determinado comportamento ocorre. Dito de outra forma, diferentes indivíduos podem prestar atenção a diferentes aspectos, ou diferentes estímulos, de um mesmo ambiente. Diz-se, nessas situações, que o organismo prestou ou não atenção ao evento, que atentou ou não a uma ou mais propriedades relevantes do estímulo. É importante ressaltar que, em Análise do Comportamento, estímulo é “qual- quer evento físico, combinação de eventos ou relação entre eventos. O vocabulário do estímulo classifica os aspectos do ambiente …” (Catania, 1998/1999, p. 402). Quando falamos de uma propriedade de um estímulo, falamos de alguma qualidade mensurável de um estímulo, por exemplo, cor, forma, cheiro, tamanho, textura, etc. O conceito de ambiente, por sua vez, pode ser definido como o “conjunto de circunstâncias físicas no qual o organismo, ou uma parte referida desse organismo, existe” (Johnston & Pennypacker, 2009, p. 29). O uso do conceito de atenção em muitos casos, entretanto, pode inverter “... a direção da ação ao sugerir que não é o estímulo que controla o comportamento do observador, mas é o observador que atenta para o estímulo e assim o controla” (Skinner, 1953/2000, p. 135). Nessa perspectiva, a “falta de atenção” não explica o controle inadequado de estímulos, é apenas uma forma resumida de se referir à ausência de controle por determinados elementos ou dimensões de estímulos sobre o comportamento. É importante lembrar que falar de controle do comportamento é falar de variáveis que tornam um determinado comportamento mais ou menos provável (não significa, necessariamente, falar de “obrigar” alguém a fazer algo). Conhecer as variáveis que aumentam as chances de haver coerência entre o que se quer ensinar dos estímulos antecedentes e o que será aprendido é funda96 Elenice S. Hanna, Márcio Borges Moreira mental para o ensino de diversos processos comportamentais complexos. A aprendizagem de conceitos, por exemplo, é base para o desenvolvimento do pensamento e da linguagem humana. Quando aprendemos o conceito de “vermelho” ou de um “número”, interagimos com eventos que são compostos por outras propriedades. Um objeto vermelho ou unitário possui forma, peso, tamanho, apenas para citar algumas das possíveis propriedades. Mas como ocorre o processo que permite que determinado comportamento fique sob controle da cor ou o número, por exemplo, dentre tantos aspectos dos objetos que contêm cor e numerosidade? Perguntando em uma linguagem mais coloquial, como prestamos atenção apenas à cor ou ao número dos objetos? O experimento que é tema deste capítulo foi publicado por George Reynolds em 1961 com o título de “Atenção no pombo” e inspirou uma série estudos relevantes para a compreensão da atenção e do controle do comportamento por estímulos compostos. Em estudos sobre controle do comportamento operante por estímulos antecedentes, o ensino é realizado por meio de procedimentos chamados de treino discriminativo. A base de um treino discriminativo é o reforçamento diferencial da resposta emitida na presença de estímulos diferentes (Dinsmoor, 1995). Na presença de um objeto vermelho (S+), a resposta de dizer “vermelho” (R) é seguida por alguma reação de aprovação do professor (SR+), mas não terá esta consequência se o objeto 97 for amarelo (S–). Responder “vermelho” faz parte de duas contingências: uma na qual a resposta produz reforçamento e outra em que produz extinção, gerando a discriminação entre os objetos de cores diferentes (i.e., vermelho e amarelo). Discriminar esses objetos é responder diferencialmente na presença de cada um, isto é, dizendo “vermelho” diante do S+ (objeto vermelho), mas não diante do S– (objeto amarelo). A discriminação está presente em muitos exemplos do que chamamos de “conhecimento” e de “atenção”. Quando se diz que alguém reconheceu o brinquedo vermelho ou prestou atenção no vestido vermelho, supõe-se que ele(a) diferencie (discrimine) as cores. No entanto, afirmações como essas são meras inferências (Sidman, 1979), como as evidências apresentadas por Reynolds (1961) permitem discutir. Passemos, então, para o estudo clássico que apresentou estas evidências e em seguida veremos como este tema tem relação com outros assuntos interessantes. DESCRIÇÃO DOS EXPERIMENTOS Os experimentos de Reynolds (1961) foram inspirados, dentre outros experimentos, pela pesquisa realizada por Lashley (1938), na qual respostas de ratos de saltar em direção a um cartão contendo a figura de um triângulo foram reforçadas com comida e as respostas de saltar em direção a Capítulo VI | Atenção um cartão contendo a figura de triângulo invertido foram punidas pela queda do animal em uma rede de segurança. Após realizar esse treino discriminativo, Lashley realizou testes nos quais apenas metade das figuras eram apresentadas aos ratos. Nesses testes, não se observou consistência no comportamento de saltar dos animais, isto é, as “partes” dos triângulos apresentadas nos testes como estímulos antecedentes exerceram controles diferentes para diferentes animais. No entanto, estes responderam de forma coerente com o treino quando apenas a metade inferior de cada figura era apresentada. Experimento 1 - Objetivo e Método Com base nos resultados da pesquisa de Lashley (1938), o objetivo do experimento de Reynolds (1961) foi avaliar os efeitos da variação e eliminação de características dos estímulos sobre a aprendizagem de discriminações de estímulos – dizemos que uma discriminação de estímulos foi estabelecida quando o indivíduo se comporta de maneira diferente na presença de estímulos antecedentes diferentes. No Experimento 1 (Reynolds, 1961), dois pombos foram colocados em câmaras experimentais que continham discos de resposta onde ora era apresentado um triângulo sobre um fundo vermelho (ΔR) e ora um círculo sobre um fundo verde (OG), Figura 1. Diagrama do treino discriminativo e dos estímulos decompostos utilizados no teste em extinção de Reynolds (1961; painel da esquerda) e resultados do Experimento 1 (painel da direita). O gráfico do painel da direita é uma adaptação da Figura 1 de Reynolds (p. 204). 98 Elenice S. Hanna, Márcio Borges Moreira de forma imprevisível. Bicadas no disco ΔR eram seguidas por comida (reforço), após transcorridos 3 min em média desde a apresentação do último reforço (i.e., um esquema de reforçamento intervalo variável, VI, 3 min). Respostas de bicar no disco OG não eram reforçadas (extinção). Esta etapa do procedimento consistiu de um treino discriminativo (Figura 1). Após a etapa de treino discriminativo, iniciava-se uma segunda etapa do experimento, chamada de teste em extinção. Nesta etapa Reynolds (1961) programou um teste no qual os componentes dos estímulos utilizados durante o treino discriminativo eram apresentados separadamente, ou seja, o disco de resposta continha ora o triângulo, ora o círculo, ora era iluminado por vermelho e ora por verde. O teste foi realizado em extinção, isto é, bicadas no disco, independentemente de qual estímulo estivesse presente no disco, não eram seguidas pela apresentação de comida. O teste em extinção foi uma verificação do que os pombos haviam aprendido durante o treino discriminativo. Portanto, procedimentos de treino são tarefas de aprendizagem e procedimento de teste em extinção são procedimentos de avaliação dessa aprendizagem. Resultados e Discussão No início do treino discriminativo, ambos os pombos bicavam no disco tanto na presença do ΔR quanto na presença do OG. No entanto, à medida que o treino discriminativo continuava, as respostas iam se 99 concentrando no disco cujas bicadas produziam comida, isto é, os animais passaram a bicar nos disco quase que exclusivamente na presença do triângulo sobre fundo vermelho (Figura 1). Neste caso, dizemos que o controle discriminativo foi estabelecido: respostas de bicar ocorriam na presença do triângulo sobre fundo vermelho e ocorriam com baixa frequência na presença do círculo sobre fundo verde. Durante o teste em extinção, na qual os componentes dos estímulos utilizados no treino foram apresentados separadamente, Reynolds (1961) verificou que, para o pombo 105, a maioria das respostas de bicar ocorreu na presença do triângulo, enquanto para o pombo 107 a maior parte das respostas ocorreu na presença da cor vermelha (Figura 1). Mesmo tendo sido submetidos ao treino discriminativo com os mesmos estímulos compostos, o comportamento de cada um dos animais, durante o teste, foi controlado por uma propriedade específica diferente do estímulo (triângulo para o pombo 105 e cor vermelha para o pombo 107). Reynolds argumentou apenas que o responder de cada um dos pombos ficou sob controle de um dos muitos aspectos de cada estímulo, não sugerindo possíveis determinantes das diferenças individuais no controle de estímulos observado no comportamento dos pombos - até porque seus dados não permitiam explicar o controle de estímulos desenvolvido pelos animais. Os analistas do comportamento acham mais produtivo ficar provisoriamente sem uma Capítulo VI | Atenção explicação do que inventar um explicação que não seja baseada nas interações entre o organismo e o ambiente. Por exemplo, Reynolds poderia ter dito: “O pombo 105 bicou mais vezes na presença do triângulo durante os testes porque ele prestou mais atenção a este aspecto do estímulo durante o treino”. No entanto, propor uma explicação como essa não explica nada, é apenas outra forma de dizer que o pombo bicou mais vezes na presença do triângulo. Mesmo se aceitássemos a explicação “bicou mais na presença do triângulo porque prestou mais atenção a esse aspecto”, ainda teríamos que explicar por que ele prestou mais atenção a esse aspeto. Os estudos que foram desencadeados após a publicação do artigo de Reynolds (1961), entretanto, mostraram que o objetivo do estudo original foi cumprido e inspirou muitos outros estudos que nos ajudam a compreender melhor como diferentes controles de estímulos se estabelecem. Experimento 2 - Objetivo e Método Reynolds (1961) realizou um segundo experimento, com os mesmos pombos, fazendo combinações de estímulos ainda mais complexas. No Experimento 2, havia as seguintes combinações de forma e cor nos discos de resposta durante o treino discriminativo: triângulo sobre fundo vermelho, círculo sobre fundo vermelho, triângulo sobre fundo azul, círculo sobre fundo azul. Além disso, em alguns momentos uma lâmpada amarela, posicionada na lateral da câmara experimental, se acendia e em outros momentos uma lâmpada verde, posi- cionada no mesmo local que a amarela, se acendia. Durante o treino discriminativo do Experimento 2, as respostas de bicar o disco foram reforçadas em esquema de intervalo fixo (FI) 3 min quando a lâmpada amarela estava acesa e o fundo do disco era vermelho (independentemente se continha círculo ou triângulo) e quando a luz verde estava acesa e o disco continha um triângulo (independentemente da cor do fundo do disco). Veja que neste treino discriminativo, o comportamento do pombo de bicar no disco deveria ficar sob controle de uma relação mais complexa (i.e., composta por mais elementos) entre os estímulos presentes do que aquela programada no Experimento 1: cor da lâmpada lateral, cor do fundo do disco e forma projetada no disco. Resultados e Discussão Após cerca de 100 horas de treino discriminativo, o comportamento dos pombos ficou sob controle dos estímulos programados, isto é, eles bicavam no disco quando a luz amarela e o fundo do disco vermelho estavam presentes e quando luz verde e o triângulo estavam presentes; quando a luz amarela e círculo sobre fundo azul estavam presentes, por exemplo, os pombos praticamente não bicavam o disco de resposta. Após o treino discriminativo, Reynolds (1961) realizou vários testes em extinção alterando a configuração dos estímulos como, por exemplo, extinção das respostas durante as mesmas configurações de estímulos do treino; extinção das respostas com as duas lâmpadas laterais apagadas; e 100 Elenice S. Hanna, Márcio Borges Moreira extinção das respostas com as duas lâmpadas laterais acesas simultaneamente. Os resultados desse segundo experimento replicaram os resultados do primeiro: controle por aspectos específicos da configuração de estímulos. Nas palavras de Reynolds (1961, p. 208): No segundo experimento, nenhum dos pombos atentou para a cor da lâmpada lateral. O responder deles foi controlado apenas pela presença ou ausência da lâmpada lateral amarela, ou, de acordo com análise posterior, pela intensidade da iluminação da lâmpada lateral. DESDOBRAMENTOS Centenas, talvez milhares, de pesquisas foram e continuam sendo realizadas com o intuito de sabermos cada vez mais sobre os fatores que determinam quais os aspectos do ambiente que controlarão o comportamento de diferentes organismos e em quais situações (e.g., Barros, Galvão, Brino, Goulart, & McIlvane, 2005; Carter & Werner, 1978; de Rose, de Souza & Hanna, 1996; Debert, Huziwara, Faggiani, de Mathis & McIlvane, 2009; Dube & McIlvane, 1999; Johnson & Cumming, 1968; Lovaas, Koegel & Schreibman, 1979). Em outras palavras, ainda hoje estudamos o que pode levar algumas pessoas a prestarem atenção a certos aspectos de seu ambiente e outras pessoas a prestarem atenção a outros aspectos. A seguir, apresentamos dois experimentos que 101 demonstraram controle discriminativo por parte da configuração de estímulos e avançaram o conhecimento sobre o tema. O primeiro experimento, conduzido por Wilkie e Masson (1976), foi uma replicação sistemática do experimento de Reynolds (1961) com controles mais refinados e também utilizando pombos como sujeitos experimentais. A primeira parte do estudo foi idêntica ao Experimento 1 de Reynolds (i.e., treino com estímulos compostos e teste com os elementos dos estímulos compostos). Na fase de teste, os seis pombos responderam quase que exclusivamente na presença da cor previamente correlacionada com o reforço (i.e., teriam atentado para cor e não para a forma). Embora as bicadas dos pombos de Wilkie e Masson não tenham ficado sob controle de aspectos diferentes do estímulo composto, como no estudo de Reynolds, a evidência de controle por apenas uma das propriedades do estímulo composto (cor) é um resultado semelhante ao (i.e., uma replicação do) estudo original. A replicação (Wilkie & Mason, 1976) confirmou que os animais não humanos não atentam para todas as propriedades de um estímulo composto, mas os autores ainda foram além para avaliar se o teste em extinção era um contexto adequado para identificar o controle de estímulos aprendido durante os treinos. Wilkie e Masson, em uma segunda etapa do estudo, realizaram um novo treino discriminativo para avaliar Capítulo VI | Atenção se a situação de teste em extinção mascarou o possível controle exercido pela outra propriedade do estímulo (forma). Neste segundo treino, bicadas no disco foram reforçadas na presença das duas formas (triângulo e círculo), mas sem o fundo colorido correspondente aos estímulos compostos do primeiro treino. Se as formas não tivessem adquirido nenhuma função comportamental no primeiro treino, a aprendizagem na presença de cada forma deveria ser semelhante no segundo treino. No entanto, já na primeira sessão de treino os pesquisadores observaram que a frequência do responder na presença da forma previamente correlacionada com reforço aumentou mais rapidamente que na presença da forma correlacionada com extinção. Embora se pudesse pensar, a partir do primeiro teste, que os pombos prestaram atenção somente à cor, os resultados do segundo treino discriminativo mostraram que as formas também exerceram algum controle sobre o comportamento. Este é um dos aspectos mais interessantes da pesquisa científica e que depende da curiosidade de pesquisadores e pesquisadoras: seu caráter cumulativo. Reynolds (1961) demonstrou atenção seletiva à determinados aspectos dos estímulos. Wilkie e Masson (1976) confirmaram esse resultado e ainda mostraram que o contexto no qual se avalia a atenção às diferentes propriedades do estímulo pode levar a conclusões diferentes sobre a extensão do controle de estímulos. Nas décadas de 1960 e 1970, muitos estudos sobre controle de estímulos realizados em laboratório utilizaram pombos como sujeitos. O sistema visual das aves, dentre outras vantagens, permite empregar diversos estímulos visuais com variação de cores, diferentemente dos roedores que são sensíveis aos raios UV e “cegos” para grande parte das frequências que seres humanos enxergam. Nesses estudos, os estímulos visuais são projetados nos discos de resposta ou em outros locais da câmara experimental para estudo do comportamento operante de pombos. Uma pergunta comumente feita quando fenômenos importantes são estudados empiricamente em laboratório com não humanos é sobre a sua generalidade para o comportamento humano. Nesse sentido, Touchette (1969) realizou um treino discriminativo com sete garotos de 12 a 17 anos com atraso severo no desenvolvimento, utilizando linhas com diferentes inclinações (45° e 135°). O treino iniciava com o reforçamento de respostas quando uma parte pequena da linha (semelhante à um ponto) aparecia na parte debaixo (para cinco participantes) ou de cima (para outros dois participantes) do painel de apresentação dos estímulos (Figura 2, Pré-treino). Em seguida, os participantes aprendiam as discriminações com as linhas inclinadas (Figura 2, Treino), devendo responder na chave da esquerda na presença de uma linha com 45° de inclinação e na chave da direita na presença de uma linha com 135° de inclinação. 102 Elenice S. Hanna, Márcio Borges Moreira Durante o teste para avaliar o controle de estímulos, Touchette (1969) considerou as linhas como estímulos compostos e separou cada linha em duas partes, apresentando ora a parte inferior ora a parte superior (Figura 2, Teste). Note que esta separação não alterava a inclinação da linha, que era a propriedade que o experimentador esperava que controlasse o comportamento dos participantes. No entanto, o controle parcial foi observado mais uma vez para a maioria dos participantes, que responderam consistentemente apenas para uma das partes (superior ou inferior) da linha com a inclinação correlacionada com reforçamento (Figura 2, painel da direita), replicando os achados de Reynolds (1961) e Wilkie e Masson (1976). Além de mostrar a generalidade do fenômeno do controle parcial com humanos e para estímulos mais simples (como linhas), Touchette mostrou a importância de aprendizagens anteriores para compreender o controle de estímulos (veja também esse efeito de his- tória em Johnson & Cumming, 1968, e Ray, 1969). A história experimental construída durante o pré-treino com estímulos em posições diferentes (superior ou inferior), foi uma variável importante para compreender o controle de estímulos observado no teste. Em geral, o responder foi apropriado (i.e., consistente com o treino) apenas quando as partes das linhas apresentadas no teste correspondiam à posição dos estímulos do Pré-treino. Em outras palavras, o início do treino que exigiu atenção para a (ou controle pela) parte de cima ou debaixo da chave determinou para qual parte da linha inclinada o participante atentou nas etapas subsequentes do procedimento. Um tema de pesquisa em Análise do Comportamento bastante relacionado com os achados de Reynolds (1961) é a superseletividade (overselectivity). Diz-se que houve superseletividade de estímulos ou controle de estímulos restrito quando se observa que um dado comportamento fica sob Figura 2. Estímulos utilizados em cada etapa do estudo de Touchette (1969; painel da esquerda) e porcentagens de acertos obtidas no teste para cada participante (painel da direita). Figura construída com base na descrição do estudo. 103 Capítulo VI | Atenção o controle de apenas uma propriedade do estímulo quando deveria, do ponto de vista do experimentador, ficar sob o controle de relações entre diferentes propriedades desse estímulo ou de outras propriedades. Por exemplo, se o pai faz a barba e o filho não o reconhece mais como sendo seu pai, dizemos que houve superseletividade de estímulos (estímulo barba, neste caso). A superseletividade (Lovaas, Schreibman, Koegel, & Rehm, 1971) ou controle restrito de estímulos é observada em humanos com desenvolvimento típico (e.g., Verneque & Hanna, 2012), mas com mais frequência em crianças com desenvolvimento atípico (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971; Lovaas, et al., 1979), especialmente em indivíduos com diagnóstico de autismo. Lovaas e colaboradores (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971) ensinaram crianças com desenvolvimento típico e com diagnóstico de autismo a discriminar estímulos compostos e mostraram que a maioria das crianças com diagnóstico de autismo respondeu a apenas um dos componentes dos estímulos quando eles foram apresentados separadamente no teste (i.e., superseletividade). Uma proporção menor de crianças com atraso do desenvolvimento do estudo de Lovaas et al. (1971) apresentou superseletividade, enquanto as crianças com desenvolvimento típico responderam a todos os componentes do estímulo composto. Lovaas et al. (1979) discutem como a superseletividade pode estar relacionada com falhas no desenvolvimento da lingua- gem, do comportamento social e a outras deficiências na aprendizagem de pessoas no espectro autista. Os estudos de Lovaas e colaboradores (e.g., Lovaas & Schreibman, 1971; Lovaas et al., 1971; Lovaas et al., 1979) foram considerados bastante relevantes para a época, quando havia escassez de conhecimento sobre a falta de responsividade a elementos críticos do ambiente em indivíduos com diagnóstico de autismo e por ter desencadeado investigações sobre as condições que reduzem a superseletividade. Lovaas e Schreibman (1971), por exemplo, mostraram que ao reforçar respostas na presença dos componentes apresentados separadamente, crianças com diagnóstico de autismo passaram a responder a todos os elementos do estímulo composto. Outros estudos (e.g., Allen & Fuqua, 1985; Schreibman, Charlop, & Koegel, 1982) mostraram que não é necessário decompor o estímulo e ensinar separadamente as discriminações de cada elemento para ampliar o controle de estímulos (i.e., para reduzir a superseletividade). Estes estudos utilizaram, durante a fase de ensino, configurações de estímulos compostos S+ e S- que variavam um componente do composto por vez (diferença única) e compararam com a condição de ensino que programa estímulos compostos com todos os componentes diferentes (diferenças múltiplas). Veja na Figura 3 exemplos de estímulos criados com diferenças múltiplas (painel direito) e estímulos com diferença única (painel esquerdo). Na configuração com di104 Elenice S. Hanna, Márcio Borges Moreira ferenças múltiplas, estímulos S+ e S- possuem maior diferença física e o responder sob controle de um único componente do estímulo tem a mesma probabilidade de reforçamento seja qual for o elemento. Nesse caso, atentar para qualquer um dos elementos do estímulo composto é suficiente para produzir 100% dos reforços. Em contraste, para a configuração que possui apenas um elemento diferente, responder sob controle dos elementos iguais tem baixa probabilidade de ser seguido por reforço, uma vez que ele também está presente nos estímulos “incorretos”, isto é, aqueles não correlacionados com reforçamento. Se o elemento diferente é variado ao longo do treino (utilizando-se diferentes S- como os da Figura 3), as discriminações por mais componentes se desenvolvem. No entanto, configurações com diferença única (crítica) produzem mais erros durante a etapa de ensino e seu uso pode não ser uma estratégia eficiente para indivíduos com baixa resistência à frustração e Figura 3. Exemplo de configuração de estímulos S+ e S- com diferença única e com diferenças múltiplas. 105 em tarefas com alta complexidade em relação ao repertório inicial de estudantes (e.g., Anderson & Rincover, 1982). Nesses casos, procedimentos especiais que combinam o ensino de discriminações com os elementos separados e compostos com diferenças críticas e/ou a programação de aumentos graduais na semelhança física entre os estímulos (fading, veja o estudo de Terrace, 1963) podem ser utilizados na metodologia de ensino. Os estudos de Dube e McIlvane (1999) e de Duarte e Baer (1997) são exemplos destes procedimentos. O primeiro ensinou discriminações entre palavras e o segundo entre faces. CONSIDERAÇÕES FINAIS Em muitas atividades humanas, é necessário atentar e discriminar diversos eventos e ignorar outros. Reynolds (1961) iniciou uma série de investigações que mostraram que o atentar e as discriminações que aprendemos dependem das contingências de reforçamento às quais somos expostos. Quando estas contingências permitem o responder sob controle de qualquer componente ou propriedade do evento antecedente para que o reforçamento ocorra, variabilidade e controle restrito por um dos elementos comumente resulta. A ocorrência dessa variabilidade depende, entretanto, de condições antecedentes históricas e presentes, além de características do organismo. O conhecimento das variáveis independentes que ampliam o controle Capítulo VI | Atenção de estímulos (atenção) tem possibilitado o desenvolvimento de metodologias efetivas para modificar o padrão de controle de estímulo muitas vezes denominado de “patológico” (Sidman, 1960). Pesquisas sobre controle de estímulos realizadas com não humanos, como as de Reynolds (1961), dentre muitas outras, foram e continuam sendo essenciais para que pesquisas sobre controle de estímulos com humanos fossem e continuem sendo realizadas – toda vez que uma criança apresenta dificuldades para aprender a ler, por exemplo, temos ali uma possível aplicação para o conhecimento sobre controle de estímulos. O conhecimento acumulado produzido tanto por pesquisas com não humanos quanto por pesquisas com humanos foi essencial para que tecnologias de ensino eficazes fossem produzidas e aplicadas nos mais diversos contextos. Graças a todo esse histórico de produção de conhecimento de base empírica, analistas do comportamento têm a possibilidade, hoje em dia, de auxiliar professores a elaborar estratégias de ensino que otimizam a aprendizagem de leitura e escrita de crianças no ensino regular; que possibilitam melhora na qualidade de vida de crianças diagnosticadas com algum tipo de atraso no desenvolvimento, incluindo desempenhos acadêmicos; e que auxiliam no desenvolvimento de softwares educacionais mais eficazes, apenas para citar alguns exemplos. PARA SABER MAIS da Hora & Benvenuti (2007). Os pesquisadores avaliaram os efeitos de um procedimento conhecido como resposta de observação diferencial sobre o desempenho de um menino autista em uma tarefa de matching-to-sample (MTS) que utilizou sílabas e palavras como estímulos. A resposta de observação diferencial impedia que o responder da criança aos estímulos comparação fosse baseado em apenas uma das sílabas da palavra apresentada como modelo. Gomes & Souza (2008). Nesta pesquisa avaliou-se o desempenho de pessoas diagnosticadas com autismo em tarefas de emparelhamento com o modelo por identidade. Buscou-se, na pesquisa, identificar os efeitos da organização dos estímulos sobre a aprendizagem dos participantes. Hanna, Karino, Araújo, & Souza (2010). Será que aprendemos a ler novas palavras mais rapidamente treinando a leitura com palavras semelhantes ou diferentes? Será que aprendemos a ler novas palavras mais rapidamente treinando com silabas ou letras? Essa pesquisa tentou responder a essas perguntas. Alves, de Assis, Kato, & Brino (2011). Nesta pesquisa investigou-se a aprendizagem de leitura recombinativa após procedimentos de esvanecimento de sílabas das palavras de ensino em pessoas com atraso no desenvolvimento cognitivo. 106 Elenice S. Hanna, Márcio Borges Moreira REFERÊNCIAS Alves, K. R. S., de Assis, G. J. A, Kato, O. M., & Brino, A. L.F. (2011). Leitura recombinativa após procedimentos de fading in de sílabas das palavras de ensino em pessoas com atraso no desenvolvimento cognitivo. Acta Comportamentalia, 19, 183-203. Anderson, N. B. & Rincover, A. (1982). The generality of overselectivity in developmentally disabled children. Journal of Experimental Child Psychology, 34, 217-230. Barros, R. S., Galvão, O. F., Brino, A. L. F., Goulart, P. R. K., & McIlvane, W. J. (2005). Variáveis de procedimento na pesquisa sobre classes de equivalência: contribuições para o estudo do comportamento simbólico. Revista Brasileira de Análise do Comportamento, 1, 15-27. Carter, D. E., & Werner, T. J. (1978). Complex learning and information processing by pigeons: A critical analysis. Journal of the Experimental Analysis of Behavior, 29, 565-601. Catania, A. C. (1998/1999). Aprendizagem: comportamento, linguagem e cognição. Porto Alegre: Artmed. da Hora, C. L., & Benvenuti, M. F. L. (2007). Controle restrito em uma tarefa de matching-to-sample com palavras e sílabas: avaliação do desempenho de uma criança diagnosticada com autismo. Revista Brasi107 leira de Análise do Comportamento, 3, 2945. Debert, P., Huziwara, E. M., Faggiani, R. B., de Mathis, M. E. S., & McIlvane, W. J. (2009). Emergent conditional relations in a go/no-go procedure: Figure-ground and stimulus-position compound relations. Journal of Experimental Analysis of Behavior, 92, 233243. Dinsmoor, J. A. (1995). Stimulus control: Part I. The Behavior Analyst, 18, 51–68. Duarte, A. M. M., & Baer, D. M. (1997). Overselectivity in the naming of suddenly and gradually constructed faces. In D. M. Baer & E. M. Pinkston (Eds.), Environment and behavior (pp. 210-218). Oxford: Westview Press. Dube, W. V., & McIlvane, W. J. (1999) Reduction of stimulus overselectivity with nonverbal differential observing responses. Journal of Applied Behavior Analysis, 32, 25-33. Gomes, C. G. S., & Souza, D. G. (2008). Desempenho de pessoas com autismo em tarefas de emparelhamento com o modelo por identidade: efeitos da organização dos estímulos. Psicologia: Reflexão e Crítica, 21, 418-429. Hanna, E., Karino, C., Araújo, V., & Souza, D. (2010). Leitura recombinativa de pseudopalavras impressas em pseudoalfabeto: Capítulo VI | Atenção similaridade entre palavras e extensão da unidade ensinada. Psicologia USP, 21, 275311. Johnson, D. F., & Cumming, W. W. (1968). Some determiners of attention. Journal of the Experimental Analysis of Behavior, 11, 157-166. Johnston, J. M., & Pennypacker, H. S. (2009). Strategies and Tactics of Behavioral Research. New York: Routledge. Lashley, K. S. (1938). The mechanism of vision: XV. Preliminary studies of the rat’s capacity for detail vision. Journal of General Psychology, 18, 123-193. Lovaas, O. I., Schreibman, L., Koegel, R. L., & Rehm, R. (1971) Selective responding by autistic children to multiple sensory input. Journal of Abnormal Psychology, 77, 211222. Lovaas, O. I., Koegel, R. L., & Schreibman, L. (1979). Stimulus overselectivity in autism: a review of research. Psychological Bulletin, 86, 1236-1254. Lovaas, O. I., & Schreibman, L. (1971). Stimulus overselectivity of autistic children in a two stimulus situation. Behavioral Research & Therapy, 9, 305-310. Ray, B. A. (1969). Selective attention: The effects of combining stimuli which control incompatible behavior. Journal of the Expe- rimental Analysis of Behavior, 12, 539-550. Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis of Behavior, 4, 203-208. Sidman, M. (1979). Remarks. Behaviorism, 7, 123-126. Sidman (1960). Normal sources of pathological behavior. Science, 132, 61-68. Skinner, B. F. (1953/2003). Ciência e comportamento humano (J. C. Todorov & R. Azzi, Trads.). São Paulo: Martins Fontes. Terrace, H. S. (1963). Errorless transfer of a discrimination across two continua. Jour-nal of the Experimental Analysis of Behavior, 6, 223–232. Touchette, P. E. (1969). Tilted lines as complex stimuli. Journal of the Experimental Analysis of Behavior, 12, 211-214. Verneque, L., & Hanna, E. S. (2012). Tempo de exposição a estímulos multidimensionais e topografias de controle de estímulo. Revista Brasileira de Análise do Comportamento, 8, 12-25. Wilkie, D. M., & Masson, M. E. (1976). Attention in the pigeon: a reevaluation. Journal of the Experimental Analysis of Behavior, 26, 207-212. 108 Peter Endemann, Candido Pessôa A resposta de observação: o papel das respostas sensoriais para o estabelecimento da discriminação Peter Endemann Universidade de São Paulo Candido V. B. B. Pessôa Paradigma Centro de Ciências do Comportamento Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry (Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey press. “A seleção natural atuou sobre o sistema sensorial por meio das consequências impostas aos comportamentos guiados por esse sistemas” Nilsson (2009) 109 Capítulo VII | Resposta de Observação INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A elaboração do conceito de resposta de observação se deu com o objetivo de abordar um conjunto de práticas e pressupostos envolvendo a experiência sensorial dos organismos a partir de uma perspectiva comportamental. De modo geral, a experiência sensorial, compreendida pelo ver, ouvir, sentir cheiros ou gostos ou sentir a textura de um objeto pelo tato, é tradicionalmente definida por habilidades tais como a diferenciação e associação de objetos. De uma perpectiva comportamental, essa experiência foi definida em termos de discriminação e generalização, isto é, pelo controle diferencial de respostas por estímulos do ambiente. Segundo Skinner (1938/1991), “pode-se dizer que um organismo ‘percebe que dois estímulos são diferentes’ se alguma diferença, qualquer que seja ela, pode ser identificada no comportamento sob controle daqueles estímulos” (p. 169). Essas respostas diferenciais são produzidas em um treino discriminativo ou treino de reforçamento diferencial. Nesse treino, respostas são reforçadas na presença de um estímulo (S+ ou SD) e não reforçadas na presença de outro estímulo (S- ou S-delta). Nas décadas de 1930 e 1940, o papel das respostas sensoriais no estabelecimento da discriminação foi empiricamente investigado. Posições opostas entre os diversos pesquisadores da época deram origem a um longo debate, conhecido como Controvérsia Continuidade vs. não Continuidade. Foi a partir desse debate que Wyckoff (1952, 1969) elaborou seu problema de pesquisa e o procedimento experimental para seu estudo. De um modo geral, o papel das respostas sensoriais foi inserido nos estudos sobre a discriminação por Karl Lashley (1929). Essa inserção se deu partir de um princípio fundamental da Gestalt, a seletividade. Com base nesse princípio, os organismos não percebem ou atentam ao ambiente como um todo, mas apenas a partes restritas desse ambiente. Segundo autores como Lashley (1929, 1938, 1942) e Krechevsky (1932, 1937, 1938), o sujeito experimental, ao ser exposto a um treino discriminativo, poderia atentar seletivamente a estímulos irrelevantes1 para a discriminação e permanecer respondendo sobre controle acidental desses estímulos. Nesses casos, o sujeito poderia não estar aprendendo nada sobre as contingências de discriminação programadas. Em síntese, o sujeito poderia, em função do controle seletivo de estímulos irrelevantes, permanecer em situação não discriminada mesmo sendo exposto e produzindo os reforçadores programados a depender de sua correlação com aqueles esO controle da resposta por estímulos irrelevantes e seu efeito no estabelecimento da discriminação tem sido investigado ao longo das últimas décadas por diversos pesquisadores (e.g. Dinsmoor, 1985; Dopson, Esber & Pearce, 2010; Endemann, 2013; Hall, 1976; Krechevsky, 1932; Lawrence, 1949; Mackintosh, 1965; Serna & Carlin, 2001; Spence, 1936; Trobalon, Miguelez, McLaren & Mackintosh, 2003; Wagner, Logan, Haberlandt & Price, 1968; Wyckoff, 1952; Zeaman & Denegre, 1967). 1 110 Peter Endemann, Candido Pessôa tímulos. Exemplos de estímulos irrelevantes poderiam ser a temperatura, o tamanho ou a textura da caixa experimental em um treino discriminativo entre as cores verde e vermelho. Respostas a estímulos irrelevantes ao longo do treino discriminativo foram chamadas de tentativas de solução e, segundo Lashley (1929, 1938, 1942), são parte de uma gama de atividades e da história do sujeito. Essas tentativas de solução foram analisadas por Krechevsky (1932, 1938) sob o rótulo de “hipóteses”. Essas respostas, registradas sobretudo no início do treino discriminativo, foram discutidas por Lashley e por Krechevsky com base em outro princípio da Gestalt, o da “organização sensorial”. O estabelecimento da discriminação envolveria, assim, uma série de controles independentes em função do contato sensorial e seletivo com os estímulos presentes. Essa série de controles antecederiam o contato e o controle diferencial das respostas pelos estímulos S+ e S-. Lashley exemplifica esses controles como “respostas à posição, à alternação, a dicas oriundas dos movimentos do pesquisador e que comumente precedem as respostas aos estímulos correlacionados” (Lashley, 1929, p. 135). O termo “estímulos correlacionados” utilizado por Lashley se refere tanto a S+ como a S-, pois ambos conservam correlações de +1 e -1 com o reforço, respectivamente2. Em conclusão, supondo uma priori111 dade da seletividade frente ao treino discriminativo e ao estabelecimento da discriminação, os autores (e.g., Lashley, 1929, 1938) apontavam para a necessidade de se investigar não apenas o estabelecimento de respostas diferenciais, mas também de respostas sensoriais que tinham como função colocar o organismo em contato com os estímulos S+ e S-, relevantes para a diferenciação da resposta. Não se questionava uma definição comportamental de discriminação, mas a natureza do processo pelo qual o organismo passava a responder diferencialmente quando exposto ao treino de reforçamento diferencial. Para os autores citados anteriormente (e.g., Krechevsky, 1932, 1938; Lashley, 1938) , o estabelecimento da discriminação seria um processo de natureza descontínua. Por outro lado, Kenneth W. Spence (1936, 1940, 1945) e Skinner (1938/1991) assumiam a discriminação como um processo contínuo, envolvendo o acúmulo de pequenas diferenças entre as respostas na presença de S+ e S-, em função do reforçamento diferencial (Skinner não participou ativamente do debate, o que lhe rendeu críticas, e.g., Krechevsky, 1938). Contudo, a concepção de que a discriminação seria Em um treino discriminativo, a correlação dos estímulos é correta e comumente tratada da seguinte maneira: S+ correlacionado ao reforço e S- correlacionado à extinção. A extinção se refere à ausência de reforço e, desse modo, o S- é correlacionado, negativamente, ao reforço. Assim, em um treino discriminativo, podemos nos referir tanto ao S+ como S- como “estímulos correlacionados”. Em termos de probabilidade de a resposta (ou cadeia de respostas) produzir o reforço, temos probabilidade de 100% e 0%, respectivamente, sob o S+ e sob o S-. Estímulos que, de fato, não são correlacionados com o reforço são aqueles que mantem correlação nula (zero) e a probabilidade de a resposta produzir o reforço em sua presença é 50% (i.e., ao acaso). 2 Capítulo VII | Resposta de Observação um processo contínuo de acúmulos de pequenas diferenças foi defendida por Spence). Essa concepção ficou, então, conhecida como continuísta. Com o objetivo de se investigar os processos básicos envolvidos na discriminação, tornar o treino mais eficaz e evitar o controle acidental das respostas por estímulos irrelevantes, tanto Skinner (1938/1991) como Spence (1936) estabeleceram algumas soluções procedimentais. Segundo Skinner, os experimentos deveriam ser conduzidos “em caixas à prova de som, escuras, com paredes lisas” (p. 55). Segundo Spence (1936), uma vez que o interesse é no processo de diferenciação das respostas aos estímulos correlacionados com o reforço, o ambiente experimental bem como a resposta sensorial aos estímulos correlacionados devem ser os mais simples possível. Segundo Spence (1936), todos estímulos que incidam sobre o aparato sensorial do organismo quando sua resposta é reforçada adquirem ou perdem tendências excitatórias. Assim, ao longo do treino discriminativo, possíveis controles da resposta por estímulos irrelevantes vão sendo gradualmente eliminados e os estímulos correlacionados com o reforço (i.e., S+ e S-) passam a controlar diferencialmente a resposta, em um processo gradual e contínuo. As posições opostas sobre o processo de discriminação foram submetidas a uma série de experimentos nas décadas de 1930 e 1940 (e.g. Ehrenfreund, 1948; Krechevsky, 1932, 1937, 1938; Lashley, 1929, 1938, 1942; McCulloch & Pratt, 1934; Spence, 1936, 1940, 1945). Nesses experimentos, a principal manipulação (variáveis independentes) foi o controle e variações em parâmetros dos estímulos (e.g., quantidade e posição dos estímulos no ambiente experimental, variação em suas propriedades físicas – brilho, frequência, textura, etc. – variação em sua correlação com o reforço) e o desempenho analisado (variável dependente) foi o número de “acertos” e “erros”. O desempenho foi registrado antes que os sujeitos atingissem o critério, ou seja, no período em que os sujeitos se mantinham respondendo tanto na presença do S+ quanto na do S-. Nesse período, as respostas não discriminadas (em relação aos S+ e S-) produzem as consequências programadas ao acaso, ou seja, as respostas produzem reforços em aproximadamente 50% das vezes. Esse período foi chamado de período pressolução. A manipulação de parâmetros dos estímulos e a análise das respostas no período pressolução foram realizadas em conjunto com uma manipulação bem engenhosa. Diversos pesquisadores aplicaram uma reversão na correlação dos estímulos com o reforço ainda no período pressolução, isto é, o estímulo que era S+ passava a ser S- e vice-versa. A justificativa dessas reversões no período pressolução era que caso a discriminação se estabelecesse por um processo contínuo, a reversão deveria afetar o número de respostas (acertos e erros) emitidas no 112 Peter Endemann, Candido Pessôa período pressolução, em comparação a um grupo controle para o qual a reversão não era conduzida. Se a discriminação fosse um processo descontínuo, a reversão dos estímulos no período pressolução não afetaria necessariamente o número de respostas, uma vez que essas poderiam ser emitidas sob controle de outras partes do ambiente (estímulos irrelevantes) que não aquelas que foram correlacionadas ao reforço. De todas as manipulações dos parâmetros dos estímulos, a posição na qual o estímulo era apresentado em um treino de discriminação visual teve um papel peculiar para o problema de pesquisa de Wyckoff (1969). Ehrenfreud (1948), com base nos dados inconclusivos dos experimentos até então realizados, decidiu expor dois grupos de sujeitos ao mesmo treino discriminativo e reversão dos estímulos no período pressolução. A única diferença entre os grupos foi a posição na qual os estímulos eram apresentados no campo de visão dos sujeitos. Os resultados obtidos por Ehrenfreud refletem os resultados obtidos ao longo de todo o debate: quando os estímulos eram apresentados bem a frente do sujeito, em uma posição a partir da qual o contato era favorecido ao longo de todo o treino, os resultados davam maior suporte àqueles que defendiam a discriminação como um processo contínuo. Quando os estímulos eram apresentados em outra posição do campo visual, os resultados davam maior suporte àqueles que defendiam discriminação como um processo não contínuo. 113 Apesar de o artigo de Ehrenfreud ter sido publicado em 1948, o efeito da posição do estímulo já vinha sendo debatido desde a década de 1930. Ao longo do debate, Spence (1940, 1945), de forma bastante coerente, analisou a situação experimental dos estudos e inseriu uma questão interessante em seus argumentos. Segundo Spence, a mera presença dos estímulos na situação experimental não garante que esses estímulos incidam no aparato sensorial do sujeito. Segundo Spence, “caso o aparato sensorial do animal não seja forçado a receber os estímulos correlacionados com o reforço desde o início do treino, as associações não serão formadas” (Spence, 1940, p. 276). Nessas situações, “o animal é requerido a aprender, em adição à resposta diferencial, uma resposta perceptual apropriada que o conduza para a recepção dos estímulos correlacionados ... o animal deve aprender a orientar e fixar a cabeça e os olhos afim de receber os estímulos correlacionados” (Spence, 1940, p. 276). Essas respostas foram chamadas de respostas de orientação dos órgãos receptores. Ao inserir a necessidade do aprendizado de uma resposta de orientação dos receptores no debate, Spence (1940, 1945) admite que o animal pode estar respondendo a estímulos irrelevantes e não estar apren- Capítulo VII | Resposta de Observação dendo nada sobre os estímulos correlacionados (i.e., S+ e S-). Mas, nesse caso, segundo Spence (1945), não estaria ocorrendo o estabelecimento da discriminação sobre o qual seus interesses estavam centrados. O autor insistiu, portanto, na simplificação do ambiente experimental. Após revisar o debate, Wyckoff levanta críticas ao modelo defendido por Spence (1940, 1945). Sem necessariamente tomar um partido no debate, Wyckoff (1952) aponta que a simplificação do ambiente experimental, de modo a minimizar a necessidade de aprendizado de respostas de orientação dos receptores (como definidas por Spence), poderia impor limites ao valor preditivo do modelo continuísta e de teorias sobre o estabelecimento da discriminação. Segundo Wyckoff, nem em situações cotidianas nem em situações controladas de laboratório seria possível precisar se os animais serão expostos aos estímulos correlacionados ao reforço. Em sua tese de doutorado, Wyckoff, manipulou a necessidade de se aprender a resposta de orientação dos receptores, além daquelas respostas que produzem (ou não) o reforço, em um treino discriminativo. Wyckoff finalizou o doutorado em 1951, publicou um artigo teórico em 1952 e, apenas em 1969, um artigo que descreve seu estudo experimental. Os objetivos e o método desse estudo serão descritos a seguir. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O objetivo principal do experimento de Wyckoff (1969) foi analisar o papel das respostas de orientação dos receptores no estabelecimento de uma discriminação. Diferentemente de como essas respostas eram discutidas, Wyckoff as definiu como respostas que colocam o organismo em contato com estímulos correlacionados com o reforço. Para diferenciá-las das respostas que produzem o reforço (e.g., bicar um disco em experimentos com pombos, pressionar uma barra em experimentos com ratos, chamadas de respostas efetivas), Wyckoff as nomeou de respostas de observação (RO). Com base na função da RO (i.e., colocar o organismo em contato com os estímulos correlacionados ao reforço) e nos princípios do condicionamento operante descritos por Skinner (1938/1991), Wyckoff (1969) investigou se a produção de estímulos discriminativos teria um efeito reforçador sobre a RO em um treino discriminativo. Essa investigação, segundo Wyckoff (1952), forneceria um tratamento comportamental ao que vinha sendo nomeado de experiência sensorial e resposta de orientação dos receptores. Frente à dificuldade de se registrar a orientação dos órgãos receptores de sujeitos experimentais, Wyckoff (1969) foi engenhoso e coerente com a definição funcional da RO. Em seu experimento, usou pombos 114 Peter Endemann, Candido Pessôa como sujeitos experimentais. Na caixa experimental, um pedal foi posto no piso e os estímulos correlacionados com o reforço (S+ ou S-) só eram apresentados caso o pombo o pressionasse. Assim, os pombos só entravam em contato com os estímulos ao pressionar o pedal. Os estímulos ficavam expostos durante todo o tempo em que o sujeito estivesse pisando o pedal, o que, por sua vez, definiu a medida a ser registrada e analisada por Wyckoff: a duração da resposta de observação. No experimento, foram utilizados 20 pombos mantidos sob um regime de privação de comida. Os pombos foram distribuídos em dois grupos, (Controle e Experimental). Além do pedal, a caixa experimental continha um disco que podia ser iluminado de branco, vermelho ou verde e um comedouro retrátil (para apresentação de comida). Em uma fase preliminar, que durou 45 min, houve a adaptação dos pombos de ambos os grupos às condições experimentais. Durante os primeiros 15 min dessa fase, o disco foi iluminado de branco e a primeira bicada no disco produzia acesso a um comedouro por 4 s em um esquema de intervalo fixo (FI) 30 s. Durante os 30 min restantes dessa fase, o disco foi iluminado de verde ou de vermelho em períodos sucessivos de 30 s. As respostas de bicar o disco davam acesso ao comedouro da mesma forma que nos primeiros 15 min dessa fase (i.e., sob um FI 30 s). Nesta fase preli115 minar, não havia contingências para pisar no pedal e tampouco uma correlação entre as luzes verde e vermelha e o acesso ao comedouro. Os pombos do Grupo Controle foram expostos a estas condições durante todo o experimento. Na Fase Experimental (treino discriminativo), aplicadas apenas aos pombos no Grupo Experimental, houve cinco sessões de 75 min e uma de 15 min. Durante as sessões desta fase, respostas de bicar o disco foram mantidas sob um esquema FI 30 s. Esse esquema se alternava com um esquema de extinção a cada 30 s. Durante a extinção, bicadas no disco não produziam acesso ao comedouro. Durante a fase experimental, a luz vermelha era correlacionada ao FI 30 s (i.e., aos reforços) a luz verde era correlacionada à extinção. Entretanto, as luzes verde ou vermelha eram produzidas somente enquanto o pombo pisasse no pedal, isto é, quando emitisse a RO. Se o pombo emitisse a RO e o esquema em vigor fosse a extinção, o disco era iluminado de verde. Quando o pombo pisasse no pedal e estivesse em vigor o esquema FI 30 s, a luz vermelha se acendia no disco. Caso o sujeito não emitisse a RO, o disco permanecia iluminado de branco tanto quando o esquema em vigor era o FI30 s quanto quando o esquema em vigor era extinção e as respostas de bicar o disco produziam o reforço a depender de qual esquema estava em vigor. Em resumo, pisar o pedal, emitindo a RO, transformava um esquema misto FI 30 s extinção em um esquema múltiplo FI 30 s extinção3. Capítulo VII | Resposta de Observação Após as seis primeiras sessões da Fase Experimental, o Grupo Experimental foi subdividido em três subgrupos A, B e C. O subgrupo A permaneceu no treino discriminativo (reforçamento diferencial) e, assim, a RO continuava a produzir as luzes verde e vermelha e essas, por sua vez, se mantinham relacionadas com a extinção e reforço, respectivamente. Para o subgrupo B, a relação dos estímulos com o reforço foi invertida (o estímulo relacionado ao FI 30 s passou a ser o verde e o estímulo relacionado à extinção passou a ser o vermelho); e o subgrupo C retornou à condições semelhantes aos últimos 30 min da fase preliminar (reforçamento não-diferencial), nas quais as luzes, apesar de produzidas pela pressão no pedal, não estavam mais correlacionadas ao reforço (i.e., reforço poderia ser produzido com a mesma probabilidade diante da luz verde e vermelha, se o pedal estivesse pressionado, e branca, se o pedal não estivesse pressionado). Resultados e Discussão Como indicado anteriormente, Wyckoff (1969) registrou o tempo em que o pedal era pressionado, isto é, a duração das respostas de observação. Com isso, ele analisou variações na duração da RO em função da produção ou não dos estímulos correlacionados com o reforço nos diferentes Em um esquema múltiplo, dois ou mais esquemas de reforço se alternam e cada um é apresentado conjuntamente a um estímulo diferente. Em um esquema misto, os esquemas de reforço se alternam, mas não há estímulos correlacionados diferencialmente com os esquemas em vigor (Machado, 1982). 3 subgrupos. A duração da RO para o Grupo Controle foi relativamente alta inicialmente, mas rapidamente diminuiu, permanecendo baixa até o fim do experimento. Para o Grupo Experimental, a duração da RO também começou alta para todos os pombos e assim permaneceu para o subgrupo A, que se manteve no treino discriminativo. Para o subgrupo B, a duração da RO diminuiu logo que a correlação dos estímulos foi invertida, mas aumentou assim que a discriminação foi novamente estabelecida. Para o subgrupo C, que retornou às condições da fase preliminar após o treino discriminativo (as luzes verde e vermelha podiam ser produzidas, mas não havia correlação diferencial com o reforço), a duração da RO diminuiu em relação à fase em que havia correlação entre as luzes verde e vermelha e o reforço. Em conclusão, Wyckoff (1969) afirmou que a exposição e o contato dos sujeitos com os estímulos discriminativos teve um efeito reforçador sobre a RO (i.e., pressão ao pedal). Assim, Wyckoff confirmou que a produção de estímulos discriminativos para a resposta de bicar um disco estabeleceu e manteve a RO. Com base em seus resultados, Wyckoff (1952, 1969) afirmou que (1) a probabilidade da RO aumenta ou permanece alta sob as condições de reforço diferencial implementadas no treino discriminativo; (2) quando a correlação dos estímulos é invertida, a probabilidade da RO diminui temporariamente e depois retorna a um valor alto; e (3) a probabilidade da RO 116 Peter Endemann, Candido Pessôa diminui ou permanece baixa em situações de reforço não-diferencial, nas quais os estímulos produzidos pela RO não são correlacionados ao reforço. Os resultados obtidos autorizaram Wyckoff (1969) a discutir o papel da RO no estabelecimento da discriminação tendo como base os princípios operantes descritos por Skinner (1938/1991). Segundo Wyckoff (1952, 1969), a RO é uma resposta operante cuja consequência é a produção dos estímulos discriminativos. Definir a resposta de observação por sua função e não por sua topografia permitiu a Wyckoff delinear um experimento que facilmente registrou as respostas de observação. Foi esta genialidade que tornou seu estudo um clássico na Análise do Comportamento e permitiu ampliar o uso do conceito de discriminação para situações em que os estímulos discriminativos não estão claramente dispostos sobre o aparato sensorial dos indivíduos. Um aspecto importante da RO vale ser ressaltado. A emissão da RO tem como única consequência a produção dos estímulos discriminativos e, portanto, não altera a obtenção dos reforços programados para uma determinada resposta. A obtenção dos reforços pode ocorrer sem a emissão da RO (i.e., na presença da luz branca). Em uma discriminação sucessiva (i.e., em que os estímulos correlacionados com reforço e com extinção se alternam), como delineada por Wyckoff (1969), todos os reforços programados podiam ser produzidos 117 sem que os pombos emitissem uma única vez a RO. Esse aspecto levou a alguns desdobramentos importantes na investigação sobre o estabelecimento da discriminação, sobre os efeitos comportamentais de reforços condicionados e sobre atenção. Esses desdobramentos são discutidos a seguir. DESDOBRAMENTOS No procedimento de Wyckoff (1969), chamado de delineamento (ou procedimento) de resposta de observação, o fortalecimento da RO não ocorreu em função direta da produção do estímulo reforçador primário (i.e., acesso a comida). Como visto, no estudo de Wyckoff, o valor de reforçador condicionado das luzes verde e vermelha foi adquirido em função de suas correlações com os esquemas de reforço (i.e., FI 30 s) e extinção que, por sua vez, controlaram o aumento na duração da RO. Por meio desse delineamento, vários autores têm investigado essa (correlação) e outras condições (e.g. temporais) necessárias para o estabelecimento do valor reforçador condicionado de determinados estímulos. Como esperado, posições e hipóteses opostas sobre o reforço condicionado foram propostas. Um amplo debate se mantém até os dias atuais. As duas principais hipóteses são conhecidas como a hipótese da redução da incerteza e a hipótese da redução do atraso. Autores que propõem a hipótese da redução da incerteza (e.g. Berlyne, 1957) Capítulo VII | Resposta de Observação defendem que a condição necessária para o estabelecimento e controle da RO é a redução na incerteza gerada pelas respostas aos estímulos não-correlacionados (estímulos irrelevantes, tais como a luz branca do esquema misto no estudo de Wyckoff, 1969). Os autores que propõem a hipótese da redução do atraso (e.g. Fantino, 1977; Fantino & Logan, 1979), defendem que a condição necessária para o estabelecimento do valor reforçador condicionado de um estímulo é a redução temporal relativa sinalizada pelo estímulo correlacionado com o reforço primário. Dinsmoor (1983) discute algumas questões referentes à RO e apresenta, além de novas possibilidades de investigação sobre reforçamento condicionado, um refinamento do estudo de Wyckoff (1969) e do conceito de resposta de observação. Como descrito anteriormente, Wyckoff registrou e analisou a duração da RO em função da correlação dos estímulos com o reforço. Dinsmoor, Browne, Lawrence, e Wasserman (1971) registraram e analisaram separadamente a duração da RO nos diferentes componentes (i.e., na presença dos diferentes estímulos) em um treino de reforçamento diferencial. Os autores notaram que a duração da RO é maior na presença do S+ do que na presença do S-. Essa assimetria na duração da RO entre S+ e S- foi definida pelos autores como observação seletiva e gerou novas pesquisas sobre o reforço condicionado e sobre o papel da RO no estabelecimento da discriminação (e.g. Dinsmoor 1985; Dinsmoor, Mueller, Martin, & Bowe, 1982). Com o desenvolvimento de novas tecnologias, especialmente a de rastreamento dos movimentos oculares, o conceito de resposta de observação tem sido submetido à novos refinamentos e discussões (e.g. Endemann, 2008, 2013; Pessôa, 2010; Tomanari, Balsamo, Fowler, Farren, & Dube, 2007; Tomanari & Pergher, 2003). O registro de parâmetros dos movimentos sacádicos4 (pico de velocidade, amplitude, curvatura) e da fixação (frequência, duração) tem permitido a análise de novas medidas da RO. De posse dessas novas medidas, o papel da RO tem sido analisado em diferentes situações básicas e aplicadas envolvendo discriminações simples e condicionais, formação de classes de estímulos equivalentes (e.g. Dube et al., 1999; Serna & Carlin, 2001), treinamento de habilidades como leitura e resolução de problemas (e.g. Endemann, Pessôa, Perez & Tomanari, 2010). CONSIDERAÇÕES FINAIS Com o objetivo de trazer a discriminação para o campo da análise do comportamento operante, Skinner (1938/1991) deMovimentos sacádicos são os movimentos oculares rápidos, antecedidos e precedidos pela fixação e acomodação dos estímulos no centro da retina (e.g. Krauzlis, 2008; Madelain, Paeye & Darcheville, 2011; Salthouse & Ellis, 1980). Segundo Krauzlis (2008), um aspecto importante dos movimentos sacádicos é que “são seletivamente guiados por objetos de interesse do observador, apesar do fato de haver usualmente no ambiente vários outros objetos distratores” (Krauzlis, 2008, p. 789, itálico acrescentado). 4 118 Peter Endemann, Candido Pessôa fendeu que a discriminação e a experiência sensorial a ela subjacente deveriam ser definidas e analisadas com base em apenas uma classe de respostas (i.e., aquela que, pela produção diferencial do reforço, fica sob controle de estímulos discriminativos). Wyckoff (1969) foi original em estabelecer medidas interdependentes entre duas classes de resposta (i.e., a que produz diretamente o reforço e a que produz os estímulos discriminativos) e em avaliar experimentalmente a resposta de observação bem como o entrelaçamento desta com a resposta que produz o reforço. Esse entrelaçamento é mediado por um estímulo com duas funções: Função reforçadora condicionada para a resposta de observação e função discriminativa para a resposta que produz o reforço (e.g., Pessôa & Sério, 2006). lares). Neste estudo, apresentam-se com mais detalhes os estudos experimentais e argumentos da Controvérsia continuidade vs. não-continuidade. Pessôa & Sério (2006). Análise teórica sobre as duas contingências envolvidas no estabelecimento da discriminação. Os autores discutem as duas funções adquiridas pelo estímulo correlacionado com o reforço: Discriminativo, para a resposta efetiva, e reforçador condicionado, para a resposta de observação. PARA SABER MAIS Tomanari (2009). Ampla revisão dos estudos sobre a resposta de observação desde pesquisas precursoras com ratos expostos a labirintos até investigações mais recentes sobre o tema. O autor apresenta aspectos relevantes do delineamento experimental tais como número de operanda e as diferentes espécies utilizadas nos estudos. Dinsmoor (1985). Análise teórica sobre o papel da resposta de observação no estabelecimento da discriminação, em que o autor critica as posições de Skinner e Spence. O autor apresenta uma série de estudos sobre controle de estímulos, destacando o papel da observação seletiva (desenvolvido desde o estudo de Dinsmoor et al., 1971). Pessôa & Tomanari (2015). Diferenciam o procedimento de resposta de observação elaborado por Wyckoff (1969) da importância da resposta de observação por ele definida funcionalmente, dando destaque às possibilidades de pesquisas aplicadas para a facilitação da aquisição de respostas de observação. Endemann (2013). Análise experimental e teórica sobre o efeito de variações nos estímulos irrelevantes para a aquisição e manutenção da resposta de observação visual (registrada por meio dos movimentos ocu119 REFERÊNCIAS Berlyne, D. E. (1957). Uncertainty and conflict: A point of contact between informa- Capítulo VII | Resposta de Observação tion theory and behavior concepts. Psychological Review, 64, 329-333. Dinsmoor, J. A. (1983). Observing and conditioned reinforcement. Behavioral and Brain Sciences, 6, 693-728. Dinsmoor, J. A. (1985). The role of observing and attention in establishing stimulus control. Journal of the Experimental Analysis of Behavior, 43, 365-381. Dinsmoor, J. A., Browne, M. P., Lawrence, C. E., & Wasserman, E. A. (1971). A new analysis of Wyckoff’s observing response. Proceedings of the 79th Annual Convention, American Psychological Association (pp. 679-680). Dinsmoor, J. A., Mueller, K. L., Martin, L. T., & Bowe, C. A. (1982). The acquisition of observing. Journal of the Experimental Analysis of Behavior, 38, 249-263. Dopson, J. C., Esber, G. R., & Pearce, J. M. (2010). Differences in the associability of relevant and irrelevant stimuli. Journal of Experimental Psychology: Animal Behavior Processes, 36, 258–267. Dube, W. V., Lombard, K. M., Farren, K. M., Flusser, D. S., Balsamo, L. M., & Fowler, T. R. (1999). Eye tracking assessment of stimulus overselectivity in individuals with mental retardation. Experimental Analysis of Human Behavior Bulletin, 17, 8-14. Ehrenfreund, D. (1948). An experimental test of the continuity theory of discrimination with pattern vision. Journal of Comparative and Physiological Psychology, 41, 408-422. Endemann, P. (2008). Resposta de observação e movimento dos olhos em uma situação de discriminação simples simultânea. (Dissertação de Mestrado). Universidade de São Paulo, São Paulo. Endemann, P. (2013). Aprendizado sobre a (ir)relevância dos estímulos. (Tese de doutorado) Universidade de São Paulo, São Paulo. Endemann, P., Pessôa, C. V. B. B., Perez, W. F., & Tomanari, G. Y. (2010). Identificação de operantes verbais constituintes da leitura por meio da análise dos movimentos dos olhos. Psicologia: Teoria e Pesquisa, 27, 139148. Fantino E. (1977). Conditioned reinforcement: Choice and information. In W.K. Honig & J.E.R. Staddon (Eds.), Handbook of operant behavior (pp. 313–339). Englewood Cliffs, NJ: Prentice-Hall. Fantino, E., & Logan, C. A. (1979). The experimental analysis of behavior: A biological perspective. New York: W. H. Freeman. Hall, G. (1976). Learning to ignore irrelevant stimuli variations within and between displays. Quarterly Journal of Experimental Psychology, 28, 247-253 120 Peter Endemann, Candido Pessôa Krauzlis, R. J. (2008). Eye movements. In L. R. Squire & D. Berg (Eds.), Fundamental Neuroscience (pp. 775-792). Amsterdam: Elsevier. Krechevsky, I. (1932). Hypotheses in rats. Psychological Review, 39, 516-532. Krechevsky, I. (1937). A note concerning “the nature of discrimination learning in animals.” Psychological Review, 44, 97-104. Krechevsky, I. (1938). A study of the continuity of the problem-solving process. Psychological Review, 45, 107-133. Lashley, K. S. (1929). Brain mechanisms and intelligence. Chicago: University of Chicago Press. Lashley, K. S. (1938). The mechanism of vision: XV. Preliminary studies of the rat’s capacity for detail vision. Journal of General Psychology, 18, 123-193. Lashley, K. S. (1942). An examination of the continuity theory as applied to discrimination learning. Journal of Genetic Psychology, 26, 241-265. Lawrence, D. H. (1949). Acquired distinctiveness of cues: I. Transfer between discriminations on the basis of familiarity with the stimulus. Journal of Experimental Psychology, 39, 770-784. Mackintosh, N. J. (1965). Selective attention 121 in animal discrimination learning. Psychological Bulletin, 64, 124-50. Madelain L., Paeye C., & Darcheville, J. C. (2011). Operant control of human eye movements. Behavioural Processes, 87, 142–148. Nilsson, D.E., (2009). The evolution of eyes and visually guided behaviour. Philosophical Transactions of the Royal Society, 364, 2833–2847. Pearce, J. M., Esber, G. R., George, D. N., & Haselgrove, M. (2008). The nature of discrimination learning in pigeons. Learning & Behavior, 36, 188-199. Pessôa, C. V. B. B. (2010). Efeito de diferentes treinos de discriminação sobre as fixações dos olhos de humanos. (Tese de doutorado). Universidade de São Paulo, São Paulo. Pessôa, C. V. B. B., & Sério, T. M. A. P. (2006). Análise do comportamento de observação. Revista Brasileira de Análise do Comportamento, 2, 143-153. Pessôa, C. V. B. B., & Tomanari, G. Y. (2015). Procedimento de resposta de observação e comportamento de observação. Perspectivas em Análise do Comportamento, 6, 8998. Salthouse, T. A., & Ellis, C. L. (1980). Determinants of eye-fixation duration. American Journal of Psychology, 93, 207-234. Capítulo VII | Resposta de Observação Serna, R. W., & Carlin, M. T. (2001). Guiding visual attention in individuals with mental retardation. In L. M. Glidden (Ed.), International review of research in mental retardation, 24 (pp. 321-357). San Diego, CA: Academic Press. Skinner, B. F. (1938). The behavior of organisms: an experimental analysis. New York: Appleton-Century-Crofts. Spence, K. W. (1936). The nature of discrimination learning in animals. Psychological Review, 43, 437-449. Spence, K. W. (1940). Continuous versus non-continuous interpretations of discrimination learning. Psychological Review, 47, 271-288. Spence, K. W. (1942). The basis of solution by chimpanzees of the intermediate size problem. Journal of Experimental Psychology, 31, 257-271. Spence, K. W. (1945). An experimental test of the continuity and noncontinuity theories of discrimination learning. Journal of Experimental Psychology, 35, 253-266. Tomanari, G. Y. (2009). Resposta de observação: Uma reavaliação. Acta Comportamentalia, 17, 259-277. Tomanari, G. Y., Balsamo, L. M., Fowler, T. R., Farren, K. M., & Dube, W. V. (2007). Manual and ocular observing behavior in human subjects. European Journal of Behavior Analysis, 8, 29-40. Tomanari, G. Y., & Pergher, N. K. (2003). Observing behavior and eye movements in a Wyckoff observing response procedure. Paper presented at the Annual Meeting of the Association for Behavior Analysis, São Francisco. Trobalon, J.B., Miguelez, D., McLaren, I. P .L., & Mackintosh, N. J. (2003). Intradimensional and extradimensional shifts in spatial learning. Journal of Experimental Psychology: Animal Behavior Processes, 29, 143-152. Wagner, A. R., Logan, F. A., Haberlandt, K., & Price, T. (1968). Stimulus selection in animal discrimination learning. Journal of Experimental Psychology, 76, 171-180. Wyckoff, L. B. (1952). The role of observing responses in discrimination learning: Part I. Psychological Review, 59, 431-442. Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry (Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey Press. Zeaman, D. & Denegre, J. (1967). Variability of irrelevant discriminative stimuli. Journal of Experimental Psychology, 73, 574-580. 122 Edson Massayuki Huziwara, Candido V. B. B. Pessôa Controle dos processos atencionais Edson Massayuki Huziwara Universidade Federal de Minas Gerais Candido V. B. B. Pessôa Paradigma Centro de Ciências do Comportamento Holland, J. G. (1958). Human vigilance. Science, 128 (3315), 61-67. “Life is what happens to you while you’re busy making other plans” John Lennon 123 Capítulo VIII | Atenção INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Notícias a respeito de pessoas diagnosticadas com o Transtorno do Déficit de Atenção e Hiperatividade (TDAH) tornaram-se consideravelmente frequentes nos dias atuais. Segundo o Manual Diagnóstico e Estatístico de Transtornos Mentais (DSM-IV-TR™), o TDAH apresenta como característica principal um “padrão persistente de desatenção e/ou hiperatividade-impulsividade, mais frequente e grave do que aquele tipicamente observado nos indivíduos em equivalente estágio de desenvolvimento” (APA, 2002, p. 112). Estima-se que 3% a 6% das crianças em idade escolar de todo o mundo tenham sido diagnosticadas com o referido transtorno (Faraone, Sergeant, Gillberg, & Biederman, 2003; Rohde, Miguel Filho, Benetti, Gallois, & Kieling, 2004), constituindo-se assim em uma das principais causas de encaminhamento para os serviços de saúde (Rohde, Barbosa, Tramontina, & Polanczyk, 2000; Rohde et al., 2004). Iniciar este capítulo apresentando considerações acerca do TDAH tem por objetivo ilustrar como questões relacionadas a processos atencionais estão em evidência na Psicologia contemporânea. A produção de conhecimento sobre tais processos continua sendo fundamental para o desenvolvimento de intervenções eficazes (Ketzer, Gallois, Martinez, Rohde, & Schmitz, 2012; Reinhardt & Reinhardt, 2013). O interesse pelos processos atencionais justifica-se não somente pelos aspectos patológicos nele envolvidos, mas também por sua aparente importância nas mais variadas situações de nossa vida cotidiana. Por exemplo, um jogador que não se mantiver atento ao jogo reduz suas possibilidades de vitória; um aluno que não se mantiver atento à aula, reduz suas possibilidades de aprender a tarefa; ou, ainda, um motorista que não se mantiver atento ao trânsito, aumenta suas possibilidades de causar ou sofrer um acidente. Estudos sobre processos atencionais conduzidos nas décadas de 1940 e 1950 utilizavam situações nas quais indivíduos eram requisitados a detectar a ocorrência de determinados eventos críticos, porém pouco frequentes, em tarefas longas e propositalmente monótonas. Mackworth (1948), por exemplo, realizou um experimento no qual a tarefa dos participantes era observar um mostrador de um relógio analógico. Em grande parte do tempo, o único ponteiro apresentado nesse mostrador realizava movimentos em ritmo regular, movendo-se apenas uma vez por segundo. Os eventos críticos que deveriam ser detectados pelos participantes consistiam em movimentos duplos do ponteiro, ou seja, ocasiões em que o ritmo era alterado e o ponteiro movia-se duas vezes em um único segundo. Esses eventos críticos ocorriam 24 vezes em cada hora de sessão, em intervalos variáveis de 124 Edson Massayuki Huziwara, Candido V. B. B. Pessôa tempo. O procedimento tinha como objetivo simular situações em que, por exemplo, um marinheiro observa um sonar para detectar a presença de submarinos inimigos. Holland (1958) destacou a similaridade desta situação com a de um trabalhador em uma fábrica que inspeciona produtos em uma linha de produção para detectar itens com defeito que raramente aparecem. Nessas situações, apesar da baixa probabilidade de ocorrência de um evento crítico, sua detecção seria de extrema importância e, portanto, marinheiros ou trabalhadores deveriam manter-se atentos durante todo o tempo de execução da tarefa. Muitos estudos utilizando tarefas experimentais similares àquela proposta por Mackworth (1948) foram conduzidos. Em geral, os resultados demonstraram que a acurácia em detectar os eventos críticos diminuía ao longo do tempo (e. g., Adams, 1956; Bakan, 1955; Bartlett, Beinert, & Graham, 1955; Deese & Ormond, 1953; Fraser, 1950; Mackworth, 1948; 1950). Mais especificamente, todos ou quase todos os eventos críticos apresentados no início da sessão eram detectados. No entanto, principalmente depois dos 30 primeiros minutos, apenas aproximadamente 30% dos participantes continuavam a detectar na mesma proporção os eventos que ocorriam. Outro resultado comum nessas pesquisas era uma correlação positiva entre a quantidade absoluta de eventos críticos apresentados e a porcentagem total de eventos detectados – i.e., em média, 46% dos eventos críticos 125 eram detectados quando 10 apresentações por hora eram realizadas; no entanto, 88% dos eventos eram detectados quando 40 apresentações por hora eram realizadas (Deese & Ormond, 1953). De acordo com Deese e Ormond, o desempenho altamente acurado no início da tarefa seria um reflexo dos altos níveis de atenção ou vigilância1 apresentados pelos indivíduos. Ainda segundo Deese e Ormond, com o passar do tempo e a consequente fadiga, os níveis de atenção ou vigilância diminuiriam e isso produziria uma queda na quantidade de detecções. A correlação positiva entre quantidade absoluta de apresentações de eventos críticos e porcentagem de detecções, por sua vez, era explicada fazendo referência à diferentes níveis de expectativa. Dizia-se que quanto maior a quantidade de eventos críticos apresentados até um determinado momento da sessão, maior também seria a expectativa de que um próximo evento crítico fosse apresentado dentro de um curto espaço de tempo. Portanto, a alta expectativa da próxima apresentação de um evento crítico manteria altos níveis de atenção e vigilância durante a tarefa, apesar da fadiga ocasionada pelo decorrer do tempo. Acerca de tais explicações, baseadas em constructos teóricos como atenção, vigilância ou expectativa, Holland (1958) argumentou: Optou-se por traduzir a palavra inglesa “vigilance” por “vigilância”. Outras possibilidades de tradução, talvez mais provocativas, seriam “concentração” ou “atenção focada”, termos que aparecem como sinônimos de “vigilance” na edição eletrônica do Oxford Dictionary. 1 Capítulo VIII | Atenção Esses conceitos dão a aparência de explicar os dados em virtude da sintaxe das frases. Diz-se que o participante faz uma detecção porque ele está, naquele momento, vigilante e atento ou esperando um sinal. Mas, os conceitos não são menos misteriosos do que os fenômenos que se propõem a explicar. Resta a tarefa de descobrir os eventos que influenciam a vigilância, a atenção ou a expectativa. (p. 62). Ainda de acordo com Holland (1958), as diferenças nas quantidades de detecções realizadas no início ou final da sessão, assim como a correlação positiva entre quantidade absoluta e percentual de eventos críticos detectados, como ocorrido, por exemplo, em Deese e Ormond (1953), são formas de descrever padrões comportamentais dos participantes e, como tal, não necessitariam de constructos mentais como atenção, vigilância ou expectativa para serem explicados. Diante desse contexto, o desafio estava assim posto: Como estudar o fenômeno da detecção de eventos críticos e explicar resultados muito regulares sem recorrer a constructos mentais (e.g., expectativa)? Holland (1958) acreditava que a precisão em detectar eventos críticos poderia estar relacionada à emissão de um conjunto de respostas que aumentaria a possibilidade de sucesso em tal tarefa, sendo estas denominadas de respostas de observação. Wyckoff (1952; 1969) definiu respostas de observação como aquelas que produzem os estímulos discriminativos para outras respostas. Manter-se observando o visor por longos períodos de tempo ou identificar prontamente quais os vários estímulos presentes durante a execução da tarefa são exemplos de respostas de observação, uma vez que um evento detectado seria o estímulo discriminativo para relatar esse evento e as respostas de observação seriam mantidas pela produção destes estímulos discriminativos. Holland foi a primeira pessoa a manipular experimentalmente a frequência e a distribuição temporal das respostas de observação. O seu experimento, adiante relatado, tornou-se assim um dos mais clássicos sobre processos atencionais realizado sob a orientação teórica da Análise do Comportamento. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Holland (1958) teve dois objetivos. O primeiro foi verificar se a detecção de sinais seria um reforçador para respostas de observação. O segundo foi medir as respostas de observação em situações similares às usadas por Mackworth (1948), para possibilitar uma reinterpretação dos eventos ocorridos na situação analisada em termos comportamentais, sem o uso de constructos como expectativa ou atenção. No experimento de Holland (1958), a tarefa experimental consistia em par126 Edson Massayuki Huziwara, Candido V. B. B. Pessôa ticipantes – jovens alistados na marinha americana – observarem um mostrador retangular com um ponteiro inicialmente posicionado na extremidade esquerda. No início da sessão, o participante era instruído a detectar e relatar o máximo de ocasiões nas quais o ponteiro se movesse da extremidade esquerda para a extremidade direita do mostrador (ver Figura 1). O relato de movimentos do ponteiro era feito pelo participante ao apertar um botão de relato, que também recolocava o ponteiro no lugar original. No fim da sessão era informado ao participante quantos sinais ele havia detectado e o tempo médio de detecção. A novidade no procedimento proposto por Holland consistiu em inserir um botão que, quando pressionado, acendia uma lâmpada localizada atrás do mostrador, iluminando-o por 0,07s (resposta de observação). Após esse curto período, a lâmpada era apagada e a única forma de iluminar o mostrador e poder observar o ponteiro novamente era uma nova pressão ao botão. As sessões ocorriam em uma sala escura, de maneira que a única forma de detectar as mudanças no ponteiro era emitir a resposta de pressionar a lâmpada. Quando um movimento do ponteiro era detectado, o participante deveria apertar outro botão para informar que havia detectado um movimento do ponteiro. Este segundo botão tinha duas consequências: (1) acionava um contador de eventos e (2) recolocava o ponteiro no lugar original, à esquerda do mostrador, o que possibilitava que um novo movimento do ponteiro ocorresse. O procedimento permitiu medir 127 Figura 1. Representação do mostrador apresentado aos participantes no experimento de Holland (1958). A parte esquerda da figura mostra a posição inicial do ponteiro, antes da ocorrência do evento crítico. A parte direita mostra a posição do ponteiro depois de ocorrido o evento crítico. A seta cinza representa o sentido do movimento executado pelo ponteiro. com precisão a ocorrência das respostas de observação – i.e., pressões no botão que iluminava o mostrador – ao longo do experimento. A questão acerca dos efeitos reforçadores da detecção de eventos críticos foi solucionada utilizando conhecimentos provenientes de uma das áreas mais exaustivamente estudadas em Análise do Comportamento, a saber, os esquemas de reforço. Esquemas são regras que especificam sob quais condições determinadas respostas produzem consequências. De crucial importância para o presente contexto foram experimentos que demonstraram que a taxa de respostas e o padrão temporal de respostas é determinado por esquemas (Catania, 1999; Ferster & Skinner, 1957). Mais precisamente, os estudos encontraram essa modulação de maneira tão regular, independente do organismo ou da resposta sob análise, que se torna possível prever o padrão comportamental diante de cada diferente esquema de reforço utilizado (Machado, 1982; Skinner, 1956). Se, sob um determinado esquema de reforço, Capítulo VIII | Atenção a resposta assume um padrão de emissão típico do esquema, pode-se concluir que a contingência de reforço pela qual o reforço é produzido no esquema está controlando aquela resposta. Com base nesse conhecimento, para fazer com que a oportunidade de realizar uma detecção (i.e., pressionar o botão que relatava um movimento do ponteiro) se tornasse contingente à emissão de um determinado padrão de respostas de observação (i.e., pressionar o botão para o acendimento da lâmpada), Holland (1958) utilizou diferentes esquemas de reforço para a produção de movimentos dos ponteiros pela emissão de respostas de observação. Caso os padrões de respostas emitidos pelos participantes no botão que acendia a lâmpada fossem similares àqueles usualmente descritos quando utilizados os diferentes esquemas de reforço, a hipótese das funções reforçadoras da detecção de eventos críticos estaria comprovada. Holland (1958) utilizou três diferentes esquemas de reforço para avaliar o padrão de emissão das respostas de observação: um esquema de intervalo fixo (FI), um esquema de razão fixa (FR) e um esquema de reforço diferencial de taxas baixas (DRL). Sob o FI, uma resposta é reforçada após transcorrido um período fixo de tempo, contado a partir de um evento ambiental relevante como a obtenção do reforço ou o início da sessão; as respostas que ocorrem antes do final do período não são reforçadas. Em esquemas FI, o padrão de respostas é caracterizado por baixas taxas no início do intervalo e um aumento na taxa de respostas à medida que se aproxima o seu final (para uma discussão das exceções a este padrão veja, por exemplo, Okouchi, 2002). No experimento de Holland, cinco participantes foram primeiramente expostos a um FI 30s por oito sessões de 40 min. Ou seja, a primeira resposta de observação (i.e., pressionar o botão para o acendimento da luz) emitida após 30 s produzia não somente o acendimento da lâmpada por 0,07s, mas também o movimento do ponteiro no mostrador e a consequente oportunidade de detecção do evento crítico. Em seguida, o valor do intervalo foi aumentado para 1, 2, 3, e, finalmente, 4 min, com oito sessões sucessivas sob cada valor do FI. Sob o FR, a produção do reforço depende apenas da emissão de um número fixo de respostas, que é contado a partir de um evento ambiental relevante, como a obtenção do reforço ou o início da sessão. Assim sendo, nesse esquema, a obtenção do reforçador não está vinculado à passagem do tempo, existe uma relação direta entre a taxa de respostas emitida e a taxa de reforços obtida. Talvez por este motivo, o padrão de respostas em FR seja caracterizado por taxas altas e constantes durante toda a sessão, sendo muitas vezes possível visualizar pausas no responder que ocorrem tipicamente após cada reforço (diferentes das pausas após o reforço em um FI, a taxa de respostas na retomada de um FR inicia-se 128 Edson Massayuki Huziwara, Candido V. B. B. Pessôa já constante, enquanto em FI ela tende a ser positivamente acelerada). Holland (1958) primeiramente expos, por seis sessões de 40 min, sete participantes a um FR 36, ou seja, a oportunidade de detecção ocorreu somente após a emissão da 36ª resposta de observação. Então, o valor do FR foi aumentado, também em blocos de seis sessões, para 60, 84, 108, 150 e, finalmente, 200 respostas por detecção. Por fim, sob o DRL, uma resposta é reforçada somente quando emitida após um intervalo de tempo especificado sem ela ocorrer. Ao considerar que o esquema reforça diferencialmente o espaçamento temporal entre as respostas, o padrão de respostas emitidas pelos participantes irá se adequar ao valor temporal estipulado, mais precisamente, quanto maior for o tempo exigido para a não ocorrência de respostas, menor será a taxa de respostas. Dessa forma, o padrão tipicamente obtido sob o DRL é o de baixas taxas de respostas, com espaçamento temporal entre elas e com ocasionais emissões de “jorros” de várias respostas com baixíssimo intervalo. Dois participantes foram expostos a um DRL 30 s, ou seja, uma resposta de observação iria provocar o movimento do ponteiro e a consequente oportunidade de detecção se, e somente se, fosse precedida por um período mínimo de 30s sem que essa mesma resposta de observação tivesse sido emitida. As sessões tinham duração de 4h. Para atingir o segundo objetivo, ve129 rificar como seriam as respostas de observação em uma situação similar à usada por Mackworth (1948), Holland (1958) usou esquemas de reforço baseando-se nas apresentações de eventos críticos usados por Mackworth. Nas situações testadas por Mackworth, os intervalos entre os eventos críticos (duplos movimentos no ponteiro do relógio) eram ¾, ¾, 1½, 2, 2, 1, 5, 1, 2, 2, 3 e 10 min em ciclos que ocorriam a cada meia hora. Na análise do comportamento, um esquema de reforço que ocorre em intervalos variáveis é denominado esquema de intervalo variável (VI). Sob esse esquema uma resposta é reforçada quando emitida após intervalos que variam ao redor de uma média de tempo estabelecido. O VI produz tipicamente uma taxa moderada e constante de respostas nos intervalos entre reforços. No caso dos intervalos usados por Mackworth, em média, a cada 1 minuto haveria um evento crítico para ser detectado. Outro aspecto do procedimento do estudo de Mackworth era a de que o evento crítico ficava disponível para ser detectado por apenas um breve período de tempo. Em análise do comportamento, quando o reforço está disponível para ser consumido por apenas um determinado período de tempo, chama-se esse período de contenção limitada (limited hold). Quando se usa a contenção limitada comumente observa-se o aumento da taxa de respostas em relação à uma condição sem contenção limitada. Holland usou uma contenção limitada de 1¼ s. Isto é, neste caso em que foi usada a contenção limitada após o movimento do ponteiro, se Capítulo VIII | Atenção o participante não detectasse o movimento nesse intervalo de tempo, o ponteiro retornaria automaticamente para a direita e o participante perderia a oportunidade de relatar o evento. Resultados e Discussão Os padrões de respostas de observação descritos para os participantes em cada um dos esquemas de reforço utilizados por Holland (1958) – FI, FR, DRL – foram extremamente similares àqueles usualmente encontrados em experimentos anteriores em outros tipos de respostas que também usaram esquemas de reforço (e.g., Ferster & Skinner, 1957). Apenas para ilustrar os efeitos dos diferentes esquemas de reforço sobre a emissão das respostas de observação, ao comparar os padrões de respostas de observação nos diferentes esquemas de reforço, foi possível verificar que, enquanto o participante sob FR, independentemente do valor do esquema, emite 600 respostas em menos de cinco minutos de sessão, o participante sob DRL emite aproximadamente 290 respostas em 50 minutos de sessão. Tais resultados demonstraram que a detecção de eventos críticos, de fato, exerce um papel reforçador para a emissão das respostas de observação, como previa o autor. Dessa forma, os resultados obtidos por Holland (1958) demonstraram que os padrões de ocorrências das respostas de observação, consideradas em muitos contextos como sendo o reflexo de processos mentais complexos, podem ser explicados a partir de conceitos propostos pelo condicionamento operante, fazendo-se referência aos esquemas de reforço que mantêm essas respostas. De acordo com o autor, não haveria a necessidade de recorrer a níveis mentais de explicação, a constructos teóricos como atenção, vigilância ou expectativa, uma vez que o controle exercido pelos diferentes esquemas de reforço pôde ser diretamente demonstrado no nível comportamental. O segundo objetivo proposto por Holland (1958), verificar como seriam as respostas de observação em uma situação similar à usada por Mackworth (1948), também trouxe um resultado importante. Assim como no experimento de Mackwhoth, dois tipos diferentes de desempenho foram observados entre os participantes de Holland que foram expostos ao VI com contenção limitada. Na mesma proporção dos participantes de Mackworth, aproximadamente 30% dos participantes de Holland detectaram todos os movimentos do ponteiro que eram programados durante o experimento. Para os outros 70%, a quantidade de eventos detectados teve um declínio acentuado ao longo da sessão. O que Holland pôde demonstrar com seu experimento é que esse declínio foi causado pela diminuição da emissão de respostas de observação. Essas respostas de observação, como visto na parte anterior do experimento, são controladas pelo esquema de reforço em vigor. Holland demonstrou que os participantes 130 Edson Massayuki Huziwara, Candido V. B. B. Pessôa que detectaram todos os reforços ao longo da sessão partiram de uma taxa inicial de emissão das respostas de observação mais alta do que os participantes que diminuíram as detecções ao longo da sessão Provavelmente, esse “ponto de partida” com que cada participante iniciou a emissão de respostas (alta ou baixa taxa de respostas) seja devido à história pregressa de reforço de respostas de observação de cada um. Os participantes que partiram de uma taxa mais baixa de emissão de respostas de observação detectaram menos movimentos no ponteiro. Essa menor detecção é, em outras palavras, uma menor taxa de reforços. Uma menor taxa de reforços gera uma menor taxa de respostas (Ferster & Skinner, 1957). Assim, os participantes que já iniciaram o experimento com uma baixa taxa inicial de emissão de respostas de observação entraram num círculo vicioso de menor emissão de respostas gerando menor taxa de reforço e menor taxa de reforço gerando menor emissão de respostas. Holland (1958), portanto, demonstrou que a detecção de um evento crítico (i.e., o movimento do ponteiro) pode controlar a frequência de emissão das respostas de observação (i.e., pressionar o botão para o acendimento da lâmpada). Vale ressaltar que estudos anteriores explicavam a ocorrência de tais respostas de observação como sendo o reflexo de estados mentais complexos como atenção, vigilância ou expectativa (e.g., Adams, 1956; Bakan, 1955; Bartlett et al., 1955; Deese & Ormond, 1953; 131 Fraser, 1950; Mackworth, 1948, 1950). Ao analisar o conjunto dos resultados obtidos por Holland, foi possível comprovar a hipótese do autor de que é possível explicar os padrões de ocorrência de tais respostas a partir dos princípios do condicionamento operante, especialmente do esquema de reforço em vigor. Os mesmos princípios sobre o condicionamento operante foram utilizados por Holland (1958) para reinterpretar alguns dos achados mais recorrentemente descritos em experimentos sobre atenção e vigilância até a data de publicação de seu artigo. O primeiro desses achados refere-se à diminuição na quantidade de detecções feitas pelos participantes ao longo da sessão, que seria explicado pelo declínio dos níveis de atenção em função da fadiga (Deese & Ormond, 1953; Mackworth, 1948, 1950). De acordo com Holland, a explicação para tal fato estaria relacionada à taxa de reforço. Ao longo da sessão, a taxa de emissão de respostas de observação se adéqua à quantidade de reforços apresentados. Assim, se a quantidade de apresentações do estímulo reforçador for baixa ou o intervalo entre reforços for demasiado longo, haverá um declínio na taxa de respostas de observação (e.g., Kelleher, Riddle, & Cook, 1962). Em decorrência da menor taxa de respostas de observação, menor também será a quantidade de eventos críticos detectados. Capítulo VIII | Atenção DESDOBRAMENTOS Um aspecto a ser destacado acerca do procedimento utilizado por Holland (1958) refere-se à considerável diferença entre as respostas que normalmente são identificadas como respostas de observação e a resposta instrumental utilizada no referido experimento. Em uma análise extremamente crítica, poder-se-ia argumentar que o fenômeno comportamental observado por Holland seria de natureza diferente daquela observada em experimentos sobre atenção e vigilância, restabelecendo o papel dos constructos mentais na explicação do comportamento. Sobre essa questão, o autor afirma: Em outros estudos sobre vigilância, o comportamento de observação foi provavelmente a fixação do olhar ou os movimentos com a cabeça, bem como respostas talvez ainda mais sutis. Seria interessante estender a técnica apresentada aqui para algumas destas respostas, mesmo considerando que, para muitas questões, a topografia da resposta pode não ser tão importante e os métodos ora utilizados sejam perfeitamente suficientes. (p. 62). Portanto, o autor parece concordar que a resposta de pressionar um botão para acender uma lâmpada é consideravelmente diferente de mover o rosto em direção a um mostrador e permanecer observando-o por longos períodos de tempo, respostas normalmente relacionada à vigilância. No entanto, de acordo com Holland (1958), uma vez demonstrada a função reforçadora da detecção de eventos críticos, elas poderiam aumentar a probabilidade de ocorrência de toda e qualquer resposta de observação, independente de qual topografia fosse requerida. Talvez até de modo contraditório à afirmação sobre as topografias de respostas, trabalhos posteriores ao de Holland (1958) estiveram relacionados a criar formas de registrar e medir o comportamento de olhar enquanto uma resposta de observação. Em 1968, juntamente com Stephen R. Schroeder, Holland publicou um artigo no qual os autores utilizaram um equipamento que permitiu registrar a frequência e a duração dos movimentos dos olhos dos participantes quando estes observavam partes específicas em uma tela contendo quatro mostradores, todos idênticos ao utilizado no experimento de Holland descrito nesse capítulo. Neste novo experimento, os participantes também foram instruídos a detectar movimentos de ponteiros em qualquer um dos quatro mostradores e a manipulação experimental feita também utilizou diferentes esquemas de reforço. Por exemplo, ao utilizar um FR, um movimento de ponteiro ocorria somente após a 36ª ocasião na qual o participante tivesse olhado para um dos mostradores, isto é, emitido a resposta de observação. Os resultados obtidos por Schroeder e Holland demonstraram que os 132 Edson Massayuki Huziwara, Candido V. B. B. Pessôa padrões de movimento dos olhos em direção aos mostradores foram sensíveis aos diferentes esquemas de reforço utilizados (i.e., FR, FI e DRL). pectos da segurança no trabalho (e.g., Abernathy & Lattal, 2014; Howell, Johnston, & Goldstein, 1966). A similaridade dos resultados obtidos por Schroeder e Holland (1968), utilizando o registro movimentos dos olhos, com aqueles descritos em Holland (1958), utilizando o registro de pressões a um botão, pareceu indicar que a função reforçadora da detecção de eventos críticos realmente independe da topografia das respostas e, talvez ainda mais importante, que a resposta instrumental utilizada em 1958 era, de fato, comparável com as respostas tipicamente identificadas com a atenção (i.e., olhar). Desde então, uma vasta quantidade publicações acerca das relações entre as respostas de observação e o comportamento de olhar tem sido produzida (e.g., Doran & Holland, 1971; Dube, Balsamo et al., 2006; Dube, Dickson et al., 2010; Huziwara, de Souza, & Tomanari, 2016; Huziwara, Silva, Perez, & Tomanari, 2015; Perez, Endemann, Pessôa, & Tomanari, 2014; Pessoa, Huziwara, Perez, Endemann, & Tomanari, 2009; Schroeder, 1969a, 1969b, 1970, 1997; Serna & Carlin, 2001). CONSIDERAÇÕES FINAIS Em relação à importância do estudo de Holland (1958) para a manutenção da atenção em tarefas de vigilância, Holland (1958) é citado em diversos experimentos da área, como na manutenção da atenção durante a navegação de barcos (Thomas, 1980) e aviões (Lewis, 1973) e, em geral, para as133 Como mencionado no início deste capítulo, o TDAH atualmente se constitui em um sério problema a ser solucionado. Sagvolden, Aase, Johansen e Russell (2005), por exemplo, apontavam a escassez de dados sobre tratamentos médicos eficazes para o subtipo déficit de atenção do TDAH. No que concerne às contribuições da Análise do Comportamento, os padrões comportamentais usualmente característicos de pessoas com diagnóstico de déficit de atenção são, ao menos em parte, explicados a partir dos gradientes de atraso de reforço (Catania, 2005). Baseado em extensa literatura, Catania explica que uma das causas do que chamamos déficit de atenção pode estar relacionada à dificuldade de controle por reforços condicionados. Nos termos do experimento de Holland (1958), caso a distância temporal entre a identificação de um evento crítico e o reforço obtido por essa identificação for demasiado longa, o movimento do ponteiro pode não adquirir uma função reforçadora para manter a resposta de prestar atenção ao (iluminar o) mostrador. Um valor da distância temporal eficiente varia entre indivíduos e, assim, no caso do experimento de Holland, pessoas que necessitassem intervalos temporais muito pequenos entre os reforços poderiam deixar de Capítulo VIII | Atenção emitir as respostas de observação ao longo do experimento. Nos limites da revisão de literatura realizada para o presente capítulo, não encontramos estudos que se apoiem diretamente no achado de Holland de que esquemas de reforços influenciariam diretamente a quantidade de atenção em uma tarefa (para exceção, veja Goldberg & Konstantareas, 1979). Assim, parece permanecer essa lacuna a ser perseguida sobre a relação entre os padrões comportamentais gerados e mantidos por diferentes esquemas de reforço e os padrões comportamentais característicos do déficit de atenção. Ao considerar todos os aspectos presentes no experimento de Holland (1958), torna-se possível verificar que a engenhosidade do autor, ao propor uma nova forma de análise, permitiu a formulação de explicações mais parcimoniosas sobre processos comportamentais. Essa busca por explicações parcimoniosas, como alternativa para explicações por vezes tão misteriosas quanto o próprio fenômeno a ser explicado, é marca dos trabalhos desenvolvidos pelo autor e, certamente, um exemplo a ser seguido. PARA SABER MAIS Pessoa, Huziwara, Perez, Endemann, & Tomanari (2009). Replicação sistemática dos resultados descritos por Schroeder (1969a; 1969b; 1970) sobre o comportamento de olhar em tarefas de discriminação sim- ples. Os principais resultados referem-se a uma aparente diminuição no tempo empregado para observar os estímulos ao longo das sucessivas tentativas de treino. Dube, Balsamo, Fowler, Dickson, Lombard, & Tomanari (2006). Avaliação do comportamento de olhar em tarefas de discriminação condicional utilizando procedimento de emparelhamento de acordo com o modelo. Resultados sugerem que os participantes com maiores porcentagens de acertos em tarefas que envolvem o aprendizado de discriminações condicionais também apresentam maior quantidade de tempo empregado na observação dos estímulos apresentados. Artigos de Revisão. Para uma revisão sobre o controle operante dos movimentos dos olhos veja Pessôa (2010). Para uma revisão sobre o papel das respostas de observação como fenômenos atencionais consulte Rico, Goulart, Hamasaki e Tomanari (2012) ou Benvenuti, Barros e Tomanari (2014). REFERÊNCIAS Abernathy, W. B., & Lattal, D. (2014). Organizational Behavior Management, past, present, and future. In F. K. Macksweeney e E. S. Murphy (Eds.), The Willey Blackwell handbook of classical and operant conditioning, (pp. 645-668). Chichester, WS: John Willey & Sons, Ltd. 134 Edson Massayuki Huziwara, Candido V. B. B. Pessôa Adams, J. A. (1956). Vigilance in the detection of low-intensity visual stimuli. Journal of Experimental Psychology, 52, 204-208. American Psychiatric Association – APA (2002). Manual diagnóstico e estatístico de transtornos mentais - DSM-IV-TR™. 4ª ed. rev. Porto Alegre: Artmed. Bakan, P. (1955). Discrimination decrement as a function of time in a prolonged vigil. Journal of Experimental Psychology, 50, 387-390. Bartlett, S. C., Beinert, R. L., & Graham, J. R. (1955). Studies of visual fatigue and efficiency in radar observation. United States Air Force Wright Air Development Center Technical Report, 55-100. Benvenuti, M. F., Barros, T., & Tomanari, G. Y. (2014). Atenção, observação e a produção do comportamento simbólico e do responder relacional. In J. C. de Rose, M. S. C. A. Gil e D. G. de Souza (Orgs.), Comportamento simbólico: Bases conceituais e empíricas, (pp. 57-93). São Paulo: Cultura Acadêmica. Deese, J., & Ormond, E. (1953). Studies of detectability during continuous visual search. United States Air Force Wright Air Development Center Technical Report, 53-88. Doran, J., & Holland, J. G. (1971). Eye movements as a function of response contingencies measured by blackout technique. Journal of Applied Behavior Analysis, 4, 11-17. Dube, W. V., Balsamo, L. M., Fowler, T. R., Dickson, C. A., Lombard, K. M., & Tomanari, G. Y. (2006). Observing behavior topography in delayed matching to multiple samples. The Psychological Record, 56, 233-244. Dube, W. V., Dickson, C. A., Balsamo, L. M., Odonnell, K. L., Tomanari, G. Y., Farren, K. M., Wheeler, E. E., & Mcilvane, W. J. (2010). Observing behavior and atypically restricted stimulus control. Journal of the Experimental Analysis of Behavior, 94, 297-313. Faraone, S. V., Sergeant, J., Gillberg, C., & Biederman, J. (2003). The worldwide prevalence of ADHD: Is it an American condition? World Psychiatry, 2, 104-113. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto Alegre: Artmed. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. East Norwalk: Appleton-Century-Crofts. Catania, C. A. (2005). Attention-deficit/ hyperactivity disorder (ADHD): Delay-of-reinforcement gradients and other behavioral mechanisms. Behavioral and Brain Sciences, 28, 397-468. Fraser, D. C. (1953). The relation of an environmental variable to performance in a prolonged visual task. Quarterly Journal of Experimental Psychology, 5, 31-32. 135 Capítulo VIII | Atenção Goldberg, J. O., & Konstantareas, M. M. (1981). Vigilance in hyperactive and normal children on a self-paced operant task. Journal of Child Psychology and Psychiatry, 22, 53-63. Holland, J. G. (1958). Human vigilance. Science, 128, 61-67. Howell, W. C., Johnston, W. A., & Goldstein, I. L. (1966). Complex monitoring and its relation to the classical problem of vigilance. Organizational Behavior and Human Performance, 1, 129-150. Huziwara, E. M., de Souza, D. G., & Tomanari, G. Y. (2016). Patterns of eye movement in matching-to-sample tasks. Psicologia: Reflexão e Crítica, 29. Huziwara, E. M., Silva, M. J. M., Perez, W. F., & Tomanari, G. Y. (2015). Analyzing the stimulus control acquisition in simple discrimination tasks through eye movement. Psicologia: Reflexão e Crítica, 28, 603-612. Kelleher, R. T., Riddle, W. C. & Cook, L. (1962). Observing response in pigeons. Journal of the Experimental Analysis of Behavior, 5, 3-13. Ketzer, C. R., Gallois, C., Martinez, A. L., Rohde, L. A., & Schmitz, M. (2012). Is there an association between perinatal complications and attention-deficit/hyperactivity disorder-inattentive type in children and adolescents? Revista Brasileira de Psiquia- tria, 34, 321-328. Lewis, M. F. (1973). Frequency of anti-collision observing responses by solo pilots as a function of traffic density, ATC traffic warnings, and competing behavior. Recuperado em http://libraryonline.erau.edu/online-full-text/faa-aviation-medicine-reports/ AM73-06.pdf Machado, L. M. C. M. (1986). Esquemas de reforçamento positivo: Esquemas simples. Psicologia, 12, 1-15. Mackworth, N. H. (1948). The breakdown of vigilance during prolonged visual search. Quarterly Journal of Experimental Psychology, 1, 6-21. Mackworth, N. H. (1950). Researches in the measurement of human performance. Medical Research Council Special Report Series, 268. Okouchi, H. (2002). Individual differences in human fixed-interval performance. The Psychological Record, 52, 173-186. Perez, W. F., Endemann, P., Pessoa, C. V. B. B., & Tomanari, G. Y. (2014). Assessing stimulus control in a discrimination task with compound stimuli: evaluating testing procedures and tracking eye fixations. The Psychological Record, 65, 83-88. Pessoa, C. V. B. B. (2010). Efeitos de diferentes treinos de discriminação sobre as fixações 136 Edson Massayuki Huziwara, Candido V. B. B. Pessôa do olhos de humanos. (Tese de doutorado). Instituto de Psicologia da Universidade de São Paulo. Pessoa, C. V. B. B., Huziwara, E. M., Perez, W. F., Endemann, P., & Tomanari, G. Y. (2009). Eye fixations to figures in a four-choice situation with luminance balanced areas: Evaluating practice effects. Journal of Eye Movement Research, 2, 1-6. Reinhardt, M. C., & Reinhardt, C. A. (2013). Attention deficit-hyperactivity disorder, comorbidities, and risk situations. Jornal de Pediatria, 89, 124-130. Rico, V. V., Goulart, P. R. K., Hamasaki, E. I. M., & Tomanari, G. Y. (2012). Percepção e atenção. In M. M. C. Hübner e M. B. Moreira. (Orgs.). Fundamentos de psicologia: Temas clássicos de psicologia à luz da Análise do Comportamento. 1ed, (pp. 155-210). Rio de Janeiro, RJ: Guanabara Koogan. Rohde, L. A., Barbosa, G., Tramontina, S., & Polanczyk, G. (2000). Transtorno de déficit de atenção/hiperatividade. Revista Brasileira de Psiquiatria, 22, 7-11. Rohde, L. A., Miguel Filho, E. C., Benetti, L., Gallois, C., & Kieling, C. (2004). Transtorno de déficit de atenção/hiperatividade na infância e na adolescência: Considerações clínicas e terapêuticas. Revista de Psiquiatria Clínica, 31, 124-131. Sagvolden, T., Aase, H., Johansen, E. B., & 137 Russell, V. A. (2005). A dynamic developmental theory of attention-deficit/hyperactivity disorder (ADHD) predominantly hyperactive/impulsive and combined subtypes. Behavioral and Brain Sciences, 28, 397-468. Schroeder, S. R. (1969a). Effects of cue factors on selective eye movements and choices during successive discriminations. Perceptual and Motor Skills, 29, 991-998. Schroeder, S. R. (1969b). Fixation and Choice selectivity during discrimination transfer. Psychonomic Science, 17, 324-325. Schroeder, S. R. (1970). Selective eye movements to simultaneously presented stimuli during discrimination. Perception & Psychophysics, 7, 121-124. Schroeder, S. R. (1997). Selective eye fixations during transfer of discriminative stimulus control. In D. M. Baer, & E. M. Pinkston (Orgs.), Environment and Behavior, (pp. 97–110). Boulder, CO: Westview. Schroeder, S. R., & Holland, J. G. (1968). Operant control of eye movements. Journal of Applied Behavior Analysis, 1, 161-166. Serna, R., & Carlin, M. T. (2001). Guiding visual attention in individuals with mental retardation. International Review of Research in Mental Retardation, 24, 321-357. Skinner, B. F. (1956). A case history in scien- Capítulo VIII | Atenção tific method. American Psychologist, 11, 221233. Thomas, T. W. (1980). The effects of fatigue on vigilance in sailing. (Dissertação de mestrado). The University of British Columbia. Wyckoff Jr., L. B., (1952). The role of observing responses in discrimination learning: Part I. Psychological Review, 59, 431-442. 138 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado O responder controlado temporalmente: desdobramentos da pesquisa com a tarefa de bissecção Marilia Pinheiro de Carvalho Marco Vasconcelos Armando Machado Universidade do Minho, Portugal Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psychology: Animal Behavior Processes, 3, 216-228. “O que é, pois, o tempo? Se ninguém mo pergunta, sei o que é; mas se quero explicá-lo a quem mo pergunta, não sei.” (Santo Agostinho, Confissões) 139 Capítulo IX | Bissecção Temporal INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Em fins da década de 1970, já era sabido que as respostas de animais não-humanos podem ser controladas por intervalos de tempo. Por exemplo, as pesquisas seminais de Pavlov (1927) sobre condicionamento respondente demonstraram que, quando comida era entregue sucessivamente em intervalos fixos de tempo, a salivação de cães sistematicamente antecipava os momentos de entrega. Dá-se a esse efeito o nome de condicionamento temporal (Catania, 1999). A Figura 1 abaixo ilustra um procedimento de condicionamento temporal e resultados hipóteticos. Figura 1. Diagrama hipotético de um procedimento de condicionamento respondente temporal. Comida (*) é apresentada sucessivamente em intervalos fixos de tempo (T). Tipicamente, salivação condicionada ocorre instantes antes de a comida ser apresentada. Em um outro estudo clássico, desta vez com um procedimento de condicionamento operante, Stubbs (1968, Experimento 2) demonstrou que pombos eram capazes de discriminar estímulos com duração de MPC e MV contaram com a bolsa de investigação UMINHO/ BI/249/2015 e com a bolsa de investigador IF/01624/2013, respectivamente, ambas da Fundação para a Ciência e Tecnologia (FCT), Portugal. AM beneficiou da bolsa de licença sabática SFRH/BSAB/113653/2015 da FCT e de uma bolsa da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP: 2015/06491-1) para Professor Convidado na Universidade Federal de São Carlos, Brasil. Este capítulo foi parcialmente financiado pela FCT e pelo Ministério da Educação e Ciência através de fundos nacionais, e cofinanciado pelo FEDER sob o acordo de parceria PT2020 (UID/PSI/01662/2013). 1 2 s a 20 s2. A tarefa consistia em uma discriminação condicional na qual o estímulo modelo era uma luz que ficava acesa durante um intervalo de tempo variável, e os estímulos comparação eram um disco verde e um disco vermelho apresentados simultaneamente após o estímulo modelo. Para receber comida, os pombos deviam bicar o disco verde se o modelo durasse de 2 a 10 s, e o disco vermelho se o modelo durasse de 12 a 20 s. Como os estímulos de 2 a 10 s são os mais curtos das durações treinadas, e os estímulos de 12 a 20 s são os mais longos, podemos dizer que respostas no disco verde são respostas ‘curto’ e que respostas no disco vermelho são respostas ‘longo’. Stubbs (1968) mediu a proporção de vezes em que os sujeitos responderam ‘longo’ (i.e., bicaram o disco vermelho) em função de cada uma durações apresentadas. Dá-se o nome de função psicométrica à função que relaciona a proporção de uma das respostas (e.g., “longo”) à duração dos estímulos (Church, 2002; Richelle & Lejeune, 1980). Se a discriminação fosse perfeita, a função psicométrica deveria assumir a forma de um degrau (ver painel de cima da Figura 2): Nenhuma resposta ‘longo’ seria emitida após os estímulos de 2 a 10 s [P(‘longo’) = 0], e apenas respostas ‘longo’ seriam emitidas após os estímulos de 12 a 20 s [P(‘longo’) = 1]. Stubbs (1968) conduziu três experimentos com intervalos temporais variando entre 1 e 40 s. Para fins didáticos, ilustramos apenas o caso do Experimento 2, com intervalos entre 2 e 20 s. 2 140 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado A Figura 2 abaixo (painel de baixo) esquematiza a tendência geral dos dados individuais obtidos por Stubbs (1968). A proporção de respostas ‘longo’ aumentou de 2 a 20 s, confirmando que os pombos eram capazes de discriminar os estímulos mais curtos dos estímulos mais longos. Contudo, o aumento na proporção de respostas foi gradual, ao invés de ser abrupto e em forma de degrau: A função psicométrica tinha uma forma ogival, com mínimo e máximo nas durações extremas de 2 e 20 s, respectivamente. Figura 2. Painel de cima: Função psicométrica hipotética em forma de degrau. Painel de baixo: Esquematização do padrão geral das funções psicométricas obtidas em uma discriminação entre 2 e 20 s por Stubbs (1968, Experimento 2). 141 Curiosamente, a proporção de respostas ‘longo’ para as durações de 10 e 12 s esteve próxima de 0.5, ou seja, em cerca de metade das vezes os sujeitos respondiam ‘curto’ e na outra metade das vezes respondiam ‘longo’ para cada uma destas durações – a despeito de terem sido treinados a responder ‘curto’ para 10 s e ‘longo’ para 12 s. Com base nestes resultados, Stubbs (1968) sugeriu que os sujeitos estabeleceram um critério de decisão para responder: Respondiam ‘curto’ para durações menores do que o critério e respondiam ‘longo’ para durações maiores do que o critério. Ainda de acordo com o autor, o critério estaria ente 10 e 12 s e quanto mais próxima uma duração estivesse dele, maior a incerteza em classificá-la como ‘curta’ ou ‘longa’ – a incerteza traduz-se em proporções de respostas ‘longo’ próximas de 0.5, como Stubbs observou nos pombos. O critério que divide as durações mais curtas das mais longas também pode ser tomado como a duração que, do ponto de vista do sujeito, está equidistante das durações treinadas. A esta duração, percebida como “o meio do caminho”, por assim dizer, dá-se o nome de ponto de igualdade subjetiva (PIS). A pergunta que naturalmente se coloca é qual duração corresponde ao PIS. A pergunta é relevante porque o valor do PIS dá pistas sobre a métrica usada pelos animais para “medir” as durações dos estímulos. Falar da métrica é falar da relação entre o tempo objetivo (medido pelo relógio) e o tempo subjetivo (inferido a partir do Capítulo IX | Bissecção Temporal comportamento). Será a métrica do tempo subjetivo linear, logarítmica, recíproca, ou de outro tipo? A Figura 3 abaixo ilustra as três primeiras métricas. Tome o caso de uma discriminação entre 1 s e 4 s. Em uma transformação linear, y = ax + b (painel da esquerda na Figura 3; no nosso exemplo, assumimos que a = 1 e b = 1), 1 s (x1) é representado subjetivamente como 2 (y1) e 4 s (x2) é representado como 5 (y2). O PIS é a duração x equivalente ao valor médio de 2 e 5 da representação subjetiva (ver a seta que projeta no eixo do x o valor médio da representação subjetiva). A derivação na Figura 3 (painel da esquerda) mostra que, se o sujeito usa uma métrica linear, o PIS é a média aritmética (MA) de 1 e 4 s. Em uma transformação logarítmica, y = ln(x) (painel central na Figura 3; logarítmo na base e), 1 s (x1) é representado como zero (y1) e 4 s (x2) como 1.39 (y2). A derivação (painel central) mostra que se o sujeito usa uma métrica logarítmica, o PIS é a média geométrica (MG) de 1 e 4 s. Por fim, em uma transformação recíproca, y = 1/x (painel da direita na Figura 3), 1 s (x1) é representado como 1 (y1) e 4 s (x2) é representado como 0.25 (y2). A derivação (painel da direita) mostra que, se o sujeito usa uma métrica recíproca, o PIS é a média harmônica (MH) de 1 e 4 s. Generalizando, se ao estimar a duração de n estímulos, t1, t2, ..., tn, os sujeitos usam uma métrica linear, o PIS é Figura 3. Painel da esquerda: Transformação linear da duração x. Painel central: Transformação logarítmica da duração x. Painel da direita: Transformação recíproca da duração x. 142 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado igual à média aritmética dos estímulos DESCRIÇÃO DO EXPERIMENTO t1 + t2 + + tn MA = ; se usam uma métrica n Objetivo e método logarítmica, o PIS é igual à média geométrica dos estímulos ( MG = n t1 × t2 ×× tn ) ; e se usam uma métrica recíproca, o PIS é igual à média harmônica dos estímulos n MH = 1 1 1 t1 + t2 + + tn Church e Deluty (1977) determinaram empiricamente o PIS em um dos estudos mais influentes na área do controle temporal do responder (timing). Eles usaram uma tarefa psicofísica clássica, a tarefa de bissecção, para medir o valor do PIS em diversas discriminações temporais. Os resultados revelaram algumas das propriedades centrais do responder controlado temporalmente em animais não-humanos e essas propriedades definiram aquilo que qualquer modelo teórico de timing deve explicar. Para além disso, o estudo de Church e Deluty identificou pela primeira vez questões importantes sobre a natureza do controle por estímulos temporais e sobre a natureza do que é aprendido em tarefas temporais, sugeriu procedimentos para analisá-las empiricamente, e avançou com respostas provisórias a essas questões. Todas elas permanecem em aberto. A tarefa de bissecção temporal é uma tarefa de discriminação condicional. Para ilustrar, considere uma tentativa de treino típica no estudo de Church e Deluty (1977) com ratos. Durante o intervalo entre tentativas (ITI, do inglês inter-trial interval), uma luz de iluminação geral ficava acesa por 30 segundos. Terminado o ITI, a luz geral apagava-se por 2 ou 8 s – o período na escuridão sinalizava o intervalo de tempo a estimar e era o estímulo modelo da tentativa. Ao fim do intervalo, duas barras de resposta eram introduzidas na caixa, uma na esquerda e outra na direita do painel de respostas. Os ratos deviam pressionar uma das duas barras condicionalmente à duração do intervalo. Respostas corretas (e.g., pressionar a barra da esquerda após 2 s e a barra da direita após 8 s) eram reforçadas com acesso a comida e respostas incorretas não produziam consequências (extinção). Para facilitar a descrição, a partir de agora vamos simplesmente dizer que os ratos aprenderam a responder ‘curto’ após a duração mais curta, e ‘longo’ após a duração mais longa – independentemente de formalmente as respostas serem pressionar a barra da esquerda ou da direita. Quatro grupos de ratos (N = 8) foram treinados em diversas discriminações ao longo de seis fases experimentais. Para os nossos propósitos, é suficiente considerar apenas as quatro primeiras fases. Na Fase 143 Capítulo IX | Bissecção Temporal I, todos os grupos aprenderam a discriminação entre 2 e 8 s. Na Fase II, os grupos A e B aprenderam a discriminação entre 1 e 4 s, e os grupos C e D a discriminação entre 4 e 16 segundos. Na Fase III, os grupos A e B aprenderam a discriminação entre 4 e 16 s, e os grupos C e D a discriminação entre 1 e 4 s. Na Fase IV, todos grupos aprenderam a discriminação entre 3 e 12 s. A Tabela 1 resume as discriminações aprendidas por cada rações de treino (e.g., no caso da discriminação entre 2 e 8 s, MH = 3.2 s, MG = 4 s e MA= 5 s). Também nas tentativas de teste, os sujeitos deviam responder ‘curto’ ou ‘longo’ condicionalmente à duração apresentada na tentativa, mas nenhuma resposta era reforçada. Concluído o treino discriminativo e o teste de generalização de uma fase experimental, iniciava-se a fase seguinte. Tabela 1. Discriminações temporais aprendidas por cada grupo de ratos nas quatro primeiras fases do estudo de Church e Deluty (1977). Em cada célula, a posição da duração de treino representa a resposta correta. Por exemplo, ‘1 s – 4 s’ significa que, para receber comida, os sujeitos deviam responder ‘esquerda’ após 1 s, e ‘direita’ após 4 s. Adaptado de Church e Deluty (1977). grupo em cada fase. Doravante, chamaremos as durações treinadas em cada discriminação de ‘durações de treino’. Cada fase começava com o treino discriminativo e terminava com um teste de generalização. O treino discriminativo incluía apenas tentativas com as durações de treino, como as descritas acima. O teste de generalização incluía, para além das tentativas de treino, tentativas de teste em que eram apresentadas cinco durações intermediárias3 às durações de treino – três destas durações correspondiam às médias harmônica, geométrica e aritmética das duAs durações de teste estavam aproximadamente em progressão geométrica, ou seja, cada duração depois da primeira era obtida multiplicando a anterior por uma constante. 3 Com os dados do teste de generalização, Church e Deluty (1977) obtiveram a função psicométrica e o PIS de cada discriminação treinada. Como o PIS é a duração que separa os modelos ‘curtos’ dos modelos ‘longos’, ele também pode ser visto como a duração em que o sujeito divide ao meio, ou bissecta, o intervalo ente as durações de treino (e.g., o intervalo entre 2 e 8 s). Daí o nome do procedimento, bissecção temporal. Resultados e discussão A Figura 4 (painel da esquerda) apresenta as funções psicométricas médias (n=8) obtidas por Church e Deluty (1977) em 144 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado cada uma das quatro discriminações. Todas as funções psicométricas tinham valores mínimo e máximo próximos das duraçõs de treino de cada discriminação e formato ogival, evidenciando que os pombos eram capazes de discriminar as diferentes durações. O painel central da Figura 4 apresenta as mesmas funções psicométricas, mas, agora, o eixo do x está com as durações em unidades logarítmicas. No eixo do x, os valores 1 e 7 correspondem às durações de treino curta e longa, respectivamente. Os valores 3, 4 e 5 correspondem às médias harmônica, geométrica e aritmética das durações de treino de cada discriminação, respectivamente. A partir das funções psicométricas, os autores calcularam o PIS de cada discriminação ajustando uma reta aos pontos correspondentes às três durações centrais [pontos com coordenadas (3, y), (4, y) e (5, y)]. Eles escolheram estes pontos porque se concentravam próximos ao ponto com coordenadas (x, 0.50), o PIS. Conhecidos os parâmetros da reta (inclinação e interseção-y), calculou-se o PIS. O painel central na Figura 4 apresenta os PISs obtidos em função da média geométrica das durações treinadas em cada discriminação – para a discriminação entre 1 e 4 s, MG = 2 s; para 2 e 8 s, MG = 4 s; para 3 e 12 s, MG = 6 s; para 4 e 16 s, MG = 8 s. A figura também mostra quais seriam os PISs esperados no caso de eles estarem nas médias4 harmônica e aritmética das durações de treino (ver as linhas tracejadas na figura). Os resultados mostraram que os PISs praticamente se sobrepuseram às médias geométricas, revelando que, do ponto de vista dos ratos, a duração que bissecta o intervalo entre as durações de treino é a média geométrica das mesmas. Também à partir das retas ajustadas às funções psicométricas, os autores calcularam o limiar diferencial de cada discriminação. O limiar diferencial, também denominado de diferença mínima perceptível (just noticeable difference ou JND), indica quanto um estímulo de comparação deve diferir de um estímulo padrão em uma dada dimensão física para ser percebido como Figura 4. Painel da esquerda: Funções psicométricas médias obtidas por Church e Deluty (1977). Painel central: Funções psicométricas obtidas por Church e Deluty (1977) graficadas em uma escala comum em unidades logarítmicas. Painel da direita: PISs médios em função da média geométrica das durações treinadas em cada discriminação. A linha contínua (MG) indica a média geométrica das durações treinadas. As linhas tracejadas (MH e MA) indicam as médias harmônica e aritmética, respectivamente. 145 Capítulo IX | Bissecção Temporal diferente. Se o JND é pequeno, uma pequena diferença entre os estímulos é suficiente para discriminá-los, se é grande, os estímulos devem diferir bastante para serem discriminados. Para obter o JND de cada rato, os autores identificaram em cada reta as durações correspondentes aos pontos com coordenadas (x1, 0.75) e (x2, 0.25) e depois calcularam JND = (x1-x2)/2. Esperamos naturalmente que o JND seja maior nas discriminações com as durações mais longas. Por exemplo, esperaríamos que ele fosse maior na discriminação entre 4 e 16 s do que na discriminação entre 1 e 4 s. É fácil percebermos que, por ser uma medida absoluta da discriminabilidade dos estímulos, o JND é afetado pela ordem de grandeza dos estímulos em questão. Conclusões gerais sobre a discriminabilidade dos estímulos, portanto, deveriam basear-se em uma medida relativa. A Fração de Weber, obtida dividindo o JND pelo valor do estímulo padrão, t (FW=JND/t), é frequentemente usada como um índice relativo da discriminabilidade. Para calcular a Fração de Weber em cada discriminação, Church e Deluty (1977) assumiram que o PIS era o estímulo padrão, ou seja, o critério em relação ao qual os sujeitos categorizavam as durações como curtas ou longas. Como em todas as discriminações A média harmômica é sempre inferior ou igual à média geométrica que, por sua vez, é sempre inferior ou igual à média aritmética, ou seja, MH ≤ MG ≤ MA. A igualdade ocorre quando os números são todos iguais. 4 o PIS estava muito próximo da média geométrica das durações de treino, os autores assumiram que t = MG em cada discriminação. As Frações de Weber obtidas eram relativamente constantes (M = 0.23) e não diferiram estaticamente entre si. Estes resultados revelaram que, para qualquer ordem de grandeza dos estímulos temporais, um estímulo deve diferir em cerca de 23%5 do estímulo padrão para ser discriminável. Em outras palavras, a discriminabilidade entre duas durações depende de sua diferença relativa e não da sua diferença absoluta. Church e Deluty (1977) verificaram que, à semelhança de muitas outras dimensões do estímulo, a discriminação da duração também segue a Lei de Weber. Se a Fração de Weber é constante, é de se esperar que os sujeitos respondam de maneira semelhante para durações distintas que representem a mesma proporção de tempo transcorrido (ou que estejam na mesma razão). Para ilustrar, voltemos ao caso das discriminações 1 s vs. 4 s e 4 s vs. 16 s. Na primeira, os sujeitos aprenderam a responder ‘longo’ após 4 s e a MG = 2 s. Na segunda, aprenderam a responder ‘longo’ após 16 s e a MG = 8 s. Em ambos os casos, a proporção entre a duração de treino mais longa (4 ou 16 s) e a correspondente média Na literatura em tarefas temporais com animais não-humanos, há evidencia da Fração de Weber variando entre 0.20 e 0.30 (Richelle & Lejeune, 1980). 5 146 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado geométrica é de 2. Assim, como a Fração de Weber é constante, a proporção de respostas ‘longo’ emitidas para cada uma dessas duas durações longas deveria ser igual: P(‘longo’) aos 4 s na discriminação 1 s vs. 4 s deveria ser igual a P(‘longo’) aos 16 s na discriminação 4 s vs. 16 s. O mesmo aconteceria para as outras durações usadas nos testes. Church e Deluty (1977) confimaram este resultado: As proporções de respostas ‘longo’ eram iguais para durações que representavam a mesma proporção em relação à média geométrica e, portanto, as funções psicométricas das quatro discriminações sobrepuseram-se (conferir o painel central na Figura 4). A sobreposição das funções psicométricas ilustra uma das propriedades mais robustas da discriminação temporal em animais, a propriedade escalar: Tarefas de bissecção com durações de treino na mesma proporção (1:4 em todas as tarefas em análise no estudo) induzem funções psicométricas que se sobrepõem quando graficadas na mesma escala. Church e Deluty (1977) verificaram que a discriminação temporal dos estímulos obedece à propriedade escalar. DESDOBRAMENTOS Responder relacional vs. responder absoluto. Retomemos o nosso exemplo com o treino discriminativo entre 1 e 4 s. 147 Para facilitar a descrição, dissemos até aqui que os sujeitos aprendem a responder ‘curto’ para 1 segundo e ‘longo’ para 4 s, quando, em verdade, eles aprendem, por exemplo, a pressionar a barra da esquerda após 1 s e a barra da direita após 4 s. Existe uma diferença fundamental entre afirmar que os sujeitos respondem que uma duração é curta e a outra é longa, e afirmar que respondem ‘esquerda’ e ‘direita’ em função das durações. A primeira afirmação implica que os sujeitos respondem com base no valor relativo das durações – isto é, aprendem que 1 s é curto relativamente a 4 s, que 4 s é longo relativamente a 1 s e, adicionalmente, quais respostas emitir para os estímulos curto e longo; a segunda afirmação implica que os sujeitos respondem com base no valor absoluto das durações – isto é, aprendem quais respostas emitir após 1 e 4 s. O responder com base no valor relativo dos estímulos, ou o responder relacional, influenciou fortemente o programa de trabalhos da escola da Gestalt em princípios do século XX e é um dos tópicos de pesquisa mais antigos da psicologia experimental. Há evidência de responder relacional controlado pelo brilho (Kohler, 1918/1938), pelo tamanho (Gulliksen, 1932) e pela forma (Saldanha & Bitterman, 1951) dos estímulos, embora interpretações alternativas sejam possíveis (e.g., Spence, 1936, 1937). Mas será que animais não-humanos respondem relacionalmente em discriminações temporais? O estudo de Church e Deluty (1977) Capítulo IX | Bissecção Temporal iniciou a linha de pesquisa neste tópico e, assim, levantou outra questão fundamental no estudo do timing, designadamente, o quê um animal aprende na tarefa de bissecção. Vejamos como os autores atacaram o problema. Volte à Tabela 1 e considere as tarefas realizadas pelos grupos A e B nas Fases II e III. Na Fase II, ambos os grupos aprenderam a responder ‘esquerda’ após 1 s e ‘direita’ após 4 s. Se, por um lado, os sujeitos aprenderam a responder ao valor relativo das durações, a contingência pode ser resumida com o esquema ‘curto→esquerda, longo→direita’. Se, por outro lado, aprenderam a responder ao valor absoluto das durações, a contingência pode ser resumida como ‘1s→esquerda, 4s→direita’. A Fase III foi planejada para testar as duas possibilidades. Ambos os grupos aprenderam a discriminação entre 4 e 16 s, mas o mapeamento entre a resposta correta e a duração do estímulo diferiu entre grupos. Um grupo aprendeu a responder ‘esquerda’ após 4 s e ‘direita’ após 16 s. Observe que se manteve o mapeamento relativo ‘curto→esquerda, longo→direita’ para este grupo e, por isso, vamos chamá-lo de grupo Relativo. O outro grupo, em contrapartida, aprendeu a responder ‘direita’ após 4 s e ‘esquerda’ após 16 s. Neste caso, manteve-se o mapeamento absoluto ‘4s→direita’ e, por isso, chamamo-lo de grupo Absoluto. Church e Deluty (1977) raciocinaram que, se o responder na discriminação temporal é baseado no valor relativo das durações, o grupo Relativo deveria aprender a Fase III mais rapidamente do que o grupo Absoluto. Se, pelo contrário, o responder é Figura 5. Painel da esquerda. Proporção de acertos para a duração de 4 s obtida nos grupos Relativo e Absoluto por Church e Deluty (1977). Painel central. Porcentagem de acertos de um sujeito do grupo Relativo para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Painel da direita. Porcentagem de acerto de um sujeito do grupo Absoluto para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). 148 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado baseado no valor absoluto, o grupo Absoluto deveria aprender mais rapidamente do que o grupo Relativo. Os autores compararam a porcentagem de respostas corretas dos grupos ao longo das sessões de treino da Fase III, mas analisaram apenas o desempenho para a duração de 4 s. Os resultados na Figura 5 (painel a) revelaram que o grupo Relativo respondia corretamente em mais de 90% das tentativas ao fim de quinze sessões de treino, mas o grupo Absoluto respondia corretamente em menos de 70% das tentativas. Além disso, já na primeira sessão de treino, o desempenho do grupo Relativo era mais alto do que o do grupo Absoluto. Com base nestes resultados, os autores concluíram que os sujeitos aprendem a responder ao valor relativo das durações em tarefas de discriminação temporal. Em nosso laboratório, replicamos com pombos o experimento de Church e Deluty (1977). Ensinamos aos animais as discriminações entre 2 s vs. 6 s e 6 s. vs. 18 segundos e usamos um disco verde e outro vermelho como estímulos de comparação. Nossos resultados (painéis b e c na Figura 5; Carvalho & Machado, 2012; Carvalho, Machado, & Tonneau, 2016), contudo, não corroboraram aqueles obtidos por Church e Deluty com ratos. Ao invés, eles mostraram que (a) na primeira sessão de treino, o desempenho do grupo Absoluto era mais alto do que o do grupo Relativo na duração de 6 s (a duração comum ao treino das duas fases e que em nosso procedimento equivalia à duração de 4 s no estudo de Church 149 e Deluty) e (b) ambos os grupos tinham um desempenho similar e elevado no final do treino. Para melhor fundamentar a comparação dos grupos, nós simulamos o desempenho na tarefa com o modelo Learning to Time (LeT; Machado, 1997; Machado, Malheiro, & Erlhagen, 2009) e, posteriormente, constratamos as simulações com os dados empíricos. O LeT é um modelo comportamental que descreve a aquisição e o estado estável de respostas controladas temporalmente com base em processos de reforçamento, extinção e generalização. De acordo com o LeT, o início do estímulo modelo ativa uma série de estados comportamentais que estão ligados às duas respostas operantes. A velocidade de ativação dos estados (λ) varia de tentativa para tentativa e provem de uma distribuição normal, λ ~ N (média = μ, desvio padrão =σ). Quando o sujeito emite uma resposta ao fim do estímulo modelo, a força do elo associativo entre a resposta emitida e o estado ativo no momento da resposta é alterada dependendo da consequência da resposta: Se foi reforçada, a força aumenta; se foi extinta, a força diminui. A Figura 6 esquematiza o modelo. Vejamos o caso da discriminação ‘2s→verde, 8s→vermelho’. Em uma tentativa com um estímulo modelo de 2 s e λ = 1, o estado n = 2 está ativo no momento em que o sujeito emite uma resposta, ‘ver- Capítulo IX | Bissecção Temporal Figura 6. Diagrama dos componentes do modelo Learning to Time (LeT) – estados comportamentais, elos associativos e respostas operantes – aplicado à uma tarefa de bissecção temporal. A cor e o tracejado dos elos indicam a força de ligação entre os estados e as respostas: Linhas pretas contínuas indicam força “elevada”, linhas pretas tracejadas indicam força “intermediária” e linhas cinzas pontilhadas indicam força “baixa”. Portanto, o estado n = 2 está fortemente ligado a ‘verde’ e fracamente ligado a ‘vermelho’, e o estado n = 8 está fracamente ligado a ‘verde’ e fortemente ligado a ‘vermelho’, por exemplo. de’ por exemplo. A resposta é reforçada e, portanto, a força do elo entre o estado n=2 e ‘verde’ aumenta e a força do elo entre o estado n=2 e ‘vermelho’ diminui . Se o sujeito responder ‘vermelho’, a resposta é extinta, o elo de n=2 e ‘vermelho’ diminui e o elo de n=2 e ‘verde’ aumenta. Veja na Figura 6 o elo “forte” (linha preta) de n=2 com ‘verde’ e o elo “fraco” (linha cinza pontilhada) de n=2 com ‘vermelho’. Em uma tentativa com um estímulo modelo de 8 s e λ = 1, o estado n = 8 está ativo no momento em que o sujeito emite a resposta ‘vermelho’. A resposta é reforçada, a força do elo entre o estado n = 8 e ‘vermelho’ aumenta e a força do elo entre o estado n = 8 e ‘verde’ diminui. Raciocínio semelhante ao já descrito acima aplica-se ao efeito da extinção da resposta ‘verde’ emitida após 8 s. O parâmetro λ é uma variável aleatória, e, portanto, o estado ativo ao fim de um dado estímulo modelo varia de tentativa para tentativa. Contudo, a ativação dos estados correlaciona-se com a passagem do tempo e, assim, estados iniciais (e.g., n = 1, 2, 3) estarão mais provavelmente ativos durante as respostas ao estímulo de 2 s, e estados subsequentes (e.g., n = 6, 7, 8) estarão mais provavelmente ativos durante as respostas ao estímulo de 8 s. Com o treino, as forças de ligação de todos os estados ativos durante as respostas são alteradas, de modo que os estados iniciais estarão mais fortemente ligados a ‘verde’ e os estados posteriores estarão mais fortemente ligados a ‘vermelho’. O resultado são dois gradientes de forças de ligação, um para a resposta ‘verde’ e outro para a resposta ‘vermelho’ (observe a gradação da espessura dos elos associativos na Figura 6). Em cada tentativa, o sujeito emitirá a resposta que tiver o elo mais forte com o estado ativo ao fim do estímulo modelo. Como você deve ter observado, o LeT assume que as respostas do sujeito são controladas pela duração absoluta do estímulo modelo (i.e., 2 s ou 8 s) e não pela sua duração relativa (i.e., ‘curto’ ou ‘longo’). Ao comparar as simulações do LeT com o desempenho dos pombos, pudemos avaliar qual é a forma de controle de estímulos predominante na tarefa de bissecção temporal. As simulações foram genericamente semelhantes ao desempenho dos pombos tanto qualitativa, quanto quantitativamente (compare os painéis d e e com os painéis b e c, respectivamente, na Figura 5). Os resultados dos estudos conduzidos por Carvalho e colaboradores (2012, 2016), portanto, 150 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado sugerem de maneira bastante robusta que o responder na tarefa de bissecção temporal é baseado no valor absoluto das durações. Permanece por identificar sob quais condições os animais aprendem a responder com base na duração relativa dos estímulos temporais. Efeitos contextuais na tarefa de bissecção. Para além dos estudos empíricos, os pesquisadores do timing também têm conduzido pesquisas teóricas. Em particular, eles têm proposto vários modelos matemáticos para explicar o desempenho em tarefas temporais. Dois dos modelos mais influentes são o LeT, já apresentado, e o Scalar Expectancy Theory (SET; Gibbon, 1977, 1991; Gibbon & Church, 1984; Gibbon, Church, & Meck, 1984). Os dois modelos diferem nos seus pressupostos sobre o que é aprendido na tarefa de bissecção temporal. Para compreendermos estas diferenças, tomemos uma tarefa em que os sujeitos devem responder ‘vermelho’ após 1 s e ‘verde’ após 4 s. De acordo com o SET, os sujeitos aprendem apenas as contingências ‘1s→escolher vermelho’ e ‘4s→escolher verde’. O LeT, pelo contrário, assume que os sujeitos aprendem ‘1s→escolher vermelho e evitar verde’ e ‘4s→escolher verde e evitar vermelho’. Para testar os pressupostos dos modelos, Machado e Keen (1999) desenvolve151 ram a tarefa de dupla bissecção temporal. Como o nome da tarefa sugere, os sujeitos são treinados em duas bissecções temporais. A primeira é semelhante à que acabamos de descrever entre 1 e 4 s. Na segunda, aprendem a responder ‘azul’ após 4 s e ‘amarelo’ após 16 s. Para o SET, os sujeitos aprendem ‘4s→escolher azul’ e ‘16s→escolher amarelo’. Para o LeT, eles aprendem ‘4s→escolher azul e evitar amarelo’ e ‘16s→escolher amarelo e evitar azul’. Aprendidas as duas discriminações, é conduzido um teste com durações que variam entre 1 e 16 s e no qual as opções de reposta são ‘verde’ e ‘azul’. Os modelos diferem nas previsões que fazem do desempenho no teste. De acordo com o SET, os sujeitos deveriam distribuir aleatoriamente suas respostas entre ‘verde’ e ‘azul’ durante o teste, porque no treino prévio eles apenas aprenderam ‘1s→escolher vermelho, 4s→escolher verde, 4s→escolher azul, 16s→escolher amarelo’ e, portanto, não deveriam apresentar vieses em favor de uma ou outra resposta em função das diferentes durações. Como consequência, a proporção de respostas ‘verde’ não deveria variar com as durações de teste. De acordo com o LeT, os sujeitos deveriam preferir ‘verde’ conforme as durações de teste aumentassem porque no treino prévio os sujeitos aprenderam (a) a evitar ‘azul após as durações mais longas (próximas de 16 s) e (b) a evitar ‘verde’ após as durações mais curtas (próximas de Capítulo IX | Bissecção Temporal 1 s). No teste, dada a escolha entre ‘verde’ e ‘azul’, a proporção de respostas ‘verde’ deveria aumentar com o aumento na duração dos estímulos. Diversos estudos usaram a tarefa de dupla bissecção temporal (Arantes & Machado, 2008; Machado & Arantes, 2006; Machado & Keen, 1999; Machado & Oliveira, 2009; Machado & Pata, 2005; Oliveira & Machado, 2008, 2009; Vieira de Castro & Machado, 2012; Vieira de Castro, Machado, & Tomanari, 2013) e sistematicamente confirmaram as previsões do LeT. A Figura 7 apresenta os resultados obtidos por Machado e Pata (2005) com pombos. Dá-se o nome de efeito de contexto a este padrão de resultados, porque as respostas no teste são determinadas pelo contexto original em que os sujeitos aprenderam a escolher ou evitar consideramos um treino discriminativo em que as probabilidades de reforço das respostas corretas para cada duração de treino eram iguais. Church e Deluty (1977) usaram um esquema de Razão Fixa (FR) 1 para as respostas ‘curto’ e ‘longo’. Sob este esquema, verificamos que o PIS está usualmente na média geométrica das durações de treino. A linha contínua na Figura 8 ilustra uma função psicométrica hipotética para um treino discriminativo entre 1 e 4 s no qual as respostas ‘curto’ e ‘longo’ tinham igual probabilidade de reforço. Observe que o PIS da função é igual a 2 s. uma resposta em função das durações. Agora, o que aconteceria com o PIS, em particular, e com a função psicométrica, de um modo geral, se conduzíssemos um treino discriminativo em que uma resposta tem maior probabilidade de reforço do que a outra? Por exemplo, o que aconteceria se a probabilidade de reforço da resposta ‘longo’ fosse de 1.0 e a probabilidade de reforço da resposta ‘curto’ fosse de 0.2? De maneira semelhante, o que aconteceria se a magnitude do reforço fosse maior para a resposta ‘longo’ do que para a resposta ‘curto’? Em ambos os casos, esperaríamos que a proporção de respostas ‘longo’ aumentasse, resultando em uma função psicométrica que está deslocada para a esquerda da função que consideramos anteriormente, e cujo PIS está abaixo de 2 s. A linha pontilhada na Figura 8 ilustra o efeito. Efeitos da probabilidade do reforço na função psicométrica. Até agora, apenas De maneira similar, quando a probabilidade de reforço da resposta ‘longo’ fosse Figura 7. Efeito de contexto obtido por Machado e Pata (2005) com pombos em uma tarefa de dupla bissecção temporal. 152 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado discrepâncias nas probabilidades e nas magnitudes de reforço. Tais resultados seriam consistentes com a Lei da Igualação (Herrnstein, 1970) e aproximariam o responder em discriminações temporais do responder observado em outros procedimentos que envolvem escolha. Mais pesquisa sobre o tópico é claramente necessária. Figura 8. Funções psicométricas hipotéticas para diferentes probabilidades de reforço na discriminação entre 1 e 4 s. Em cada linha da legenda, o valor à esquerda representa a probabilidade de reforço da resposta ‘curto’ e o valor à direita representa a probabilidade de reforço da resposta ‘longo’. menor do que a probabilidade de reforço da resposta ‘curto’, a proporção de respostas ‘longo’ diminuiria, a função psicométrica deslocar-se-ia para a direita e o PIS seria superior a 2 s. A linha tracejada na Figura 8 ilustra o efeito. Até o momento, contudo, os resultados experimentais são escassos e inconsistentes. Stubbs (1976), por exemplo, reportou deslocamentos consistentes com as previsões em uma tarefa em que a probabilidade relativa de reforço diferia entre as respostas ‘curto’ e ‘longo’ (ver também Raslear, 1985). Outros estudos que manipularam a magnitude do reforço, no entanto, revelaram tanto resultados consistentes quanto resultados inconsistentes com as previsões (e.g., Galtress & Kirkpatrick, 2010). Caso ocorram de fato, os deslocamentos da função psicométrica indicariam que a distribuição das respostas entre as duas opções (‘curto’ e ‘longo’) é sensível às 153 CONSIDERAÇÕES FINAIS O estudo de Church e Deluty (1977) é hoje considerado um clássico da pesquisa em timing. Por um lado, foi pioneiro na implementação de uma tarefa de bissecção temporal recorrendo a um procedimento psicofísico clássico (i.e., o método de estímulos constantes). Anteriormente, Stubbs (1968, 1976) tinha utilizado um procedimento similar, mas, ao invés de reforçar apenas as repostas para as durações mais curta e mais longa, reforçava também as respostas para as durações intermediárias. Church e Deluty, por sua vez, foram os primeiros a reportar funções psicométricas e PISs obtidos em testes de generalização e sem reforçamento das respostas para as durações intermediárias. Por outro lado, e porventura mais importante, o estudo de Church e Deluty deu lugar a uma série de questões consideradas ainda hoje centrais para a nossa compreensão da percepção temporal tanto em humanos como em animais não humanos. Como discutido anteriormente, o PIS Capítulo IX | Bissecção Temporal na média geométrica sugere uma escala logarítmica para o tempo subjetivo, combinada com uma regra de decisão baseada na diferença entre tempos subjetivos. Contudo, logo após o estudo de Church e Deluty (1977), outros autores mostraram como o PIS na média geométrica pode ser obtido a partir de uma escala linear e de uma regra de decisão baseada na razão entre os tempos subjetivos (ver Gibbon, 1991). As questões sobre a métrica da escala subjetiva do tempo – logarítmica versus linear – e sobre a regra de decisão permanecem em aberto (e.g., Jozefowiez, Machado, & Staddon, 2013). Da mesma forma, há evidência de responder relacional em algumas circunstâncias (e.g., Zentall, Weaver, & Clement, 2004), muito embora nosso laboratório tenha encontrado evidências sólidas de responder absoluto, pelo menos em pombos. Ainda, a tarefa de bissecção abriu a porta para procedimentos mais complexos como a dupla bissecção. Esta última tem sido usada para estudar efeitos de contexto na percepção temporal, testando previsões contrastantes de dois modelos proeminentes da área, o SET e o LeT. Por fim, ainda não são claros os efeitos da manipulação da probabilidade e da magnitude do reforço na função psicométrica. Os resultados obtidos por alguns autores apontam para deslocamentos da função induzidos por estas manipulações (Galtress & Kirkpatrick, 2010; Raslear, 1985; Stubbs, 1976), mas o assunto permanece por esclarecer cabalmente. tância do trabalho de Church e Deluty (1977) são as linhas de pesquisa que abriu. Trinta e nove anos após a sua publicação, as sugestões nele contidas permanecem atuais e alvo de forte disputa e investigação. PARA SABER MAIS Carvalho & Machado (2012); Carvalho, Machado, & Tonneau (2016). Em ambos os artigos, os autores reproduziram o estudo original de Church e Deluty (1977) com procedimentos que melhoraram o desenho experimental e a análise de dados para estudar a questão do responder relacional vs. responder absoluto. Nos artigos, os autores também apresentam uma revisão detalhada do trabalho de Church e Deluty (1977). Carvalho, Machado, & Vasconcelos (2016). Os autores revisam as principais tarefas experimentais usadas na pesquisa em timing e os principais resultados obtidos até hoje. Propõem uma abordagem integrativa dos resultados que se baseia na interação de gradientes de generalização temporal. Richelle & Lejeune (1980). Livro de referência na área do timing, escrito por dois dos principais pesquisadores da área. Resume os principais procedimentos, resultados e propriedades do responder controlado por intervalos de tempo. A melhor prova do sucesso e impor154 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado REFERÊNCIAS cesses, 3, 216-228. Arantes, J., & Machado, A. (2008). Context effects in a temporal discrimination task: Further tests of the Scalar Expectancy Theory and Learning-to-Time models. Journal of the Experimental Analysis of Behavior, 90, 33-51. Galtress, T., & Kirkpatrick, K. (2010). Reward magnitude effects on temporal discrimination. Learning and Motivation, 41, 108-124. Gibbon, J. (1977). Scalar expectancy theory and Weber’s law in animal timing. Psychological Review, 84, 279-325. Carvalho, M. P., & Machado, A. (2012). Relative versus absolute stimulus control in the temporal bisection task. Journal of the Experimental Analysis of Behavior, 98, 23-44. Gibbon, J. (1991). Origins of scalar timing. Learning and Motivation, 22, 3-38. Carvalho, M. P., Machado, A., & Tonneau, F. (2016). Learning in the temporal bisection task: Relative or Absolute? Journal of Experimental Psychology, 42, 67-81. Gibbon, J., & Church, R. M. (1984). Sources of variance in an information processing theory of timing. In H. L. Roitblat, T. G. Bever, & H. S. Terrace (Eds), Animal Cognition (pp. 465-488). Hillsdale, NJ: Lawrence Erlbaum Associates. Carvalho, M. P., Machado, A., & Vasconcelos, M. (2016). Animal timing: a synthetic approach. Animal Cognition, 1-26. Catania, A. C. (1999). Aprendizagem: Comportamento, Linguagem e Cognição (4ª ed.). Porto Alegre: Artes Médicas. Church, R. M. (2002). Temporal learning. In H. Pashler, & R. Gallistel (Eds), Stevens’ Handbook of Experimental Psychology, Third Edition: Volume 3, Learning, Motivation, and Emotion (pp. 365-393). New York, NY: Wiley. Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psychology: Animal Behavior Pro155 Gibbon, J., Church, R. M., & Meck, W. H. (1984). Scalar Timing in Memory. Annals of the New York Academy of Sciences, 423, 5277. Gulliksen, H. (1932). Studies of transfer of response: I. Relative versus absolute factors in the discrimination of size by the white rat. Journal of Genetic Psychology, 40, 37-51. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Köhler, W. (1918/1938). Simple structural functions in the chimpanzee and in the chicken. In W. D. Ellis (Ed), A source book of Capítulo IX | Bissecção Temporal gestalt psychology (pp. 217-227). New York: Harcourt, Brace & World. (Trabalho original publicado em alemão em 1918). Machado, A. (1997). Learning the temporal dynamics of behavior. Psychological Review, 104, 241-265. Machado, A., & Arantes, J. (2006). Further tests of the Scalar Expectancy Theory (SET) and the Learning-to-Time (LeT) model in a temporal bisection task. Behavioural Processes 72, 195-206. Machado, A., & Keen, R. (1999). Learning to Time (LeT) or Scalar Expectancy Theory (SET)? A critical test of two models of timing. Psychological Science, 10, 285-290. Machado, A., Malheiro, M. T., & Erlhagen, W. (2009). Learning to time: A perspective. Journal of the Experimental Analysis of Behavior, 92, 423-458. Machado, A., & Oliveira, L. (2009). Dupla bissecção temporal: testes críticos de dois modelos de timing. Acta Comportamentalia, 17, 25-60. Machado, A., & Pata, P. (2005). Testing the scalar expectancy theory (SET) and the learning-to-time model (LeT) in a double bisection task. Learning & Behavior, 33, 111122. Oliveira, L., & Machado, A. (2008). The effect of sample duration and cue on a double temporal discrimination. Learning and Motivation, 39, 71-94. Oliveira, L., & Machado, A. (2009). Context effect in a temporal bisection task with the choice keys available during the sample. Behavioural Processes, 81, 286-292. Pavlov, I. (1927). Conditioned reflexes. London: Oxford University Press. Raslear, T. G. (1985). Perceptual bias and response bias in temporal bisection. Perception & Psychophysics, 38, 261-268. Richelle, M., & Lejeune, H. (1980). Time in animal behaviour. Oxford: Pergamon Press Ltd. Saldanha, E. L., & Bitterman, M. E. (1951). Relational learning in the rat. The American Journal of Psychology, 64, 37-53. Santo Agostinho. (2004). Confissões, Livro XI, XIV, 17 (2ª ed.). Lisboa: Imprensa Nacional da Casa da Moeda. Spence, K. W. (1936). The nature of discrimination learning in animals. Psychological Review, 43, 427-449. Spence, K. W. (1937). The differential response in animals to stimuli varying within a single dimension. Psychological Review, 44, 430-444. Stubbs, D. A. (1968). The discrimination of 156 Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado stimulus duration by pigeons. Journal of the Experimental Analysis of Behavior, 11, 223238. Stubbs, D. A. (1976). Response bias and the discrimination of stimulus duration. Journal of the Experimental Analysis of Behavior, 25, 243-250. Vieira de Castro, A. C., & Machado, A. (2012). The interaction of temporal generalization gradients predicts the context effect. Journal of the Experimental Analysis of Behavior, 97, 263-279. Vieira de Castro, A. C., Machado, A., & Tomanari, G. Y. (2013). The context effect as interaction of temporal generalization gradients: Testing the fundamental assumptions of the Learning-to-Time model. Behavioural Processes, 95, 18-30. 157 Hiroto Okouchi Como você se sente? 1, 2 Hiroto Okouchi Universidade Osaka Kyoiku, Japão Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15. “Nós não precisamos supor que eventos que ocorrem dentro da pele de um organismo tem propriedades especiais por essa razão” (Skinner, 1953, p.257). 158 Capítulo X | Eventos Privados INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Muitas pessoas, não somente os psicólogos mas também os não especialistas em Psicologia, estão interessados em compreender a “mente”. Analistas do comportamento têm uma perspectiva única sobre ela, baseada no Behaviorismo Radical (Skinner, 1945). A entidade hipotética que geralmente tem sido chamada de “mente” está relacionada com um dos conceitos analítico-comportamentais, os eventos privados. Eventos privados têm sido geralmente definidos estruturalmente como eventos que ocorrem dentro da pele de uma pessoa (Catania, 1992, p.388) e, funcionalmente, como eventos que são diretamente acessíveis a apenas uma pessoa (Skinner, 1953, p.257). Sentimentos, como “depressão” e “entusiasmo”, são eventos privados não só estruturalmente, mas também funcionalmente, porque ocorrem dentro da pele de uma pessoa e estão diretamente acessíveis apenas para ele ou ela. Tais sentimentos, em geral, são considerados como “elementos da mente” (Dicionário de Inglês Oxford, 2004, pp.1047-1048). Tradução realizada por João Henrique de Almeida, Carlos Renato Xavier Cançado e Paulo Guerra Soares. O primeiro tradutor é bolsista de pós-doutorado FAPESP processo número 2014/01874-7. 1 O artigo descrito nesse texto foi traduzido para a língua portuguesa por Júlio de Rose e está publicado: Lubinski,D. & Thompson, T. (2010) Um modelo animal de comunicação interpessoal de estados interoceptivos (privados). Revista Brasileira de Análise do Comportamento, 6, 229-252. 2 Em oposição aos eventos privados, eventos que ocorrem fora da pele de uma pessoa e/ou eventos que são diretamente acessíveis a mais do que um indivíduo podem ser chamados de eventos públicos. O pressionar de uma barra por um rato e a entrega de uma pelota de comida, durante um experimento de condicionamento operante, são exemplos típicos de eventos públicos. A análise experimental do comportamento tem acumulado um extenso corpo de conhecimento sobre as relações sistemáticas entre tais eventos públicos (Ferster & Skinner, 1957, Honig, 1966; Honig & Staddon, 1977; Iversen & Lattal, 1991; Madden, 2013). Analistas do comportamento presumem que eventos privados obedecem os mesmos princípios comportamentais revelados pela análise experimental de eventos públicos. De acordo com este ponto de vista, por exemplo, até mesmo descrever nossos próprios sentimentos é um resultado de contingências de reforçamento. Skinner (1945) argumentou que as respostas verbais sob controle de estímulos privados são estabelecidas e mantidas principalmente pelas contingências de reforço “arranjadas” por outras pessoas. Suponha que uma pessoa “deprimida” (um falante), diga: “Estou deprimido.” Se alguém (um ouvinte) ouviu e entendeu a reclamação (isto é, se o ouvinte pertencesse a uma mesma comunidade verbal que o falante e pudesse reagir de forma adequada ao que o falante disse), e se o ouvinte soubesse que o fa159 Hiroto Okouchi lante tinha experimentado um evento que normalmente provoca sentimentos de depressão (por exemplo, a perda de um ente querido), o ouvinte poderia dizer: “Eu sei exatamente como você se sente.” Comportamentalmente, o sentimento de depressão, a queixa “estou deprimido”, e as palavras de conforto “Eu sei exatamente como você se sente”, respectivamente, são um estímulo discriminativo, uma resposta e um reforçador do comportamento verbal do falante. Uma resposta verbal (e.g., “vermelho”) a um estímulo público (e.g., um cartão vermelho) pode ser estabelecida pelo reforço dado por outros (e.g., “Correto, esta é a cor do cartão.”). Os analistas do comportamento supõe que descrever os próprios sentimentos (e.g., estar deprimido), também é aprendido (e.g., Skinner, 1953, pp.257-282). Skinner (1945) também demonstrou que o relato de uma pessoa sobre um estímulo privado não ocorre por reforço direto, mas por meio de generalização. Uma pessoa pode descrever seu sentimento novo como “deprimido(a)” se ele ou ela aprendeu que a palavra “deprimido(a)” é usada quando algo (e.g. uma barra) foi empurrado para baixo (generalização de eventos públicos para os privados, Skinner, 1957, pp.132-133) ou a palavra é usada quando ele ou ela experimenta um sentimento semelhante ao sentimento novo (i.e. generalização de eventos privados conhecidos para aqueles desconhecidos). Apesar da grande quantidade de 160 análises conceituais (e.g., Leigland, 2014; Schlinger, 2011; Tourinho, 2006), análises experimentais de eventos privados têm recebido relativamente pouca atenção. O experimento conduzido por Lubinski e Thompson (1987) é um dos raros casos em que foi praticada uma análise experimental de eventos privados. DESCRIÇÃO DO EXPERIMENTO Objetivos e Método O objetivo do experimento de Lubinski e Thompson (1987) foi avaliar se animais não-humanos poderiam aprender a interagir comunicativamente, com base em eventos em seu ambiente interno. Figura 1. Painéis adjacentes de trabalho das caixass para os dois grupos de pombos. Os painéis de trabalho foram separados por uma divisória de acrílico Os mandadores foram treinados na caixa esquerda; os tateadores foram treinados na caixa direita (figura reproduzida da tradução de Lubinski & Thompson, com permissão da ReBAC e JEAB). Capítulo X | Eventos Privados Figura 2. Uma comunicação entre dois pombos com base na ingestão de drogas (estado interno) de um dos pombos. Da esquerda para a direita, os cinco quadros (A-E) mostram os componentes sucessivos do procedimento. Os pombos à esquerda e à direita em cada quadro eram o mandador e o tateador, respectivamente (reproduzida da tradução de Lubinski & Thompson, 1987, com permissão da ReBAC e JEAB). Os sujeitos foram cinco pombos White Carneau fêmeas, experimentalmente ingênuas, distribuídos em dois grupos, denominados “mandadores” (dois pombos) e “tateadores” (três pombos). Duas caixas experimentais contíguas, separadas por uma divisória de acrílico transparente, que permitiu que os pombos vissem um ao outro, foram usadas (ver Figuras 1 e 2). Os mandadores foram treinados na caixa esquerda, os tateadores na direita. Antes de serem colocados em suas caixas simultaneamente, cada pombo foi treinado individualmente. Os tateadores, que estavam privados de água e comida durante o experimento, foram treinados em uma cadeia comportamental com dois componentes, em que o primeiro componente compreendia uma tarefa pareamento ao modelo arbitrária (arbitrary matching-to-sample )(o procedimento deste treino será resumido em seguida). Após o treino, a cadeia comportamental estabelecida era a seguinte: (a) O tateador era injetado com um depressor (pentobarbital), um estimulante (cocaína) ou uma solução salina isotônica; (b) três discos de resposta, cada um marcado com a letra “D”, “N”, ou “Σ” foram iluminados (Figura 1); (c) bicadas correspondentes à substância injetada (o disco “D” para o pentobarbital, o disco “Σ” para a cocaína, e o disco “N” para a solução 161 Hiroto Okouchi salina) foram seguidas pela apresentação de uma luz azul piscando acima dos discos de resposta; (d) as respostas em um disco acima de um comedouro (disco da comida) e em um disco acima de um bebedouro (disco da água) foram reforçadas com comida e água, respectivamente. A tarefa de pareamento ao modelo que os tateadores experimentaram é conhecida como um procedimento de discriminação de drogas (drug discrimination): reforçar um tipo de comportamento após a administração de uma droga e reforçar outro comportamento após a administração de nenhuma droga ou alguma outra droga (Branch, 1991). Na ausência de qualquer estímulo diferencial exteroceptivo correlacionado com qualquer comportamento, escolhas produziam reforçadores mais frequentemente do que ao acaso e poderiam ser atribuídas a estímulos interoceptivos decorrentes da substância administrada (e.g., a droga ou a solução salina). Assim, os tateadores no experimento de Lubinski e Thompson (1987) foram treinados para “relatar seus sentimentos” pela tarefa de pareamento ao modelo. Foram necessários aproximadamente sete meses para os tateadores responderem de forma consistente (i.e., pelo menos 80% de respostas corretas) nesta tarefa. Um segundo objetivo do experimento Lubinski e Thompson (1987) foi avaliar se as respostas dos pombos aos seus eventos internos (privados) poderiam funcionar 162 como um tato, o que foi estudado na parte final do experimento (descrito em seguida). Um tato, uma unidade do comportamento verbal, é “um operante verbal em que uma resposta de determinada forma é evocada (ou pelo menos fortalecida) por um determinado objeto ou evento ou propriedade de um objeto ou evento” (Skinner, 1957, pp. 81-82). Citando vários outros autores (e.g., MacCorquodale, 1969; Skinner, 1957, pp.81-82), Lubinski e Thompson afirmam que tatos não são mantidos por reforços específicos, nem mudam com o estado de privação ou de estimulação aversiva do indivíduo, mas são mantidos por reforçadores condicionados generalizados (e.g., dizendo “Correto” quando alguém nomeia com precisão a cor de um cartão vermelho dizendo “Vermelho”). A fim de alcançar este segundo objetivo, Lubinski e Thompson tentaram estabelecer a luz azul intermitente como um reforçador condicionado generalizado que pudesse manter o comportamento dos tateadores. Os tateadores foram privados de comida de forma mais rigorosa do que eles foram privados de água em um dia (i.e., privação de comida por 28 hr e privação de água por 4hr), e eles foram privados de água de forma mais rigorosa do que eles foram privados de comida em outro dia (i.e., privação de água por 28 hr e privação de comida por 4hr). Alternando essas duas condições de uma forma A-B-A-B, os tateadores escolhiam comida e água indiferenciadamente quando a luz azul estava piscando. Um mando, uma unidade mais pri- Capítulo X | Eventos Privados mitiva do comportamento verbal, é “um operante verbal em que a resposta é reforçada por uma consequência particular, e está, portanto, sob controle funcional das condições relevantes de privação ou de estimulação aversiva” (Skinner, 1957, pp.35 -36). Dizer a palavra “Doce” é um exemplo de um mando quando reforçado pelo acesso a doces, e a resposta “Doce” será mais provável de ocorrer após um período de privação de doces ou comida (Skinner, 1957, p.35). Os mandadores, que foram mantidos sob privação de comida a 85% de seu peso com livre acesso a comida, foram treinados em uma cadeia comportamental com três componentes, em que o terceiro componente envolvia uma tarefa de pareamento ao modelo arbitrário. A cadeia estabelecida para o mandador era a seguinte: (a) foi iluminado um disco com letras em Inglês dispostas para formar as palavras (Figura 1); “Como você se sente?”; (b) as bicadas do mandador ao disco “Como você se sente” foram seguidas pela iluminação de um outro disco rotulado “Obrigado”; (c) quando o mandador bicava o disco “Obrigado”, a letra “D”, “N”, ou “Σ” era projetada em um disco modelo; (d) bicar o disco modelo e, em seguida, bicar o disco de comparação contendo a resposta com a correspondência correta (o disco “P” para a letra “D”, o disco “C” para a letra “Σ”, e o disco “S”para a letra”N”) produziam comida. Depois de ambos os mandadors e tateadores adquirirem independentemente a precisão necessária (i.e., pelo menos 80% de respostas corretas) no encadeamento, tateadores e mandadors individuais fo- ram colocados nas suas caixas simultaneamente. Como a Figura 2 ilustra, a interação comportamental necessária de cada par mandador-tateador foi: (a) foi iluminado o disco do mandador “Como você se sente?” e o mandador bicava esse disco; (b) foram iluminados todos os discos de comparação do tateador (i.e., os discos “D”, “N”, e “Σ”) e o tateador bicava o disco de comparação correlacionado com a substância injetada (ou os próprios “sentimentos” do tateador); (c) foi iluminado o disco “Obrigado” na caixa do mandador e o mandador bicava esse disco; (d) a letra (“D”, “N”, ou “Σ”, i.e., o “nome” da droga ou o relato do tateador de seus “sentimentos”) previamente bicada pelo tateador aparecia no disco modelo do mandador e a luz azul começava a piscar a caixa do tateador; o mandador bicava o disco modelo e, em seguida, bicava do disco de comparação correto; o tateador bicava o disco da comida ou da água, produzindo comida ou água; (e) o mandador recebeu comida. Se o tateador bicasse o disco de comparação não correlacionado com a substância injectada (uma resposta incorreta), as luzes da caixa eram escurecidas por 4 s e o elo inicial da cadeia (a) era reiniciado. Assim, o estímulo modelo apresentado ao mandador sempre foi correto. Ambos os mandadors trabalharam com cada um dos tateadores. Os pombos foram testados nessa interação por 40 sessões experimentais. Deve-se notar que o experimento de Lubinski e Thompson (1987) apresentava duas fases adicionais (Fases 2 e 3). Na 163 Hiroto Okouchi Fase 2, os tateadores foram injetados com novas drogas, clordiazepóxido e d-anfetamina, que possuem propriedades farmacológicas em comum com o pentobarbital e cocaína, respectivamente, como um teste de generalização. Na Fase 3, os autores examinaram se as respostas dos tateadores aos seus eventos privados funcionavam realmente como tatos. Foram testados os desempenhos dos tateadores quando foram colocados em suas caixas experimentais depois de receberem 24 horas de acesso livre a alimento e água (os tateadores foram saciados com alimento e água), e quando suas respostas corretas produziam apenas a luz azul piscando, mas que não produziam água ou comida (as respostas corretas dos tateadores produziam apenas reforçadores condicionados). Resultados e Discussão Resultados da Fase 1. Como apenas uma única substância (pentobarbital, cocaína, ou salina) foi injetada antes de cada sessão, a escolha correta para o tateador foi a mesma em todas as tentativas em uma sessão. Assim, o desempenho dos tateadores na primeira tentativa de uma sessão foi importante neste experimento. Tanto o mandador quanto o tateador responderam corretamente (e.g., o tateador que recebeu o pentobarbital e bicou o disco “D”, e o mandador bicou o disco “P”) na primeira tentativa em 70-100% das sessões, enquanto que a porcentagem de uma discriminação correta acontecer por acaso 164 era de aproximadamente 11% (i.e., o produto dos dois desempenhos individuais acontecendo por acaso, i.e., 0,33 x 0,33). Estes resultados sugerem que os pombos aprenderam a interagir comunicativamente com base em eventos do seu ambiente interno. Resultados das Fases 2 e 3. Os desempenhos observados na Fase 1 persistiram na Fase 2, sugerindo que as respostas dos tateadores aos seus eventos privados decorrentes do treino com as drogas (pentobarbital e cocaína) generalizaram para os eventos privados semelhantes decorrentes de drogas não utilizadas no treino (clordiazepóxido e d-anfetamina). Os desempenhos observados nas Fases 1 e 2 persistiram na Fase 3, sugerindo que as respostas precisas dos tateadores aos seus eventos privados não foram mantidas pelos reforçadores específicos (comida ou água), e não covariaram com os estados de privação dos tateadores, mas foram mantidas por um reforço condicionado generalizado (a luz azul piscando). A discussão do artigo de Lubinski e Thompson (1987) pode ser resumida da seguinte forma: (a) o comportamento dos tateadores envolveu tatear os eventos privados; (b) os tateadores aprenderam a tatear eventos privados sob um esquema de reforçamento contínuo com 100% de precisão, isto é, por meio de uma contingência em que cada resposta correta produzia um reforçador e qualquer resposta incorreta Capítulo X | Eventos Privados não produzia reforçadores; por outro lado, considera-se que humanos aprendem a tatear eventos privados sob um esquema de reforçamento intermitente com baixa precisão (Skinner, 1945); (c) a generalização obtida na Fase 2 configura-se como um exemplo de tatos extendidos e exemplifica com não-humanos a descrição de Skinner de como humanos aprendem a relatar novos sentimentos; (d) os resultados de Thompson e Lubunski demonstram que o comportamento encoberto (e.g., pensamentos, sentimentos e imaginação), que tem sido um dos candidatos para análise por meio de modelos experimentais com não-humanos (Epstein, 1984), mas tem resistido à análise empírica, é passível de uma análise objetiva; (e) os desempenhos estudados por Lubinski e Thompson podem não consistir em um exemplo de “atividade lingüística”, como o termo é geralmente entendido, mas compartilham características com aqueles comportamentos observados em crianças muito novas ou indivíduos com diagnóstico de deficiências de desenvolvimento; (f) Savage-Rumbaugh (1984) afirmou que o comportamento controlado por contingências impostas por circuitos eletrônicos ao invés de por um outro indivíduo não poderia ser caracterizado como “comunicação”. No entanto, as trocas diádicas humanas de respostas muitas vezes são mediadas por eventos externos, tais como ligações telefônicas e quadros de avisos no computador, e nós estamos satisfeitos em nos referirmos a essas trocas como “verbais”. DESDOBRAMENTOS O experimento de Lubinski e Thompson (1987) recebeu grande atenção (e.g., Catania, 1992, pp.219-220). Em 1993, a revista Behavioral and Brain Sciences dedicou um número para um debate sobre o mesmo, com comentários de 27 estudiosos da análise do comportamento e de outras abordagens (ver Lubinski & Thompson, 1993). O experimento de Lubinski e Thompson (1987), no entanto, não foi replicado diretamente ou sistematicamente. Provavelmente, isto pode ser devido a razões de ordem prática. O equipamento utilizado por Lubinski e Thompson era muito diferente de caixas operantes padrão. As drogas psicoativas não são acessíveis a todos os pesquisadores. Além disso, este tipo de experimento demora muito tempo. Conforme descrito na parte de Objetivos e Método deste capítulo, de fato, Lubinski e Thompson passaram sete meses para ensinar os tateadores a discriminação entre as drogas. Dois estudos podem ser considerados como sucessores Lubinski e Thompson (1987). Um foi realizado por DeGrandpre, Bickel, e Higgins (1992). Eles também usaram o procedimento de discriminação de drogas como Lubinski e Thompson fizeram, e examinaram se relações de equivalência podem surgir entre os estímulos interoceptivos (ativados por drogas) e os estímulos exteroceptivos. Humanos adultos foram treinados em discriminações de drogas com 165 Hiroto Okouchi triazolam (reduzindo auto-relatos de ansiedade) e placebo (cápsulas cheias de lactose) como estímulos modelo, e estímulos visuais como estímulos de comparação. Quando o triazolam (A1) foi apresentado, a escolha de um estímulo visual B1 era a correta, enquanto a escolha dos estímulos visuais B2 e A0 eram incorretas; ou quando escolher um estímulo visual C1 era a escolha correta e a escolha dos estímulos visuais C2 e C0 incorretas. Da mesma forma, quando o placebo (A2) era o modelo, as comparações corretas eram B2 e C2. Após o estabelecimento das relações condicionais A1B1, A1C1, A2B2, A2C2 por meio desse treino de discriminação de drogas, as relações não treinadas B1C1 e B2C2 emergiam. Estes resultados demonstram que eventos privados podem emergir como membros de uma classe equivalente, da mesma forma que ocorre com os estímulos públicos (Sidman & Tailby, 1982) e, como Lubinski e Thompson mostraram, fornecem evidências de que os princípios comportamentais que operam em eventos públicos funcionam também com os eventos privados (Skinner, 1953, pp.257-258). Outro exemplo relevante para o tema é um experimento realizado por Okouchi (2006). Como no experimento de Lubinski e Thompson, no experimento de Okouchi respostas a estímulos privados de um indivíduo configuravam estímulos modelos para outro indivíduo. Diferente do experimento de Lubinski e Thompson, no entanto, estímulos privados não eram estímulos interoceptivos mas exteroceptivos, isto é, 166 estímulos visuais que apenas um indivíduo de um par de estudantes de graduação podia ver. De acordo com a definição funcional de eventos privados como eventos que são diretamente acessíveis a uma só pessoa (Skinner, 1953, p.257), eventos que ocorrem fora da pele de uma pessoa podem ser privados (Rachlin, 2003, chamou esse tipo de evento privado de Privacidade B e o distinguiu da Privacidade A, que são eventos que ocorrem sob a pele de uma pessoa). Empregando a definição funcional de eventos privados, Okouchi (2006) examinou uma das interpretações de Skinner (1945) de como respostas verbais sob controle de um estímulo privado são estabelecidas: o relato de um estímulo privado (e.g., dor) pode ser aprendido por meio de reforços providos por outras pessoas que inferem o estímulo privado das respostas públicas colaterais (e.g., a mão no queixo, expressões faciais, gemidos) ao estímulo. Oito dos 16 participantes, descritos como instrutores, aprendiam primeiro discriminações condicionais BC com os estímulos B como os modelos e os estímulos C como comparações. Em seguida, outros oito participantes, descritos como aprendizes, foram expostos a um procedimento de pareamento ao modelo modificado em que as respostas dos aprendizes foram reforçadas ou punidas não pelas respostas do experimentador, mas pelas respostas dos instrutores. As discriminações condicionais AC deveriam ser estabelecidas para os aprendizes, em que os estímulos modelos As foram Capítulo X | Eventos Privados apresentados simultaneamente com os estímulos B para que os instrutores pudessem ver os Bs, mas não os As. De acordo com a definição funcional de eventos privados, os estímulos A eram privados para os instrutores. Assim, os estímulos modelo As e os estímulos modelo correlacionados Bs correspondiam, respectivamente, a estímulos privados e suas respostas públicas colaterais na interpretação de Skinner. Okouchi examinou se os relatos dos aprendizes (Cs) de seus próprios estímulos (As) seriam estabelecidos pelo reforço diferencial provido por outras pessoas (os instrutores) que poderiam ter acesso apenas aos estímulos colaterais (BS) e aos relatos (CS). No experimento de Okouchi (2006), dois de oito pares de participantes apresentaram o desempenho previsto, no qual aprenderam as discriminações condicionais AC dos instrutores que não tinham acesso aos estímulos A. Posteriormente, Sonoda e Okouchi (2012) replicaram os resultados de Okouchi utilizando um procedimento modificado. Eles utilizaram estímulos abstratos e um computador, por exemplo, enquanto Okouchi havia usado estímulos geométricos, sílabas sem sentido, e estímulos coloridos e havia controlado a apresentação no experimento manualmente. Sonoda e Okouchi obtiveram os desempenhos esperados de todos os 26 pares de alunos de graduação. CONSIDERAÇÕES FINAIS Talvez, simular o comportamento de relatar eventos privados por animais não-humanos tenha sido uma das realizações mais significativas de Lubinski e Thompson (1987). Epstein (1981, 1984) insistiu que as simulações animais, ou modelos experimentais, sintetizando o chamado comportamento humano “complexo” em animais, poderiam dar insights sobre que tipos de variáveis constituem alguns desses comportamentos “complexos” em seres humanos. Epstein (1984) listou quatro classes de comportamentos que tinham resistido a essas análises e, portanto, tinham sido considerados como “complexos”: (a) comportamentos encobertos (“pensamentos”, “sentimentos” e “imaginações”); (b) comportamentos tipicamente humanos (linguagem, comportamentos que são descritos sob a rubrica do “self”, e o comportamento de resolução de problemas); (c) os comportamentos controlados por estímulos temporalmente remotos (“memória”); e (d) novos comportamentos (“criatividade” e “pensamento produtivo”). Exceto pela classe de comportamentos encobertos, alguns comportamentos de cada uma dessas classes foram simulados e estudados experimentalmente (e.g., Epstein, 1981; Epstein, Lanza, & Skinner, 1980; Epstein & Skinner, 1981). O trabalho de Lubinski e Thompson pode ser considerado um sucesso de uma simulação animal de comportamentos encobertos ou eventos privados ( “sentimentos”). 167 Hiroto Okouchi Como o título do artigo de Lubinski e Thompson (1987) sugere, duas práticas que ilustram um modelo de como examinar eventos privados também podem ser realizações significativas deste trabalho. Em primeiro lugar, eles mostraram que os processos de discriminação de drogas podem ser utilizados em experimentos sobre eventos privados. Uma das dificuldades na experimentação sobre eventos privados é a manipulação dos mesmos. Apresentação e não apresentação de um “sentimento”, por exemplo, não é fácil, ao passo que apresentações de uma luz colorida têm sido comumente implementadas em experimentos comportamentais. O uso de drogas psicoativas seria um dos poucos métodos para manipular sentimentos de forma relativamente confiável (mas ver Branch, 1991, para uma discussão sobre as dificuldades em usar drogas como estímulos discriminativos). Em segundo lugar, Lubinski e Thompson conduziram um experimento sobre eventos privados no contexto das interações entre indivíduos. Esta prática é útil porque, de acordo com a definição funcional de eventos privados (Skinner, 1953, p.257), se um evento é privado ou não, depende se ele é acessível a outras pessoas ou não. PARA SABER MAIS DeGrandpre, Bickel, & Higgins (1992). Esse artigo relata um experimento em que eventos privados humanos foram manipulados 168 por meio de drogas psicoativas. Kohlenberg, & Tsai (1991). Este livro descreve como eventos privados, como emoções, memória, cognições e crenças são conceituados e manejados em uma psicoterapia analítico comportamental. Okouchi (2006). Este artigo mostra como eventos fora da pele do participante e não acessíveis a outros participantes, mas a um experimentador podem contribuir para a análise experimental dos eventos privados, e relata um experimento que investigou uma das interpretações de Skinner (1945) da maneira em que os humanos aprendem a relatar eventos privados. Rachlin (2003). Esse capítulo de livro descreve como o behaviorismo teleológico compreende os eventos privados. O behaviorismo teleológico exclui eventos internos (eventos sob a pele do organismo) de uma análise do comportamento e busca por variáveis controladoras do comportamento de forma ampla no ambiente temporalmente estendido do organismo. Skinner (1945). Esse é um clássico sobre eventos privados. Você PRECISA ler se você estuda eventos privados a partir de uma perspectiva comportamental. Sonoda, & Okouchi (2012). Esse artigo relata experimentos que replicam os resultados de Okouchi (2006), utilizando um procedimento modificado. No Experimento 2, os Capítulo X | Eventos Privados aprendizes aprenderam a tatear “eventos privados” por reforçamento não com 100% mas com 83,3% de precisão, ilustrando um análogo de laboratório da vida diária, em que se entende que os humanos aprendem a tatear eventos privados sob um esquema de reforçamento com fraca acurácia (Skinner,1945). ence, 207, 543-545. REFERÊNCIAS Honig, W. K. (Ed.). (1966). Operant behavior: Areas of research and application. New York: Appleton-Century-Crofts. Branch, M. N. (1991). Behavioral pharmacology. In I. H. Iversen & K. A. Lattal (Eds.), Experimental analysis of behavior (Part 2, pp.21-77). Amsterdam: Elsevier. Catania, A. C. (1992). Learning (3rd ed.). Englewood Cliffs, NJ: Prentice-Hall. DeGrandpre, R. J., Bickel, W. K., & Higgins, S. T. (1992). Emergent equivalence relations between interoceptive (drug) and exteroceptive (visual) stimuli. Journal of the Experimental Analysis of Behavior, 58, 9-18. Epstein, R. (1981). On pigeons and people: A preliminary look at the columban simulation project. The Behavior Analyst, 4, 43-55. Epstein, R. (1984). Simulation research in the analysis of behavior. Behaviorism, 12, 41-59. Epstein, R., Lanza, R. P., & Skinner, B. F. (1980). Symbolic communication between two pigeons (Columba livia domestica). Sci- Epstein, R., & Skinner, B. F. (1981). The spontaneous use of memoranda by pigeons. Behavior Analysis Letters, 1, 241-246. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. Honig, W. K., & Staddon, J. E. R. (Eds.). (1977). Handbook of operant behavior. Englewood Cliffs, Prentice-Hall. Iversen, I. H., & Lattal, K. L. (Eds.). (1991). Experimental analysis of behavior (Part 1). Amsterdam: Elsevier. Kohlenberg, R. J., & Tsai, M. (1991). Functional analytic psychotherapy: Creating intense and curative therapeutic relationships. New York: Plenum Press. Leigland, S. (2014). Contingency horizon: On private events and the analysis of behavior. The Behavior Analyst, 37, 13-24. Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15. 169 Hiroto Okouchi Lubinski, D., & Thompson, T. (1993). Species and individual differences in communication based on private states. Behavioral and Brain Sciences, 16, 627-680. MacCorquodale, K. (1969). B. F. Skinner’s verbal behavior: A retrospective appreciation. Journal of the Experimental Analysis of Behavior, 12, 831-841. Skinner, B. F. (1945). The operational analysis of psychological terms. Psychological Review, 52, 270-277. Skinner, B. F. (1953). Science and human behavior. New York: Macmillan. Skinner, B. F. (1957). Verbal behavior. New York: Appleton-Century-Crofts. Madden, G. J. (Ed.). (2013). APA handbook of behavior analysis (Vol.1). Washington, DC: American Psychological Association. Sonoda, A., & Okouchi, H. (2012). A revised procedure for analyzing private events. The Psychological Record, 62, 645-661. Okouchi, H. (2006). An experimental analysis of another privacy. The Psychological Record, 56, 245-257. The Oxford English Dictionary (2nd. ed.). (2004). Oxford: Clarendon Press. Rachlin, H. (2003). Privacy. In K. A. Lattal, & P. N. Chase (Eds.), Behavior theory and philosophy (pp.187-201). New York: Kluwer Academic/Plenum Publishers. Savage-Rumbaugh, E. S. (1984). Verbal behavior at a procedural level in the chimpanzee. Journal of the Experimental Analysis of Behavior, 41, 223-250. Schlinger, H. D. (2011). Introduction: Private events in a natural science of behavior. The Behavior Analyst, 34, 181-184. Sidman, M., & Tailby, W. (1982). Conditional discrimination vs. matching to sample: An expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22. 170 Tourinho, E. Z. (2006). Private stimuli, covert responses, and private events: Conceptual remarks. The Behavior Analyst, 29, 13-31. Andréia Schmidt “Esse não é um pitilics, então só pode ser aquele”: o responder por exclusão e a aprendizagem de repertórios verbais Andréia Schmidt Universidade de São Paulo Dixon, L. S. (1977). The nature of control by spoken words over visual stimulus selection. Journal of the Experimental Analysis of Behavior, 27, 433-442. “- Mamãe, por que é que eu me chamo Marcelo? (...) Por que é que não escolheram marmelo? - Porque marmelo é nome de fruta, menino! - E a fruta não podia chamar Marcelo, e eu chamar marmelo?” (Ruth Rocha – Marcelo, Martelo, Marmelo) 171 Capítulo XI | Responder por Exclusão INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Um dos fenômenos mais interessantes que ocorre no desenvolvimento humano é, sem dúvida, a aprendizagem da linguagem. Apesar de bebês entenderem algumas palavras ditas por adultos já aos sete ou oito meses de idade, e até mesmo executarem algumas ordens simples nessa idade (e.g., “dar tchau”), as primeiras palavras só serão faladas aproximadamente ao final do primeiro ano de vida. Ao longo do segundo ano ocorre um aumento lento do vocabulário, mas o ritmo de aprendizagem de novas palavras parece ocorrer cada vez mais rápido e, aproximadamente aos três anos, a maioria das crianças com desenvolvimento típico já serão capazes de falar frases completas, e em geral de acordo com as normas da língua falada por sua comunidade verbal (Nelson, 2007). O que sempre intrigou pesquisadores e pesquisadoras é como as crianças podem aprender tanto em tão pouco tempo, apenas pela exposição à sua comunidade e sem o ensino formal das inúmeras unidades verbais (e.g., palavras ou frases) que compõem as práticas verbais dessa comunidade. Diversos pesquisadores da Psicolinguística e da Psicologia do Desenvolvimento se dedicaram ao estudo desse tema, sobretudo a partir das décadas de 1960 e 1970 (e.g., Bloom, 1970; Brown, 1973; Menyuk, 1969). A compreensão dos processos envolvidos na aprendizagem de vocabulário, além do seu valor em si, é importante para o desenvolvimento de intervenções comportamentais para pessoas com dificuldades na aprendizagem de repertórios verbais, como aquelas com diagnóstico de autismo, de deficiência intelectual ou de atrasos de linguagem. De acordo com Baer, Wolf e Risley (1968), o desenvolvimento de intervenções baseadas nos princípios da Análise Experimental do Comportamento era o foco das primeiras pesquisas de Análise Aplicada do Comportamento. Muitas estavam focadas no ensino de diversos repertórios comportamentais a indivíduos com deficiência intelectual, inclusive repertórios verbais. Várias pesquisas sobre intervenções para indivíduos com desenvolvimento atípico foram publicadas na década de 1970 e uma delas, em especial, chamou a atenção por demonstrar um processo de aprendizagem que ocorria a partir de um procedimento de ensino de discriminações condicionais. A pesquisa de Dixon (1977) demonstrou a ocorrência do responder por exclusão, um fenômeno comportamental que, mais tarde, foi relacionado por pesquisadores e pesquisadoras da Psicolinguística à aprendizagem rápida de vocabulário observada em crianças antes dos três anos. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Dixon (1977) investigou o proces172 Andréia Schmidt so envolvido na aprendizagem de relações entre palavras ditadas e figuras em tarefas de emparelhamento ao modelo (ou pareamento de acordo com o modelo – em inglês matching to sample), por jovens com diagnóstico de deficiência intelectual. Nesse tipo de tarefa, um estímulo modelo é apresentado ao participante (e.g., uma palavra é ditada: “Bola”) e ele deve selecionar, dentre alguns estímulos disponíveis (e.g., figuras ou objetos tridimensionais: um carrinho, um peão e uma bola) aquele que corresponde ao modelo. Essa tarefa envolve uma discriminação condicional: o objeto “correto” dependerá da palavra que foi ditada, ou seja, a bola será o S+ (objeto correto) apenas quando a palavra ditada for “bola” (estímulo condicional), mas não (S-) quando a palavra ditada for “Carrinho”, por exemplo. A autora partiu de dados da literatura da época que mostravam que (a) pessoas com deficiência intelectual apresentavam dificuldades em aprender vocabulário; e (b) procedimentos de ensino por emparelhamento ao modelo poderiam ser mais eficientes quando uma das alternativas de escolha já era conhecida do participante e servia de contraste para a nova aprendizagem (Vincent-Smith, Bricker, & Bricker, 1974). O objetivo do estudo de Dixon era testar um procedimento de ensino de relações palavra-figura para pessoas com deficiência intelectual, baseado no princípio de que, a partir do ensino de uma relação, outras poderiam ser aprendidas mais facilmente em função do controle por exclusão exercido pela relação previamente treinada. 173 Participaram do estudo oito jovens com deficiência intelectual. A tarefa dos jovens era selecionar uma figura (dentre duas disponíveis) de acordo com a palavra ditada pela pesquisadora. Foram utilizados três conjuntos de estímulos, cada conjunto composto por três figuras e seus respectivos nomes ditados. Os conjuntos eram compostos por letras gregas (Conjuntos 1 e 3) ou por símbolos japoneses (Conjunto 2). Cada participante foi exposto aos três conjuntos, um de cada vez. Antes de iniciar o procedimento com cada conjunto de estímulos, foi conduzido um pré-teste para avaliar se os participantes eram capazes de aprender rapidamente as relações nome-figura com os estímulos do conjunto. Se eles aprendessem muito rapidamente essas relações, isto é, a partir de um número pequeno de exposições, o efeito do procedimento testado em fases subsequentes do estudo poderia ser obscurecido, uma vez que esses participantes poderiam ter desenvolvido na sua história estratégias específicas de aprendizagem que não a de exclusão, objeto de estudo da pesquisa. No pré-teste foram conduzidos no mínimo dois blocos de 12 tentativas em que o nome de cada estímulo era ditado por quatro vezes não consecutivas (a ordem dos estímulos ditados ao longo das tentativas era aleatória), e duas figuras eram colocadas em frente ao participante para que ele apontasse aquela que correspondia à palavra ditada. Desempenhos corretos produziam elogios e fichas que poderiam ser trocadas por outros reforçadores no final da sessão. Caso o participante apresentas- Capítulo XI | Responder por Exclusão se mais que 75% de acertos em pelo menos dois de três blocos de tentativas, seria excluído do estudo, o que aconteceu com quatro jovens (além dos oito que finalizaram o estudo). Os oito participantes que apresentaram menos de 75% de acertos nos blocos de pré-teste com cada conjunto de figuras seguiram para a fase de treino, descrita na sequência. Na Fase de treino a pesquisadora ensinava cada participante a relacionar uma palavra ditada a uma figura do conjunto (e.g., a palavra ditada “Pi” e a figura da letra grega π). Na primeira tentativa da primeira sessão de treino, a pesquisadora colocava diante do participante duas figuras, uma considerada correta (S+), que seria relacionada à palavra ditada, e outra incorreta (S-), que era uma das outras duas figuras do conjunto. No exemplo da relação “Pi”- π, na primeira tentativa a pesquisadora apontava para a figura π e dizia: “Este é o Pi. Aponte para o Pi”. Nas tentativas seguintes, ela apresentava as duas figuras e pedia que o participante apontasse para a figura de “Pi”. Respostas corretas (a escolha da figura π) eram seguidas de elogios e fichas. Os blocos de treino dessa fase eram compostos por 18 tentativas nas quais o estímulo modelo (palavra ditada) era sempre o mesmo e os estímulos de comparação eram o S+ (π) e um S-, que se alternava nas tentativas entre θ e Y. Após o participante ter apresentado ao menos 16 respostas corretas em 18 ten- tativas, eram apresentadas as chamadas sondas de exclusão (exclusion probes). Em um bloco de 18 tentativas, eram apresentadas 12 tentativas de linha de base (i.e., em que a palavra ditada era aquela treinada na fase anterior) e seis tentativas de sonda. Nas sondas de exclusão, uma nova palavra era ditada (e.g., “Theta” ou “Upsilon”) e os estímulos disponíveis eram a figura relacionada à palavra modelo na fase anterior (e.g., a letra grega π) e o estímulo anteriormente com função negativa (e.g., θ ou Y). Caso o participante tivesse aprendido a relação “Pi” - π, ao ouvir a palavra completamente nova deveria selecionar outra figura, não aquela anteriormente relacionada à “Pi”. Respostas corretas nessa fase produziam elogios e fichas, tanto nas tentativas de linha de base, quanto nas sondas de exclusão. Após a sessão de sondas de exclusão, os participantes passavam para a fase seguinte, a de sondas de discriminação (discrimination probes). Em cada sessão, era apresentado um bloco de 18 tentativas, das quais 12 eram tentativas de linha de base e seis tentativas de discriminação, nas quais o modelo era uma das palavras novas ditadas nas sondas de exclusão (e,g., “Theta” ou “Upsilon” – três tentativas para cada palavra), e os estímulos de comparação disponíveis eram as duas figuras que tinham função negativa na fase de treino (e.g., θ e Y). Nessa fase, a autora tinha como objetivo verificar se, ao relacionar os estímulos auditivo e visual “novos” nas sondas de exclusão, esse desempenho se manteria em uma ten174 Andréia Schmidt tativa em que a palavra não treinada fosse ditada como modelo e em que os estímulos disponíveis para escolha fossem apenas os dois não diretamente treinados. A pergunta implícita nesses testes era: será que os participantes realmente aprenderam as relações “Theta”- θ e “Upsilon”- Y nas sondas de exclusão, ou será que eles selecionaram as figuras corretas diante dos modelos novos apenas porque haviam aprendido que a figura π não era Theta ou Upsilon? As sessões de sondas de discriminação eram apresentadas até que o participante apresentasse 100% de respostas corretas no bloco, até o máximo de quatro sessões. Se os participantes atingissem o critério em uma ou duas sessões, isso indicaria que eles realmente haviam aprendido as novas relações entre os estímulos não treinados nas sondas de exclusão. Mas, se o critério não fosse atingido nas quatro sessões possíveis, ou se fossem necessárias mais de duas sessões, seria possível deduzir que os participantes não aprenderam as novas relações nas sondas de exclusão, mas apenas relacionaram os modelos novos às figuras não treinadas sob controle da alternativa incorreta (a figura π), como se tivessem estabelecido uma espécie de regra: “se a palavra ditada for ‘Pi’, a figura certa é π; se a palavra ditada não for ‘Pi’, a figura correta é a outra”. Todas as fases (pré-teste, fase de treino, fase de sondas de exclusão e fase de sondas de discriminação) foram realizadas com todos os três conjuntos de estímulos. A ordem dos conjuntos, porém, variou entre 175 os participantes. Resultados e Discussão Na Fase de treino, todos os participantes aprenderam a primeira relação ensinada rapidamente, na maioria dos casos em uma única sessão. O desempenho de maior interesse, porém, era se os participantes responderiam ou não por exclusão na Fase de sondas de exclusão, ou seja, se diante de palavras nunca antes ditadas, selecionariam a figura que, nas tentativas de ensino (Fase de treino), funcionavam como S-. Foi exatamente isso o que ocorreu. Na sessão de sondas de exclusão, todos os participantes selecionaram a figura não treinada (e.g., θ ou Y) quando a palavra nova era ditada, e continuaram respondendo corretamente nas tentativas de linha de base. Esse resultado demonstrou que os participantes aprenderam a relação que foi treinada explicitamente (e.g., “Pi” e π) e que relacionaram a nova palavra à figura não treinada nas tentativas de sonda. As sondas de discriminação, porém, indicaram que, apesar dos participantes terem relacionado os estímulos modelo e comparação não treinados nas sondas de exclusão (“Theta” e θ, e “Upsilon” e Y), essas novas relações não se estabeleceram de forma tão estável quanto aquela treinada inicialmente. Apenas dois dos participantes atingiram o critério de desempenho nas sondas de discriminação realizadas com o primeiro conjunto de estímulos: um deles Capítulo XI | Responder por Exclusão na primeira sessão de sondas de discriminação e o outro apenas na quarta sessão. Os demais participantes não atingiram o critério de 100% de acertos no bloco, mesmo após quatro sessões. No entanto, foi verificada melhora no desempenho dos participantes nas sondas de discriminação com o segundo conjunto de estímulos: seis participantes atingiram 100% de acertos nas sondas de discriminação com, no máximo, quatro sessões, sendo que três desses seis participantes atingiram esse resultado em uma única sessão. Somente dois participantes foram expostos ao último conjunto de estímulos, uma vez que os demais apresentaram um alto desempenho com os estímulos no pré-teste realizado. Ambos os participantes atingiram 100% de acertos nas sondas de discriminação já na primeira sessão. Diante desses resultados, Dixon (1977) argumentou que o controle exercido pelas palavras novas nas sondas de exclusão era, aparentemente, a rejeição da figura treinada, isto é, daquela relacionada no treino a uma outra palavra. Nesse caso, o que estaria controlando a escolha dos participantes nas sondas de exclusão não era uma relação entre a nova palavra e a figura não treinada, mas a exclusão da alternativa já treinada diante de uma nova palavra. Essa hipótese foi fortalecida pelos resultados nas sondas de discriminação. Ao remover a alternativa treinada (a figura π) e apresentar juntas as figuras não diretamente treinadas, a maioria dos participantes não atingiu o critério de 100% de acertos nas sondas de discriminação, a despeito de terem relacionado corretamente as palavras novas às figuras não treinadas em 100% das sondas de exclusão. É interessante notar, porém, que a exposição ao segundo conjunto de estímulos promoveu melhora no desempenho dos participantes, uma vez que um número maior deles atingiu o critério de desempenho estabelecido nas sondas de discriminação. Esse resultado sugere que ocorreu uma espécie da “aprendizagem da tarefa” pelos participantes. DESDOBRAMENTOS Os resultados do estudo de Dixon (1977) chamaram a atenção de pesquisadores interessados em desenvolver procedimentos de ensino automatizados para indivíduos com deficiência intelectual, particularmente aqueles ligados ao grupo de pesquisa liderado por Larry Stoddard (Wilkinson, de Souza, & McIlvane, 2000). O desempenho por exclusão pareceu a esses pesquisadores especialmente interessante por se constituir em um desempenho emergente. Isto significa que, sem ensino direto, os participantes do estudo de Dixon estabeleceram duas novas relações entre estímulos auditivos e visuais, além daquela diretamente ensinada, o que pareceria um avanço em relação aos procedimentos utilizados até então. Os procedimentos de 176 Andréia Schmidt ensino que envolviam tarefas de emparelhamento ao modelo empregados na época costumavam apresentar aos participantes um estímulo modelo novo e dois ou mais estímulos de comparação também desconhecidos. O participante poderia acertar ou errar a primeira tentativa e a aprendizagem das relações dependia da sua exposição a várias tentativas desse tipo com cada estímulo modelo, o que se constituía em um procedimento longo e que expunha o participante a uma quantidade grande de erros. Esse tipo de procedimento é chamado de procedimento por tentativa e erro. O procedimento de ensino por exclusão apresentava vantagens por produzir aprendizagem de forma mais rápida e com menor exposição do participante a erros, cujos efeitos prejudiciais foram amplamente discutidos pela literatura (Terrace, 1963). Além disso, a melhora do desempenho dos participantes de Dixon (1977) nas sondas de discriminação ao longo do procedimento, com a exposição dos jovens aos diferentes conjuntos de estímulos, indicava que a exposição repetida do indivíduo às tentativas de exclusão poderia gerar aprendizagem consistente das relações entre estímulos. Procedimentos de ensino baseados no desempenho por exclusão foram, então, desenvolvidos e extensamente testados ao longo das décadas seguintes. McIlvane e Stoddard (1981), por exemplo, foram bem sucedidos em ensinar um jovem com deficiência intelectual a selecionar alguns alimentos diante de palavras ditadas. Em 177 estudos posteriores, esses resultados foram replicados e ampliados, inclusive com o registro de respostas de nomeação dos estímulos visuais por parte dos participantes, somente a partir de tentativas de exclusão (e.g., McIlvane, Kledaras, Lowry, & Stoddard, 1992; McIlvane, Munson, & Stoddard, 1988). Estudos sobre procedimentos de ensino baseados em exclusão foram testados em comparação a procedimentos de ensino por tentativa e erro, e se mostraram superiores a estes em relação à rapidez de aprendizagem dos repertórios ensinados, com a produção de um número menor de erros por parte dos aprendizes (Ferrari, de Rose, & Mcllvane, 1993, 2008). Os bons resultados obtidos com procedimentos de ensino baseados em exclusão para o ensino de relações auditivo-visuais para crianças e jovens com deficiência intelectual motivaram muitos pesquisadores a adaptá-los para o ensino dessas e de outras relações para diferentes populações: leitura, para crianças com dificuldades nessa área (e.g., de Souza & de Rose, 2006), relações entre palavras e figuras para crianças surdas com implante coclear (e.g., Almeida-Verdu, Huziwara, de Souza, de Rose, Bevilacqua, Lopes Jr et al., 2008; Battaglini, Bevilacqua, & de Souza, 2012), relações entre nomes e faces para idosos com demência (Ducatti & Schmidt, 2016) e nomeação de estímulos para crianças com diagnóstico de autismo (Greer & Du, 2015). Paralelamente aos resultados obtidos Capítulo XI | Responder por Exclusão nos procedimentos de ensino, questões de natureza básica surgiram e têm sido extensamente investigadas. Uma delas se refere à generalidade do fenômeno: todos os indivíduos apresentariam desempenho por exclusão? Inúmeras pesquisas, realizadas nos últimos 40 anos, têm confirmado a generalidade do fenômeno com pessoas de diferentes idades (crianças, jovens, adultos e idosos) e condições de desenvolvimento (desde indivíduos com desenvolvimento típico, até crianças com desenvolvimento atípico e idosos com demência). A confirmação da generalidade desse fenômeno em indivíduos com diferentes condições de desenvolvimento levou alguns pesquisadores a questionar se o desempenho por exclusão seria, como afirmavam alguns autores da Psicolinguística (e.g., Markman & Wachtel, 1988), um fenômeno diretamente relacionado à aquisição de repertórios verbais. Os dados obtidos com crianças pré-verbais e crianças que não tinham repertório verbal completamente desenvolvido foram as primeiras evidências de que a linguagem não parecia ser uma condição necessária para ocorrência de desempenhos por exclusão. O estudo desse fenômeno com não humanos poderia resolver essa questão uma vez que, se não humanos demonstrassem desempenho por exclusão, ficaria descartada a hipótese da linguagem como condição para ocorrência do fenômeno. Diferentes espécies de não humanos passaram por procedimentos que testavam o responder por exclusão a partir de diferentes metodologias. Primatas não humanos (Beran & Washburn, 2002; Campos, Brino, & Galvão, 2013; Tomonaga, 1993), cães (Kaminski, Call, & Fischer, 2004; Zaine, Domeniconi, & Costa, 2014), leões marinhos (Kastak & Schusterman, 2002), algumas espécies de pássaros (Clement & Zentall, 2003; Schloegl, Dierks, Gajdon, Huber, Kotrschal, & Bugnyar, 2009) e ratos (Souza & Schmidt, 2014) têm demonstrado desempenho por exclusão em diferentes tipos de tarefa envolvendo discriminações simples e condicionais. Souza e Schmidt (2016), por exemplo, submeteram ratos Wistar a uma tarefa de discriminação simples simultânea, na qual duas figuras geométricas (um triângulo e uma linha) eram apresentadas lado a lado em uma caixa de condicionamento operante, mas apenas a escolha de uma delas era seguida pela apresentação de água. Uma das figuras, portanto, tinha função discriminativa na tarefa (S+) e outra não (S-). Após os animais terem atingido o critério de 80% de respostas corretas em três sessões consecutivas, foram apresentadas sondas de exclusão, nas quais o S- era apresentado junto a uma figura geométrica completamente nova. Cinco dos seis ratos selecionaram consistentemente a figura nova (ao menos duas de três tentativas), rejeitando (excluindo) a figura treinada previamente como S-. Para garantir que os animais não selecionaram a figura desconhecida em função de uma eventual preferência por estímulos novos (viés de novidade, ou 178 Andréia Schmidt neofilia), foram apresentadas tentativas em que a figura treinada como S+ foi apresentada junto a outro estímulo completamente novo e todos os animais selecionaram o estímulo treinado como S+. O conjunto de resultados obtidos em diferentes pesquisas sobre exclusão com não humanos indica que esse desempenho não é um fenômeno típico de humanos e, portanto, parece ser um processo comum a diferentes espécies. Autores da Psicolinguística argumentam que os desempenhos demonstrados por não humanos nessas situações podem ser indícios de capacidades cognitivas que estão presentes também em humanos e que, coordenadas com outros processos, tornariam os humanos especialmente eficientes na aprendizagem da linguagem (Markman & Abelev, 2004). Essa discussão parece longe de ser resolvida e o estudo do desempenho por exclusão em não humanos é ainda um campo promissor para o entendimento das bases evolutivas do processo de aprendizagem de repertórios verbais. Outra questão que permanece em aberto diz respeito à aprendizagem de relações entre estímulos a partir do desempenho por exclusão. Apesar de todos os participantes de Dixon (1977) terem respondido por exclusão, nas sondas de discriminação apenas dois deles atingiram o critério estabelecido, um dos quais somente após quatro blocos de tentativas. Esses resultados foram replicados com outras crianças 179 e jovens, com deficiência (Costa, McIlvane, Wilkinson, & de Souza, 2001; McIlvane & Stoddard, 1981) e com desenvolvimento típico (Domeniconi, Costa, de Souza, & de Rose, 2007; Schmidt, Franco, Lotério, & Gomes, 2016; Wilkinson & McIlvane, 1997). Os resultados obtidos nessas pesquisas indicaram claramente que apenas um número reduzido de indivíduos aprende e mantém as relações estabelecidas a partir de uma ou de poucas tentativas de exclusão. Estudos realizados para estabelecer o número mínimo de tentativas de exclusão necessárias para a aprendizagem de relações entre estímulos (e.g., Costa, Grisante, Domeniconi, de Rose, & de Souza, 2013) também têm encontrado resultados muito variáveis, o que levou pesquisadores a investigar variáveis que podem facilitar ou dificultar a aprendizagem por exclusão, ou mesmo o desempenho inicial por exclusão (e.g., Antoniazzi, Domeniconi, & Schmidt, 2014; Costa, de Rose, & de Souza, 2010; Wilkinson & McIlvane, 1994). Os resultados desses estudos são ainda inconclusivos, uma vez que as variáveis manipuladas (e.g., conhecimento anterior dos estímulos não treinados e tipos de estímulos empregados) não produziram melhora na aprendizagem a partir de poucas exposições a tentativas de exclusão. São necessárias pesquisas adicionais que possam indicar variáveis que possam facilitar a aprendizagem de relações entre estímulos a partir de tentativas de exclusão. Capítulo XI | Responder por Exclusão CONSIDERAÇÕES FINAIS Na mesma época em que Dixon (1977) publicou sua pesquisa, pesquisadoras ligadas à Psicolinguística publicaram um estudo demonstrando o desempenho por exclusão na aprendizagem do nome de cores com crianças com desenvolvimento típico (Carey & Bartlett, 1978). Nesse estudo, Carey e Bartlett nomearam o desempenho por exclusão de “mapeamento rápido” (fast mapping), um processo de reconhecimento imediato e parcial do significado de novas palavras, que incluía (mas não se resumia ao) desempenho por exclusão. Muitos estudos têm sido realizados sob essa perspectiva teórica na tentativa de compreender a aprendizagem de vocabulário em crianças pequenas (e.g., Bion, Borovsky, & Fernald, 2013; Horst & Samuelson, 2008; Markman, 1989, entre inúmeros outros). Os resultados desses estudos e de outros realizados por analistas do comportamento têm mostrado que outras variáveis, além da presença de um estímulo conhecido junto ao estímulo desconhecido em um episódio de exclusão, são fatores que auxiliam o indivíduo a relacionar uma palavra desconhecida ao seu referente (e.g., pistas sociais, linguísticas ou perceptuais) e que essas diferentes pistas têm diferentes pesos no desempenho estudado, a depender da idade e da experiência do indivíduo com sua comunidade verbal (Levine, Strother-Garcia, Golinkoff, & Hirsh-Pasek, no prelo). A despeito dos resultados já encontrados por analistas do comportamento e por psicolinguistas, po- rém, muitas questões ainda permanecem em aberto. Pode-se destacar, por exemplo, que os estudos sobre como o desempenho por exclusão está envolvido na aprendizagem de repertórios verbais têm sido feitos predominantemente a partir de relações entre substantivos e estímulos concretos (figuras ou objetos tridimensionais). Há poucos estudos sobre o tema envolvendo propriedades de estímulos (e.g., adjetivos – Malerbo & Schmidt, no prelo; Ribeiro, 2013) ou ações (e.g., verbos – Costa et al., 2010; Fonseca, 2016). Para que seja possível afirmar que o desempenho por exclusão é um dos principais processos envolvidos na aprendizagem rápida de vocabulário, são necessários estudos que ampliem os dados obtidos com verbos e adjetivos, e que outras categorias gramaticais sejam também estudadas. Além disso, são necessários estudos que procurem simular situações mais naturais de interações verbais entre a criança e sua comunidade verbal para entender de que maneira o desempenho por exclusão ocorre nessas situações. Em situações de laboratório, utilizando-se palavras isoladas, o desempenho por exclusão tem se mostrado um fenômeno robusto e que auxilia fortemente as crianças a relacionar palavras aos seus estímulos correspondentes. Esses resultados são fundamentais para se compreender o papel do desempenho por exclusão na aprendizagem de repertórios verbais, mas é preciso ponderar que, nas interações 180 Andréia Schmidt naturais entre adultos e crianças, dificilmente a criança ouvirá palavras isoladas e terá diante de si um único objeto ou figura desconhecidos. Nestas interações palavras desconhecidas aparecem no meio de frases, músicas e histórias e o desempenho por exclusão é um, mas provavelmente não o único processo envolvido. Entender se, e como, o desempenho por exclusão ocorre nas interações verbais da criança com a sua comunidade é um desafio ainda longe de ser vencido. O enfrentamento desse desafio certamente passa pela união de esforços de pesquisadores de diferentes áreas em um empreendimento conjunto para compreender melhor as peculiaridades da aprendizagem do comportamento verbal. PARA SABER MAIS Costa, Domeniconi, & de Souza (2014). Revisão de um conjunto de pesquisas realizadas com crianças sobre o responder por exclusão, mostrando as regularidades encontradas nos dados e discutindo os métodos empregados. Costa, de Rose, & de Souza (2010). Estudo experimental com crianças com desenvolvimento típico que mostra que, em uma tarefa de exclusão, as crianças não ficam apenas sob controle da novidade dos estímulos modelo e comparação, mas também de outras dicas presentes no modelo, como o gerúndio, que indica que o comparação correto provavelmente é uma ação em cur181 so, e não uma figura estática, ainda que ambos sejam desconhecidos. Schloegl, Bugnyar, & Aust (2009). Revisão dos estudos sobre exclusão com não humanos, analisando não apenas os resultados obtidos, mas também os métodos empregados com cada espécie e qual o significado desses resultados para a compreensão da cognição animal. Zaine, Domeniconi, & de Rose (2016). Estudo experimental que investigou o desempenho por exclusão em quatro cães em tarefas de discriminação simples com estímulos tridimensionais. O estudo relata que todos os cães responderam por exclusão e que três deles também demonstraram aprendizagem das novas relações após exposição a sucessivas tentativas de exclusão. REFERÊNCIAS Almeida-Verdu, A. C. M., Huziwara, E. M., de Souza, D. G., de Rose, J. C. C.,Bevilacqua, M. C., Lopes Jr., J., et al. (2008). Relational learning in children with deafness and cochlear implants. Journal of the Experimental Analysis of Behavior, 89, 407-424. Antoniazzi, M., Domeniconi, C., & Schmidt, A. (2014). Efeito da pré-exposição ao objeto no desempenho por exclusão e na aprendizagem da relação nome-objeto. Acta Comportamentalia, 22, 23-36. Capítulo XI | Responder por Exclusão Baer, D. M., Wolf, M. M., & Risley, T. R. (1968). Some current dimensions of applied behavior analysis. Journal of Applied Behavior Analysis, 1, 91-97. Battaglini, M. P., Bevilacqua, M. C., & de Souza, D. G. (2012). Desempenho de seleção e nomeação de figuras em crianças com deficiência auditiva com implante coclear. Temas em Psicologia, 20, 189-202. Beran, M. J., & Washburn, D. A. (2002). Chimpanzee responding during matching to sample: Control by exclusion. Journal of the Experimental Analysis of Behavior, 78, 497–508. Bion, R., Borovsky, A., & Fernald, A. (2013). Fast mapping, slow learning: Disambiguation of novel word-object mappings in relation to vocabulary learning at 18, 24, and 30 months. Cognition, 126, 39-53. Bloom, L. (1970). Language development: Form and function in emerging grammars. Cambridge, Mass: MIT Press. Brown, R. (1973). A first language: The earlier stages. Harmondsworth: Penguin Books. Carey, S. & Bartlett, E. (1978). Acquiring a single new word. Papers and Reports on Child Language Development, 15, 17–29. Campos, R. S., Brino, A. L. F., & Galvão, O. F. (2013). Expansão de repertório de relações arbitrárias em Sapajus sp. via exclusão. Te- mas em Psicologia, 21, 31-48. Clement, T. S., & Zentall, T. R. (2003). Choice based on exclusion in pigeons. Psychonomic Bulletin & Review, 10, 959-964. Costa, A. R. A., de Rose, J. C., & de Souza, D. G. (2010). Interferência de variáveis de contexto em sondas de exclusão com substantivos e verbos novos. Acta Comportamentalia, 18, 35-54. Costa, A. R. A., Domeniconi, C., & de Souza, D. G. (2014). Controle de estímulos, mapeamento simbólico emergente e aquisição de vocabulário. In J. C. de Rose, M. S. C. A. Gil, & D. G. de Souza (Orgs.), Comportamento simbólico: Bases conceituais e empíricas (pp. 269-308). Marília / São Paulo: Oficina Universitária / Cultura Acadêmica. Costa, A. R. A., Grisante, P. C., Domeniconi, C., de Rose, J. C. C. & de Souza, D. G. (2013). Nomeação de estímulos novos a partir da seleção por exclusão. Paidéia, 23, 217-224. Costa, A. R. A., McIlvane, J. W., Wilkinson, K. M., & de Souza, D. G. (2001). Emergent word-object mapping by children: Further studies using the blank comparison technique. The Psychological Record, 51, 343-355. de Souza, D. G., & de Rose, J. C. C. (2006). Desenvolvendo programas individualizados para ensino de leitura e escrita. Acta Comportamentalia, 14, 77-98. 182 Andréia Schmidt Domeniconi, C., Costa, A. R. A., de Souza, D. G. & de Rose, J. C. (2007). Responder por exclusão em crianças de 2 a 3 anos em uma situação de brincadeira. Psicologia: Reflexão e Crítica, 20, 342-350. Ducatti, M., & Schmidt, A. (2016). Learning conditional relations in elderly people with and without neurocognitive disorders. Psychology & Neuroscience, 9, 240-254. Ferrari, C., de Rose, J. C. & McIlvane, W. J. (2008). A comparison of exclusion and trial-and-error procedures: Primary and secondary effects. Experimental Analysis of Human Behavior Bulletin, 29, 9-16. Ferrari, C., de Rose, J. C. & McIlvane, W. J. (1993). Exclusion vs. selection training of auditory-visual conditional relations. Journal of Experimental Child Psychology, 56, 49-63. Fonseca, J. (2016). Responder por exclusão em crianças com atraso de linguagem. (Dissertação de Mestrado). Universidade de São Paulo. Greer, R. D., & Du, L. (2015). Experience and the onset of the capability to learn names incidentally by exclusion. The Psychological Record, 65, 355-373. Horst, J. S. & Samuelson, L. K. (2008). Fast mapping but poor retention in 24-month-old infants. Infancy, 13, 128-157. 183 Kaminski, J., Call, J. & Fischer, J. (2004). Word learning in a domestic dog: Evidence for “fast mapping”. Science, 304, 1682-1683. Kastak, C. R., & Schusterman, R. J. (2002). Sea lions and equivalence: Expanding classes by exclusion. Journal of the Experimental Analysis of Behavior, 78, 449-465. Levine, D., Strother-Garcia, K., Golinkoff, R. M., & Hirsh-Pasek, K. (in press). Language development in the first year of life: What deaf children might be missing before cochlear implantation. Otology & Neurotology. Markman, E. M. (1989). Categorization and naming in children: Problems of induction. Boston: MIT Press. Markman, E. M., & Abelev, M. (2004). Word learning in dogs? Trends in Cognitive Sciences, 8, 479-481. Markman, E. M., & Wachtel, G. F. (1988). Children’s use of mutual exclusivity to constrain the meaning of words. Cognitive Psychology, 20, 121–157. McIlvane, W. J., Kledaras, J. B., Lowry, M. W., & Stoddard, L. T. (1992). Studies of exclusion in individuals with severe mental retardation. Research in Developmental Disabilities, 13, 509-532. Mcllvane. W. J., Munson, L., & Stoddard, L. T. (1988). Some observations on control Capítulo XI | Responder por Exclusão by spoken words in children’s conditional discrimination and matching by exclusion. Journal of Experimental Child Psychology, 45, 472-495. McIlvane, W.J., & Stoddard, L. T. (1981). Acquisition of matching to sample performances in severe retardation: Learning by exclusion. Journal of Mental Deficiency Research, 25, 33-48. Menyuk, P. (1969). Sentences children use. Cambridge, Mass.: MIT Press. Nelson, K. (2007). Young Minds in Social Worlds: Experience, Meaning and Memory. London: Harvard University Press. Ribeiro, T. A. (2013). Responder por exclusão na aprendizagem de relações simbólicas envolvendo adjetivos. (Dissertação de Mestrado). Universidade Federal de São Carlos. Schloegl, C., Bugnyar, T., & Aust, U. (2009). Exclusion performances in non-human animals: From pigeons to chimpanzees and back again. In S. Watanabe, A. P. Blaisdell, L. Huber, & A. Young (Eds.), Rational animals, irrational humans (pp. 217-234). Tóquio: Keio University Press. Schloegl, C., Dierks, A., Gajdon, G. K., Huber, L., Kotrschal, K., & Bugnyar, T. (2009). What you see is what you get? Exclusion performances in ravens and keas. PLoS One, 4, e6368. Schmidt, A., Franco, M. G. O., Lotério, L. S., & Gomes, G. F. (2016). Learning name-object relations after a single exclusion trial in children in 18- to 48-months-old children. The Psychological Record, 66, 53-63. Schmidt, A., & Malerbo, A. C. D. B. (no prelo). Aprendizagem de relações nome-textura por meio de dois procedimentos de ensino por exclusão. Acta Comportamentalia. Souza, M. F., & Schmidt, A. (2014). Responding by exclusion in Wistar rats in a simultaneous visual discrimination task. Journal of the Experimental Analysis of Behavior, 102, 346-352. Terrace, H. S. (1963). Discrimination learning with and without errors. Journal of the Experimental Analysis of Behavior, 6, 1–27. Tomonaga, M. (1993). Tests for control by exclusion and negative stimulus relations of arbitrary matching-to-sample in a ‘‘symmetry-emergent’’ chimpanzee. Journal of the Experimental Analysis of Behavior, 59, 215–229. Vincent-Smith, L., Bricker, D. D., & Bricker, W. A. (1974). Acquisition of receptive vocabulary in the toddlerage child. Child Development, 45, 189-193. Wilkinson, K. M., de Souza, D. G., & McIlvane, W. J. (2000). Origens da exclusão. Temas em Psicologia, 8, 195-203. 184 Andréia Schmidt Wilkinson, K. M., & McIlvane, W. J. (1994). Stimulus organization and learning by exclusion: A preliminary experimental analysis. Experimental Analysis of Human Behavior Bulletin, 12, 21-25. Wilkinson, K. M., & McIlvane, W. J. (1997). Blank comparison analysis of emergent symbolic mapping by young children. Journal of Experimental Child Psychology, 67, 115-130. Zaine, I., Domeniconi, C., & Costa, A. R. A. (2014). Exclusion performance in visual simple discrimination in dogs (Canis familiaris). Psychology & Neuroscience, 7, 199206. Zaine, I., Domeniconi, C., & de Rose, J. C. (2016). Exclusion performance and learning by exclusion in dogs. Journal of the Experimental Analysis of Behavior, 105, 362-374. 185 João Henrique de Almeida, William Ferreira Perez Paus e pedras podem machucar, mas palavras... também! - Teoria das molduras relacionais João Henrique de Almeida Universidade Federal de São Carlos William Ferreira Perez Paradigma Centro de Ciências do Comportamento Dougher, M. J., Hamilton, D. A., Fink, B. C. & Harrington, J. (2007) Transformation of the discriminative and eliciting functions of generalized relational stimuli. Journal of the Experimental Analysis of Behavior, 88, 179-197. “Abracadabra! ” Palavra mágica prototípica usada por mágicos. 186 Capítulo XII | Teoria das Molduras Relacionais INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO É amplamente disseminado na literatura de fantasia medieval e em jogos que palavras, frases curtas e textos faziam parte de rituais mágicos. Nesse contexto, poderosos magos armazenavam seu poder por escrito em tomos e pergaminhos. Uma vez que os sons exatos fossem proferidos, coisas incríveis poderiam acontecer (Gygax & Arneson, 1974). A palavra “Abracadabra” na epígrafe deste texto deriva de uma frase em Aramaico que significa “Eu crio quando eu falo” (Lawrence, 1988). Obviamente, não iremos explorar, neste capítulo, os efeitos das palavras a partir da perspectiva da literatura fantástica, sequer existem evidências científicas de que as essas podem alterar os eventos do mundo físico. No entanto, partindo de uma perspectiva analítico-comportamental, baseada em evidências empíricas, falaremos do “poder” das palavras de funcionar como estímulos e, então, agir sobre as pessoas. Vamos explorar, neste capítulo, a “magia” que permite que palavras e frases (símbolos) afetem o comportamento, ou seja, afetem o que as pessoas fazem, pensam e sentem. Para compreender esse efeito das palavras, recorremos a uma explicação operante da linguagem e cognição humana proposta pela Teoria das Molduras Relacionais (Relational Frame Theory ou RFT; de Rose & Rabelo, 2012; Hayes, Barnes-Holmes & Ro- che 2001; Perez, Nico, Kovac Fidalgo, & Leonardi, 2013; Zettle, Hayes, Barnes-Holmes & Biglan, 2016). Essa perspectiva analítico-comportamental foi grandemente influenciada pela explicação funcional da linguagem presente no Comportamento Verbal (Skinner,1957) e pelo estudo de relações derivadas entre estímulos, iniciado pelas pesquisas sobre Equivalência de Estímulos (Sidman & Tailby, 1982; Sidman, 1994, 2000). Nessa explicação da RFT, um tipo específico de comportamento operante pode alterar o modo como os estímulos adquirem função a partir de relações arbitrárias derivadas entre estímulos. Elas são chamadas de arbitrárias, pois não dependem de características físicas dos estímulos relacionados (são baseadas em convenções); e são chamadas de derivadas pois, a partir de treinos diretos, inúmeras respostas não ensinadas diretamente podem ser observadas. Isso tudo é possível porque, desde muito pequenos, somos expostos a tarefas em que relacionamos estímulos, e essas relações podem ser de diversos tipos, como: de similaridade (“esse tênis é parecido com o meu”), de igualdade (“nossas camisetas são iguais”), de oposição (“doce é oposto a salgado”), de comparação (“meu carrinho é maior que o seu”), entre outras (Tornëke, 2010). Por questões práticas, vamos tomar o exemplo da comparação. Imagine uma criança aprendendo a comparar objetos. Naturalmente, ao ser exposta às contingências da comunidade verbal que modelam os repertórios linguísticos, a criança se depa187 João Henrique de Almeida, William Ferreira Perez ra com as palavras “maior” e “menor”. Inicialmente, tais palavras são utilizadas para controlar respostas baseadas em propriedades físicas dos estímulos. Diante de perguntas e solicitações do tipo “Qual é o maior brinquedo de todos esses aqui?”, “Qual é a menor bola que você tem?”, “Pegue a boneca menorzinha!”, “Pegue uma peça maior do quebra-cabeça”, as crianças aprendem a comparar objetos sob controle do seu tamanho, volume ou peso. Uma questão curiosa, no entanto, é que as dicas contextuais “maior” e “menor” também são frequentemente utilizadas para ensinar comparações que não se baseiam nas dimensões físicas dos estímulos, mas em convenções da comunidade verbal. Por exemplo, quando for um pouco mais velha, a criança aprenderá que a moeda de 50 centavos tem valor maior, ainda que seja menor do que a moeda de 25 centavos. Na escola, nas aulas de matemática, aprenderá que 0,000000001 é menor do que 1, embora o primeiro número contenha muito mais algarismos. Assim, a criança aprende a responder adequadamente também a relações arbitrárias de comparação, ou seja, relações que não têm por base a comparação de dimensões físicas, mas dependem das contingências arranjadas para que dados eventos do mundo sejam tratados comparativamente. Em contextos como esse, dizemos que as respostas relacionais podem ser arbitrariamente aplicadas a quaisquer eventos do mundo. Em outras palavras, as dicas contextuais “maior” e “menor” são 188 aplicadas para estabelecer relações de comparação convencionadas pela comunidade verbal. Esse tipo de aprendizagem descrita acima é uma parte do que chamamos de Treino de Múltiplos Exemplares, e acontece comumente de forma não planejada na interação da criança e seus pais ou cuidadores. Além de aprender relações especificamente ensinadas, depois de inúmeras exposições, a criança logo aprenderá a responder também de acordo com novas relações que, embora não diretamente explicitadas, derivam das inicialmente ensinadas. Tomando o exemplo da comparação, ela aprenderá que as respostas relacionais também são bidirecionais, ou seja, que existe uma implicação mútua entre os estímulos relacionados: logo, se um estímulo A é maior que B, B será necessariamente menor que A. Ela aprenderá, também, a combinar relações (implicação combinatória) de tal modo que, após aprender que A é maior que B e B maior que C, poderá responder a novas relações, tais como: A é maior que C e C é menor que A. Por fim, aprenderá que estímulos relacionados arbitrariamente podem ter suas funções transformadas com base no tipo de relação implicada. Assim, se A é “bom”, logo B e C podem ser ainda melhores! O fenômeno da Transformação de Função1 pode ser definido como a propagação de função de um estímulo para demais os estímulos relacionados. As funções transformadas podem ser de natureza muito Capítulo XII | Teoria das Molduras Relacionais diversa, como funções discriminativas, reforçadoras, punitivas, eliciadoras, entre outras. Tal fenômeno já foi exaustivamente comprovado por experimentos, principalmente em relações de similaridade (e.g., Bortoloti & de Rose, 2009; de Almeida & de Rose, 2015; Dougher, Augustson, Markham, Greenway & Wulfert, 1994; Ferro & Valero, 2008; Perez, Fidalgo, Kovac & Nico, 2015; Vervoort, Vervliet, Benett & Baeyens, 2014). O mais importante a ser destacado a respeito desse fenômeno é seu efeito em nosso comportamento: nós respondemos aos estímulos que adquiriram “indiretamente” uma determinada função de maneira semelhante a como responderíamos ao estímulo que “possuía aquela função” originalmente, como veremos a seguir. Essa maneira de responder aos estímulos na ausência de um treino direto modifica completamente o nosso modo de interagir com o mundo. Uma vez que nos tornamos verbais, o significado ou a função de todos os estímulos ambientais poderá também depender de relações arbitrárias estabelecidas com diversos outros estímulos, além da aprendizagem direta. Essa possibilidade de aprender a partir de relações arbitrárias e responder a relações derivadas é importantíssima para a explicação de diversos comPara a Teoria das Molduras Relacionais, a Transferência de Funções é um tipo de Transformação de Função. Os dois termos são utilizados na literatura da área: Transferência quando diz respeito à propagação de função considerando relações derivadas de similaridade; Transformação quando diz respeito às demais relações, como, por exemplo, oposição, comparação, diferença, etc (para um aprofundamento nessa discussão, ver Dymond & Rehfeldt, 2000) ou ao efeito mais geral de responder de uma forma não treinada diretamente a estímulos relacionados. 1 portamentos humanos complexos. A seguir, descreveremos um estudo clássico da Teoria das Molduras Relacionais, de Dougher, Hamilton, Fink e Harrington (2007), publicado no Journal of Experimental Analysis of Behavior. Esse estudo investigou como o estabelecimento de relações arbitrárias de comparação (e.g., A< B < C) pode modular a frequência de respostas e a magnitude dos respondentes eliciados na presença de dados estímulos. DESCRIÇÃO DOS EXPERIMENTOS Experimento 1- Objetivo e Método A pergunta que precisava de resposta era a seguinte: respostas relacionais de comparação podem transformar (ampliar ou reduzir) as funções evocativas e eliciadoras de um estímulo? Por exemplo: imagine que os estímulos A, B e C são figuras abstratas com o mesmo tamanho; em termos de propriedades físicas, um estímulo não é comparativamente maior do que o outro. No entanto, suponha que sejam estabelecidas relações arbitrárias de comparação entre eles, convencionadas pelo experimentador: A é menor que o B, e B é menor que C (A<B<C). Dito isso, se o participante for ensinado a emitir uma frequência de respostas estável diante de B, diante de A observaremos uma frequência de respostas menor e diante de C uma frequência maior do que em B? Ou, ainda, se B for pareado a um estímulo incondicionado aversivo (e.g., choque) e pas189 João Henrique de Almeida, William Ferreira Perez sar a eliciar uma resposta eletrodermal (característica da reação de medo), será que A irá eliciar uma resposta eletrodermal menor do que B? E, mais importante, será que C irá eliciar uma resposta eletrodermal ainda maior do que o estímulo pareado diretamente com o choque (B)? O objetivo do primeiro experimento foi responder exatamente a essas questões. Vinte um participantes universitários (12 para o grupo experimental e 9 para o controle) foram recrutados e receberiam créditos em disciplinas por sua cooperação. Para garantir que os participantes apresentariam índices eletrodermais mensuráveis pelo galvanômetro, foi realizado um teste de “explosão do balão”.2 Considerando os 12 sujeitos do grupo experimental, três deles não obtiveram o critério exigido no teste e foram eliminados do estudo. Consequentemente, nove participantes seguiram para a próxima etapa, de seleção da intensidade do choque. Essa tarefa serviu para calibrar a intensidade individual do choque elétrico. Esse estímulo precisava ser de intensidade forte e desconfortável, mas O galvanômetro é um instrumento que serve para medir a diferença de potencial elétrico entre dois pontos. Não são todos os participantes expostos à avaliação do índice eletrodermal que mostram um responder suficiente para realização de experimentos. Isso se dá devido a diversas características individuais da pele dos participantes. Dessa forma, é comum nesse tipo de experimento, inicialmente, expor o sujeito a uma avaliação para certificar que será possível coletar os dados com aquele participante. Um dos testes realizados, o de explosão do balão (Levis & Smith,1987) é um dos mais comumente realizados, e consiste em apenas verificar o efeito no índice eletrodermal diante da explosão de um balão, que estava sendo enchido pelo participante de olhos vendados. Se a alteração possuir uma magnitude mínima, no caso do experimento aqui descrito de 2 micromhos, ele estaria apto a participar. Do contrário, o participante seria descartado do experimento. 2 190 não deveria ser doloroso. O procedimento foi o seguinte: o gerador de choque possuía 10 níveis e, inicialmente, era colocado no nível 7 para a administração de um choque breve (50ms). Foi pedido aos participantes que classificassem esse choque, dando uma nota de 1-10 (sendo 8 o nível desconfortável, mas não doloroso). Se os participantes considerassem o choque de qualquer nível diferente de oito, a intensidade era aumentada ou diminuída e outro choque apresentado. Quando a intensidade fosse considerada como oito, um segundo choque idêntico era apresentado para ver se essa avaliação permaneceria estável. Quando o participante considerasse dois choques idênticos consecutivos avaliados como oito a ‘calibragem da intensidade’ esta etapa era finalizada. Dos nove participantes do grupo experimental, um deles foi eliminado, por avaliar todos os choques do gerador com notas menores que oito. Assim, oito participantes seguiram para a próxima fase. Sete outros participantes constituíram um Grupo Controle. Esses realizaram todas as etapas do experimento, exceto o treino de múltiplos exemplares. Treino de Múltiplos Exemplares Nesse treino, um de três estímulos sem sentido (A, B ou C) eram apresentados no topo da tela juntamente de três estímulos de comparação idênticos, que só variavam em seu tamanho (e.g., uma bola pequena, uma média e uma grande), apresentados na parte inferior. Diante do estímulo A, a esco- Capítulo XII | Teoria das Molduras Relacionais lha correta seria o estímulo de comparação de menor dimensão; diante de B, a escolha correta seria o estímulo de comparação com dimensão média; e diante de C a escolha correta seria o de maior dimensão - como pode ser visto na Figura 1. Antes de iniciar a tarefa, o participante foi informado que deveria selecionar um dos estímulos na parte inferior da tela e receberia feedback sinalizando se sua escolha havia sido correta ou incorreta. Durante o treino, foram usados múltiplos conjuntos de estímulos de mesma forma, porém com tamanhos relativos diferentes .(e.g., triangulo pequeno, médio e grande; quadrado pequeno, médio e grande etc.). Depois de aprender a responder corretamente para 12 conjuntos de estímulos distintos, três novos conjuntos foram apresentados em tentativas de teste, ou seja, sem feedback para as respostas dos participantes. O objetivo dessa fase era verificar que os estímulos A, B e C continuariam evocar respostas de escolha do comparação menor, mediano e maior, respectivamente, mesmo quando novos estímulos eram apresentados e o feedback era retirado. Caso os participantes apresentassem uma alta porcentagem de acertos no teste ( > 96%), prosseguiam para outra etapa do estudo. Figura 1. Figura baseada na Figura 1 de Dougher et. al. (2007), exemplificando um dos conjuntos de estímulos de comparação presentes no treino de múltiplos exemplares. No topo encontram-se os estímulos A, B e C que sinalizariam a escolha dos comparações com dimensões, menor maior e média respectivamente. As posições dos comparações variavam a cada tentativa. Treino e teste de transformação evocativa da resposta de pressão à barra de espaços do computador Nesta etapa, os participantes foram instruídos a pressionar a barra de espaço do computador em uma frequência estável na presença do estímulo B (médio). Eles também foram informados que deveriam pressionar a barra de espaços durante todo o tempo em que esse estímulo fosse apresentado na tela do computador e que não haveria nenhum feedback para essa resposta. Por fim, foram avisados que, uma vez que a frequência estivesse estável, outros estímulos seriam apresentados na tela do computador; sua tarefa era pressionar a barra na frequência que achassem apropriada para cada estímulo apresentado na tela. Após essas instruções, por modelação, o experimentador pressionava a barra uma vez por segundo durante 30 segundos, com o estímulo B presente na tela do computador. Seguindo essa tentativa, o participante foi solicitado responder da mesma maneira que o experimentador. As tentativas foram repetidas até que o participante respondesse três vezes seguidas mantendo uma frequência de respostas constantes (dentro de mais ou menos 10% das respostas na tentativa anterior). Mantida a estabilidade da taxa de resposta, os participantes foram expostos aos testes, em que o estímulo B foi apresentado quatro vezes e sucedido pelos estímulos A, B (novamente) e C. Essa fase tinha por objetivo verificar se participantes modificaram a taxa de resposta de forma consistente com o treino relacional realizado anterior191 João Henrique de Almeida, William Ferreira Perez mente. Será que a taxa de pressão à barra em A e em C foi, respectivamente, menor e maior se comparada a taxa apresentada na presença do estímulo B? Vamos descrever a última etapa do procedimento e descobriremos os resultados a seguir. Pareamento e teste transformação de função eliciadora da resposta galvânica da pele Na última etapa, ocorreu o pareamento do choque elétrico com o estímulo B e o teste de transformação de função eliciadora. Nessa etapa, os participantes foram instruídos que estímulos seriam apresentados na tela do computador e eles receberiam choques. Eles não precisariam fazer nada, exceto prestar a atenção nos estímulos apresentados. Após as instruções, o participante permanecia sentado por cinco minutos e seu índice eletrodermal era registrado por esse período como linha de base. O estímulo B deveria adquirir a função de um estímulo aversivo condicionado, graças ao seu pareamento consistente com um choque elétrico. Nesse pareamento, o estímulo B foi exibido por 30 segundos na tela do computador e quando removido, foi apresentado o choque elétrico. Esse condicionamento foi realizado por seis vezes. Essas tentativas de condicionamento tinham intervalo entre tentativas de 90s, para que os índices de condutância da pele pudessem ser estabilizados. Após o intervalo da última tentativa de condicionamento do 192 estímulo B, de forma idêntica, foi apresentado no centro da tela o estímulo A; após a sua apresentação, um choque elétrico com metade da voltagem de B foi apresentado. Após novo intervalo de 90s, o estímulo C foi apresentado, mas sem nenhum choque. A ordem foi sempre a mesma descrita aqui, B por seis vezes, seguido de A, B e C. Assim como na pressão à barra, será que os índices eletrodermais foram modulados de forma coerente com o treino relacional? Ou seja, será que a ativação da condutância elétrica da pele foi maior para C do que para B, mesmo na ausência de qualquer pareamento direto de C com o choque? Resultados e Discussão Todos os oito participantes do grupo experimental aprenderam a tarefa relacional, ou seja, responderam consistentemente aos estímulos apresentados inicialmente no topo da tela (A = escolha o menor; B = escolha o médio; C = escolha o maior). A primeira medida de interesse foi a frequência de pressão à barra no teste que apresentava os estímulos A, B e C. Para todos os oito participantes do grupo experimental, a taxa de resposta diante de A e C refletiu os efeitos do treino relacional, ou seja, a taxa apresentada em A e em C foi menor e maior do que em B. Para dois participantes, a diferença foi pequena, mas ocorreu de forma coerente com o treino realizado. Porém, para os seis outros participantes, a diferença foi bem grande, em alguns casos até dobrando a frequência de respostas ao se comparar A Capítulo XII | Teoria das Molduras Relacionais com B e B com C. Um resultado totalmente diferente foi observado nos dados dos sete participantes do grupo controle. Esses participantes realizaram todas as etapas do experimento, exceto o treino de múltiplos exemplares, ou seja, não aprenderam A < B < C. Apenas um dos sete apresentou dados coerentes com o treino relacional, com uma diferença mínima entre o número de respostas emitidas. A segunda medida de interesse foi o resultado dos testes de índices eletrodermais diante de A e C. Os índices foram obtidos subtraindo o menor índice eletrodermal observado durante os 30 segundos que precederam a apresentação do estímulo do maior índice durante os 30 segundos de apresentação do estímulo. Não custa lembrar que os choques elétricos apresentados com a retirada dos estímulos B e A ocorreram sempre depois desta medida ser efetuada. Os oito participantes do grupo controle responderam de forma coerente com o treino relacional realizado. Os autores relatam que, diante da apresentação do estímulo C, muitos deles ficavam assustados, e um deles chegou a tentar remover os eletrodos de choque do seu braço. Além disso, vários participantes desse grupo relataram que acreditavam que receberiam um choque mais forte, após a apresentação do estímulo C. Esse tipo de resultado não foi observado para nenhum dos participantes do Grupo Controle. Para cinco dos sete participantes, a resposta de maior magnitude foi diante do estímulo B, diretamente pareado com o choque. Apenas um participante do grupo controle mostrou respostas maiores em A do que em B e para B em comparação a C. Os resultados tanto da resposta de pressão à barra como dos índices eletrodermais foram realmente surpreendentes nesse estudo. Podemos destacar apenas duas limitações nesse procedimento: a quantidade de tentativas nos testes de transformação de funções e a ordem dos testes. Apenas uma tentativa foi realizada para cada teste e sempre na mesma ordem, tanto no teste da resposta de pressão à barra (após a estabilidade, uma tentativa de teste para cada estímulo, A, B e C), como também na medida do índice eletrodermal (primeiro, uma para A e, em seguida, uma para C). Em relação as pressões à barra, os autores mencionam que poderiam ter realizado um número maior de tentativas de teste, contudo isso não ocorreu. Em relação ao índice eletrodermal, múltiplas apresentações poderiam interferir nos respondentes observados, alterando a condutância da pele dos participantes; portanto, os autores decidiram por uma única tentativa de teste. Em relação à ordem dos testes, os experimentadores já estavam usando o limite eticamente permitido para o choque. Não apresentar o choque seguido do estímulo durante o teste poderia gerar um processo de extinção respondente. Como teriam que apresentar um choque, e não poderiam dar um choque mais forte que o que seguia B (incômodo, mas não doloroso), as únicas opções seriam 193 João Henrique de Almeida, William Ferreira Perez apresentar um choque menor para A ou um choque de intensidade igual a B para C. A segunda opção poderia afetar as respostas que seriam apresentadas em seguida diante do estímulo A. Por essa razão, C foi escolhido para ser testado sempre por último. Nesse primeiro experimento, os estímulos A, B e C exerceram o papel de dicas contextuais relacionais (nesse caso, de comparação) sinalizando a seleção do estímulos de comparação, menores, médios e maiores. Contudo, o treino relacional foi baseado em propriedades físicas dos estímulos, já que os estímulos de comparação tinham dimensões diferentes. Para verificar se os mesmos estímulos A, B e C possibilitariam o estabelecimento de relações arbitrárias de comparação entre estímulos, o segundo experimento foi realizado empregando estímulos de comparação com dimensões idênticas. arbitrárias de comparação entre círculos coloridos de mesmo tamanho. Esse treino tinha por objetivo estabelecer um “ranking de tamanho” entre quatro círculos coloridos. Para isso, o estímulo A (menor) era apresentado no topo da tela junto de dois circulos apresentados na parte inferior. Como A representava a dica “escolha o menor”, as respostas corretas seriam as seguintes: o círculo verde seria menor que o roxo, o roxo menor que o azul e o azul menor que o vermelho (verde < roxo < azul < vermelho). Uma representação dessas relações pode ser observada na Figura 2. Dessa forma, se estivessem presentes na tela verde e roxo (sempre na presença do estímulo A, no topo), a escolha do círculo verde seria seguida da apresentação da palavra “correto”, enquanto a escolha do roxo seguida da palavra “incorreto”. Experimento 2- Objetivo e Método Treino de Múltiplos Exemplares No Experimento 2, seis participantes universitários foram expostos a três etapas. Na primeira delas, foi realizado um treino de múltiplos exemplares exatamente igual ao Experimento 1. Treino relacional com círculos coloridos Nesta etapa, os estímulos A, B e C foram então utilizados para estabelecer relações 194 Figura 2. Figura baseada na Figura 4 de Dougher et al (2007), exemplificando tentativas presentes no treino relacional do Experimento 2. Na parte superior, tentativas de treino. Na parte inferior, tentativas de teste. As tentativas foram apresentadas aleatoriamente. O treino foi realizado até que os participantes respondessem de forma correta a doze tentativas consecutivas. Depois Capítulo XII | Teoria das Molduras Relacionais de atingir esse critério de aprendizagem, os participantes foram expostos a um teste. Durante esse teste, um dos três estímulos A, B ou C seria apresentado no topo da tela, com três dos quatro círculos na parte inferior. Nenhuma consequência foi apresentada nesse teste. Os participantes deveriam responder escolhendo o círculo relativamente “maior”, “menor” ou “médio”, a partir do ranking ensinado no treino anterior (verde < roxo < azul < vermelho). O teste apresentava 18 tentativas, e caso o participante respondesse a todas corretamente, seguiria para a terceira etapa. Teste de transformação de função evocativa da resposta de pressão à barra A última etapa do Experimento 2, foi praticamente igual ao treino e teste de pressão a barra realizado no Experimento 1, com uma pequena mudança: o estímulo que foi utilizado para o treino de pressão à barra, não foi o B, e sim o círculo roxo. Além disso, os círculos verde e azul, foram utilizados no teste, em vez dos estímulos A e B. Resultados e Discussão Os seis participantes foram capazes de realizar o treino de múltiplos exemplares e também o treino relacional com os círculos coloridos. Esse tipo de procedimento é um análogo de como aprendemos a relacionar eventos do ambiente de modo arbitrário, baseado em convenções. O treino de múl- tiplos exemplares ensinou aos participantes as seguintes dicas: “diante de A, escolha o menor”, “diante de B, escolha o médio”, “diante de C, escolha o maior”. A partir do ensino dessas dicas contextuais que passaram a evocar respostas de comparação baseadas em propriedades físicas, foi possível ensinar relações de comparação não mais baseadas em dimensões físicas (o tamanho dos estímulos), e sim relações em uma convenção determinada pela programação do experimentador. Por isso, dizemos que a relação entre os círculos (que tinham o mesmo tamanho) eram relações arbitrárias de comparação, e que as dicas contextuais foram arbitrariamente aplicadas à situação com os círculos para estabelecer o ranking entre eles. A pergunta, agora um pouco mais complexa, envolve saber se relações arbitrárias de comparação “verde < roxo < azul < vermelho” também determinariam diferentes taxas de pressão à barra de espaços na presença dos círculos. No teste de pressão à barra, cinco dos seis participantes responderam de forma coerente com o treino relacional arbitrário estabelecido entre os círculos, ou seja, frequências menores foram observadas diante do verde e frequências maiores diante do azul, se comparadas à frequência observada na presença do estímulo roxo. Apesar dos resultados consistentes, os autores afirmam que existe uma chance (muito pequena) de as funções transformadas nos experimentos 1 e 2 não serem baseadas em relações derivadas entre os modelos, mas em as195 João Henrique de Almeida, William Ferreira Perez sociações com as características não arbitrárias dos estímulos de comparação. Para investigar a ocorrência dessa possibilidade, novos estímulos foram adicionados investigando relações de comparações entre os modelos. Experimento 3 - Objetivo e Método Treino de Múltiplos Exemplares O Experimento 3 foi conduzido com sete participantes e consistiu apenas de duas fases. A fase inicial foi exatamente igual ao treino de múltiplos exemplares dos Experimentos 1 e 2. Teste arbitrário de relações de comparação Nesta etapa, os participantes foram expostos a tentativas que apresentavam, na parte de cima da tela do computador, um número; na parte central um símbolo de “menor que”, “maior que” ou “igual”; e na parte inferior três outros números. Uma representação dessas tentativas pode ser observada no painel da esquerda da Figura 3. Os participantes foram instruídos que deveriam “ler” a tela, como se colocassem o número na parte superior à esquerda do sinal e um dos números na parte inferior à direita do sinal. Além disso, foram informados que deveriam escolher o número na parte de baixo que tornasse essa “equação” verdadeira. O critério de encerramento dessa fase foi que os participantes apresentassem seis tentativas corretas consecutivamente. 196 Encerrada essa etapa, sem qualquer instrução, novas tentativas foram adicionadas. Tais tentativas já correspondiam ao teste dessa segunda fase. Essas tentativas novas, tinham o mesmo formato da primeira fase com os números, mas esses números foram substituídos pelas dicas contextuais do treino de múltiplos exemplares (A, B e C), o que pode ser observado no segundo painel da Figura 4. Esse procedimento foi executado por 18 tentativas. Figura 3. Figura baseada na Figura 7 de Dougher et al. (2007), exemplificando as tentativas de testes do Experimento 3. Após essas tentativas, novos estímulos foram introduzidos, inicialmente como comparações e, mais tarde, como modelos. Nesse teste, os pesquisadores queriam verificar se os participantes iriam inferir esse ranking de estímulos abstratos baseados nas relações aprendidas anteriormente. Exemplos dessas tentativas finais estão apresentados no terceiro e quarto painéis da Figura 4. As novas figuras adicionadas iriam acrescentar novos elementos ao ranking original, aumentando o número de estímulos relacionados (A-- < A- < A < B < C < C+ < C++). A cada estímulo novo apresentado nesse teste, apenas uma resposta poderia ser considerada correta. Esse novo ranking foi apresentado em cinco tipos de tentativas diferentes: (1) A<B<C; (2) A- < A < B; (3) A-- < A- < A; (4) B< C <C +; (5) C< C+ < C++. Cada tipo de tentativa foi apresentado seis vezes sem nenhum feedback. Capítulo XII | Teoria das Molduras Relacionais Resultados e Discussão Todos os sete participantes realizaram o treino de múltiplos exemplares. Eles necessitaram do número mínimo de estímulos para aprenderem a função das três dicas contextuais A, B e C. Na Fase 2 desse procedimento, dois dos sete participantes responderam corretamente a todas as tentativas do teste. Outros três participantes responderam corretamente a todas as tentativas de quatro dos cinco tipos de testes e apresentaram índices superiores a 80% no restante. Apenas um participante apresentou resultados menos consistentes nesses testes, acertando em média 72% das tentativas e com três dos cinco tipos de tentativas com critérios abaixo de 80%. O resultado robusto e coerente com as tentativas testadas na etapa final desse procedimento mostra que os procedimentos de treino relacional estabeleceram relações derivadas entre os estímulos presentes no treino. Esse resultado permite, segundo os autores, observar que, além de transformar as funções como notado nos experimentos descritos anteriormente, o procedimento realizado no Experimento 3 permitiu o estabelecimento de uma rede relacional arbitrária entre novos estímulos. Esses novos estímulos nunca foram pareados ou apresentados juntamente com os estímulos que possuíam diferenças em sua dimensão. Todas essas relações adicionais foram estabelecidas arbitrariamente. DESDOBRAMENTOS Demonstrações robustas dos efeitos da aprendizagem de relações arbitrárias entre estímulos têm proporcionado à Teoria das Molduras Relacionais, uma explicação funcional de diversos comportamentos humanos complexos (Zettle et al, 2016; Stewart, 2015; Dymond & Roche, 2013; Barnes-Holmes, Barnes-Holmes, McHugh & Hayes, 2004). Essas explicações têm proporcionado a inserção, o estudo e a intervenção da Análise do Comportamento em diversas áreas relevantes da Psicologia. Uma dessas áreas é a aplicação clínica. A transformação de funções na perspectiva da RFT tem proporcionado avanços importantes em estudos sobre Ansiedade (Luciano et al, 2013; Luciano et al 2014), Delírios Persecutórios (Stewart, Hughes & Stewart, 2017), Ideação Suicida (Hussey, Barnes-Holmes & Booth, 2016), Anedonia Social (Vilardaga, Estévez, Levin & Hayes, 2012), Desamparo Aprendido (Hooper & McHugh, 2013), entre outros. Além disso, a RFT tem sido aplicada na explicação funcional da psicopatologia (Dymond, Roche, & Bennett, 2013; Wilson, Hayes, & Zettle, 2001), bem como no desenvolvimento de propostas de modelos de intervenções clínicas (Törneke, 2010; Törneke, Luciano, Barnes-Holmes, & Bond, 2016; Villatte, Villatte, & Hayes, 2016). Nesse último caso, a RFT tem sido uma ferramenta importante no entendimento dos efeitos comportamentais de diferentes técnicas utilizadas na ACT (Acceptance and Commitment Therapy, Hayes, Strosahl, 197 João Henrique de Almeida, William Ferreira Perez Wilson, 1999), tanto em investigações interpretativas (e.g., Foody, Barnes-Holmes, Barnes-Holmes, Törneke, Luciano, Stewart, & McEnteggart, 2014) quanto experimentais (e.g., Foody, Barnes-Holmes, Barnes-Holmes, Rai, & Luciano, 2015; Foody, Barnes-Holmes, Barnes-Holmes, & Luciano, 2013; Luciano et al., 2014; Gil-Luciano, Ruiz, Valdivia-Salas, & Suárez-Falcón, 2016). A RFT também tem sido utilizada para abordar problemas relacionados ao desenvolvimento. Uma dessas temáticas é a Inteligência, em que métodos baseados em responder relacional têm sido repetidamente comprovados como efetivos para melhora do desempenho em testes de QI (Cassidy, Roche, Colbert, Stewart & Grey, 2016; Cassidy, Roche & Hayes, 2011; O´Toole, Barnes-Holmes, Murphy, O´Connor & Barnes Holmes, 2009). Outro tema que, até recentemente, era investigado apenas por psicólogos cognitivos e recebeu uma interpretação comportamental via RFT, é a Tomada de Perspectiva. Os comportamentos relacionados à tomada de perspectiva podem ser entendidos resumidamente como a capacidade de assumir a perspectiva de outro, permitindo inferir suas crenças, emoções e desejos (Carpendale & Lewis, 2006). Esse repertório é de suma importância para nossa vida social, e déficits nesses comportamentos têm sido correlacionados com problemas de relacionamento interpessoal e até mesmo com autismo (e.g., Ranick, Persicke, Tarbox, Kornack, 2013; Rehfeldt, Dillen, Ziomek, & Kowalchuk, 2007) , ane198 donia (Villatte, Monestès, McHugh, Freixa i Baqué, & Loas, 2008) e esquizofrenia (Villatte, Monestès, McHugh, Freixa i Baqué, & Loas, 2010) Diversos outros trabalhos foram desenvolvidos para avaliar e intervir na Tomada de Perspectiva sob a ótica da RFT (e.g., Lovett & Rehfeldt, 2014; McHugh, Barnes-Holmes, & Barnes-Holmes, 2004; Rehfeldt, Dillen, Ziomek, & Kowalchuck, 2007). Outra área muito relevante em que o estudo desses fenômenos tem contribuído grandemente é a das questões sociais, amplamente conhecidas por psicólogos cognitivos como atitudes implícitas, permitindo o estudo de preconceitos, estigmatização social e preferências. A transformação de funções permite uma explicação comportamental precisa desses fenômenos sociais e diversos estudos permitiram a investigação e o desenvolvimento de instrumentos para mensuração de sua força (Hughes, Barnes-Holmes & Vahey, 2012; Barnes-Holmes, Murphy & Barnes-Holmes, 2010; Barnes-Holmes, Barnes-Holmes, Stewart & Boles, 2010; Mizael, de Almeida, Silveira & de Rose, 2016). Esses e muitos outros temas relevantes têm sido investigados recentemente (e.g. analogias, regras e instruções, geratividade e desenvolvimento linguagem) a partir da perspectiva da RFT (ver, Stewart, 2015). Portanto, podemos entender que essa nova interpretação do comportamento verbal tem permitido uma explicação integrada de vários comportamentos humanos comple- Capítulo XII | Teoria das Molduras Relacionais xos, baseada na aprendizagem relacional derivada. Essa abordagem funcional da linguagem tem permitido a investigação analítico comportamental de vários temas que por muito tempo foram acessíveis apenas aos leitores interessados em outras abordagens psicológicas. CONSIDERAÇÕES FINAIS O experimento de Dougher e colaboradores (2007) pode ser considerado um marco importante para o estudo da aprendizagem relacional derivada. Esse trabalho, junto com inúmeros outros da mesma época (para uma revisão, ver Dymond, May, Munnelly, & Hoon, 2010), permitiu que analistas do comportamento se aventurassem a investigar e explicar fenômenos relacionados à linguagem e à cognição antes circunscritos somente a outras abordagens da psicologia. Isso ocorreu, especialmente, pela compreensão dos processos comportamentais que permitem a aquisição indireta de funções de estímulo via participação em redes de relações arbitrárias. Tal noção possibilitou que um olhar analítico-comportamental fosse legítimo também em situações nas quais uma história de aprendizado direta, via pareamento ou contingências de reforço, parecia ausente, sendo as causas atribuídas à mecanismos mentais (cognitivos). Uma estrapolação dos dados obtidos no estudo de Dougher et al. (2007) permite, por exemplo, compreender como são construídas as fobias, como aprendemos a temer (ainda mais) eventos com os quais nunca tivemos uma experiência aversiva direta e também como eventos aversivos podem ser categorizados por comparação, tal como observado nos procedimentos de exposição realizados em terapia. Os estudos da transformação de função ainda não são tão numerosos, e, assim, algumas relações receberam pouca atenção dos pesquisadores, como é o caso de relações espaciais ou relações hierárquicas derivadas. Novos trabalhos têm surgido com uma velocidade muito grande, e o entendimento da cognição humana a partir desses parâmetros comportamentais tem capacitado a Análise do Comportamento com um instrumental novo e abrangente. O avanço do estudo da aprendizagem derivada, isto é, de como esse tipo de responder relacional derivado amplia as possibilidades de aprendizagem humanas, tem se apresentado recentemente como uma linha de pesquisa muito promissora. Para alguns pesquisadores, o desenvolvimento dessa explicação da linguagem e cognição humana pode representar uma maior integração das vertentes básicas e aplicadas da Análise do Comportamento, como também maior inserção e impacto na Psicologia em geral (Hayes & Bernes, 2004). Conhecer o “poder” que a linguagem pode exercer – ampliando enormemente nossa interação com o ambiente - é essencial para o entendimento completo das contingên199 João Henrique de Almeida, William Ferreira Perez cias a que nós seres humanos somos expostos. Pode parecer “magia” algo extremamente não científico. Porém, a proposta da RFT, apesar de nova, possui evidências robustas e mostra como a ciência pode auxiliar no entendimento deste fenômeno, para alguns inacessível ou “fantástico”. Como toda perspectiva recente, sabemos que ainda há muito a ser feito, então, mãos à obra! PARA SABER MAIS Perez, de Almeida, & de Rose (2015). Nesse estudo, os pesquisadores ensinaram redes relacionais de similaridade e oposição e observaram resultados consistentes de transformação de funções emocionais avaliadas por instrumentos de avaliação implícita e explícita. Perez, Nico, Leonardi, & Kovac (2015). Nesse estudo, os pesquisadores mostraram a transferência de função de dica contextual relacional em um procedimento com diversas variações, demonstrando a flexibilidade do controle contextual. Gil, Luciano, Ruiz, & Valdivia-Salas (2012). Esse estudo é uma das proposições iniciais para o estabelecimento de relações hierárquicas entre estímulos. Além disso, ele investiga os efeitos da transformação de funções em diferentes níveis hierárquicos. Hughes, Barnes-Holmes, De Houwer, de Almeida, & Stewart (submetido). Esse con200 junto de cinco experimentos em que são avaliadas relações de comparação, similaridade e oposição entre diferentes conjuntos de estímulos (pokémons, produtos fictícios e prêmios potenciais) Os efeitos de transformação de função foram evidentes para um conjunto diferente de medidas comportamentais, explícitas e implícitas. Perez, Nico, Kovac, Fidalgo, & Leonardi, (2013) e de Rose, & Rabelo (2012). Textos introdutórios sobre a Teoria das Molduras Relacionais em língua portuguesa. REFERÊNCIAS Barnes-Holmes, Y., McHugh, L., & Barnes-Holmes, D. (2004). Perspective-taking and Theory of Mind: A relational frame account. The Behavior Analyst Today, 5, 15–25. Barnes-Holmes, D., Barnes-Holmes, Y., Stewart, I. & Boles, S. (2010) A sketch of the implicit relational assessment procedure (IRAP) and the elaboration and coherence (REC) model. The Psychological Record, 60, 527-542 Barnes-Holmes, D., Murph, A., & Barnes-Holmes, Y. (2010) The implicit relational assessment procedure: exploring the impact of private versus public contexts and the response latency criterion on pro-white and anti-black stereotyping among Irish individuals. The Psychological Record, 60, 57-66. Capítulo XII | Teoria das Molduras Relacionais Bortoloti, R., & de Rose, J. C. (2009) Assessment of the relatedness of equivalent stimuli through a semntic differential. The Psychological Record, 59, 563-590. Cassidy, S., Roche, B., & Hayes, S. C. (2011) A relational frame training intervention to raise intelligence quotients: a pilot study. The Psychological Record, 61, 173-198. Carpendale, J. I., & Lewis, C. (2006). How children develop social understanding. Malden: Blackwell Publishing. de Almeida, J. H. & de Rose, J. C. (2015) Changing the meaningfulness of abstract stimuli by the reorganization of equivalence classes: effects of delayed matching. The Psichological Record, 65, 451-462. de Rose, J. C. & Rabelo, L. Z. (2012). Teoria das molduras relacionais e possíveis aplicações à educação. Revista de Deficiência Intelectual, 3, 10-15. Dougher, M. J., Augustson, E. M., Markham, M. R., Greenway, D. E., & Wulfert E. (1994) The transfer of respondent eliciting and extinction functions through stimulus equivalence classes. Journal of the Experimental Analysis of Behavior, 62, 331-351. Dougher, M. J., Hamilton, D. A., Fink, B. C., & Harrington, J. (2007). Transformation of the discriminative and eliciting functions of generalized relational stimuli. Journal of the Experimental Analysis of Behavior, 88, 179-197. Dymond, S. & Roche, B. (2013) Advances in Relational Frame Theory:Research & Application. New Harbringer: Context Press. Ferro, R., & Valero, L. (2008) Transfer of function through equivalence relations using pictures with strong emotional content. European Journal of Behavior Analysis, 9, 13-27. Gil, E., Luciano, C., Ruiz, F. J., & Valdivia-Salas, V. (2012). A Preliminary Demonstration of Transformation of Functions through Hierarchical Relations. International Journal of Psychology and Psychological Therapy, 12, 1, 1-19. Gygax, G. & Arneson, D. (1974). Dungeons & Dragons. Lake Geneva: TSR. Inc. Hayes, S. C. Barnes-Holmes, D., & Roche, B. (2001). Relational Frame Theory: A Post-Skinnerian account of human language and cognition. New York: Plenum Press. Hayes, S. C. & Berens, N. M. (2004). Why Relational Frame Theory alters the relationship between basic and applied behavioral psychology. International Journal of Psychology and Psychological Therapy, 4, 341-353. Hooper, N., & McHugh, L. (2013). Cognitive Defusion Versus Thought Distraction in the Mitigation of Learned Helplessness. The 201 João Henrique de Almeida, William Ferreira Perez Psychological Record, 63, 209–218. Hughes, S., Barnes-Holmes, D., & Vahey, N. (2012) Holding on to our fuctional roots when exploring new intelectual islands: a Voyage through the implicit cognition research. Journal of Contextual Behavioral Science, 1, 17-38 Hughes S., Barnes-Holmes, D., De Houwer, J., de Almeida, J. H. & Stewart, I. (submetido) On the symbolic generalization of likes and dislikes. Journal of Experimental Psychology. Hussey, I. Barnes-Holmes, D. & Booth, R. (2016) Individuals with current suicidal ideation demonstrate implicit “fearlessness of death”. Journal of Behavior Therapy and Experimental Psychiatry, 51, 1-9. Lawrence, K. (1988). The book of words: Talking spiritual life, living spiritual talk. Woodstok: Jewish Lights Publishing. Luciano, C. Valdivia-Salas, S., Ruiz, F. J., Rodríguez-Valverde, M., Barnes-Holmes, D. Dougher, M. J., Cabello, F., Sánchez, V., Barnes-Holmes, Y. & Guitierrez, O. (2013). Extinction of aversive eliciting functions as an analog exposure to conditioned fear: Does it alter avoidance responding? Journal of Contextual Behavioral Science, 2, 120-134. Luciano, C. Valdivia-Salas, Ruiz, F. J. Rodríguez-Valverde, M. Barnes-Holmes, D., Dougher, M. J., López-López, J., Barnes-Holmes, 202 Y., Gutierrez-Martínez, O. (2014) Effects of an acceptance/defusion intervention on experimentally induced generalized avoidance: A laboratory demonstration. Journal of the Experimental Analysis of Behavior, 101, 94-111. Levis, D. J., & Smith, J. E. (1987). Getting individual differences in autonomic conditioning to work for you instead of against you: Determining the dominant psychological stress channel on the basis of a biological stress test. Psychophysiology, 24, 346–352. Lovett, S., & Rehfeldt, R. A. (2014). An evaluation of multiple exemplar instruction to teach perspective-taking skills to adolescents with Asperger Syndrome. Behavioral Development Bulletin, 19, 22-36. McHugh, L., Barnes-Holmes, Y., & Barnes-Holmes, D. (2004). Perspective-taking as relational responding: a developmental profile. The Psychological Record, 54, 110–135. Mizael, T. M., de Almeida, J. H., Silveira, C. C. & de Rose, J. C. (2016) Changing racial bias by transfer of functions in equivalence classes. The Psichological Record, 66, 451462. O´Toole, C., Barnes-Holmes, D., Murphy, C., O´Connor, J., & Barnes-Holmes, Y. (2009) Relational flexibility and Human Intelligence: extending the remit of Skinner´s verbal behaviour. International Journal of Psychology and Psychological Therapy, 9, 1-17. Capítulo XII | Teoria das Molduras Relacionais Perez, W. F., de Almeida, J. H., & de Rose, J. C. (2015). Transformation of meaning through relations of sameness and opposition. The Psychological Record, 65, 679-689. Perez, W. F., Fidalgo, A. P., Kovac, R. & Nico, Y. C. (2015) The transfer of Cfunc contextual control through equivalence relations. Journal of the Experimental Analysis of Behavior, 103, 511-523. Rehfeldt, R. A., Dillen, J. E., Ziomek, M. M., & Kowalchuk, R. K. (2007). Assessing relational learning deficits in perspective-taking in children with high-functioning Autism Spectrum Disorder. The Psychological Record, 57, 23–47. Cassidy, S., Roche, B., Colbert, D., Stewart, I., & Grey, I. M. (2016) A relational frame skills training intervention to increase general intelligence and scholastic aptitude. Learning and Individual Differences, 47, 222-235. Sidman, M. (1994). Equivalence relations and behavior. A research story. Boston: Authors Cooperative. Sidman, M. (2000). Equivalence relations and the reinforcement contingency. Journal of the Experimental Analysis of Behavior, 74, 127-146. Sidman, M., & Tailby, W. (1982). Conditional discrimination vs. matching to sample: an expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22. Skinner, B. F. (1978). O comportamento verbal. Traduzido por M.P. Villalobos. São Paulo: Cultrix. (trabalho original publicado em 1957). Stewart, C., Hughes, S., & Stewart, I. (2017) A contextual behavioral approach to (persecutory) delusions. Journal of Contextual Behavioral Science, 5, 235-246. Stewart, I. (2015) The fruits of a functional approach for psychological science. Internatinal Journal of Psychology, 51, 15-27. Törneke, N. (2010). Learning RFT: An introduction to Relational Frame Theory and Its Clinical Application. Oakland: Context Press. Vervoort, E. Vervliet, B., Bennett, M., & Baeyens. (2014). Generalization of Human Fear acquisition and extinction within a Novel Arbitrary Stimulus Category. Plos One, 9, 1-10. Vilardaga, R., Estévez, A., Levin, M. E., & Hayes, S. C. (2012) Deictic relational responding, empathy, and experiential avoidance as predictors of social anhedonia: further contributions from relational frame theory. The Psychological Record, 62, 409-432. Villatte, M., Villate, J. L., & Hayes, S. C. (2016) Mastering the clinical conversation: 203 João Henrique de Almeida, William Ferreira Perez Language as intervention. New York: The Guilford Press. Zettle, R. D., Hayes, S. C., Barnes-Holmes, D. & Biglan, A. (2016) The Wiley Handbook of Contextual Behavioral Science. John Wiley & Sons. 204 Carlos Eduardo Costa, Carlos Renato Xavier Cançado Quando o mundo interage com o que é dito sobre o mundo: o comportamento governado por regras Carlos Eduardo Costa Universidade Estadual de Londrina Carlos Renato Xavier Cançado Universidade de Brasília Galizio, M. (1979). Contingency-shaped and rule-governed behavior: Instructional control of human loss avoidance. Journal of Experimental Analysis of Behavior, 31, 53-70. “A coisa mais certa de todas as coisas, não vale um caminho sob o sol” Caetano Veloso 205 Capítulo XIII | Comportamento Governado por Regras INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A evolução do comportamento verbal permitiu outras formas de controle do comportamento de um indivíduo pelo comportamento de outros indivíduos, sobretudo quando é impossível ou improvável o contato físico entre eles (Skinner, 1957/1978, 1986). Grande parte do comportamento humano ocorre sob o controle de regras1, que são descrições das contingências de reforçamento e punição em vigor em determinado ambiente (Skinner, 1969). Skinner (e.g., 1969, 1974) distinguiu o comportamento modelado pelas contingências do comportamento governado por regras. O comportamento modelado pelas contingências é função das modificações que produz no ambiente, isto é, de suas consequências. O comportamento governado por regras, no entanto, ocorre primariamente sob o controle de antecedentes verbais, isto é, das descrições das contingências de reforçamento e punição em vigor, feitas pelo indivíduo que se comporta, ou por outro indivíduo. Preparar uma refeição, por exemplo, pode ocorrer primariamente sob controle das contingências em vigor e da consequência de ter o alimento pronto. No entanto, o comportamento de indivíduos que não possuem uma história de aprendizagem relacionada a preparar refeições pode ocorrer No presente capítulo os termos “regra” e “instrução” serão utilizados como sinônimos. 1 sob o controle estrito de regras: O indivíduo pode seguir as instruções descritas em um livro de receitas ou mesmo o que diz outro indivíduo sobre preparar a refeição. Regras em forma de instruções, conselhos, recomendações, sugestões, avisos, e ordens, são utilizadas para ensinar e prescrever comportamentos nas mais diversas situações, como cozinhar, operar um equipamento eletrônico, resolver um problema em determinada área do conhecimento, comportar-se em determinados contextos sociais ou dirigir um veículo. Não aprendemos a dirigir um carro simplesmente sentando atrás do volante, ligando o carro e acelerando. Primeiramente, somos instruídos a como proceder. Da mesma forma, aprendemos a cozinhar ou a tocar instrumentos musicais com um forte auxílio do controle por regras. O controle por regras pode facilitar a seleção de novos comportamentos porque esses comportamentos novos podem ocorrer sem que o indivíduo tenha que passar por uma longa história de exposição às contingências (Catania, 1999; Cerutti, 1989; Matos, 2001; Skinner, 1969, 1974). Imagine o quão difícil seria (para você e para os outros!) aprender a dirigir um carro sem nenhuma instrução e apenas por exposição direta às contingências! Apesar disso, quando o comportamento está sob o controle estrito das regras, diz-se que o comportamento é “insensível” às suas consequências (cf. Madden, Chase, & Joyce, 1998). Isto é, o comportamento pode não se alterar quando há alterações nas contingências de 206 Carlos Eduardo Costa, Carlos Renato Xavier Cançado reforçamento e punição (Catania, 1999; Galizio, 1979; Lowe, 1979). Diversos estudos experimentais sobre o comportamento governado por regras foram conduzidos após a publicação de análises teóricas feitas por Skinner (1957/1978) no livro “O Comportamento Verbal” e pelo autor (1969) no capítulo “Uma análise operante da resolução de problemas” (ver também Skinner, 1974; para revisões da literatura ver Albuquerque & Paracampo, 2010; e Teixeira Júnior, 2009). Dentre esses estudos, destaca-se uma série de quatro experimentos conduzida por Galizio (1979). Baseado principalmente em considerações teóricas feitas por Skinner (1974), Galizio chegou à seguinte proposição: Se as teorias comportamentais sobre o porquê as pessoas seguem instruções estiverem corretas, então “o seguimento de instruções deve ser influenciado pelo reforço [de seguir instruções], ser sujeito à extinção e deve ficar sob controle discriminativo” (p. 54). Se isso ocorresse, poderíamos dizer que seguir regras é comportamento operante. Os resultados obtidos por Galizio (1979) lançaram luz sobre algumas variáveis determinantes do comportamento governado por regras. Além disso, seu procedimento estabeleceu as bases para análises experimentais do comportamento governado por regras conduzidas desde então (e.g., Albuquerque, de Souza, Matos, & Paracampo, 2003; Athayde Neto, Costa, & Banaco, 2015; Baumann, Abreu-Rodrigues, & Souza, 207 2009; Bentall, Lowe, & Beasty, 1985; Calixto, Ponce, & Costa, 2014; Catania, Matthews, & Shimoff, 1982; Hayes, Brownstein, Haas, & Greenway, 1986; Lowe, Beasty, & Bentall, 1983; Matthews, Catania, & Shimoff, 1985; Okouchi, 1999; Rosenfarb, Newland, Brannon, & Howey, 1992; Shimoff, Catania, & Matthews, 1981). Vejamos, então, como foram os experimentos conduzidos por Galizio. DESCRIÇÃO DOS EXPERIMENTOS Experimento 1 - Objetivo e Método O objetivo desse experimento foi analisar o efeito de instruções acuradas sobre o comportamento. Instruções acuradas descrevem adequadamente as contingências em vigor (i.e., são verdadeiras) e segui-las garante a obtenção dos reforços programados. O experimento foi conduzido com seis universitários e o equipamento consistiu em um painel contendo uma série de lâmpadas e uma alavanca (ver Baum, 2006, p. 169 para uma representação gráfica do equipamento ). No início das sessões os participantes eram instruídos que tinham U$ 2,00 de crédito e deviam evitar a perda de dinheiro. A resposta sob análise era girar a alavanca 45o para a direita e essa resposta adiava a perda de dinheiro (i.e., U$ 0,05) que era sinalizada por uma luz vermelha e um som. Este é um procedimento de reforçamento negativo descrito como “esquiva”, em que o comportamento adia ou evita a Capítulo XIII | Comportamento Governado por Regras apresentação de determinada consequência (e.g., perdas de pontos ou dinheiro, administração de choque elétrico; Sidman, 1953). Os participantes foram expostos a um programa de reforço múltiplo com quatro componentes. Cada componente era sinalizado por uma de quatro luzes de cor âmbar e ocorria aleatoriamente uma vez por sessão. A duração de cada componente era de 12,5 min.. Acima de cada luz âmbar, podiam ser colocados rótulos que descreviam as contingências de esquiva em vigor (i.e., as regras). Em um componente, perdas de dinheiro não ocorriam. Nos outros três componentes, as perdas de dinheiro ocorriam a cada 10 s na ausência de respostas. Além disso, nesses três componentes, as respostas adiavam as perdas de dinheiro por 10 s, em um componente, por 30 s, em outro, e por 60 s, no outro componente. No início do experimento, os participantes foram instruídos que cada vez que a luz vermelha acendesse, cinco centavos seriam subtraídos dos dois dólares que eles teriam de crédito no início da sessão. Os participantes foram informados que girar a alavanca para a direita adiaria a apresentação da luz vermelha e as perdas de dinheiro, mas não sobre o tempo que cada resposta adiaria a perda de dinheiro em cada componente do múltiplo. Em uma condição, os participantes foram expostos ao programa múltiplo de reforço na ausência de instruções (Condi- ção Sem Instrução, SI). Em outra condição, instruções acuradas sobre as contingências em vigor em cada componente do múltiplo foram dadas aos participantes (Condição com Instrução, I): Rótulos que descreviam o tempo que cada resposta adiava a perda de pontos (i.e., “10 s”, “30 s” e “60 s”; o componente sem perdas era indicado pelo rótulo “NO LOSS”) foram adicionados acima de cada luz âmbar no painel. Após exposição de cada participante às duas condições, os rótulos eram retirados e a posição das luzes âmbar, que indicavam qual componente do múltiplo estava em vigor, eram alteradas, e replicações das condições SI e I foram conduzidas. Quatro participantes iniciaram o experimento pela Condição SI (i.e., três foram expostos à sequência de condições SI-I-SI e outro à sequência SI-I) e dois pela Condição I (i.e., um participante foi exposto à sequência de condições I-SI-I-SI e outro apenas à sequência I-SI). Resultados e Discussão Em procedimentos de esquiva, observa-se uma relação inversa entre a taxa de respostas e a duração do intervalo em que respostas adiam a apresentação de consequências (Sidman, 1953). Assim, quanto maior esse intervalo, menor a taxa de respostas. Dos quatro participantes que iniciaram o experimento pela Condição SI, uma relação inversa entre a taxa de respostas e a duração do intervalo em cada componente do múltiplo foi observada apenas para um participante. Para os outros três 208 Carlos Eduardo Costa, Carlos Renato Xavier Cançado participantes, a taxa de respostas foi alta o suficiente para evitar praticamente todas as perdas de dinheiro, mas foi indiferenciada entre os componentes do múltiplo. Na Condição I, independentemente de ter sido a primeira ou a segunda condição a qual o participante foi exposto, todos os participantes responderam de acordo com o intervalo descrito nos rótulos e observou-se uma relação inversa entre a taxa de respostas e o intervalo em que respostas adiavam a perda de dinheiro em cada componente. Os resutados desse experimento demonstraram o controle exercido pelas instruções sobre o comportamento humano mantido sob contingências de esquiva. A exposição às contingências na ausência de instruções acuradas gerou um responder discriminado para apenas um dos participantes. Quando a Condição SI foi replicada, três de cinco participantes responderam de acordo com os intervalos de adiamento das perdas de dinheiro em vigor. Portanto, houve um efeito da história de seguir instruções (Condição I) sobre a exposição subsequente às mesmas contingências sem instruções (segunda exposição à Condição SI). Os resultados para esses três participantes sugerem que a exposição às instruções facilitaram a ocorrência do comportamento quando o ambiente se alterou e as instruções estavam ausentes. Para dois participantes, no entanto, a exposição à instruções na Condição I não facilitou a ocorrência do comportamento sob o controle de cada componente do múltiplo durante a 209 replicação da Condição SI. Experimento 2 - Objetivo e Método No Experimento 1 as instruções dadas aos participantes foram sempre acuradas. No Experimento 2, Galizio (1979) estudou o efeito de instruções inacuradas sobre o comportamento. Instruções incacuradas não descrevem adequadamente as contingências em vigor (i.e., são falsas) e segui-las não garante a obetenção dos reforços programados. Participaram quatro estudantes que haviam participado do Experimento 1, e o equipamento foi o mesmo utilizado naquele experimento. Para esses participantes, o Experimento 1 terminou com a Condição SI. Por isso, a condição inicial do Experimento 2 foi a Condição I (como descrita anteriormente) por duas ou três sessões. Os participantes foram então expostos à Condição Sem Contato (SC), na qual perdas de pontos não ocorriam em nenhum componente do múltiplo mas os estímulos discriminativos (luzes âmbar) e as instruções (rótulos acima das luzes) foram mantidos. As instruções eram inacuradas nessa condição porque não havia perda de dinheiro em nenhum componente do múltiplo (i.e., as respostas não adiavam perdas de dinheiro). Além disso, os participantes que seguissem essas instruções não entrariam em contato com essa mudança nas contingências pois um comportamento eficaz em um procedimento de esquiva implica que a consequência programada não ocorra. Capítulo XIII | Comportamento Governado por Regras Depois, os participantes foram expostos à Condição Contato (C). Nessa condição, as luzes e as instruções permaneciam inalterados em relação à condição SC, mas, em cada componente, perdas de pontos ocorriam a cada 10 s na ausência de respostas e as respostas adiavam a perda de dinheiro por 10 s. Seguir as instruções, que eram também inacuradas nessa condição (e.g., uma instrução de que respostas adiavam a perda de dinheiro por 30 s enquanto, na verdade, adiavam por apenas 10 s), levaria a perdas de dinheiro, isto é, a um contato com a discrepância entre as instruções as contingência em cada componente do múltiplo. Posteriormente, a condição SC foi replicada para cada participante. Resultados e Discussão Na Condição I, uma relação inversa entre taxa de respostas e o intervalo em que respostas adiavam perdas foi observada para cada participante, assim como no Experimento 1. Na Condição SC, as taxas de respostas dos quatro participantes foram idênticas às da Condição I, indicando que o comportamento estava sob o controle das instruções inacuradas e não das contingências (lembre-se que os participantes não precisavam responder para evitar perdas de dinheiro, que não ocorriam nessa condição). Esse é um aspecto de controle importante em qualquer análise experimental do comportamento governado por regras: entre condições, Galizio (1979) manteve as instruções e alterou as contingências; a manutenção do comportamento entre condições indica o controle por regras; a mudança no comportamento indica o controle pelas novas contingências (alternativamente, pode-se manter as mesmas contingências entre condições, e alterar as instruções em vigor em cada condição, e.g., Albuquerque, dos Reis, & Paracampo, 2008). Na Condição C, na qual respostas adiavam a perda de pontos por 10 s em todos os componentes do múltiplo, os participantes deixaram de seguir as instruções inacuradas. A taxa de respostas foi equivalente entre os componentes e próxima àquela do intervalo de 10 s de perda de pontos da Condição SC anterior. Portanto, o comportamento de cada participante ficou sob o controle das contingências em vigor em cada componente e não das instruções inacuradas. Esses resultados demonstraram que quando seguir uma regra produz consequências que não condizem com a descrição presente na regra (e.g., a regra diz que respostas adiam perdas por 30 s, mas perdas ocorrem a cada 10 s) é provável que o comportamento fique sob o controle da contingência em vigor e a regra seja abandonada. Durante a replicação da Condição SC, nenhum participante voltou a seguir as instruções inacuradas. Isto é, em cada componente, as taxas de respostas de três participantes diminuíram para próximo de zero (o esperado quando não há perdas de dinheiro), enquanto as taxas de respostas 210 Carlos Eduardo Costa, Carlos Renato Xavier Cançado de um participante permaneceram altas e indiferenciadas entre os componentes, um desempenho semelhante ao observado para esse participante na Condição C. Os resultados desse experimento demonstraram que não é suficiente que exista uma discrepância entre regras e contingências (Condição SC) para que o controle do comportamento por regras seja alterado e o comportamento fique sob o controle das contingências em vigor. É necessário que o comportamento entre em contato com a discrepância (como na Condição C) entre o que a regra descreve e as contingências em vigor. O experimento foi conduzido com dois participantes, e o equipamento foi o mesmo dos experimentos anteriores, exceto que duas luzes novas (roxa e laranja) foram adicionadas. Na presença das luzes laranja e roxa, respectivamente, as instruções eram sempre acuradas e inacuradas (as luzes laranja e roxa seriam, respectivamente, equivalentes às pessoas A e B do exemplo anterior). Assim como no Experimento 2, os participantes foram expostos à Condição SC, à Condição C e novamente à Condição SC, programadas como naquele experimento. Resultados e Discussão Experimento 3 - Objetivo e Método O controle de estímulos é uma propriedade do comportamento operante. Isto é, a probabilidade de um comportamento ocorrer é influenciada pela presença de determinados estímulos em função da correlação desses estímulos com as consequências do comportamento. Imagine que você receba instruções de diferentes pessoas, A e B. Após uma história de seguir instruções acuradas de A, e instruções inacuradas de B, a probabilidade de que você siga instruções seria determinada pela pessoa (A ou B) que dá as instruções? Isto é, a probabilidade de seguir instruções seria alta na presença de A e baixa na presença de B? No Experimento 3, o objetivo de Galizio (1979) foi estudar o controle de estímulos do comportamento de seguir instruções. 211 Durante a primeira exposição à Condição SC, os participantes emitiram taxas de respostas correspondentes aos rótulos (i.e., seguiram as instruções) tanto na presença dos estímulos correlacionados às instruções acuradas (luz laranja) quanto inacuradas (luz roxa). Esses resultados demonstram que, nessa condição, não houve controle pelos estímulos correlacionados às instruções acuradas e inacuradas. Na Condição C, na presença da luz laranja a taxa de respostas em cada componente foi diferenciada como as instruções acuradas descreviam. Na presença da luz roxa, correlacionada às instruções inacuradas, as taxas de respostas foram altas e semelhantes em cada componente do múltiplo. Portanto, quando a luz laranja estava em vigor, os participantes seguiram as instruções (acuradas); quando a luz roxa estava em vigor, Capítulo XIII | Comportamento Governado por Regras os participantes não seguiram as instruções (inacuradas) e o comportamento em cada componente do múltiplo estava sob o controle das contingências. Na segunda exposição à Condição SC, na presença da luz laranja os participantes responderam de acordo com as instruções. Na presença da luz roxa, no entanto, os participantes pararam de responder em cada componente do múltiplo, indicando um controle do comportamento pelas contingências em vigor (i.e., não havia perdas em nenhum componente do múltiplo). Portanto, os participantes continuaram a seguir instruções na presença do estímulo que havia sido correlacionado com instruções acuradas mas – e esse é o ponto central – deixaram de seguir instruções na presença do estímulo que havia sido correlacionado com instruções inacuradas. Os resultados do Experimento 3 demonstraram o controle de estímulos do comportamento de seguir instruções. É mais provável que você faça o que alguém diz quando esse alguém, no passado, foi uma fonte de instruções acuradas (i.e., foi uma fonte “confiável”) e é mais provável que você deixe de seguir as instruções de alguém que, no passado, foi uma fonte de instruções inacuradas. Seguir regras é influenciado por suas consequências e por estímulos antecedentes na presença dos quais seguir a regra produziu (ou não) as consequências descritas na regra. Experimento 4 - Objetivo e Método O objetivo do Experimento 4 foi verificar se estímulos correlacionados à instruções acuradas e inacuradas poderiam funcionar como reforçadores condicionais para uma resposta de observação (i.e., uma resposta estabelecida e mantida pela produção desses estímulos; Wyckoff Jr., 1952; 1969). O experimento foi conduzido com três estudantes e o equipamento foi o mesmo utilizado nos experimentos anteriores. Assim como nos Experimentos 1 à 3, girar a alavanca 45o para a direita adiava perdas de dinheiro. Nesse experimento, girar a alavanca 45o para a esquerda era a resposta de observação. Os participantes foram expostos a um programa múltiplo com quatro componentes assim como no Experimento 1. No entanto, a luz âmbar correlacionada a cada componente do múltiplo só acendia após a emissão de uma resposta de observação. Na primeira condição, respostas de observação acendiam as luzes âmbar por 10 , 20 , ou 30 s. Cada uma dessas durações de apresentação das luzes esteve em vigor, para cada participante, até que a taxa de respostas de observação fosse estável por duas sessões consecutivas (o esperado é que houvesse uma relação inversa entre a taxa de respostas de observação e a duração de apresentação dos estímulos; assim taxas mais altas de respostas de observação seriam esperadas quando as luzes âmbar ficassem acesas por 10 s do que quando ficassem acesas por 20 ou 30 s). Na segunda condição, as res212 Carlos Eduardo Costa, Carlos Renato Xavier Cançado postas de observação deixaram de acender as luzes âmbar (i.e., as respostas de observação estavam em extinção). Na primeira parte da terceira condição, as respostas de observação voltaram a produzir as luzes âmbar, em cada componente, por 10 s. Na segunda parte da terceira condição, perdas de dinheiro passaram a ocorrer a cada 10 s na ausência de respostas de esquiva em todos os componentes (portanto, as instruções passaram a ser inacuradas e a presença das luzes âmbar dependia da resposta de observação). Se os estímulos correlacionados às instruções (i.e., luzes âmbar) adquirissem função de reforçadores condicionais, seria esperado que as respostas de observação fossem mantidas na primeira condição e que a taxa dessas respostas diminuísse na segunda condição. Além disso, na terceira condição, seria esperado que a taxa das respostas de observação diminuísse quando essas respostas produzissem os estímulos correlacionados à instruções inacuradas por 10 s. Resultados e Discussão Na primeira codição, para cada participante, a taxa de respostas de observação foi inversamente proporcional à duração de apresentação das luzes âmbar (i.e., quanto maior a duração de apresentação das luzes, menor foram as taxas de respostas de observação). Nessa condição, a taxa de respostas de esquiva foi correspondente com 213 as instruções e contingências programadas (i.e., taxas de respostas de esquiva mais altas quando a resposta adiava a perda de dinheiro por 10 s e relativamente mais baixas quando adiava a perda por 30 s e 60 s, e nenhuma resposta no componente sem perdas). Na segunda condição (extinção), as taxas de respostas de observação dos três participantes ficaram próximas de zero e a taxa de respostas de esquiva se tornou menos diferenciada entre os componentes do múltiplo. Na primeira parte da terceira condição, a taxa de respostas de observação aumentou para todos os participantes e as taxas de respostas de esquiva voltaram a ser diferenciadas entre os componentes do múltiplo. Na segunda parte dessa condição, as taxas de respostas de observação dos três participantes foram novamente próximas de zero e a taxa de respostas de esquiva foi alta e indiferenciada entre os componentes. A relação funcional entre a duração da exibição das luzes âmbar e a taxa de respostas de observação, assim como a extinção das respostas de observação, demonstrou que os estímulos correlacionados à instruções acuradas funcionaram como reforçadores condicionais para as respostas de observação. Além disso, a redução na taxa de respostas de observação quando as instruções se tornaram inacuradas demonstrou que os estímulos correlacionados às instruções eram reforçadores apenas quando as instruções eram acuradas (i.e., quando seguir as instruções evitava a perda de pontos). Em outras palavras, tendemos Capítulo XIII | Comportamento Governado por Regras a pedir informações quando, no passado, pedi-las levou a reforçamento e tendemos a não pedi-las quando, no passado, pedir informações não produziu consequências diferenciais. DESDOBRAMENTOS Os resultados obtidos por Galizio (1979) têm sido replicados em diversos experimentos. Os resultados do Experimento 1 sugeriram que o comportamento pode ser mais rapidamente estabelecido com o uso de instruções acuradas, algo que tem sido demonstrado também com comportamentos instruídos mantidos por contingências de reforçamento positivo. Por exemplo, a diferenciação na taxa de respostas em programas de reforço múltiplo razão fixa (FR) reforçamento diferencial de baixas taxas (DRL) é prontamente obtida em alguns estudos somente quando instruções acuradas sobre as contingências são fornecidas aos participantes (e.g., Hayes, Brownstein, Haas, et al., 1986; Hayes, Brownstein, Zettle, Rosenfarb, & Korn, 1986, mas ver Porto, Ramos, & Costa, 2011; e Soares, Costa, Cançado & Cirino, 2013, para exceções). Os resultados de Athayde Neto et al. (2015) também demonstraram que instruções acuradas favorecem a diferenciação das taxas de respostas em um múltiplo FR DRL, mas que essa diferenciação pode ser obtida também com instruções mínimas (i.e., instruções gerais sobre a topografia da resposta – “ganhe pontos utilizando o mouse”). Os resultados do Experimento 2 de Galizio (1979) indicaram que seguir regras é influenciado por suas consequências. Calixto et al. (2014, Experimento 2) estudaram o controle do seguimento de regras por suas consequências com contingências de reforçamento positivo. Participantes foram expostos a um DRL 5 s com instrução mínima (Grupo IM), acurada (Grupo IA) ou inacurada (Grupo II). Em uma condição subsequente, para os participantes em cada grupo, a contingência mudou de DRL para extinção, mas as instruções (agora inacuradas) foram mantidas. Sob o DRL, os participantes do Grupo IA emitiram taxas de respostas mais baixas e obtiveram a maioria dos reforços programados em relação aos participantes dos outros grupos, corroborando os resultados do Experimento 1 de Galizio. Quando a extinção estava em vigor, mais participantes dos Grupos IM e II abandonaram a instrução do que os do Grupo IA. Assim como nos Experimentos 2 e 3 de Galizio, esses resultados sugerem que o seguimento de regras é mais provável após uma história de exposição a instruções acuradas (Grupo IA) e menos provável após exposição a instruções inacuradas (Grupo II; mas ver Albuquerque et al., 2003, para resultados diferentes). No estudo de Galizio (1979) vimos que quando as instruções são acuradas, os indivíduos tendem a emitir o comportamento descrito nas instruções. O mesmo acontece quando as instruções fornecidas são inacuradas mas não há contato com a 214 Carlos Eduardo Costa, Carlos Renato Xavier Cançado discrepância entre instruções e contingências. Quando há este contato com a discrepância entre instruções e contingências (e.g., ao seguir a instrução o indivíduo perde dinheiro) o seguimento de instrução tende a ser abandonado. Além disso, Galizio sugeriu que em estudos sobre comportamento governado por regras nos quais há transição entre condições em que o comportamento é mantido por contingências de reforçamento positivo para extinção (uma situação em que a instrução passa a ser inacurada e há contato com a discrepância pois os reforçadores deixam de ser produzidos, como no estudo de Calixto et al., 2014, descrito anteriormente) pode ocorrer maior persistência do comportamento instruído porque seriam necessárias muitas sessões para que o comportamento se enfraquecesse. Isto é, o contato com a discrepância por perder dinheiro pode não ter o mesmo efeito que o contato com a discrepância por deixar de ganhar dinheiro. na Fase 1, mas extinção estava em vigor em cada componente do múltiplo. Cinco dos seis participantes mantiveram altas taxas de respostas nos dois componentes em ambas as fases sugerindo seguimento da regra durante todo o experimento, independente do monitoramento. O fato dos participantes continuarem a responder em altas taxas na Fase 2 corrobora a afirmação de Galizio (1979) de que o comportamento pode persistir por bastante tempo quando ocorre mudança de contingência de reforçamento positivo para extinção. Além disso, Ramos et al. sugeriram que pode ter ocorrido um efeito da história de reforço de seguir regras (Fase 1) sobre o comportamento em extinção (Fase 2), já que o seguimento da regra na Fase 1 garantia a obtenção dos pontos disponíveis (monitoramento também não teve efeito no estudo de N. M. A. Albuquerque, Paracampo, & Albuquerque, 2004; mas teve efeito em outros estudos, e.g., Barrett, Deitz, Gaydos, & Quinn, 1987; Cerutti, 1994). Ramos, Costa, Benvenuti e Andrade (2015) avaliaram essa questão em um experimento com seis estudantes que deveriam clicar com o cursor do mouse sobre um botão em uma tela de computador para ganhar pontos. A instrução era sempre “Pressione o botão rapidamente para ganhar pontos”. Na Fase 1 estava em vigor um múltiplo intervalo fixo (FI) 30 s FI 30 s e o experimentador estava presente em apenas um dos componentes do múltiplo. Na Fase 2, a instrução e o monitoramento pelo experimentador foram mantidos como Por fim, os resultados do Experimento 3 de Galizio (1979) sugerem que, dada uma história de reforçamento diferencial, o seguimento de regras pode ser colocado sob controle de estímulos. Okouchi (1999) também investigou se instruções poderiam ser consideradas estímulos discriminativos. Quatro universitários foram expostos a um programa múltiplo FR DRL e instruídos, na tela do computador, a responderem lentamente no FR e rapidamente no DRL. Depois, foram expostos a um múltiplo FI FI com as mesmas instruções. Durante o 215 Capítulo XIII | Comportamento Governado por Regras múltiplo FI FI, para três de quatro participantes, as taxas de respostas foram maiores com a instrução para responder lentamente do que com a instrução para responder rapidamente. Tal controle por instruções não foi observado para outros participantes expostos apenas ao múltiplo FI FI com ou sem instruções. Os resultados de Okouchi demonstraram que o efeito de instruções pode ser alterado por contingências e sugerem que as instruções podem funcionar como estímulos discriminativos. Em outras palavras, a instrução “pressione lentamente”, passou a controlar altas taxas de respostas e a instrução “pressione rapidamente” passou a controlar baixas taxas de repostas em um múltiplo FI FI devido a história de contingências que correlacionou o “lentamente” ao FR e o “rapidamente” ao DRL. Os participantes expostos diretamente ao múltiplo FI FI responderam em altas taxas na presença de “pressione rapidamente” e baixas taxas na presença de “pressione lentamente. O ponto interessante é que Okouchi construiu uma nova relação entre uma palavra e a história de contingência que dá “significado” a esta palavra e não se baseou, como outros estudos, em palavras cujo significado foi construído na história extra experimental do participante. CONSIDERAÇÕES FINAIS Tomados em conjunto os quatro experimentos de Galizio (1979) demonstram que o seguimento de instruções é compor- tamento operante e como a história comportamental pode determinar o comportamento de seguir instruções. Além disso, os resultados de Galizio indicam que, em estudos com humanos em que o interesse é nos efeitos comportamentais das contingências, atenção ao controle instrucional deve sempre ser um cuidado. Se instruções acuradas e detalhadas forem apresentadas aos participantes, o comportamento pode se assemelhar àquele selecionado por suas consequências mas pode estar sob controle da instrução fornecida. Galizio adverte que “em casos nos quais o controle de respostas simples pelo programa [de reforço] é de interesse, instruções mínimas deveriam ser empregadas” (p. 68). O fato de que o seguimento de instrução pode ser colocado sob o controle de estímulos levanta questões interessantes para a análise de interações sociais. É mais provável que um indivíduo siga instruções de fontes (pessoas, instituições) que lhe forneceram instruções acuradas e que deixe de seguir instruções de fontes que lhe deram instruções inacuradas (Cerutti, 1989; Galizio, 1979, Experimento 3). Assim, seguir regras de um professor ou de um especialista em determinada área do conhecimento pode ser mais provável do que seguir regras fornecidas por um leigo. Por fim, os resultados apresentados por Galizio (1979) sugerem que o controle do comportamento humano por regras não deve ser interpretado como uma limitação 216 Carlos Eduardo Costa, Carlos Renato Xavier Cançado do controle do comportamento humano por contingências de reforçamento e punição, ou mesmo como um limite ao princípio de seleção do comportamento por suas consequências (Skinner, 1981), mas como um exemplo de uma determinada história de reforço (por seguir regras) influenciando o efeito de determinadas contingências sobre o comportamento. Em geral, os resultados de Galizio e de outros experimentos sobre o comportamento governado por regras indicam que o que é dito sobre o mundo interage com o mundo no controle do comportamento de um indivíduo. Portanto, comportamento governado por regras é comportamento operante. A tarefa para uma análise experimental é descrever quais variáveis influenciam o controle do comportamento por regras e a interação entre o comportamento governado por regras e o comportamento modelado por contingências. PARA SABER MAIS Catania, Matthews, & Shimoff (1982). Investigaram as diferenças entre o comportamento verbal modelado e o instruído. Os participantes deveriam aprender a pressionar dois botões de acordo com diferentes programas de reforçamento por modelagem ou instrução de seus comportamentos verbais. O interessante nesse estudo é que a instrução não foi dada ao participante. Ela foi modelada por meio de pontos dados 217 para a descrição que os próprios participantes faziam sobre seu desempenho. Os resultados sugeriram que o comportamento verbal produz efeitos sobre o comportamento não-verbal subsequente, principalmente quando o comportamento verbal é modelado. Buskist & Miller Jr. (1986). Neste estudo, os autores procuraram investigar a interação entre instrução e contingência no desenvolvimento do desempenho de humanos em FI. Os resultados sugeriram que quando há contato com a discrepância entre regra e contingência é mais provável abandonar a regra do que quando isso não ocorre. Hayes, Brownstein, Zettle, Rosenfarb, & Korn, (1986). Procuraram avaliar o efeito de instruções sobre a taxa de respostas em um programa de reforço múltiplo FR DRL e sobre a sensibilidade à mudança nas contingências quando extinção passou a estar em vigor em cada componente do múltiplo. Os autores sugeriram que a diferenciação na taxa de respostas no múltiplo FR DRL foi obtida somente quando instruções acuradas sobre as contingências foram fornecidas aos participantes. Entretanto, a taxa de respostas dos participantes que receberam instruções acuradas sobre como responder foi mais resistente à extinção. Torgrud & Holborn (1990). O objetivo foi observar se existe diferença no seguimento de regras quando os participantes eram expostos às contingências na ausência de Capítulo XIII | Comportamento Governado por Regras regras. Os resultados sugerem que quando os participantes passaram pela fase de exposição direta às contingências (com instrução mínima), antes da fase em que era fornecida a instrução, o comportamento da maioria dos participantes mudou quando as contingências programadas mudaram. Baumann, Abreu-Rodrigues, & Souza (2009). Avaliaram os efeitos de regras e autorregras sobre a sensibilidade do comportamento à mudança nas contingências. Participantes em diferentes grupos foram expostos a diferentes programas de reforçamento ou a apenas um esquema de reforçamento. Alguns participantes foram expostos a regras e outros foram instruídos a gerar regras sobre as contingências em vigor; participantes em um grupo controle não receberam ou foram instruídos a gerar regras. A sensibilidade do comportamento à mudança nas contingências foi maior para participantes com uma história de exposição à diferentes programas de reforçamento e às regras ou autorregras variadas do que para participantes com uma história de exposição à apenas um esquema e a regras ou autorregras específicas. REFERÊNCIAS Albuquerque, L. C., de Souza, D. G., Matos, M.A., & Paracampo, C. C. P. (2003). Análise dos efeitos de histórias experimentais sobre o seguimento subsequente de regras. Acta Comportamentalia, 11, 87-126. Albuquerque, L. C., dos Reis, A. A., & Paracampo, C. C. P. (2008). Efeitos de histórias de reforço, curtas e prolongadas, sobre o seguimento de regras. Acta Comportamentalia, 16, 305-332. Albuquerque, L. C., & Paracampo, C. C. P. (2010). Análise do controle por regras. Psicologia USP, 21, 253-273. Albuquerque, N. M. A., Paracampo, C. C. P., & Albuquerque, L. C. (2004). Análise do papel de variáveis sociais e de conseqüências programadas no seguimento de instruções. Psicologia: Reflexão e Crítica, 17, 31-42. Athayde Neto, C. A., Costa, C. E., & Banaco, R. A. (2015). Efeitos da história comportamental e de instruções sobre a aquisição e a resistência à extinção em um esquema múltiplo fr drl. Psicologia: Teoria e Pesquisa, 31, 365-374. Barrett, D. H., Deitz, S. M., Gaydos, G. R., & Quinn, P. C. (1987). The effects of programmed contingencies and social conditions on response stereotypy with human subjects. Psychological Record, 37, 489-505. Baum, W. M. (2006). Compreender o behaviorismo: Comportamento, cultura e evolução (M. T. A. Silva, M. A. Matos, G. Y. Tomanari, E. Z. Tourinho, & F. Dentello, Trans. 2a ed.). Porto Alegre, RS: Artmed. Baumann, A. A., Abreu-Rodrigues, J., & Souza, A. S. (2009). Rules and self-rules: Ef218 Carlos Eduardo Costa, Carlos Renato Xavier Cançado fects of variation upon behavioral sensitivity to change. The Psychological Record, 59, 641-670. Bentall, R. P., Lowe, C. F., & Beasty, A. (1985). The role of verbal behavior in human learning: Ii. Developmental differences. Journal of the Experimental Analysis of Behavior, 43, 165-180. Buskist, W. F., & Miller Jr., H. L. (1986). Interaction between rules and contingencies in the control of human fixed-interval performance. The Psychological Record, 36, 109116. Calixto, F. C., Ponce, G. D., & Costa, C. E. (2014). O efeito de diferentes instruções sobre o comportamento em drl e a sensibilidade comportamental. Acta Comportamentalia, 22, 201-217. Catania, A. C. (1999). Aprendizagem: comportamento, linguagem e cognição. (D. G. Souza Trad.). Porto Alegre: Artmed. Catania, A. C., Matthews, B. A., & Shimoff, E. (1982). Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior, 38, 233-248. Cerutti, D. T. (1989). Discrimination theory of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 51, 259276. 219 Cerutti, D. T. (1994). Compliance with instructions: Effects of randomness in scheduling and monitoring. The Psychological Record, 44, 259-269. Galizio, M. (1979). Contingency-shaped and rule-governed behavior: Instructional control of human loss avoidance. Journal of the Experimental Analysis of Behavior, 31, 5370. Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147. Hayes, S. C., Brownstein, A. J., Zettle, R. D., Rosenfarb, I., & Korn, Z. (1986). Rule-governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45, 237256. Lowe, C. F. (1979). Determinants of human operant behaviour. In M. D. Zeiler & P. Harzem (Eds.), Reinforcement and the organization of behavior (pp. 159-192). New York: John, Wiley & Sons. Lowe, C. F., Beasty, A., & Bentall, R. P. (1983). The role of verbal behavior in human learning: Infant performance on fixed-interval schedules. Journal of the Experimental Analysis of Behavior, 39, 157-164. Capítulo XIII | Comportamento Governado por Regras Madden, G. J., Chase, P. N., & Joyce, J. H. (1998). Making sense of sensitivity in the human operant literature. The Behavior Analyst, 21, 1-12. Matos, M. A. (2001). Comportamento governado por regras. Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 51-66. Matthews, B. A., Catania, A. C., & Shimoff, E. (1985). Effects of uninstructed verbal behavior on nonverbal responding: Contingency descriptions versus performance descriptions. Journal of the Experimental Analysis of Behavior, 43, 155-164. Okouchi, H. (1999). Instructions as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 72, 205-214. Porto, T. H., Ramos, M. N., & Costa, C. E. (2011). História de aquisição do comportamento em um múltiplo FR-DRL: diferenciação e estabilidade das taxas de respostas. Acta Comportamentalia, 19, 281-306. Ramos, M. N., Costa, C. E., Benvenuti, M. F., & Andrade, C. C. F. (2015). Efeito de regras inacuradas e monitoramento sobre desempenhos em programas de reforços. Psicologia: Reflexão e Crítica, 28, 813-822. Rosenfarb, I. S., Newland, M. C., Brannon, S. E., & Howey, D. S. (1992). Effects of self-generated rules on the development of schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 58, 107-121. Shimoff, E., Catania, A. C., & Matthews, B. A. (1981). Uninstructed human responding: Sensitivity of low-rate performance to schedule contingencies. Journal of the Experimental Analysis of Behavior, 36, 207220. Sidman, M. (1953). Two temporal parameters of the maintenance of avoidance by the white rat. Journal of Comparative and Physiological Psychology, 46, 253-261. Skinner, B. F. (1969). Contingencies of reinforcement. New York, NY: Appleton-Century-Crofts. Skinner, B. F. (1974). About behaviorism. New York, NY: Vintage Books. Skinner, B. F. (1978). O comportamento verbal. São Paulo, SP: Cultrix/EDUSP. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. DOI: 10.1126/ science.7244649 Skinner, B. F. (1986). The evolution of verbal behavior. Journal of the Experimental Analysis of Behavior, 45, 115-122. Soares, P. G., Costa, C. E., Cançado, C. R. X., & Cirino, S. D. (2013). Controle de estímulos e história comportamental em humanos. Psicologia: Reflexão e Crítica, 26, 357-366. 220 Carlos Eduardo Costa, Carlos Renato Xavier Cançado Teixeira Júnior, R. R. (2009). Variáveis do comportamento governado por regras: Uma análise de estudos da área. Acta Comportamentalia, 17, 351-385. Torgrud, L. J., & Holborn, S. W. (1990). The effects of verbal performance descriptions on nonverbal operant responding. Journal of the Experimental Analysis of Behavior, 54, 273-291. Wyckoff Jr., L. B., (1952). The role of observing responses in discrimination learning: Part I. Psychological Review, 59, 431-442. Wyckoff Jr., L. B. (1969). The role of observing responses in discrimination learning. In D. P. Hendry (Ed.). Conditioned Reinforcement. Homewood, IL: Dorsey Press. 221 Carlos Augusto de Medeiros, Lucas Ferraz Córdova A função do mentir em crianças: o controle operante na correspondência verbal Carlos Augusto de Medeiros Centro Universitário de Brasília Lucas Ferraz Córdova Universidade Federal de Mato Grosso do Sul Ribeiro, A. F. (1989). Correspondence in children’s self-report: tacting and manding aspects. Journal of the Experimental Analysis of Behavior, 51, 361-367. “Mentiras sinceras me interessam” Cazuza e Frejat 222 Capítulo XIV | Correspondência Verbal INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Em 1957, B. F. Skinner publicou o livro O Comportamento Verbal, no qual propôs que este tipo de comportamento poderia também ser explicado por meio da sua relação com variáveis ambientais. Mais especificamente, Skinner descreveu o comportamento verbal como um comportamento operante, isto é, comportamento estabelecido e mantido por processo de seleção pelas consequências. O que distinguiria o comportamento verbal dos comportamentos não verbais seria a forma de consequenciação desses comportamentos. No comportamento verbal, a alteração no ambiente é proporcionada por um ouvinte, enquanto que no comportamento não verbal, a modificação no ambiente é direta. O marido pode pegar o controle remoto da TV e trocar de canal, atuando assim, de forma direta no ambiente, por exemplo. Ele também pode, todavia, pedir para que a sua esposa mude de canal por ele. Neste caso, a mudança de canal foi proporcionada pela sua esposa, de modo que a atuação do marido no ambiente foi indireta. Explicar uma resposta verbal, então, é explicitar suas fontes de controle, é descrever os eventos ambientais contingentes a sua emissão, ou seja, identificar a sua função. Isto implica que comportamentos que são cotidianamente designados por termos como “descrever”, “pedir”, “recitar”, “persuadir” ou mesmo “mentir” ou “xingar” seriam comportamentos, logo, seriam função de variáveis ambientais. A existência de tais comportamentos é dependente de contingencias de reforçamento socialmente estabelecidas que os tornam mais ou menos prováveis. Por exemplo, falar “cadeira” diante do objeto cadeira, ou dizer “comi macarrão” após ter comido macarrão, são comportamentos que a comunidade verbal coloca sob controle discriminativo das respectivas condições mencionadas via reforçamento diferencial. Ou seja, caso a resposta “cadeira” seja emitida na presença de outros móveis, não será reforçada, enquanto que, na presença do móvel cadeira, sim. Após esse treino, a resposta verbal “cadeira” será provável na presença de cadeiras e não de outros móveis. A relação de controle entre uma resposta verbal ou não verbal emitida por um falante e o comportamento verbal de relatá-la é chamada de correspondência verbal, que também denomina um tema de pesquisa em Análise do Comportamento (Beckert, 2005; Lloyd, 2002; Paniagua, 1990). As variáveis ambientais que afetam essa relação de controle entre o que um falante faz e o que diz acerca do que faz são investigadas pelas pesquisas empíricas em correspondência verbal. Três tipos principais de correspondência verbal são investigados: (a) correspondência dizer-fazer, na qual é avaliado se o comportamento emitido (fazer) ocorreu conforme anunciado previamente pelo falante (dizer); (b) correspondência fazer-di223 Carlos Augusto de Medeiros, Lucas Ferraz Córdova zer, sendo verificado se o relato está sob o controle discriminativo do comportamento previamente emitido; e (c) correspondência dizer-fazer-dizer, na qual a correspondência é investigada em dois momentos, isto é, se o fazer corresponde ao dizer prévio e se o relato posterior corresponde ao comportamento previamente emitido. LIoyd (2002) afirmou que há ocorrência de correspondência quando o falante anuncia que irá fazer algo e o faz ou que não fará algo e não o faz (correspondência dizer-fazer). Também ocorre correspondência quando o falante diz que fez algo que realmente fez ou que não fez algo que, de fato, não fez (correspondência fazer-dizer). Portanto, são possíveis quatro tipos correspondência (dizer que fará e fazer; dizer que não fará e não fazer; fazer e dizer que fez e não fazer e dizer que não fez) e quatro tipos de não correspondência (dizer que fará e não fazer; dizer que não fará e fazer; fazer e dizer que não fez; e não fazer e dizer que fez). A existência desse tema de investigação em Análise do Comportamento, segundo LIoyd, baseia-se no pressuposto de que o fazer e o dizer são comportamentos distintos e que, portanto, não estão necessariamente relacionados. Tais comportamentos podem ocorrer em momentos distintos e sob o controle de variáveis específicas. O dizer é obrigatoriamente controlado por reforçamento social, ou seja, aquele provido por outra pessoa, na medida em que se trata de um comportamento verbal (Skinner, 1957). Já o fazer é determinado por suas pró224 prias consequências que podem ser sociais ou não. Ainda que as consequências de um fazer específico sejam sociais, não necessariamente são as mesmas do dizer. Caso um adolescente diga aos pais que respeitará seus professores, por exemplo, é provável que seus pais reforcem esse relato. Por outro lado, um comportamento desrespeitoso em relação aos professores pode ser reforçado pelos risos dos colegas de classe. Ambas consequências são sociais nesse caso, entretanto, são distintas e podem resultar na ausência de correspondência dizer-fazer. Ao enfatizar as relações de contingência para explicar a não ocorrência de correspondência, a Análise do Comportamento exclui as explicações mentalistas como “má índole” ou “ausência de caráter” (Lloyd, 2002). Além disso, ao contrário das explicações do senso comum, analistas do comportamento não pressupõem uma relação de controle a priori do comportamento verbal sobre o comportamento não verbal. Ainda assim, o controle verbal do comportamento possui grande relevância aplicada, o que justifica a investigação das variáveis ambientais que interferem na correspondência e, principalmente, a tentativa de criar condições que favoreçam a correspondência entre o dizer e o fazer. Em uma psicoterapia, por exemplo, é comum os clientes verbalizarem irão emitir certos comportamentos (e.g., se matricular numa autoescola para motoristas habilitados como parte do tratamento para voltar Capítulo XIV | Correspondência Verbal a dirigir) sem que essa verbalização seja acompanhada do comportamento correspondente (i.e., se matricular na autoescola em si). Desse modo, é muito importante investigar variáveis que afetam a correspondência entre dizer e o fazer de modo a aumentar as chances de prever e controlar o comportamento no contexto aplicado. Os procedimentos comumente utilizados em pesquisas sobre correspondência verbal envolvem três tipos de condições experimentais (Beckert, 2005; LIyod, 2002). Uma linha de base, na qual os reforçadores não são contingentes a relatos ou comportamentos relatados específicos, nem à correspondência entre eles. As condições de linha de base são delineadas para verificar a correspondência verbal decorrente da história pré-experimental dos participantes (Ribeiro, 1989). Com exceção de alguns experimentos como, por exemplo, os de Critchifield e Perone (1990; 1993), Brino e de Rose (2006), Cortez, de Rose e Montagnoli (2013), a grande parte dos estudos sobre correspondência reportam alto índice de correspondência verbal nas condições de linha de base. Esses resultados corroboram a pressuposição de Skinner (1957) acerca do extenso treino da comunidade verbal em propiciar relatos correspondentes. Entretanto, segundo Medeiros (2013), caso o comportamento relatado tenha histórico de punição, é possível que a correspondência seja enfraquecida. Esse foi justamente o resultado reportado em ambos os estudos de Critchifield e Perone, por Brino e de Rose, e Cortez e cols., uma vez que as crianças participantes tinham que relatar erros em tarefas diversas, e como erros costumam ser punidos, a precisão desses relatos é empobrecida frente à dos relatos de acertos. A outra condição experimental comumente utilizada é o reforçamento de relatos (correspondentes ou não) específicos (Paniagua & Baer, 1982; Ribeiro, 1989). Essa condição tende a reduzir a correspondência verbal. Esse tipo de manipulação é muito importante, uma vez que demonstra que a correspondência verbal é uma propriedade do comportamento que é afetada por variáveis ambientais. Na sequência dizer-fazer, o reforçamento contingente a um dizer prévio específico nem sempre é acompanhando do fazer posterior. No estudo de Paniagua e Baer (1982), eram mostradas fotos de brinquedos que estariam disponíveis para a criança brincar. Sempre que esta dizia que brincaria com um brinquedo previamente preterido por ela em um pré-teste, o seu relato era reforçado. Entretanto, na situação de brincar em que todos os brinquedos estavam disponíveis, a criança brincava com um brinquedo diferente do que havia anunciado – constituindo uma situação de ausência de correspondência dizer-fazer. Na sequência fazer-dizer, são reforçadas topografias de relato específicas independentemente se estas correspondem ou não ao comportamento relatado. Com esse procedimento, Pergher (2002), Ribeiro (1989) 225 Carlos Augusto de Medeiros, Lucas Ferraz Córdova e Sadi (2002) observaram um aumento na frequência de relatos não correspondentes, ainda que em apenas a minoria de suas participantes crianças. Os treinos de correspondência são o terceiro de tipo de condição experimental e têm como objetivo estabelecer a correspondência entre o dizer e o fazer. Também é verificado se a correspondência se mantém após a retirada da condição de treino de correspondência. Os treinos de correspondência envolvem o reforçamento diferencial no qual apenas o fazer correspondente ao dizer prévio é reforçado na correspondência dizer-fazer. Caso ocorra um fazer diferente do anunciado previamente ou o fazer correspondente não seja emitido, o reforçador não é apresentado. Esse procedimento se demonstrou eficaz em estabelecer relatos correspondentes na direção dizer-fazer nos estudos de Paniagua e Baer (1982) e Risley e Hart (1968). Nos treinos de correspondência fazer-dizer, o reforçador é contingente ao dizer correspondente ao fazer prévio, e não é apresentado caso o dizer não corresponda ao fazer (Brino & de Rose, 2006; Paniagua & Baer, 1982; Ribeiro, 1989). Esse procedimento tem se mostrado eficaz tanto em produzir correspondência quanto em mantê-la após o retorno à linha de base. que buscava-se propiciar a correspondência entre o que as pessoas diriam que fariam e o que realmente fariam. Em outras palavras, criar condições para que as pessoas passem a fazer o que disseram que fariam. O estudo de Ribeiro (1989), por outro lado, não enfatizava o fazer, e sim, o dizer como objeto de estudo. Nesse estudo, não era objetivado alterar a probabilidade de um comportamento específico a ser relatado. Na realidade, a meta do estudo de Ribeiro era investigar o que leva o falante a relatar com precisão ou de forma distorcida um fazer prévio. Em decorrência disso, Ribeiro, diferentemente do que havia sido feito em estudos anteriores, descreveu os comportamentos verbais envolvidos em seu estudo utilizando as categorias funcionais propostas por Skinner (1957), como tatos1 e mandos2. Essas inovações, a engenhosidade dos procedimentos e a robustez dos resultados, como será verificado a seguir, provavelmente fizeram com que essa pesquisa fosse citada e descrita em diversos estudos em Análise Experimental do Comportamento, tendo inaugurado uma nova forma de estudar a correspondência verbal. Tatos são operantes verbais cujas respostas estão sob o controle discriminativo de estímulos não verbais, sendo estabelecidos e mantidos por reforçadores generalizados. Os exemplos comuns de tatos são os relatos, as descrições e as narrativas. Se uma criança brincou com o carrinho de relata que brincou com o carrinho, está emitindo um tato, já que o seu relato está sob o controle discriminativo do comportamento de brincar prévio, que é um estímulo não verbal. 1 Os mandos são operantes verbais cujas respostas são controladas por reforçadores específicos. Pedidos, súplicas e ordens são exemplos de mandos na linguagem cotidiana. Quando uma criança pede uns trocados para o pai para comprar doces na padaria, está emitindo um mando, uma vez que o que controla a sua resposta verbais é o dinheiro a ser dado pelo pai. 2 Até a publicação do estudo de Ribeiro (1989), o foco das pesquisas foi sobre a correspondência dizer-fazer, na medida em 226 Capítulo XIV | Correspondência Verbal DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O estudo de Ribeiro (1989) teve como objetivo investigar os efeitos do reforçamento do conteúdo das verbalizações de crianças sobre a acurácia do relatar. Em outras palavras, o que seria observado se o reforçamento de relatos específicos acontecesse independentemente da acurácia desse relato. Oito crianças, de ambos os sexos, com idades entre três e cinco anos, participaram do experimento. Individualmente, as crianças eram levadas a uma “sala de brincar”, onde o experimentador podia observá-las por meio de um espelho unidirecional. Nesta sala, a criança tinha acesso a brinquedos que ela podia escolher para brincar. Ela poderia brincar com apenas um brinquedo por vez. Após o termino do período de brincar, que durava 12 minutos ou até ela ter brincado com três brinquedos, a criança era encaminhada para a “sala de relatar”. Nesta sala, um segundo experimentador, que não tinha acesso a quais brinquedos a criança havia brincado na “sala de brincar”, dizia para a criança que gostaria de saber o que ela havia feito no período de brincar daquele dia. Ele se sentava à mesa, do lado oposto da criança, mostrando a foto de cada brinquedo e perguntava se ela havia brincado com aquele brinquedo. que consistiam em um período de brincar e um período de relato. A diferença entre as condições foi quanto ao período de relato: (a) Linha de Base (de quatro a seis sessões): ao fim de cada relato de brincar ou não, a criança recebia uma ficha que poderia ser trocada por comestíveis; (b) Reforçamento Individual do Relato de Brincar (seis sessões): qualquer relato de brincar, independentemente de ter realmente brincado, produzia uma ficha e demonstração de aprovação pelo experimentador. Por outro lado, os relatos de que não havia brincado não produzia a apresentação das fichas nem demonstração de aprovação pelo experimentador; (c) Reforçamento do Relato de Brincar em Grupo (quatro sessões): essa condição era semelhante à condição (b), porém o período de relato era conduzido em grupos de quatro crianças. Assim, cada criança tinha acesso ao relato e à forma de consequenciação dos relatos das outras; (d) Reforçamento de Correspondência em Grupo (oito sessões): o reforçador foi contingente ao relato correspondente ao comportamento ocorrido durante o período de brincar. Cada relato correspondente com o brincar ou não brincar produzia aprovação e uma ficha, enquanto que os relatos não correspondentes não produziam fichas nem aprovação; (e) Reforçamento Não-Contingente (uma sessão): essa condição foi semelhante à linha de base, com a diferença que as crianças recebiam seis fichas antes do período de relatar ao invés de apenas uma. O experimento teve cinco condições, todas compostas por sessões experimentais 227 Carlos Augusto de Medeiros, Lucas Ferraz Córdova Resultados e Discussão Durante a Linha de Base, todas as crianças apresentaram alto nível de correspondência (seis das oito crianças apresentaram correspondência total, enquanto uma delas emitiu um relato não correspondente de ter brincado e a outra emitiu dois relatos não correspondentes de não ter brincado). Na condição de Reforçamento Individual do Relato de Brincar, foi observada grande variabilidade entre os participantes de pesquisa. Das oito crianças, seis apresentaram pelo menos um relato não correspondente. Quatro crianças não apresentaram correspondência apenas no início da condição, e as outras duas relataram terem brincado com todos os brinquedos disponíveis independentemente de terem realmente brincado, maximizando, assim, os reforçadores. As outras duas crianças não apresentaram nenhum relato não correspondente ao longo de toda a segunda condição, não se expondo assim à mudança de contingência em relação à Linha de Base. Na condição de Reforçamento do Relato de Brincar em Grupo, que tinha como objetivo permitir as crianças observarem o relato e consequências dos relatos das demais, houve um aumento no número de relatos de brincar independentes da correspondência desse relato. Cinco das oitos crianças passaram a relatar terem brincado com todos os brinquedos disponíveis, maximizando os reforçadores. As demais três crianças emitiram relatos correspondentes ao longo de todo o estudo. Na condição 228 de Reforçamento de Correspondência em Grupo, todas as crianças passaram a apresentar correspondência tanto para o relato de brincar quanto para o de não brincar. Apenas duas participantes precisaram de três sessões nesta condição para que seus relatos passassem a ser consistentemente correspondentes. Por fim, na condição de Reforçamento Não-Contingente houve 100% de correspondência entre todas as crianças. Ribeiro (1989) discutiu os dados primeiramente apontando alto grau de correspondência dos participantes no início do experimento (i.e., Linha de base), justificada, provavelmente, por um histórico pré-experimental que teria estabelecido eficientemente um padrão de correspondência. Este seria, segundo Ribeiro (1989), também o motivo do porquê, na segunda condição, quatro dos participantes terem apresentado uma baixa frequência de relatos não correspondentes. Para o autor, é provável que consequências “naturais ou automáticas” do relato correspondente se sobreponham as consequências arranjadas. Apenas na condição Reforçamento de Relato de Brincar em Grupo foi possível observar um efeito do reforçamento do relato sob o desempenho de não correspondência. A possibilidade de observar a relação resposta-consequência em outro participante, somada à interação verbal entre as crianças (que descreveram umas para as outras a contingencia vigente) foi Capítulo XIV | Correspondência Verbal fundamental para ampliar o controle do reforçamento sobre o relato de brincar independentemente da correspondência. Essas variáveis sociais teriam permitido a exposição às contingências de reforçamento para relatos de brincar não correspondentes, os quais produziam mais reforçadores que os relatos correspondentes nas condições de Reforçamento de Relato de Brincar em Grupo. O papel do reforçamento na manutenção da correspondência ou não do relato fica claro com o retorno, em todos os participantes, ao padrão de correspondência observado durante a condição Linha de Base, que voltou a ser observado nas condições de Reforçamento de Correspondência e de Reforçamento Não Contingente. Nestas duas fases, a apresentação de reforçadores passou a ser contingente à correspondência e não ao mero relato de brincar. A partir da variação da correspondência dos relatos de brincar de cinco de oito participantes do estudo em função das condições experimentais às quais foram submetidos, pode-se concluir que a correspondência verbal é uma propriedade do comportamento função das contingências de reforçamento. Ribeiro (1989) discute os relatos correspondentes como tatos, na medida em que as respostas verbais estão sob o controle do comportamento de brincar prévio da criança (SD não verbal). Por outro lado, os relatos não correspondentes seriam instâncias de mando, na medida em que estariam sob o controle das consequências para os relatos específicos e não sob o controle do comportamento de brincar prévio da criança. Outro aspecto demonstrado pelo estudo de Ribeiro foi o efeito do reforçamento sobre as distorções de outros participantes (i.e., aprendizagem por observação) e das instruções (i.e., regras) fornecidas pelos próprios participantes na Condição de Reforçamento de Relato de Brincar em Grupo sobre a diminuição na acurácia do relato. Esses resultados apontaram para o efeito de variáveis sociais antecedentes sobre a correspondência verbal, além das consequências para os relatos correspondentes ou não. DESDOBRAMENTOS O experimento de Ribeiro (1989) foi replicado no Brasil em pelo menos cinco estudos (Dias, 2008; Ferreira, 2009; Ferreira, Neves, Simonassi, Andrade & Dias, 2014; Pergher, 2002; Sadi, 2002). Sadi (2002), por exemplo, replicou o estudo de Ribeiro com alterações procedimentais mínimas, como por exemplo a adição apenas do registro de verbalizações espontâneas das crianças. Já Pergher (2002), adicionou uma condição na qual a criança observava outra criança brincando e era solicitada a relatar o comportamento de brincar da colega. Ambos estudos replicaram os resultados obtidos por Ribeiro, não importando se o comportamento relatado era o próprio comportamento ou o comportamento de outras 229 Carlos Augusto de Medeiros, Lucas Ferraz Córdova crianças (Pergher, 2002). Entretanto, os participantes, na condição de Reforçamento da Correspondência em Grupo, levaram mais sessões para passar a emitir relatos correspondentes que os participantes do estudo de Ribeiro. Os experimentos de Dias (2008) e Ferreira et al. (2014), trocaram o “fazer” utilizado no experimento de Ribeiro (1989) (i.e., o brincar) pelo comportamento de comer. Participaram destes dois experimentos crianças obesas e não obesas (Dias) e crianças e adultos também obesos e não obesos (Ferreira et al.). Em ambos estudos foram adicionadas fases de grupos heterogêneos e homogêneos em relação aos participantes acima (obesos) e abaixo (não obesos) do índice de massa corporal (IMC). Os dois estudos não observaram a variação dos relatos não correspondentes em função das diferentes condições experimentais. Ou seja, quando o brincar foi trocado pelo comportamento de comer, os resultados de Ribeiro não foram replicados, ainda que Dias tenha observado um aumento na frequência do comportamento de comer para alguns participantes nas condições de Reforçamento do Relato Individual e em Grupo de Comer. Ferreira (2009) também não replicou os resultados obtidos por Ribeiro (1989) ao trocar o brincar pela tarefa de realizar operações matemáticas. Além disso, no estudo de Ferreira, na etapa de relatar, perguntava-se à criança quantas “continhas” ela havia feito, ao contrário dos estudos de Ribeiro 230 (1989), Dias (2008) e Ferreira et al. (2014) em que o experimentador apontava para uma fotografia do brinquedo ou do alimento e perguntava se a criança havia brincado/comido ou não. Ferreira (2009) levantou algumas hipóteses acerca das diferenças nos resultados de seu estudo e o de Dias (em relação ao de Ribeiro (1989). Em primeiro lugar, nos estudos de Ferreira e de Dias, o fazer da criança deixava um registro evidente, como os alimentos que sobraram ou as folhas de papel com as operações concluídas ou não. O mesmo não ocorre nos estudos do relato de brincar, que era filmado sem o conhecimento das crianças. Diante dos registros dos comportamentos de fazer operações matemáticas e de comer, haveria a possibilidade de checagem a qualquer momento pelos experimentadores (ainda que esta nunca tivesse ocorrido), o que poderia ter diminuído a probabilidade de distorção do relato. Ferreira (2009) também comenta que nenhum dos participantes de seu estudo e do estudo de Dias (2008) emitiu relatos não correspondentes de forma sistemática nas condições de Reforçamento de Relato Individual ou em Grupo. Desse modo, é improvável que as condições de Reforçamento de Relato em Grupo tenham sido eficazes em propiciar mais relatos distorcidos como nos estudos de Ribeiro (1989), Sadi (2002) e Pergher (2002). Como todas as crianças nos estudos de Ferreira e Dias apresentaram Capítulo XIV | Correspondência Verbal uma alta frequência de relatos correspondentes, as contingencias de reforçamentto para relatos específicos correspondentes ou distorcidos não modelaram os relatos não correspondentes. Desse modo, a frequência de relatos distorcidos era baixa na condição de Reforçamento de Relatos em Grupo, dificultando a aprendizagem por observação de modelos. Também é improvável que as crianças desses estudos tenham formulado regras acerca da possibilidade de distorção do relato como fizeram as crianças do estudo de Ribeiro (1989). Sendo assim, os efeitos de instruções e de modelos reportados nos estudos de Ribeiro (1989), Sadi (2002) e Pergher (2002) parecem não ter ocorrido em Ferreira (2009), Dias (2008) e Ferreira et al. (2014). Ribeiro (1989) e Sadi (2002) sugeriram que a idade dos participantes talvez tenha sido uma variável, não controlada, que teve efeito na correspondência verbal dos participantes, já que nas condições de Reforçamento de Relato Individual, apenas as crianças mais velhas começaram a distorcer. Os autores sugeriram que as crianças mais velhas, ao contrário das mais novas, provavelmente já passaram por contingências de reforçamento de relatos não correspondentes ou de punição de relatos correspondentes. Desse modo, seria mais provável que as contingências de reforçamento para os relatos de brincar na condição de Reforçamento de Relato Individual, ainda que não correspondentes, passassem a exercer controle sobre o seu comportamento verbal. Já as crianças mais novas talvez precisassem ser instruídas ou terem acesso a modelos se comportando de acordo com as contingências em vigor para passarem a distorcer os relatos nas condições de Reforçamento de Relato em Grupo. Por outro lado, os dados de Ferreira et al. (2014) com adultos sugerem que essa não é uma variável relevante, já que os relatos distorcidos de seus participantes adultos replicaram os apresentados pelas crianças, os quais não variaram de acordo com as condições experimentais. Talvez as diferenças quanto ao tipo de fazer dos estudos de Dias (2008), Ferreira (2009) e Ferreira et al. (2014) em relação aos demais estudos, conforme discutido acima, possam ser relevantes para entender a baixa frequência de relatos distorcidos mesmo em participantes adultos. A correspondência verbal fazer-dizer continuou sendo investigada em diversos outros estudos no Brasil ainda que com a metodologias distintas da utilizada por Ribeiro (1989). Entretanto, com exceção dos trabalhos de Critchfield e Perone (1990; 1993), fora do país, a atenção se voltou novamente para a direção dizer-fazer (e.g. Baer & Detrich, 1990). Foi observada uma queda no interesse pelo tema durante a década de 1990, sendo retomado nos anos 2000 (LIoyd, 2002; López, Valverde & Luciano, 2011). Quanto aos estudos no Brasil, é possível supor que, ainda que não se tratem de replicações, estes estudos tenham sido inspirados pelo trabalho de Ribeiro, pois o estudo foi sistematicamente citado e descri231 Carlos Augusto de Medeiros, Lucas Ferraz Córdova to em praticamente todos esses trabalhos. É possível propor três categorias para agrupar esses estudos: (a) Estudos observacionais: Um conjunto de estudos investigou a correspondência verbal sem manipular diretamente o reforçamento de relatos específicos ou de relatos correspondentes. Esses estudos voltaram a enfatizar o fazer, como os estudos anteriores ao experimento de Ribeiro (1989). Outra especificidade desses estudos foi a realização das pesquisas em ambientes mais próximos ao natural, como na realização de exercícios físicos em três mulheres diagnosticadas com diabetes tipo 2 (Coelho, Wechsler & Amaral, 2008 – dizer-fazer); em consultas pediátricas de díades mães e filhos (Wechsler & Amaral, 2010 – dizer-fazer-dizer); em situações de sala de aula de professores da rede estadual de ensino (Leme & Pereira, 2012 – fazer-dizer-fazer; Ricci & Pereira, 2006 – dizer-fazer); e no contexto organizacional entre gestores (Ramalho & Pedroso, 2014 – fazer-dizer-fazer); (b) Relatos acerca do próprio desempenho: Critchfield e Perone (1990; 1993) realizaram dois estudos nos quais os participantes eram solicitados a relatar se haviam acertado ou não cada tentativa em um procedimento de escolha atrasada de acordo com modelo, sendo manipuladas as condições de relato. Os estudos de Critchfield e Perone foram extensamente replicados, sendo avaliada a correspondência verbal em função do histórico ou não de fracasso escolar (Brino & de Rose, 2006; Cortez et al., 232 2013); presença ou ausência do experimentador durante a sessão experimental (Brino & de Rose, 2006); punição de relatos específicos em adultos (Sanabio & Abreu-Rodrigues, 2002); dificuldade da tarefa (Cortez et al., 2013; Domeniconi, de Rose & Perez, 2014); tipo de desempenho relatado (Cortez, de Rose & Miguel, 2014); e treino de correspondência (Brino & de Rose, 2006; Cortez et al., 2013; Cortez et al., 2014; Domeniconi et al., 2014). Dentre as variáveis listadas acima, a frequência de erros no fazer, ainda que não manipulada diretamente, representou a variável mais relevante na determinação da precisão dos relatos acerca do desempenho. Os treinos de correspondência se mostraram eficazes em estabelecer e manter a precisão dos relatos. No estudo de Brino e de Rose (2006), por exemplo, as crianças eram solicitadas a ler em voz alta uma palavra que aparecia na tela do computador. Na tela do computador, em seguida, apareciam dois quadrados paralelos, um verde e um vermelho. Ao clicar no quadrado verde a criança relatava ter acertado a leitura, no quadrado vermelho que havia errado a leitura. Na linha de base, a criança permanecia sozinha durante a aplicação do experimento e não havia consequências programadas para os seus relatos de acerto e erro. Na condição de treino de correspondência, eram reforçados os relatos correspondente de erro de leitura. Também foi realizada uma condição experimental na qual o experimentador permanecia com a criança durante a realização do Capítulo XIV | Correspondência Verbal experimento e os relatos de erros e acertos não tinham consequências programadas. Os autores observaram que as crianças tendiam a relatar como acertos seus erros de leitura na linha de base, o que não foi observado quando os relatos correspondentes eram reforçados ou quando o experimentador permanecia com a criança durante o experimento. Brino e de Rose concluíram, com base nesses resultados, que o treino de correspondência foi eficaz no estabelecimento da correspondência de relatos de erros e que a presença de adultos pode ter suprimido a emissão de comportamentos punidos no passado como, por exemplo, os relatos não correspondentes; (c) Relato do valor das cartas em um jogo de baralho. Diversos estudos sobre correspondência verbal foram realizados em Brasília com um procedimento diferente dos utilizados até então. Foi criado um jogo de cartas inspirado em jogos de blefe (e.g., truco ou pôquer), com o objetivo de criar condições mais próximas às naturais para favorecer a emissão de relatos distorcidos sem a necessidade de tokens e de reforçadores de retaguarda (e.g., guloseimas ou pequenos brinquedos), ainda que estes pudessem ser usados. Nesse jogo, dois participantes jogavam um contra o outro, sendo as partidas divididas em rodadas. Os jogadores recebiam pilhas de cartas e, a cada rodada, coletavam uma (e.g., Souza, Guimarães, Antunes & Medeiros, 2014) ou duas cartas (e.g., Medeiros, Oliveira & Silva, 2013) de cima de sua pilha e relatavam de forma correspondente ou não o valor da carta ou da soma das cartas compradas. Quem relatasse o maior valor, a depender do estudo, ganhava pontos (e.g., Medeiros, F. H., 2012) ou descartava a carta (e.g., Medeiros et al., 2013). Vencia a partida aquele que tivesse mais pontos ou menos cartas após um número fixo de rodadas. Após os relatos que podiam ser orais (e.g., Medeiros et al., 2013), via seleção de um valor numa janela da tela do computador (e.g., Medeiros, F. H., 2012) ou escritos simultaneamente em um quadro branco (e.g., Antunes & Medeiros, 2016; Demoly, 2016), um dado de seis faces real (e.g., Medeiros et al., 2013) ou virtual (e.g., Medeiros, F. H., 2012; Demoly, 2016) era lançado e, a depender do valor obtido, os participantes precisariam mostrar as cartas que compraram para o oponente e para o experimentador. Consequências eram programadas para relatos correspondentes ou não nos diversos estudos realizados. O efeito de diversas variáveis experimentais foi verificado sobre a precisão dos relatos dos valores das cartas, como a probabilidade de checagem dos relatos, ou seja, quantos valores do dado determinavam a checagem (Medeiros et al., 2013); a magnitude das consequências punitivas para relatos distorcidos em termos do número de cartas adicionais a serem compradas (Brito, Medeiros, Medeiros, F. H., Antunes & Souza, 2014); a faixa etária dos participantes (Souza et al., 2014); o modo como o relato 233 Carlos Augusto de Medeiros, Lucas Ferraz Córdova era solicitado (perguntas fechadas vs. perguntas abertas; Andrade, 2011; Souza et al., 2014; Demoly, 2016); o tipo de consequência para relatos precisos (ganho de pontos) e distorcidos (perda de pontos) em situação computadorizada (Medeiros, F. H., 2012); e a probabilidade de ganho da partida com a emissão de relatos precisos (Antunes & Medeiros, 2016). As variáveis manipuladas afetaram a precisão do relato do valor das cartas, demonstrando o efeito de aspectos do ambiente sobre o comportamento verbal, como em Ribeiro (1989). Em resumo, foi observado que, quanto menor a frequência de checagem, a magnitude das consequência punitivas para relatos distorcidos e a probabilidade de ganho com relatos precisos, maior a frequência de relatos distorcidos. Ao mesmo tempo, o tipo de consequência, se punitiva para relatos distorcidos ou reforçadora para relatos precisos, não parece ter efeitos sistemáticos sobre a correspondência verbal. Também foi verificado que a solicitação do relato via perguntas fechadas (e.g., você ganha a rodada?), ao invés de perguntas abertas (e.g., qual a sua carta?), produz relatos distorcidos mais frequentes. Por fim, foi verificado que adultos distorcem mais que as crianças caso não sejam fornecidas instruções acerca da possibilidade de distorcer o relato. 234 CONSIDERAÇÕES FINAIS Dentro da área de pesquisa de correspondência verbal, o estudo de Ribeiro (1989) tem importância em vários sentidos. Um primeiro ponto a ser destacado é sua importância metodológica, como pode ser observado nos experimentos citados acima (Dias, 2008; Ferreira 2009; Ferreira & cols., 2014; Pergher 2002; Sadi, 2002). Mas para além da mudança procedimental, ao inverter a direção da correspondência tradicionalmente investigada naquela época (i.e., passar a investigar a correspondência fazer-dizer ao invés da correspondência dizer-fazer) Ribeiro altera também o objeto de estudo da área. Na direção dizer-fazer investiga-se o controle verbal sobre o comportamento não verbal, ou seja, o foco está sobre o fazer, onde o dizer se insere como variável antecedente discriminativa. Com a mudança de Ribeiro, a resposta verbal passa a ser o foco, e agora, a estimulação discriminativa é identificada como sendo o fazer, um elemento da contingência controladora do dizer. Assim, a investigação se volta para as condições ambientais que determinam a emissão da resposta verbal. Essa mudança de foco do fazer para o dizer, inaugurou, dentro da Análise Experimental do Comportamento, a investigação sistemática do que cotidianamente é denominado mentir. Como sugere Medeiros (2013), em grande parte das vezes, a única forma de acesso que temos acerca do que uma pessoa fez ou ao ambiente que Capítulo XIV | Correspondência Verbal está exposta é o seu relato verbal. Desse modo, caso o relato verbal não seja confiável, teremos muitas dificuldades para predizer e controlar o comportamento que não se tem acesso direto. A área de investigação da correspondência verbal na direção fazer-dizer, inaugurada por Ribeiro (1989), é fundamental para a atuação do psicólogo no contexto aplicado, o qual, diante das condições ambientais, terá mais condições de avaliar um relato como fonte confiável de acesso às informações ou não. Ademais, terá condições de, ao manipular certos aspectos do ambiente (e.g., frequência de checagem, reforçamento diferencial de relatos correspondente, solicitação de relatos via perguntas abertas), afetar a correspondência verbal em contexto aplicado. Extrapolando a área especifica de pesquisa da correspondência verbal, o estudo de Ribeiro (1989) se soma, de forma reconhecidamente robusta, ao banco de dados que corroboram o caráter operante do comportamento verbal. Ao demonstrar a sensibilidade da frequência de respostas verbais às variáveis antecedentes e consequentes, Ribeiro (1989) descreve o que, na Análise do Comportamento, é denominado controle. Assim, Ribeiro permite sustentar a ideia de que tanto topografia quanto frequência de respostas verbais seriam estabelecidas e mantidas por sua relação com variáveis ambientais. Em outras palavras, o comportamento verbal poderia ser explicado a partir da noção de operante (Skinner, 1957). O presente capítulo buscou permitir ao seu leitor compreender o experimento desenvolvido por Ribeiro (1989), tanto as modificações metodológicas quanto conceituais por ele proposta. Além disso foram discutidos os desdobramentos possibilitados pelo mesmo na produção da área de correspondência verbal. Como foi visto, esse desdobramento é multifacetado, o que marca ainda mais a sua importância para área do comportamento verbal como um todo. PARA SABER MAIS Antunes & Medeiros (2016). Estudo que investiga o efeito da probabilidade de reforçamento para relatos precisos sobre a correspondência verbal num jogo de cartas em crianças. Beckert (2005). Uma revisão de literatura em correspondência verbal. Cortez, de Rose, & Miguel (2014). Estudo que investiga a correspondência do relato de erros, sendo manipulando o tipo de tarefa relatada Critchfield & Perone (1990). Estudo no qual os participantes eram solicitados a relatar se haviam acertado ou não cada tentativa em um procedimento de escolha atrasada de acordo com modelo, sendo manipuladas as condições de relato. 235 Carlos Augusto de Medeiros, Lucas Ferraz Córdova REFERÊNCIAS Andrade, C. M. R. Q. (2011). O efeito de perguntas abertas e fechadas na correspondência verbal. (Monografia de conclusão de curso). Centro Universitário de Brasília, Brasília. Antunes, R. A. B., & Medeiros, C. A. (2016). Correspondência verbal em um jogo de cartas com crianças. Acta Comportamentalia, 24, 15-28 Baer, R. A. & Detrich, R. (1990). Tacting and manding in correspondence training: Effects of child selection of verbalization. Journal of the Experimental Analysis of Behavior, 54, 23-30. Beckert, M. E. (2005). Correspondência Verbal/Não-Verbal: Pesquisa Básica e Aplicações na Clínica. In J. Abreu-Rodrigues, & M. R. Ribeiro (Orgs), Análise do comportamento: Pesquisa, teoria e aplicação (pp. 229 - 244). Porto Alegre: Artes Médicas. B. Borges, L. F. G. Aureliano & J. F. Leonardi (Orgs.). Comportamento em Foco, v. 4 (pp. 173- 188). São Paulo: ABPMC. Coelho, C. R. & Wechsler, A., & Amaral, V. L. A. R. (2008). Dizer e fazer: a prática de exercícios físicos em portadores de diabetes mellitus tipo 2. Revista Brasileira de Terapia Comportamental e Cognitiva, 10, 29-38. Cortez, M. D., de Rose, J. C., & Miguel, C. (2014). The role of correspondence training on children’s self-report accuracy across tasks. The Psychological Record, 64, 393402. Cortez, M. D., de Rose, J. C., & Montagnoli, T. A. S. (2013). Treino e manutenção de correspondência em autorrelatos de crianças com e sem história de fracasso escolar. Acta Comportamentalia, 21, 139–157. Critchfield, T. S., & Perone, M. (1990). Verbal self-reports of delayed matching to sample by humans. Journal of the Experimental Analysis of Behavior, 53, 321–344. Brino, A. L. F., & de Rose, J. C. (2006). Correspondência entre auto-relatos e desempenhos acadêmicos antecedentes em crianças com história de fracasso escolar. Revista Brasileira de Análise do Comportamento, 2, 67-77. Critchfield, T. S., & Perone, M. (1993). Verbal self-reports about matching to sample: effects of the number of elements in a compound sample stimulus. Journal of the Experimental Analysis of Behavior, 59, 193–214. Brito, R. L., Medeiros, C. A., Medeiros, F. H., Antunes, R. A. B. & Souza, L. G. (2014). Efeitos da magnitude da punição na correspondência verbal em situação lúdica. In N. Demoly, P. M. (2016). Efeito de perguntas abertas e fechadas na correspondência verbal num jogo de cartas. (Monografia de conclusão de curso). Centro Universitário 236 Capítulo XIV | Correspondência Verbal de Brasília, Brasília. Dias, J. S. (2008). Análise de correspondência entre comer e relatar de crianças. (Dissertação de mestrado). Universidade Católica de Goiás, Goiânia. liminary study. International. Journal of Psychology and Psychological Therapy, 11, 269-284. Domeniconi, C, de Rose, J.C., & Perez, W.F. (2014). Effects of Correspondence Training on Self-Reports of Errors During a Reading Task. The Psychological Record, 64, 381-391. Medeiros, C. A. (2013). Mentiras, Indiretas, Desculpas e Racionalizações: Manipulações e Imprecisões do Comportamento Verbal. In C. E. Costa, C. R. X. Cançado, D. R. Zamignani, S. R. S. Arrabal-Gil (Orgs), Comportamento em Foco v. 2 (pp. 157- 170). São Paulo: ABPMC. Ferreira, J. V. (2009). Correspondência Fazer-Dizer em crianças na resolução de operações matemáticas. (Monografia de conclusão de curso). Centro Universitário de Brasília, Brasília. Medeiros, C.A., Oliveira, J. A., Silva, C. O. (2013). Correspondência verbal em situação lúdica: efeito da probabilidade de checagem. Revista Fragmentos de Cultura, 23, 563-578. Ferreira, M., Neves, S. M. M., Simonassi, L. E., Andrade, M., & Dias, D. O. P. (2014). Análise comparativa da correspondência entre comer e relatar de crianças e adultos. Fragmentos de Cultura, 24, 61-72. Medeiros, F. H. (2012). Contingências de reforçamento positivo e punição negativa na correspondência verbal. (Monografia de conclusão de curso). Centro Universitário de Brasília, Brasília. Leme, R. C., & Pereira, M. E. M. (2012). Correspondência verbal: a relação entre os comportamentos verbal e não verbal de professores. Acta Comportamentalia, 20, 71-85. Paniagua, F. (1990). A procedural analysis of correspondence training techniques. The Behavior Analyst, 13, 107-119. Lloyd, K. E. (2002). A review of correspondence training: suggestions for a revival. The Behavior Analyst, 25, 57–73. López, M. H., Valverde, M. R., & Luciano, C. (2011). Contextual control and generalization of say-do correspondence: A pre- Paniagua, F., & Baer, D. (1982) The analysis of correspondence training as a chain reinforceable at any point. Child Development, 53, 786-798. Pergher, N. K. (2002). De que forma as coisas que nós fazemos são contadas por outras pessoas? Um estudo de correspondência entre comportamento não-verbal e verbal. 237 Carlos Augusto de Medeiros, Lucas Ferraz Córdova (Dissertação de mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo. York: Appleton-Century-Crofts. Ramalho, N. V. R., & Pedroso, R. (2014). Correspondência entre o dizer e o fazer do comportamento do gestor. In C. Vichi, E. Huziwara, H. Sadi, L. Postalli (Orgs.), Comportamento em Foco, v. 3 (pp. 115-126). São Paulo: ABPMC. Souza, R. S., Guimarães, S. S. Antunes, R. A., & Medeiros, C. A. (2014). Correspondência verbal em um jogo de cartas: Perguntas abertas e perguntas fechadas. In N. B. Borges, L. F. G. Aureliano & J. F. Leonardi (Orgs.), Comportamento em Foco, v. 4 (pp. 189-204). São Paulo: ABPMC. Ribeiro, A. F. (1989). Correspondence in children’s self-report: tacting and manding aspects. Journal of the Experimental Analysis of Behavior, 51, 361–367. Wechsler, A. M., Amaral, V. L. A. R. (2008). Dizer X Fazer de mães e filhos em exame médico. Revista Psicologia em Estudo, 15, 55-63. Ricci, L. S. V. & Pereira, M. E. M. (2006). Uma análise da relação entre o dizer e o fazer do professor. Psicologia da Educação, 23, 27-55. Risley, T., & Hart, B. (1968). Developing correspondence between nonverbal and verbal behavior of preschool children. Journal of Applied Behavior Analysis, 1, 267–281. Sadi, H. M. (2002). A correspondência entre o fazer e o dizer no auto-relato de crianças: uma replicação de Ribeiro. (Dissertação de mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo. Sanabio, E. T., & Abreu-Rodrigues, J. (2002). Efeitos de contingências de punição sobre os desempenhos verbal e não verbal. Psicologia: Teoria e Pesquisa, 18, 161-172. Skinner, B. F. (1957). Verbal Behavior. New 238 Marcelo Borges Henriques Do indivíduo ao grupo: simulações experimentais de relações sociais com animais não-humanos Marcelo Borges Henriques Universidade Federal de Goiás Universidade de Brasília Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental Analysis of Behavior, 5, 531-533. “Many social practices essential to the welfare of the species involve the control of one person by another, and no one can suppress them who has any concern for human achievements” (Skinner, 1971/1976, p.45) 239 Capítulo XV | Competição e Cooperação INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO O comportamento social foi tratado por Skinner (1953/2000) como uma forma de comportamento operante, obedecendo os mesmos princípios básicos derivados dos estudos com organismos individuais em interações com um ambiente não-social. Para Skinner, o adjetivo “social” destaca certos aspectos da relação condicional responsável pelo estabelecimento e manutenção do comportamento. No comportamento social, os eventos ambientais que estabelecem, mantém e evocam o comportamento são produzidos por outro indivíduo. Entretanto, as consequências de um comportamento social não precisam ser diretamente fornecidas por outro indivíduo. Há contextos em que a consequência deve ser coproduzida, mediante a coordenação dos comportamentos de pelo menos dois indivíduos. Neste último caso, o efeito ambiental correlacionado com a produção de consequências não é gerado pelo comportamento individual, mas pela coordenação dos comportamentos de dois ou mais indivíduos (i.e., efeito do comportamento grupal). A definição de comportamento social de Skinner (1953/2000) é abrangente e possibilita abordar diferentes tipos de fenômenos sociais, entre eles a competição e cooperação. Uma interação social é denominada competitiva quando o sistema reforçador impõe uma limitação ou impe- dimento de acesso ao reforço para um indivíduo, em função do comportamento de outro indivíduo dentro do mesmo sistema. Já na cooperação, o acesso ao reforço é mútuo, desde que a coordenação entre os indivíduos produza o efeito especificado no sistema (De-Farias, 2005). É provável que o estudante de Psicologia não esteja familiarizado com as definições apresentadas acima, e que apresente certo espanto ao saber que a Análise do Comportamento também trabalha com fenômenos sociais. É comum o desconhecimento de que, em artigos e livros escritos por Skinner, o principal tema é o homem em sociedade. Aproximadamente um terço do livro Ciência e Comportamento Humano (Skinner, 1953/2000) – um dos principais livros introdutórios do Behaviorismo Radical – foi dedicado à análise do comportamento de indivíduos em grupo (e.g., capítulos 19 à 29). Além disso, Skinner (1938), no início de seu programa de pesquisas, deixou claro que “a importância de uma ciência do comportamento deriva-se, em grande parte, da possibilidade de uma eventual extensão às questões humanas” (p. 441). Talvez o espanto inicial se dê pela forma típica pela qual a Análise do Comportamento é apresentada à comunidade acadêmica: O famoso laboratório didático. Por meio de experimentos demonstrativos, virtuais ou reais, estudantes são ensinados a observar, descrever e controlar o comportamento de organismos não-humanos 240 Marcelo Borges Henriques individuais (tipicamente, ratos albinos). Estudantes que tiveram seu primeiro contato com a área por meio do laboratório didático devem se perguntar: “Ok, mas como pode uma teoria que só faz experimentação com animais não-humanos individuais ser utilizada para explicar relações sociais humanas? Como o trabalho experimental com animais não-humanos pode ser estendido ao comportamento humano, incluindo as relações sociais”? O estudante que se vê incomodado com estas questões está manifestando uma desconfiança legitima que merece alguns esclarecimentos. Há pelo menos duas possibilidades para explicar por quê o estudante se sente incomodado com a extensão de princípios derivados de pesquisas com animais não-humanos. Uma delas é a má compreensão sobre a teoria evolutiva, que o leva a expressar uma concepção de que seres humanos são animais “superiores” na escala evolutiva. Se fossemos mais complexos, superiores e especiais, então seria impossível explicar o comportamento humano por meio de estudos com outros animais, certo? Contudo, este é um erro comum de interpretação. A continuidade filogenética ou escala evolutiva não é linear. A continuidade filogenética é representada por árvores, cada galho representando ramificações de linhas prováveis de ascendência evolutiva. Uma característica importante da escala é a consideração de descontinuidades como resultado da divergência de linhas evolutivas, e a extinção de muitas formas interme241 diárias de vida. Portanto, por si só, no que diz respeito a qualquer medida de gradação de complexidade, a escala não dá nenhuma indicação do grau de complexidade dos organismos listados. A escala não é em termos de complexidade, mas de tempo: o momento provável na história do planeta em que cada espécie surgiu e que semelhanças cada uma guarda com outras espécies extintas e vivas (Hodos & Campbell, 1969). Portanto, o homem não é mais complexo que outros animais, ele é simplesmente distinto. A singularidade de cada espécie também não pode ser usada como ataque contra a extensão de princípios. Os princípios da seleção natural são aplicáveis a qualquer organismo vivo, independentemente de suas especificidades. O mesmo poderia ser dito sobre os princípios comportamentais básicos. Uma das premissas centrais na Análise Comportamento é a ideia de que os processos comportamentais são adaptações biológicas selecionadas. O comportamento é uma das propriedades mais importantes da vida dos organismos, uma vez que é um meio de ligação com o seu ambiente. Poderíamos dizer que o comportamento desempenha um papel crítico na evolução dos organismos vivos e, por isso, os processos de aprendizagem foram selecionados assim como outras características adaptativas (Skinner, 1984). Logo, é possível abstrair das pesquisas com animais não-humanos princípios que operam na seleção de comportamentos de qualquer espécie animal. Isto não significa que não hajam singularidades. Capítulo XV | Competição e Cooperação Entretanto, as singularidades se dão naquilo que cada organismo é capaz de fazer e dos eventos no mundo que são, e se tornam, relevantes para cada espécie (Sidman, 1960/1976). O segundo ponto responsável pelo incomodo é a falta de conhecimento sobre as táticas de pesquisa em Análise do Comportamento. Os estudantes de Psicologia têm em comum a noção errada de que os pesquisadores em Psicologia devem trabalhar com humanos em situações mais próximas às reais. Caso o pesquisador opte por trabalhar com animais não-humanos, os experimentos deveriam gerar comportamentos análogos aos dos seres humanos, pois esta seria a única maneira de se encontrar generalidade. Entretanto, quando o assunto é a generalidade do dado científico, a analogia não é um ingrediente necessário (Sidman, 1960/1976). Para demostrar a generalidade de um processo, o cientista buscará a replicação experimental do dado. Uma das principais características das pesquisas em Análise do Comportamento é a utilização do próprio comportamento do sujeito experimental como fonte de comparação dos efeitos das variáveis independentes. Mesmo que o pesquisador observe mudanças comportamentais em função da introdução de uma manipulação experimental, ele não estará seguro até que uma replicação seja feita. Um primeiro passo, seria reproduzir a mudança comportamental ocasionada pela manipulação da variável independente com o mesmo indivíduo. Se a replicação é bem sucedida com o mesmo indivíduo, e com outros indivíduo de uma mesma espécie, então o pesquisador poderia analisar a generalidade do dado manipulando outros parâmetros da variável independente. Após sucessivas replicações o cientista poderia se questionar se a variável independente produziria o mesmo processo em indivíduos de outras espécies. Cada descoberta de similaridades processuais é uma instância a mais de generalidade (Sidman, 1960/1976). Como o uso de animais não-humanos não compromete a compreensão da singularidade humana nem é um problema para a generalidade dos dados, eles são amplamente utilizados não só na Análise do Comportamento mas também em outras ciências. Animais não-humanos são utilizados na pesquisa experimental pois o controle de variáveis independentes pode ser mais facilmente alcançado, há possibilidade de controle genético e de história de vida, além da possibilidade de se investigar os efeitos de variáveis que seriam impossibilitadas por questões éticas em pesquisas com humanos (Hake, 1982; Lattal, 2001). A pesquisa comportamental com animais não-humanos desempenha um papel central em muitas áreas de interesses humanos, incluindo aprendizagem, psicopatologia e neurofisiologia. Quase todas as técnicas eficazes em uma ampla variedade de interesses aplicados tem suas origens na pesquisa básica com animais não-humanos 242 Marcelo Borges Henriques (Domjan & Purdy, 1995). Até então estivemos apresentando os motivos e as vantagens de se utilizar animais não-humanos em pesquisas comportamentais. Espera-se que, nesse momento, o estudante de Psicologia esteja em melhores condições de compreender que o estudo de questões sociais também podem ser abordados nos mesmos moldes. O pesquisador analista do comportamento poderia se perguntar sobre a possibilidade de simular contingências sociais tipicamente humanas em animais não-humanos. Esta seria uma maneira de investigar variáveis relevantes para a ocorrência daquilo que é adjetivado como social. Por exemplo, o pesquisador poderia se perguntar se a linguagem é um aspecto essencial das relações sociais. Porem, se dois animais não-humanos apresentarem comportamento social tipicamente humano, somente pelo controle de contingências de reforçamento, então esse aspecto poderia ser questionado como um critério necessário e suficiente para explicar o fenômeno social estudado. Portanto, a ciência estaria mais próxima de compreender as variáveis envolvidas no fenômeno humano (Herrnstein, 1964). O exercício de simular contingências sociais humanas com animais não-humanos chegou a ser realizado por Skinner, que descreveu um experimento sobre cooperação com pombos no livro Ciência e Comportamento Humano (Skinner, 1953/2000). Como este e outro experimento estavam 243 sendo constantemente descritos na literatura comportamental, Skinner ponderou que seria aconselhável um relato mais explícito dos experimentos. Assim, em 1962, ele publicou, no Journal of the Experimental Analysis of Behavior, o artigo que será descrito a seguir. Vale ressaltar que esse artigo não foi o primeiro trabalho na literatura analítico-comportamental sobre comportamentos sociais com animais não-humanos. Daniel (1942) foi um dos primeiros autores a argumentar ter obtido comportamento cooperativo em ratos em uma situação experimental. O que torna o artigo de Skinner singular é a inclusão de um experimento sobre competição e o tipo de contingência cooperativa (i.e., o sistema reforçador mútuo). Além do mais, Skinner utilizou pombos ao invés de ratos, o que por si só torna o experimento interessante em termos de replicação entre espécies e generalidade dos dados. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método O artigo de Skinner (1962) descreve dois experimentos demonstrativos, utilizados para ilustrar princípios comportamentais para estudantes da Universidade de Harvard. Como os experimentos eram demonstrativos, não há no artigo um relato claro dos procedimentos, nem apresentação de dados quantitativos. O objetivo dos experimentos foi demostrar que comportamento social análogo ao de humanos pode Capítulo XV | Competição e Cooperação ser obtido com animais não-humanos por meio do controle de variáveis ambientais. O Experimento de Competição O primeiro experimento relatado por Skinner (1962) procurou simular um jogo de pingue-pongue com pombos, um contexto competitivo típico do comportamento social em humanos. O equipamento foi descrito como uma versão “minimamente” mecanizada de um equipamento já existente. O diferencial do equipamento utilizado por Skinner era que a bola era movida pelos próprios sujeitos, e não por um dispositivo motor. O equipamento consistia basicamente em uma mesa com altura conveniente aos animais e com uma leve inclinação partindo do centro para ambos os lados. Dois pombos podiam ser posicionados um frente ao outro, prevenindo que os pombos pudessem voar ou se deslocar de suas posições sobre o equipamento. Uma bola de pingue-pongue podia ser posicionada no centro da mesa de tal forma que quando solta, poderia rolar para qualquer um dos lados. Alguns centímetros antes do final da mesa, em ambos os lados, havia uma calha onde a bola poderia cair. Ao cair na calha, um interruptor ali localizado acionava o comedouro do lado oposto, fornecendo alimento para o pombo ali posicionado. Os passos para se obter a relação competitiva entre os pombos foram sucintamente descritos no artigo. Os pombos eram privados de alimento para controle de peso corporal. O primeiro passo foi condicionar os pombos, separadamente, a bicar uma bola de pingue-pongue padrão, fixada à borda da mesa. O passo seguinte foi alternar a posição da bola ao longo da borda da mesa e, posteriormente, a bola era deixada livre para rolar. No momento em que a bola era deixada livre, o comportamento dos pombos somente era reforçado se a bola rolasse para um ponto predeterminado, ligeiramente distante da borda. Depois de o pombo conseguir jogar a bola para além do centro da mesa, o esquema de liberação do reforçamento era modificado para ter certa intermitência (i.e., nem todas as respostas eram reforçadas). Somente após a manutenção do repertório de jogar a bola para a calha, localizada no lado oposto da mesa, foi que os pombos foram expostos ao sistema competitivo. A nova condição experimental implicava em colocar ambos pombos um de frente ao outro e deixar a bola rolar em direção a qualquer um dos animais, o qual poderia bicar a bola em direção ao lado oposto. A obtenção dos reforços (i.e., alimento) fazia analogia à obtenção de pontos no jogo de pingue-pongue. Na contingência competitiva o comportamento de um indivíduo era reforçado em detrimento do outro, ou seja, a “vitória” de um implicava a “derrota” do outro. Uma vez que a razão de reforços produzidos por cada pombo poderia ser extremamente desproporcional, o comportamento do pombo mal sucedido poderia entrar em extinção. Sendo assim, as parti244 Marcelo Borges Henriques das eram mantidas por meio do controle de peso dos animais, aumentando a privação do pombo frequentemente derrotado ou diminuindo a privação do pombo frequentemente bem sucedido. Resultados e Discussão A descrição de Skinner (1962) é anedótica e relata o que o público em geral poderia observar da situação. Uma vez estabelecida a história de interação com o ambiente experimental e colocados um de frente ao outro, em lados opostos, cada pombo bicava efetivamente a bola de pingue-pongue, jogando-a para o lado oposto. Os pombos bicavam a bola de um lado para o outro até que ela eventualmente rolasse para dentro da calha no lado oposto. Skinner relata que os animais rebatiam a bola em sequências de cinco a seis rebatidas. Entretanto, o autor não observou evidências de variações (e.g., em termos de velocidade ou direção) nas bicadas dos pombos de modo a produzir a derrota do adversário. O Experimento de Cooperação O segundo experimento descrito por Skinner (1962) foi uma simulação do fenômeno cooperativo. O equipamento consistia em duas câmaras experimentais unidas lado a lado, separadas por uma divisão transparente. Em cada compartimento encontrava-se uma fileira vertical de três discos de resposta vermelhos, e abaixo de cada arranjo de discos o comedouro que dava 245 acesso ao alimento. Dois pombos privados de alimento foram treinados separadamente a bicar os discos. Somente um dos três discos funcionava por vez de uma maneira semialeatória. Após o estabelecimento da resposta de bicar os discos, os pombos foram colocados juntos no equipamento com uma nova contingência em vigor. A contingência cooperativa não só exigia que os pombos “encontrassem” qual dos três discos estava em funcionamento, mas também que as respostas de ambos os pombos ocorressem com uma diferença de meio segundo (0,5 s) uma da outra em discos correspondentes. A relação condicional programada na contingência cooperativa era a seguinte: se bicadas ≤ 0,5 s uma da outra, em discos correspondentes, então comida para ambos; se bicadas > 0,5 s uma da outra ou em discos diferentes, então comida não era produzida. Procedimentos de privação foram aplicados a ambos pombos (e.g., um dos pombos poderia ser submetido a um nível de privação maior do que o outro), de modo a alterar a frequência e alternância de bicadas entre eles. Resultados e Discussão Skinner (1962) descreve que após uma prolongada exposição à contingência cooperativa, os pombos passavam a bicar discos correspondentes quase que simultaneamente. Skinner também observou uma divisão de trabalho entre os dois pombos. Um dos pombos explorava os discos sendo sempre o primeiro a bicar, e o outro pombo Capítulo XV | Competição e Cooperação seguia as respostas do primeiro bicando o disco correspondente. A divisão de trabalho foi invertida manipulando o nível de privação. O pombo mais privado aumentava a frequência de exploração dos discos de forma que o antigo “líder” passava a seguir os discos bicados pelo pombo agora mais privado. Segundo o relato de Skinner, a coordenação dos pombos se tornou tão perfeita que dava a impressão de se estar observando um espelho. Em sua interpretação, o primeiro pombo a bicar um disco fornecia estímulos discriminativos para o segundo pombo bicar no disco correspondente. Por último, Skinner (1962) descreve que a dupla de pombos desenvolvia um repertório de imitação generalizado em função do controle de privação, que gerava a alternância da liderança. A alternância da liderança estabelecia um contexto em que o comportamento de ambos fosse controlado pelo comportamento um do outro. Skinner menciona que quando bebedouros eram disponibilizados para cada pombo na câmara experimental, eles passavam a beber água simultaneamente. Se os sujeitos experimentais fossem colocados do lado oposto aos discos, virados para o fundo transparente das câmaras, ambos começavam a fazer movimentos exploratórios como uma imagem no espelho. DESDOBRAMENTOS O experimento de Skinner (1962) que teve maior influência em pesquisas subsequentes foi o experimento sobre cooperação. O procedimento e os resultados obtidos por Skinner estabeleceram o contexto para perguntas sobre os princípios básicos envolvidos em comportamentos sociais, tais como a cooperação e aprendizagem social, por exemplo. Como no estudo de Skinner (1962) o comportamento do pombo “líder” não foi manipulado assim como é comum em um estudo sobre controle de estímulos, não é claro em que medida o comportamento do pombo denominado de “seguidor” estava sob controle do comportamento do pombo “líder”. Há a possibilidade de que outros fatores no ambiente experimental tenham exercido controle sobre o comportamento dos pombos. Tanto na imitação quanto na cooperação é imprescindível que ao menos um dos indivíduos emita respostas sob controle discriminativo dos comportamentos do outro indivíduo. Para pesquisadores como Danson e Creed (1970), Hake, Donaldson e Hyten (1983), Husted e Mckenna (1966), Wiest (1969) e Nakashika (2004), o aspecto central da análise de interações sociais, como a relatada por Skinner (1962) no experimento de cooperação, é o controle discriminativo. O objetivo desses autores foi verificar se animais não-humanos poderiam ser condicionados a emitir uma resposta sob controle do comportamento de outro indivíduo da 246 Marcelo Borges Henriques mesma espécie (um estímulo social). Todos os autores encontraram evidências de que diferentes animais podem discriminar estímulos sociais de coespecíficos, sejam eles a presença vs. a ausência de outro indivíduo (e.g., Husted & Mckenna, 1966, com ratos), a diferença na taxa de repostas emitida por outro indivíduo (e.g., Danson & Creed, 1970, com macacos-esquilo) ou a localização da resposta do outro indivíduo (e.g., Nakashika, 2004, com pombos). É verdade que os estudos de Danson e Creed (1970), Hake, et.al. (1983), Husted e Mckenna (1966), Wiest (1969) e Nakashika (2004) apresentam uma diferença crucial em relação ao experimento de cooperação de Skinner (1962). A contingência social criada pelos autores nestes estudos era uma contingência individual. Os pesquisadores pré-definiam os papéis desempenhados por cada sujeito no experimento. O comportamento de um sujeito servia como fonte de estímulos, e o comportamento do outro servia como variável dependente do treino de controle de estímulos. O animal cujo comportamento servia como um estímulo discriminativo estava exposto à sua própria contingência. Já o comportamento do sujeito experimental era reforçado diferencialmente para responder a determinadas características do comportamento do sujeito-estímulo (e.g., em Danson & Creed, 1970, a taxa alta de respostas do sujeito-estímulo sendo o estímulo discriminativo e a taxa baixa sendo o estímulo delta, i.e., na presença da qual reforços não eram produ247 zidos). No estudo de cooperação de Skinner, o reforço era contingente à produção de um efeito ambiental que só podia ser produzido com o comportamento conjunto dos indivíduos. Entretanto, os estudos citados acima (e.g., Danson & Creed, 1970; Husted & Mckenna, 1966) são úteis para discutir o resultado do estudo sobre cooperação de Skinner (1962): esses estudos discutem a dificuldade de se gerar evidências de controle discriminativo por estímulos sociais. Quando o estímulo não é o comportamento de outro indivíduo, há a possibilidade de se controlar diferentes dimensões do estímulo, de forma que ele seja padronizado de apresentação à apresentação (e.g., intensidade do comprimento de onda luminosa, o intervalo de tempo entre apresentações dos estímulos, entre outras). Quando o estímulo é o comportamento de outro indivíduo, inúmeras propriedades podem ser diferentes de ocorrência a ocorrência, além da dificuldade se isolar o evento de outros estímulos não sociais presentes no experimento (e.g., a localização das respostas é um estímulo não social que pode exercer controle sobre o comportamento do outro indivíduo pelo emparelhamento entre local e disponibilidade de alimento), dificultando interpretações. Hake, et al. (1983), por exemplo, argumentaram que os resultados dos estudos sobre comportamento social, de maneira geral, Capítulo XV | Competição e Cooperação (...) sugerem que as futuras pesquisas dução de consequências?. sobre interações sociais, tais como cooperação e competição deveriam proporcionar o treino e/ou testes de controle por parte do comportamento apropriado do outro sujeito ao invés de assumir que tal controle existe, como tem sido frequentemente o caso” (p. 22). Sem uma evidência para além do relato de aquisição de coordenação entre os animais não-humanos, é possível questionar em que medida um sujeito está efetivamente respondendo ao comportamento do outro. Esta pergunta é essencial para que possamos aceitar o estudo com animais não-humanos como um modelo experimental de relações sociais humanas. Se os pombos do experimento de cooperação de Skinner (1962) tivessem adquirido uma alta taxa de respostas alternadas, em função do treino individual anterior, eles poderiam, ao acaso, atender ao critério de reforçamento mútuo. A manipulação da privação que gerava alternância na liderança poderia ser somente um caso de mudança na frequência de exploração dos discos pelo pombo anteriormente no papel de seguidor. Neste caso, não haveria relação social ou cooperativa entre os pombos. Portanto, uma pergunta que poderia ser derivada do estudo de Skinner é: A ocorrência da resposta cooperativa foi casual ou ambos indivíduos estão efetivamente respondendo ao comportamento um do outro de modo a gerar o efeito ambiental correlacionado com a pro- Em um estudo mais recente, Tan e Hackenberg (2016) demostraram preocupação com a possibilidade da explicação alternativa para o comportamento cooperativo. Os autores estudaram pares de ratos utilizando caixas experimentais paralelas, divididas por uma parede de acrílico transparente, e em cada compartimento havia somente uma barra. A contingência cooperativa era semelhante à de Skinner (1962), pois reforços somente poderiam ser produzidos se a pressão à barra de ambos os ratos fosse separada por 0,5 s. Cada par foi exposto a três condições em um delineamento do tipo ABACA (i.e. “A” sendo a condição de reforçamento mútuo ou contingência cooperativa, “B” um esquema acoplado de tempo variável, em que os reforços independiam das respostas, e “C” um esquema acoplado de intervalo variável, em que os reforços dependiam das respostas, mas neste caso, sem a contingência cooperativa). As condições “B” e “C” do estudo serviram como condições de controle, pois serviam como fonte de comparação do repertório adquirido na contingência cooperativa. Se a frequência de cooperação entre os ratos fosse casual, então a frequência de cooperação deveria se manter relativamente inalterada mesmo diante de outra contingência. Os esquemas acoplados permitem controlar a taxa de reforços do esquema, tendo com base a taxa de reforços obtidos em um outro esquema. Este procedimento permite ao pesquisador verificar se um padrão de comportamento é 248 Marcelo Borges Henriques função da distribuição de reforços no tempo ou da relação condicional entre o comportamento e a produção de consequências (ver Catania, 1999, p. 183). No procedimento de Tan e Hackenberg (2016), a resposta de um dos ratos abria um intervalo de tempo que era registrado até que o segundo rato pressionasse sua barra. Esse registro gerou duas unidades de medida: a proporção de intervalos menores do que 0,5 s entre as respostas de ambos os ratos, e o número de alternâncias entre as respostas, independentemente do critério de 0,5 s (i.e., nas condições “B” e “C”, a ocorrência do reforço interrompia o registro, independentemente do segundo indivíduo ter emitido uma resposta). O dado obtido foi favorável à contingência cooperativa. Quando a contingência provia reforçamento para a coordenação entre as respostas dos ratos, a frequência de respostas grupais era significativamente maior do que nas outras condições, mesmo a distribuição de reforços sendo controlada pelo acoplamento em vigor nas condições B e C. Quanto ao número médio de respostas de alternância, observou-se que a alternação de respostas foi maior na condição cooperativa, mas diminuiu consideravelmente nas condições dos esquemas acoplados (i.e., o número de respostas individuais aumentou). Os resultados indicam que a contingência cooperativa promovia o entrelaçamento entre as respostas dos animais, ou seja, um rato pressionava a barra sob controle da resposta do outro rato. O dado 249 enfraquece a explicação alternativa de simultaneidade ao acaso. Mesmo assim, é possível enfatizar a importância de garantir que o efeito no ambiente seja efetivamente fruto de controle social mútuo. Embora os resultados do estudo de Tan e Hackenberg demonstrem que a contingência cooperativa foi responsável pelo estabelecimento da resposta grupal, não se pode deixar de destacar que o número de respostas coordenadas fora do critério foi muito maior, mesmo os pesquisadores tendo considerado o desempenho em estado estável. Portanto, o cuidado em demostrar que ambos animais não-humanos estão efetivamente respondendo um ao comportamento do outro permanece. CONSIDERAÇÕES FINAIS Pesquisas que simulam interações sociais humanas com animais não-humanos, como a apresentada neste capítulo, testam o alcance dos conceitos básicos na explicação de fenômenos sociais e expandem nossa compreensão dos processos que seriam relevantes no comportamento humano. É uma maneira de explorar os limites dos processos comportamentais ou de encontrar fenômenos que, em tese, só poderiam ser observados em humanos. Ao longo do capítulo procuramos exemplificar por meio da apresentação de um artigo clássico (Skinner, 1962), e sua influência em pesquisas sobre cooperação na Capítulo XV | Competição e Cooperação Análise do Comportamento, que é possível desenvolver pesquisas analítico-comportamentais de fenômenos sociais com animais não-humanos. Pôde-se discutir que o uso de animais não-humanos em pesquisas analítico comportamentais torna-se uma ótima oportunidade de se determinar a extensão na qual os princípios comportamentais básicos podem se constituir em explicações válidas sobre o comportamento social observado em humanos. Ademais, os trabalhos citados no texto são um bom exemplo de que a replicação sistemática e a utilização de diferentes espécies de animais não-humanos é o caminho para se ampliar a generalidade dos princípios comportamentais básicos aplicados ao estudo de fenômenos sociais. O artigo de Skinner (1962) é importante para a Análise do Comportamento não só por fomentar a pesquisa experimental sobre comportamentos sociais, mas pela relação condicional inovadora criada no estudo. A contingência cooperativa elaborada por Skinner possibilita um olhar diferente para a contingência de reforçamento. Enquanto esta última diz respeito ao comportamento de organismos individuais, a contingência cooperativa provê reforços para o comportamento conjunto de organismos. Neste sentido, a unidade de análise não é mais o comportamento individual, mas o comportamento grupal. Estudos experimentais sobre seleção de comportamentos grupais podem contribuir para o melhor entendimento de alguns aspectos da seleção de determinadas práticas culturais. O modelo inovador de programação de relações condicionais no nível grupal vem sendo testado em novas áreas, como no estudo de metacontingências (e.g., Henriques, Navarini, Souza & Todorov, 2015, Todorov & Vasconcelos, 2015, Toledo, et al., 2015, Velasco, Benvenuti & Tomanari, 2012). Embora a demonstração de controle por estímulos sociais seja, em alguma medida, um desafio para os pesquisadores da área (Hake, et al., 1983), o processo de seleção por consequências continua valendo na explicação do comportamento social. O que há de especial em interações sociais é a dificuldade de padronização no controle de estímulos. Estímulos sociais são mais difíceis de se manipular do que os não sociais, pois suas dimensões podem não ser tão consistentes de uma apresentação à outra e são comumente “contaminados” por estímulos não sociais (e.g., o som produzido pela operação do equipamento; Danson & Creed, 1970; Hake, et al., 1983). Entretanto, a dificuldade da tarefa do pesquisador não denota que sejam necessários constructos psicológicos hipotéticos para se explicar o comportamento social humano. Pesquisas com animais não-humanos caminham na direção do abandono de constructos hipotéticos por uma explicação baseada na descrição de relações condicionais entre o comportamento de indivíduos e grupos e variáveis ambientais relevantes (Herrnstein, 1964). 250 Marcelo Borges Henriques PARA SABER MAIS Epstein (1981). Este artigo divulga parte das pesquisas realizadas no projeto Columban Simulations. O projeto consistiu em simular, com pombos, comportamentos exclusivamente humanos como a “comunicação simbólica”, “insight”, “autoconsciência”, e o “uso espontâneo de memorandos” para determinar os princípios comportamentais responsáveis pela ocorrência de tais fenômenos. O autor discute a implicação dos dados para a Psicologia e como o uso de simulações com animais não-humanos pode contribuir para uma melhor compreensão do comportamento humano. Schmitt (1998). Este capítulo apresenta uma contextualização conceitual dos termos “cooperação” e “competição” como um dos principais fenômenos sociais estudados pela Análise do Comportamento. Ademais, discute os principais procedimentos utilizados com humanos, as variáveis independente e dependente e compila os principais resultados de pesquisas. Schmitt & Marwell (1968). Os autores utilizaram uma tarefa experimental similar à de Skinner (1962) com humanos. O objetivo foi verificar se a estrutura do procedimento utilizado com animais não-humanos e humanos poderia oferecer uma explicação alternativa (e.g., a casualidade na coordenação das respostas) ao aumento da frequência da resposta cooperativa. Cada um dos seis pares de participantes foram sub251 metidos a dois procedimentos: Um procedimento típico, em que cada oportunidade de resposta cooperativa era separada por um timeout; e um procedimento modificado em que os participantes deveriam responder, necessariamente, ao estímulo (i.e., um luz) produzido pelo parceiro para que uma resposta cooperativa fosse registrada. Por meio dos dados foi possível concluir que a resposta grupal (cooperativa) é dependente da presença de estímulos sociais (i.e., eventos no ambiente experimental gerados pelo comportamento de outro indivíduo). Outra conclusão a que se pôde chegar é a necessidade de realçar o estímulo social (em vez de utilizar o deslocamento motor como estímulo, utilizar produtos físicos do comportamento, como uma luz que se acende quando uma resposta é emitida por qualquer um dos indivíduos) em experimentos derivados da contingência cooperativa de Skinner. Łopuch & Popik (2011). O estudo é interessante por ser uma pesquisa externa à Análise do Comportamento. Apesar de utilizar um referencial teórico mais próximo à etologia, os autores utilizam procedimentos operantes semelhantes ao de Skinner (1962). Os pesquisadores avaliaram o efeito de condições de restrição de contato físico, visual e auditivo sobre a resposta cooperativa. Com base nos dados obtidos foi possível concluir que as respostas cooperativas foram mais frequentes quanto maior a possibilidade de contato social, e que a vocalização dos animais pode ter sido um fator Capítulo XV | Competição e Cooperação facilitador das respostas cooperativas. REFERÊNCIAS Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto Alegre, RS: Artmed. Daniel, W. J. (1942). Cooperative problem solving in rats. Journal of Comparative Psychology, 34, 361-368. Danson, C., & Creed, T. (1970). Rate of response as a visual social stimulus. Journal of the Experimental Analysis of Behavior, 13, 233-242. De-Farias, A. K. C. R. (2005). Comportamento social: Cooperação, competição e trabalho individual. In J. Abreu-Rodrigues & M. R.Ribeiro. Análise do Comportamento: Pesquisa, teoria e aplicação (pp. 265-281). Porto Alegre: Artmed. Behavior Analyst, 5, 21. Hake, D. F., Donaldson, T., & Hyten, C. (1983). Analysis of discriminative control by social behavioral stimuli. Journal of the Experimental Analysis of Behavior, 39, 7- 24. Henriques, M. B., Navarini, V., Souza, M. C. G. & Todorov, J. C. (2015). Inter- aggregate-product-time distribution as a function of differential reinforcement of temporally spaced aggregate products. Painel apresentado na Reunião Anual da Society for the Quantitative Analyses of Behavior, San Antonio, Texas. Herrnstein, R. J. (1964). Will. Proceedings of the American Philosophical Society, 455458. Hodos, W., & Campbell, C. B. (1969). Scala naturae: Why there is no theory in comparative psychology. Psychological Review, 76, 337. Domjan, M., & Purdy, J. E. (1995). Animal research in psychology: More than meets the eye of the general psychology student. American Psychologist, 50, 496–503. Husted, J. R., & McKenna, F. S. (1966). The use of rats as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 9, 677-679. Epstein, R. (1981). On pigeons and people: A preliminary look at the Columban Simulation Project. The Behavior Analyst, 4, 43. Lattal, K. A. (2001). The human side of animal behavior. The Behavior Analyst, 24, 147-161. Hake, D. F. (1982). The basic-applied continuum and the possible evolution of human operant social and verbal research. The Łopuch, S., & Popik, P. (2011). Cooperative behavior of laboratory rats (Rattus norvegicus) in an instrumental task. Journal of 252 Marcelo Borges Henriques Comparative Psychology, 125, 250-253. Nakashika, N. (2004). Pigeon’s behavior as a discriminative stimulus. International Journal of Comparative Psychology, 17. 369-377. Schmitt, D. R., & Marwell, G. (1968). Stimulus control in the experimental study of cooperation. Journal of the Experimental Analysis of Behavior, 11, 571-574. Schmitt, D. R. (1998). Social behavior. In K. A. Lattal & M. Perone (Eds.). Handbook of research methods in human operant behavior (pp. 471-505). US: Springer. Sidman, M. (1976). Táticas da pesquisa científica: Avaliação dos dados experimentais na psicologia. São Paulo: Brasiliense. (Original publicado em 1960) Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York: Appleton-Century-Crofts. Skinner, B. F. (2000). Ciência e comportamento humano. São Paulo: Martin Fontes (Original publicado em 1953). Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental Analysis of Behavior, 5, 531-533. Skinner, B. F. (1976). Beyond freedom and dignity. Harmondsworth: Penguin Books. (Original publicado em 1971). 253 Skinner, B. F. (1984). The evolution of behavior. Journal of the Experimental Analysis of Behavior, 41, 217-221. Tan, L., & Hackenberg, T. D. (2016). Functional analysis of mutual behavior in laboratory rats. Journal of Comparative Psychology, 130, 13–23. Todorov, J. C., & Vasconcelos, I. (2015). Experimental analysis of the behavior of persons in groups: Selection of an aggregate product in a metacontingency. Behavior and Social Issues, 24, 111-125. Toledo, T. F. N., Benvenuti, M. F. L., Sampaio, A. A. S., Marques, N. S., Cabral, P. A. A., Araújo, L. A. de S., … Moreira, L. R. (2015). Free Culturant : A software for the experimental study of behavioral and cultural selection. Psychology & Neuroscience, 8, 366–384. Velasco, S. M., Benvenuti, M. F., & Tomanari, G. Y. (2012). Metacontingencies, experimentation and nonhumans: Searching for conceptual and methodological advances. Revista Latinoamericana de Psicología, 44, 25-34. Wiest, W. M. (1969). Socially mediated stimulus control in pigeons. Psychological Reports, 25, 139-148. Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva Metacontingências: investigação experimental da seleção cultural Fábio Henrique Baia Alina Barboza Cabral Bianco Isabella Guimarães Lemes Poliana Ferreira da Silva Universidade de Rio Verde Vichi, C., Andery, M. A. P. A., Glenn, S. S. (2009). A metacontingency experiment: The effects of contingent consequences on patterns of interlocking contingencies of reinforcement. Behavior and Social Issues, 18, 41-57. “É o efeito sobre o grupo e não as consequências reforçadoras para seus membros, o responsável pela evolução da cultura” (Skinner, 1981, p. 215) 254 Capítulo XVI | Cultura INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO consequências. Tal modelo especifica três níveis de seleção comportamental: filogenia, ontogenia e cultura. A Análise do Comportamento é uma ciência que tem o comportamento dos organismos como seu objeto de estudo (Baum, 2006). Para um analista do comportamento, o comportamento não carece de elementos externos a sua definição para ser compreendido (e.g., Skinner, 1974). A definição de comportamento envolve a relação entre ambiente e organismo (Pierce & Cheney, 2008; Skinner, 1953). Portanto, a explicação do comportamento não envolve outros elementos que não sejam eventos ambientais e eventos do organismo. Por exemplo, vejamos o caso de alguém afirmar que o comportamento é causado por “pensamento” ou “sentimento”. Neste caso, “pensamento” ou “sentimento” seriam externos ao comportamento. E assim, para essas pessoas os pensamentos deveriam ser compreendidos fora da definição de comportamento. Para analistas do comportamento pensamentos são um tipo de comportamento – chamados eventos privados – que devem ser explicados dentro da definição relacional entre ambiente e organismo (Tourinho, 2009), e não como algo que causa essa relação. No Behaviorismo Radical, o termo “radical” faz referência à “raiz”, isto é, o comportamento é investigado como um objeto de estudo legítimo (Chiesa, 2006) e não como um acessório explicativo para outros fenômenos – como desejos e sentimentos. Skinner (1981) propôs o modelo explicativo de seleção por A filogenia envolve a história da espécie (Mayr, 2009). Nesse nível de seleção, comportamentos que permitiram a sobrevivência da espécie foram selecionados e passaram a compor o repertório dos organismos (Melo, Dittrich, Moreira, & Martone, 2013). Vejamos o caso do reflexo de sucção. Imagine a situação hipotética de dois grupos de recém-nascidos em um período passado longínquo. Um grupo nasceu – graças à mutação – com a capacidade de sugar dada a apresentação de algo em sua boca, como o seio da mãe. O outro grupo nasceu sem essa capacidade. Quais bebês tem mais chance de sobreviver? Certamente aqueles do grupo com a capacidade de sugar, já que não terão que aprender esse comportamento. Esses, portanto, serão capazes de mamar segundos após o parto. Esses bebês terão mais chance de chegar a fase adulta, se reproduzir e transmitir a seus descendentes essa capacidade. Já os outros bebês dificilmente conseguiram mamar e morrerão antes mesmo de se chegarem à vida adulta. A ontogenia diz respeito à história de vida de um organismo. Neste caso, estímulos que antes não eram capazes de eliciar respostas podem adquirir essa capacidade se contingenciados a estímulos que eliciam respostas. No exemplo do choro, o médico por si só é incapaz de eliciar o choro em recém-nascidos. Mas se repetidamente o mé255 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva dico der tapas no bumbum do bebê, após algumas tentativas, a mera presença do médico poderá disparar a resposta de choro na criança. Note que bebês não nascem com a capacidade de chorar dada a mera presença do médico, mas em sua vida, se a situação acima ocorrer, então o recém-nascido aprenderá a chorar dada a presença do médico. Outra possibilidade de aprendizagem de comportamentos durante a história de vida se dá pela relação contingente entre respostas e suas consequências. O bebê, ao chorar, é colocado no seio da mãe, com isso passa a ter acesso ao leite materno. Essa relação estabelecerá que a resposta de chorar tem como consequência o alimento (Tourinho, 2009). Portanto, no futuro, em situações nas quais o bebê estiver privado de alimento, ele provavelmente emitirá a resposta de chorar que no passado foi reforçada com a apresentação de alimento. O terceiro nível de seleção descrito por Skinner (1981) é a cultura. Por cultura, entende-se a manutenção do ambiente social de um grupo (Andery, 2011). Nesse sentido, comportamentos são selecionados por atenderem critérios sociais de reforçamento e punição estabelecidos por um dado grupo de indivíduos. Por critérios sociais nos referimos a situações nas quais o comportamento de um organismo é reforçado ou punido por consequências que são mediadas por outros indivíduos. 256 No caso do choro, uma pessoa pode aprender durante sua história de vida a chorar se esta resposta produzir como consequência retirada da demanda de trabalho. Porém, em um grupo de pesquisas, ao chorar após a demanda do orientador, os demais membros do grupo podem punir o comportamento da colega reclamando da mesma. Assim, o grupo estabelece que tal resposta é passível de punição. Ou seja, o ambiente social criado pelos membros do grupo de pesquisa estabelece condições para supressão de comportamentos. Este exemplo ilustra a tradição de analistas do comportamento interessados no terceiro nível de seleção, que investigam de que modo o comportamento individual é determinado pelo ambiente social (e.g., Baum, Richerson, Efferson, & Paciotti, 2004; Cohen, 1962; Schmitt & Marwell, 1968; Schmitt, 1998; Tan & Hackenberg, 2012, 2016). Nesses casos, aspectos da cultura são entendidos como variáveis independentes e os comportamentos são investigados como variáveis dependentes (Andery, 2011). Porém, a cultura também pode ser entendida como variável dependente. Nesse caso, o interesse de analistas do comportamento é compreender como práticas culturais são mantidas. Práticas culturais são comportamentos socialmente aprendidos que são similares e que são transmitidos entre diferentes gerações de membros de um grupo de indivíduos (Glenn, 2004; Sampaio & Andery, 2010). Por exemplo, analistas do comportamento tentam explicar por Capítulo XVI | Cultura quê uma pratica cultural como parar o carro diante da faixa de pedestres se inicia (Sénéchal-Machado & Todorov, 2008), ou ainda politicas públicas, como programas de controle de reprodução de animais abandonados e que habitavam as ruas da cidade de São Carlos (Bortoloti & D’Agostino, 2007) . Esse tipo de análise tem como objeto o que Skinner (1981) especificou na epígrafe desse capítulo: a evolução da cultura. Quando estudamos a evolução da cultura, entendemos que as consequências que selecionam práticas culturais agem sobre o grupo e não como consequências individuais do comportamento de cada membro do grupo. Mas o grupo não é um organismo que se comporta. Quem se comporta são os indivíduos membros do grupo. Assim, teoricamente, um grupo não pode ser sensível às consequências. Então como pode uma consequência agir sobre o grupo? tingência: estímulo discriminativo (SD), resposta (R) e estimulo reforçador (SR). Note que são apresentadas duas possibilidades de entrelaçamentos, mas existem muitas outras possibilidades. Escolhemos estas pois representam duas situações distintas no que se refere a produção de reforços. Na primeira, apresentada no quadro da esquerda, a coordenação de respostas produz diferentes reforçadores para cada organismo. Este é o caso dos pombos cooperativos descritos por Skinner (1962). Naquele estudo, quando os pombos coordenavam suas respostas bicando cada qual em um disco diferente, porém ao mesmo tempo, reforços eram liberados para cada organismo. Primeiramente, é preciso ter clareza de que o objeto de estudo da Análise Comportamental da Cultura (ACC) ainda é o comportamento e quem se comporta são os organismos individuais. Porém, esse objeto de estudo não é o comportamento de um único individuo, mas o comportamento de vários indivíduos (que geralmente, mas não necessariamente, recorre entre gerações). Nesse caso, as contingências estão entrelaçadas, isto é, as contingências comportamentais individuais estão conectadas umas às outras (Skinner, 1953). Como pode ser visto na Figura 1, o comportamento de cada indivíduo é descrito pela tríplice con- Figura 1. Diagrama de contingências comportamentais entrelaçadas. No quadro da esquerda os indivíduos precisam coordenar suas respostas para produzir reforços para cada organismo. No quadro da direita, a coordenação de respostas produz um reforço comum que é partilhado pelos organismos. O quadro da direita da Figura 1 apresenta a situação na qual dois organismos coordenam suas respostas e produzem uma consequência comum para ambos. O exemplo descrito por Sampaio e Andery (2010) é uma situação em que vários organismos precisam coordenar suas respostas para remover uma pedra de uma tonelada. Note que somente um dos organismos atuando sozinho não poderia remover a pedra. A remoção da pedra só é possível pela coorde257 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva nação das respostas de vários organismos. Além disso, a consequência – pedra removida – é partilhada por todos os organismos envolvidos. Em ambos os casos apresentados na Figura 1, é o comportamento de organismos individuais que é sensível às consequências (Todorov, 2012). Mas no estabelecimento e manutenção de uma cultura, a produção das consequências depende do “conjunto”, do entrelaçamento, dos comportamentos dos indivíduos. Portanto, não se afirma que o “grupo” é sensível às consequências. A passagem de Skinner (1981) que serve como epígrafe desse capítulo ressalta que a recorrência da prática dependerá dos efeitos sobre o grupo como um todo. Por exemplo, a adoção de uma nova prática de pesca dependerá das consequências para o grupo: mesmo que um dos membros do grupo tenha menos lucro individualmente, se o grupo como um todo lucrar mais, é provável que a nova prática se torne mais frequente do que a antiga. Culturante Figura 2. Diagrama de uma metacontingência. Os comportamentos operantes estão envolvidos em contingências entrelaçadas. Em conjunto, os comportamentos geram um produto agregado (PA). Como o PA atende o critério ambiental uma consequência cultural (CC) é liberada. 258 Glenn (1986, 1988, 1991, 2004) descreveu um tipo de programação de contingências chamada metacontingência para descrever a seleção de práticas culturais. Como pode ser visto na Figura 2, o conceito descreve uma relação de dependência entre culturantes e consequências culturais (Glenn et al., 2016). Culturantes se referem à contingências comportamentais entrelaçadas (CCEs) e seus produtos agregados (Hunter, 2012). Desse modo, assim como o operante é entendido como uma classe de respostas que é controlada por uma mesma consequência, o culturante seria uma classe de CCEs mais PA que estão sob controle das mesmas consequências culturais. O produto agregado (PA) é um efeito ambiental que só pode ser produzido pelo comportamento de diversos indivíduos que estão envolvidos em CCEs (Vichi & Tourinho, 2011). Em uma programação de metacontingência, caso o PA atenda um critério, consequências culturais (CC) são produzidas. Essas consequências culturais alteram a probabilidade futura de recorrência dos culturantes. O caso da pesca ilustra esta situação (Costa, Nogueira e Vasconcelos, 2012). Imagine um grupo de pescadores que se reúne para pescar em alto mar. Este grupo de pescadores utiliza a técnica da tarrafa. Tarrafas são redes artesanais redondas que contém pesos em suas bordas. Os pescadores jogam as tarrafas no mar e puxam de volta. Os pescados ficam presos nessas tarrafas. Neste caso, o barco de pesca possui um capitão que navega a embarcação, pescadores, lim- Capítulo XVI | Cultura padores de peixe e pessoas que armazenam os peixes em recipientes refrigerados. Cada indivíduo envolvido na pescaria tem seu comportamento controlado por uma consequência, mas esses comportamentos individuais estão envolvidos em CCEs. Veja, o capitão tem seu comportamento reforçado por atingir o local de pesca. O local de pesca funciona como SD para o comportamento dos pescadores de jogarem as tarrafas e a puxarem de volta. A consequência para o comportamento dos pescadores são os pescados. Os pescados são, por sua vez, SD para o comportamento dos limpadores de peixes, que tem seus comportamentos reforçados por pescados limpos. Por fim, pescados limpos são SD para o comportamento dos armazenadores de alocarem os pescados em recipientes refrigerados. Além das consequências individuais, as CCEs geram o PA: quantidade de peixes pescados e limpos, digamos, 1 tonelada. Com essa quantidade, os pescadores podem vender os pescados e assim produzirem mil reais (CC). Essa quantidade de dinheiro irá selecionar (i.e., tornar mais frequente) o comportamento dos pescadores de se reunirem e utilizar tarrafas. Assim como nos níveis filogenético e ontogenético, é possível observarmos variação no nível cultural. Por exemplo, além da tarrafa, os pescadores podem fazer uso de redes de arrastro. Neste caso, as redes são lançadas ao fundo do mar e o barco é colocado em movimento. Com isso, os pei- xes ficam presos nas redes de arrastro e são retirados do mar. Novamente, o comportamento de cada organismo envolvido produz sua consequência reforçadora individual. Porém, o PA gerado é maior do que aquele produzido pela técnica de tarrafas. Digamos que a técnica de redes de arrastro gere 3 toneladas de peixe. Logo, a CC será três mil reais. Neste caso, a prática cultural selecionada será a de utilizar a técnica de redes de arrastro. O problema é que esta técnica produz certos efeitos ambientais deletérios. Redes de arrastro coletam não apenas os peixes de tamanho adulto, mas também peixes que ainda não atingiram a idade adulta. Outro problema é que peixes que não são alvo de pesca acabam sendo pescados e morrem no processo. Com isso, a quantidade de peixes diminui a em médio e longo prazo e essa técnica de pesca é considerada predatória e danosa. Mas como produz CC de maior magnitude em curto prazo, provavelmente esta técnica é que será seleciona. Note que quando se programam metacontingências, os comportamentos individuais podem ser selecionados por seus reforçadores. Porém, esses comportamentos podem ser alterados sem que se modifiquem as contingencias operantes individuais. É nesse sentido que se afirma que há um terceiro nível de seleção (cf. Skinner, 1981): Diferentes arranjos do tipo [CCEs + PA] → CC podem produzir mudanças no comportamento dos organismos envolvidos sem que se haja mudanças em cada contingên259 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva cia operante individual envolvida no entrelaçamento. Apesar da proposição do conceito de metacontingência ter ocorrido em meados da década de 1980 (Glenn, 1986), apenas em 2004 o primeiro trabalho experimental foi realizado. O experimento conduzido por Christian Vichi fez parte de sua dissertação de mestrado e foi publicado incialmente como capítulo de livro (Vichi, 2005) e, mais tarde, como artigo, no Behavior and Social Issues (Vichi, Glenn, & Andery, 2009). Além de ter sido o primeiro trabalho experimental sobre metacontingência, o estudo tornou-se clássico por descrever um de delineamento experimental e um procedimento para investigação de práticas culturais em laboratório. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Vichi et al. (2009) investigaram se a apresentação contingente de consequências culturais (ganhos) a determinado produto agregado (modo de distribuição dos ganhos obtidos, se igual ou desigual) poderia influenciar interações entre indivíduos em pequenos grupos. A engenhosidade dos autores foi programar consequências para a decisão do grupo de como distribuir os ganhos, o que só poderia ser produzido pelas interações de todos os membros do grupo e não pelo comportamento individual de cada participante. Assim, mudanças no 260 comportamento individual não poderiam ser explicadas como efeito de consequências para o comportamento de indivíduos, isto é, por reforçamento. Lembre-se, no reforçamento, uma classe de respostas de um individuo tem sua probabilidade de ocorrência aumentada por um evento ambiental contingente. Na programação de Vichi et al., as respostas de todos os indivíduos seriam alteradas ao se exigir um tipo específico de interações entre todos os membros do grupo para que as consequências fossem liberadas. Desse modo, foi produzida em laboratório a situação sugerida por Skinner (1981) na epígrafe desse capítulo. Os participantes do estudo de Vichi et al. (2009) foram oito universitários de ambos os sexos, distribuídos em dois grupos com quatro participantes cada. O delineamento utilizado foi intrassujeitos. Os participantes em cada grupo foram expostos a diferentes ordens de condições. O Grupo 1 foi exposto à ordem A-B-A-B e o Grupo 2 à ordem B-A-B. A programação de diferentes ordens de condições verificar se há algum efeito que é função da ordem de exposição às condições (ver Sidman, 1960). A mudança de condições envolvia atingir o critério de estabilidade exigido. Tal critério foi estipulado como 10 distribuições consecutivas de acordo com as exigências programadas para a condição. A tarefa utilizada foi baseada no trabalho de Wiggins (1969). Uma matriz composta por oito colunas e oito linhas foi Capítulo XVI | Cultura impressa e fixada em uma parede da sala experimental. A junção entre colunas e linhas formavam células (ao todo, 64 células). Metade das células foram preenchidas com símbolos de adição (+) e as demais com símbolo de subtração (–). Cada sessão foi composta por 30 ciclos. Um ciclo era composto por apostas, nas quais cada participante entregava fichas para compor a aposta do grupo, o anuncio de uma das linhas pelos participantes, o anuncio de uma das colunas pelo pesquisador, e o anuncio de ganhos e distribuição de ganhos. Assim, no começo de cada ciclo, cada participante entregava uma quantidade de fichas a seu critério para compor a aposta do grupo. Após todos os participantes terem entregado sua quantidade de fichas para a aposta, o experimentador solicitava que fosse realizada escolha consensual dos participantes por uma linha da matriz. Tendo sido declarado acordo consensual por uma das linhas, o pesquisador declarava a escolha de uma das colunas. Caso a junção entre linha e coluna fosse um símbolo de adição, os participantes recebiam o dobro do total (i.e., a soma das apostas individuais) apostado. Se a junção entre linha e coluna fosse um símbolo de subtração, os participantes recebiam metade do valor total apostado. Por fim, os participantes distribuíam os ganhos da aposta entre todos os membros do grupo. A escolha do pesquisador por uma coluna não era aleatória. O pesquisador escolhia uma coluna que resultasse em adição ou subtração a depender da maneira como os ganhos eram distribuídos entre os participantes no final da tentativa anterior. Na condição A, caso os participantes distribuíssem seus ganhos igualmente (i.e., a mesma quantidade para cada membro) na tentativa anterior, o pesquisador escolhia uma coluna que necessariamente resultaria em adição (i.e., produzindo como ganho para o grupo o dobro do valor apostado na tentativa). Distribuições desiguais de ganhos na tentativa anterior (i.e., cada participante recebia diferentes quantidades de fichas) levavam o pesquisador a selecionar um símbolo de subtração (i.e., produzindo como ganho para o grupo metade do valor apostado na tentativa). Na condição B, as programações foram invertidas: caso os participantes distribuíssem seus ganhos desigualmente (i.e., diferentes quantidades para cada membro) na tentativa anterior, o pesquisador escolhia uma coluna que necessariamente resultaria em adição (i.e., produzindo como ganho para o grupo o dobro do valor apostado na tentativa). Distribuições iguais de ganhos na tentativa anterior (i.e., cada participante recebia a mesma quantidades de fichas) levavam o pesquisador a selecionar um símbolo de subtração (i.e., produzindo como ganho para o grupo metade do valor apostado na tentativa). A exposição sucessiva do mesmo grupo à diferentes condições possibilitou investigar se o modo como os participantes distribuíam seus ganhos poderia ser alterado por mudanças nas metacontingências sem que houvesse mudanças nas contin261 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva gências operantes. Por um lado, se os resultados indicassem que a distribuição de ganhos não foi alterada a despeito das diferentes metacontingências (i.e., as condições A e B descritas anteriormente), isso significaria que as consequências para o grupo não eram capazes de selecionar diferentes práticas (i.e., a distribuição de ganhos entre participantes ao final de cada tentativa). Por outro lado, caso a distribuição de ganhos se alterasse dadas as alterações nas metacontingências, seria demonstrado que as consequências providas pelo pesquisador estavam selecionado as práticas sem que houvesse interferência nas contingências operantes. O procedimento de Vichi et al. (2009) estabeleceu que o culturante fosse composto pelas respostas verbais dos participantes (CCEs) que geravam a escolha consensual por uma linha (PA) que, se atendesse o critério da condição, produzia o dobro ou metade do valor apostado (CC). Resultados e Discussão De modo geral, os dois grupos distribuíram seus ganhos de acordo com a metacontingência programada em cada condição. Porém, na condição B, na qual a metacontingência exigia distribuição desigual, os pesquisadores precisaram intervir já que os participantes incialmente tendiam a não realizar distribuições desiguais. Tal estratégia não foi prevista quando o experimento foi delineado. Porém, os dados ob262 tidos demandaram a realização de uma intervenção: o pesquisador informava que era necessário reter parte dos ganhos para “o banco” (i.e., quem pagava as apostas). Esse “confisco” foi uma estratégia desenvolvida pelos pesquisadores durante o experimento para produzir contato com a metacontingência em vigor na condição B. Em algumas situações experimentais é necessário realizar intervenções de modo que o comportamento do organismo ocorra e entre em contato com as contingências em vigor. Reflita, se o comportamento nunca ocorrer, como as consequências poderiam seleciona-lo? Assim, forçamos a ocorrência do comportamento para garantir que, ao menos uma vez, o comportamento entre em contato com as contingências. Vejamos o caso de estudos onde o participante precisa realizar escolhas. Nesse experimento hipotético, o participante pode ganhar um real por escolher o cartão azul ou três reais por escolher o cartão vermelho. Se no começo do experimento o pesquisador não forçar o participante a realizar ao menos uma escolha em cada opção, como podemos afirmar que a escolha estava sob controle de uma variável como a magnitude (quantidade) de reforços (i.e., um real vs. três reais)? É possível que os participantes do estudo de Vichi et al. (2009) tenham tendido a realizar distribuições igualitárias para evitar conflitos entre os membros do grupo sobre quem ganharia mais. Afinal os participantes eram colegas de turma na mesma Capítulo XVI | Cultura universidade. Nesse caso, a história pré-experimental dos participantes (isto é, aprendizagem anteriores ao experimento) pode ter atuado na determinação do comportamento durante o experimento. Quando o pesquisador forçou a distribuição desigual por meio da intervenção, os participantes entravam em contato com o fato de que essa distribuição gerava maiores ganhos. Assim, os efeitos da história pré-experimental dos participantes podem ser minimizados em função de arranjos experimentais adicionais. Vichi et al. (2009) precisaram intervir 23 vezes na condição B para o Grupo 1 e 30 vezes para o Grupo 2, na mesma condição. A intervenção também aconteceu na condição A (distribuição igualitária) para o Grupo 1, mas apenas duas vezes. Em geral, uma vez que os participantes entravam em contato com a metacontingência, poucas interferências do pesquisador foram necessárias. Você se lembra do cuidado metodológico de expor cada grupo a diferentes ordens de condições? Pois bem, os experimentadores também observaram que a história de exposição influenciou os resultados. Em ambos os grupos, na segunda exposição à condição B, se comparada a primeira, precisou de menos tentativas para que a distribuição se tornasse estável (ocorresse por 10 tentativas consecutivas). Esses resultados indicam que a prática de distribuir os ganhos, se igual ou desigual, dependeu das consequências programadas para o grupo e não para cada participante individualmente. Portanto, as metacontingências foram responsáveis por alterar as interações entre os membros do grupo . DESDOBRAMENTOS Após o estudo de Vichi et al. (2009) diversos estudos sobre a seleção cultural foram conduzidos. Martone (2008), por exemplo, conduziu uma replicação sistemática do experimento de Vichi et al. num estudo com quatro experimentos. O objetivo foi investigar se as práticas de distribuição igualitária e desigual seriam mantidas após a substituição de participantes em cada grupo. Ou seja, no estudo de Martone investigou-se não apenas a seleção de culturantes, mas também a transmissão de comportamento entre gerações. Uma das principais diferenças entre os trabalhos de Vichi et al. e Martone é que no segundo a matriz foi apresentada em um programa de computador. A cada nova tentativa os símbolos de adição e subtração eram apresentados em diferentes células. Além disso, havia outras diferenças entre os estudos, como o número de participantes por grupo e o modo como o pesquisador intervinha para propiciar o contato com a metacontingência. Os resultados de Martone sugerem indícios de seleção das práticas culturais mas, segundo o autor, não de forma contínua. Isto porquê, para alguns grupos de participantes, não foi observado um padrão de distribuição de acordo com a metacontingência em vigor. 263 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva Os culturantes por vezes atendiam as exigências ambientais mas não se mantinham estáveis. Esse resultado é diferente do observado por Vichi et al. Por outro lado, os resultados de Martone (2008) indicam que a substituição de participantes não afetou o padrão de distribuição dos grupos. Mesmo após a troca de participantes, os grupos tendiam a continuar a apresentar o padrão de distribuição desenvolvido pelas gerações anteriores. Uma das principais contribuições do estudo de Vichi et al. (2009) foi apresentar um procedimento para a análise experimental de metacontingências. Diversos outros estudos utilizaram o “jogo da matriz” descrito em seu artigo (e.g., Borba & Glenn, 2014; Borba et al., 2014; Cavalcanti, Leite, & Tourinho, 2014; Franceschini, Samelo, Xavier & Hunziker, 2012; Pavanelli, Leite, & Tourinho, 2014; Soares, Cabral, Leite, & Tourinho, 2012). Novas questões de pesquisa e procedimentos foram desenvolvidos. Pereira (2008), por exemplo, tentou isolar experimentalmente os efeitos da programação de contingências individuais e metacontingências na seleção de comportamentos envolvidos em entrelaçamentos como aqueles no experimento de Vichi et al. Para tanto, Pereira (que trabalhou no mesmo laboratório da PUC-SP no qual Vichi havia realizado seu estudo) desenvolveu o “jogo dos números”, no qual é possível programar diferentes consequências individuais e culturais (atualmente diversos procedimentos 264 apresentam este cuidado, incluindo o jogo da matriz). Diversos estudos foram realizados utilizando esse procedimento (e.g., Baia, Azevedo, Segantini, Macedo, & Vasconcelos, 2015; Bullerjhann, 2009; Caldas, 2009; Saconatto & Andery, 2013; Vieira, 2010). De modo geral, os estudos encontraram que culturantes são selecionados por consequências culturais. Isto é, os organismos tendem a coordenar suas ações de modo a gerar um produto agregado que atenda as exigências ambientais para liberação de consequências culturais. A investigação experimental da seleção por metacontingências é um campo de pesquisa recente. Por este motivo, diferentes procedimentos existem atualmente (e.g., Costa et al., 2012; Hunter, 2012; Neves, Woels, & Glenn, 2012; Ortu, Becker, Woelz, & Glenn, 2012; Sampaio et al., 2013). Em geral, os procedimentos envolvem tentativas discretas – situação na qual o responder é restringido a períodos de observação seja removendo o acesso dos participantes ao equipamento ou à possibilidade de responder (Perone, 1991). Nos experimentos que usam o jogo da matriz, os participantes precisam aguardar o pesquisador autorizar o novo ciclo de apostas. Já no procedimento do jogo dos números, após todos participantes terem inserido seus números, o computador libera as consequências e realiza um intervalo (em geral é de 0,8 s) antes do início de uma nova possibilidade de os participantes inserirem os números. Um ponto importante em relação a esses pro- Capítulo XVI | Cultura cedimentos que usam tentativas discretas é que a sessão termina comumente em função do número de tentativas. Assim, os participantes deve sempre responder, não sendo possível que respostas não ocorram. Esse aspecto do procedimento dificulta a análise de efeitos da suspensão das consequências culturais (Baia et al., 2015). Tal dificuldade pode ser minimizada ao se utilizar procedimentos similares ao operante livre. Há ao menos dois procedimentos que foram desenvolvidos utilizando método similar ao operante livre: O jogo do xadrez (Vasconcelos & Todorov, 2015) e o culturante livre (Toledo et al., 2015). Nesse tipo de procedimento os organismos são livres para responder – podem ou não emitir os comportamentos alvo de análise sem restrições ao acesso dos participantes ao equipamento ou à possibilidade de responder (Perone, 1991). O uso desses procedimentos permite verificar, por exemplo, o que ocorre com culturantes em situações nas quais as consequências são programadas de modo intermitente, ou ainda em situações em que não há relação de dependência entre culturantes e consequências culturais. Outra vantagem de estudos cujo o procedimento é similar ao operante livre é que os efeitos da suspensão das relações condicionais entre culturantes e consequências culturais (como extinção) podem produzir resultados mais confiáveis, já que os participantes podem não se engajar na emissão de comportamentos sem alterar a exposição ao procedimento (como ocorre em procedimentos de tentativas discretas). A condução de experimentos sobre metacontingências é de suma importância para a perspectiva analítico-comportamental da seleção cultural. Há críticas sobre a necessidade do conceito de metacontingências (e.g., Gusso & Kubo, 2007). Contudo, sendo a Análise do Comportamento uma ciência indutiva, a validade dos conceitos depende da sua demonstração empírica (Harzem & Miles, 1978). CONSIDERAÇÕES FINAIS O estudo de Vichi et al. (2009) inaugurou o campo de investigações experimentais sobre metacontingências. Além disso, os resultados do estudo sugerem que é possível alterar comportamentos de pessoas em pequenos grupos sem que as alterações sejam nas contingências operantes. Essa é uma importante demonstração de seleção cultural. Esse tipo de explicação do comportamento é alinhada aos princípios da seleção por consequências (Skinner, 1981). Um grupo não se comporta, não é sensível à consequências, mas seus membros se comportam e são sensíveis a mudanças ambientais. O conceito de metacontingência não afirma que é possível uma seleção do comportamento de grupos, mas que é possível alterar comportamentos que estejam envolvidos em CCEs ao programar 265 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva diferentes consequências culturais (i.e., programando-se diferentes relações condicionais entre os diferentes culturantes e as consequências culturais). É apenas neste sentido que diz-se que o grupo esteve sob controle das exigências comportamentais. O mesmo acontece quando alguém diz “o rapaz ficou sob controle dos reforços sociais”. É importante ressaltar que, em ambos os casos, quem está sob controle das consequências são os comportamentos, seja dos membros do grupo ou do indivíduo. Quando falamos em programar metacontingências estamos mais interessados em alterar os comportamentos envolvidos em CCEs sem intervir nas contingências operantes que mantém cada comportamento individual. Imagine a quantidade de recursos envolvidos para alterar contingências operantes numa situação na qual as CCEs envolvem o comportamento de milhares de pessoas. Portanto, se for possível alterar o comportamento desses indivíduos ao se estabelecer metacontingências, sem que seja necessário manipular cada contingência operante, então o conceito de metacontingências pode se mostrar útil. Isso porque, neste caso, a intervenção se daria no nível cultural e não no operante. Vejamos um exemplo. Em uma situação de escassez de água – como a vivida na cidade de São Paulo em 2014 e 2015 – pode ser mais eficiente ocupar-se de programações que gerem o PA, quantidade de água consumida, 266 do que estabelecer contingências operantes para o comportamento de cada usuário do sistema de abastecimento. Nesse contexto, o conceito de metacontingência pode ser promissor para aplicações. Até o momento, o que temos são análises interpretativas (e.g., Bortoloti & D’Agostino, 2007; Perossi & Carrara, 2012; Sénéchal-Machado & Todorov, 2008). Esperamos que no futuro o conceito seja útil para análise de problemas da sociedade, além da elaboração de intervenções comportamentais no nível cultural. Por exemplo, o consumo e gestão da água é um problema que talvez possa ser abordado no nível supra-organismo (i.e., cultural). Seria algo muito bom se o conhecimento experimental básico sobre seleção cultural pudesse ajudar a resolver problemas sociais que demandam a intervenção simultânea no comportamento de muitos indivíduos. PARA SABER MAIS Martone & Todorov (2007). Artigo que apresenta o desenvolvimento do conceito de metacontingência desde sua proposição por Glenn (1986). Sampaio & Andery (2010). Apresentação de conceitos e possibilidades de análise de fenômenos sociais na Análise do Comportamento. Saconatto & Andery (2013). Programação de metacontingências com contingências aversivas. Nessa pesquisa as consequências Capítulo XVI | Cultura culturais foram caracterizadas por evitar a perda de bônus para todo o grupo. Gusso & Kubo (2007). Neste artigo os autores questionam a necessidade do conceito de metacontingência. Um importante contraponto a ser considerado. Revista Latinoamericana de Psicologia 44 (1), (2012). Um número especial sobre o conceito de metacontingência e seleção cultural. REFERÊNCIAS Andery, M. A. P. A. (2011). Comportamento e cultura na perspectiva da análise do comportamento. Perspectivas em Análise do Comportamento, 2, 203–217. Baia, F. H., Azevedo, F. F., Segantini, S. M., Macedo, R. P., & Vasconcelos, L. A. (2015). Efeitos de diferentes magnitudes de consequências individuais e culturais sobre culturantes. Acta Comportamentalia, 23, 257–272. Baum, W. M. (2006). Compreender o behaviorismo: comportamento, cultura e evolução. Porto Alegre: Artmed. Baum, W. M., Richerson, P. J., Efferson, C. M., & Paciotti, B. M. (2004). Cultural evolution in laboratory microsocieties including traditions of rule giving and rule following. Evolution and Human Behavior, 25, 305– 326. Borba, A., & Glenn, S. S. (2014). Establishing the macrobehavior of ethical self-control in an arrangement of macrocontingencies in two microculturures. Behavior and Social Issues, 86, 68–86. Borba, A., Silva, B. R. da, Cabral, P. A. dos A., Souza, L. B. de, Leite, F. L., & Tourinho, E. Z. (2014). Effects of exposure to macrocontingecies isolation and social situations in the production of ethical self-control. Behavior and Social Issues, 19, 5–19. Bortoloti, R., & D’Agostino, R. G. (2007). Ações pelo controle reprodutivo e posse responsável de animais domésticos interpretados à luz do conceito de metacontingência. Revista Brasileira de Análise Do Comportamento, 3, 17–28. Bullerjhann, P. B. (2009). Análogos experimentais de fenômenos sociais: o efeito das consequências culturais. (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo. São Paulo. Caldas, R. A. (2009). Análogos experimentais de seleção de extinção de metacontingências. (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo. Cavalcanti, D. E., Leite, F. L., & Tourinho, E. Z. (2014). Seleção de práticas culturais complexas : Avaliação experimental de um aná267 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva logo do procedimento de aproximação sucessiva. Psicologisa e Saber Social, 3, 2–21. Chiesa, M. (2006). Behaviorismo Radical: A filosofia e a ciência. Brasilia: Editora Celeiro. Cohen, D. J. (1962). Justin and his peers: an experimental analysis of a child’s social world. Child Development, 33, 697–717. Costa, D., Nogueira, C. de P. V., & Vasconcelos, L. A. (2012). Effects of communication and cultural consequences on choices combinations in INPDG with four participants. Revista Latinoamericana de Psicologia, 44, 121–131. Franceschini, A. C. T., Samelo, M. J., Xavier, R. N., & Hunzinker, M. H. L. (2012). Effects of consequences on patterns of interlocked contingencies: A replication of a metacontingency experiment. Revista Lainoamericana de Psicologia, 44, 87–95. Glenn, S. S. (1986). Metacontingencies in Walden Two. Behavior Analysis and Social Action, 5, 2–8. Glenn, S. S. (1988). Contingencies and metacontingencies: Toward a synthesis of behavior analysis and cultural materialism. The Behavior Analyst, 11, 161–179. Glenn, S. S. (1991). Process and content in behavioral and cultural phenomena. Behavior and Social Issues, 1, 1– 4. 268 Glenn, S. S. (2004). Individual behavior, culture, and social change. The Behavior Analyst, 2, 133–151. Glenn, S. S., Malott, M. E., Andery, M. A. P. A., Benvenuti, M., Houmanfar, R., Sandaker, I., … Vasconcelos, L. A. (2016). Toward consistent terminology in a behaviorist approach to cultural analysis. Behavior and Social Issues, 25, 11–27. Gusso, H. L., & Kubo, O. M. (2007). O conceito de cultura: Afinal, a “jovem” metacontingência é necessária? Revista Brasileira de Terapia Comportamental e Cognitiva, 139-144. Harzem, P., & Miles, T. R. (1978). Conceptual issues in operant psychology. Chichester: John Wiley & Sons. Hunter, C. S. (2012). Analyzing behavioral and cultural selection contingencies. Revista Latinoamericana de Psicologia, 44, 43–54. Martone, R. C. (2008). Efeito de consequências externas e de mundanças na constituição do grupo sobre a distribuição dos ganhos em uma metacontingência experimental. (Tese de Doutorado). Universidade de Brasília, Brasília. Martone, R. C., & Todorov, J. C. (2007). O desenvolvimento do conceito de metacontingência. Revista Brasileira de Análise do Comportamento, 3, 181–190. Capítulo XVI | Cultura Mayr, E. (2009). O que é evolução. Rio de Janeiro: Editora Rocco. Melo, C. M., Dittrich, A., Moreira, M. B., & Martone, R. C. (2013). O modelo de seleção por consequências: o nível filogenético. In M. B. Moreira (Ed.), Comportamento e práticas culturais (pp. 24–34). Brasilia: Walden4. Neves, A. B. V. S., Woels, T. A. R., & Glenn, S. S. (2012). Effect of resource scarcity on dyadic fitness in a simulation of two-hunter nomoclones. Revista Latinoamericana de Psicologia, 44, 159–167. Ortu, D., Becker, A. M., Woelz, T. A. R., & Glenn, S. S. (2012). An iterated four-player Prisoner’s Dilemma Game with an external selecting agent : A metacontingency experiment. Revista Latinoamericana de Psicologia, 44, 111–120. Pavanelli, S., Leite, F. L., & Tourinho, E. Z. (2014). A “ modelagem ” de contingências comportamentais. Acta Comportamentalia, 22, 425–440. Pereira, J. M. C. (2008). Investigação experimental de metacontingências : separação do produto agregado e da consequência individual. (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo. Perone, M. (1991). Experimental design in the analysis of free-operant behavior. In I. H. Iversen & K. A. Lattal (Eds.), Experimental analysis of Behavior - Part 1. (pp. 135– 171). Amsterdam: Elsevier Inc. Perossi, G. R., & Carrara, K. (2012). Por que funcionam limitadamente campanhas e programas de conservação de água ? Uma análise comportamental. Interação em Psicologia, 16, 199–210. Pierce, W. D., & Cheney, C. D. (2008). Behavior analysis and learning. New York: Psychology Press. Saconatto, A. T., & Andery, M. A. P. A. (2013). Seleção por metacontingências : Um análogo experimental de reforçamento negativo. Interação em Psicologia, 17, 1–10. Sampaio, A. A. S., & Andery, M. A. P. A. (2010). Comportamento Social, produção agregada e prática cultural: Uma análise comportamental de fenômenos sociais. Psicologia: Teoria e Pesquisa, 26, 183–192. Sampaio, A. A. S., Araújo, L. A., Gonçalo, M. E., Ferraz, J. C., Alves Filho, A. P., Brito, I. S., Barros, N. M., & Calado, J. I. F. (2013). Exploring the role of verbal behavior in a new experimental task for the study of metacontingencies. Behavior and Social Issues, 22, 87–101. Schmitt, D. R. (1998). Social behavior. In K. A. Lattal & M. Perone (Eds.), Handbook of research methods in human operant behavior (pp. 471–508). New York: Plenum Press. 269 Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva Schmitt, D. R., & Marwell, G. (1968). Stimulus control in the experimental study of cooperation. Journal of the Experimental Analysis of Behavior, 5, 571–574. Sénéchal-Machado, V. L., & Todorov, J. C. (2008). A travessia na faixa de pedestre em Brasília (DF/Brasil): Exemplo de uma intervenção cultural. Revista Brasileira de Análise do Comportamento, 4, 191–204. Sidman, M. (1960). Tactics of scientific research: Evaluating experimental data in psychology. New York: Basic Books Inc. Skinner, B. F. (1953). Science and Human Behavior. New York: Macmillan. Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental Analysis of Behavior, 5, 531–3. Skinner, B. F. (1974). About behaviorism. New York: Bantam Books. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. Soares, P. F. R., Cabral, P. A. A., Leite, F. L., & Tourinho, E. Z. (2012). Efeitos de consequências culturais sobre a seleção e manutenção de duas práticas culturais alternadas. Revista Brasileira de Análise do Comportamento, 8, 37–46. Tan, L., & Hackenberg, T. (2012). Social foraging in rats: Group and individual choice in 270 dynamic environments. Mexican Journal of Behavior Analysis, 38, 87–105. Tan, L., & Hackenberg, T. D. (2016). Functional analysis of mutual behavior in laboratory rats. Journal of Comparative Psychology, 130, 13–23. Todorov, J. C. (2012). Metacontingências e a análise comportamental de práticas culturais. Clínica & Cultura, 1, 36–45. Toledo, T. F. N., Benvenuti, M. F. L., Sampaio, A. A. S., Marques, N. S., Cabral, P. A. A., Araújo, L. A. de S., … Moreira, L. R. (2015). Free Culturant : A software for the experimental study of behavioral and cultural selection. Psychology & Neuroscience, 8, 366–384. Tourinho, E. Z. (2009). Subjetividade e relações comportamentais. São Paulo: Paradigma. Vasconcelos, I. G., & Todorov, J. C. (2015). Experimental analysis of the behavior of persons in groups: Selection of an aggregate product in a metacontingency. Behavior and Social Issues, 24, 111–125. Vichi, C. (2005). Igualdade e Desigualdade: Manipulando um análogo experimental de prática cultural em laboratório. In J. C. Todorov, R. C. Martone, & M. B. Moreira (Eds.), Metacontingências: comportamento, cultura e sociedade (pp. 81–100). Santo André: ESETEC Editores Associados. Capítulo XVI | Cultura Vichi, C., Glenn, S. S., & Andery, M. A. P. A. (2009). A metacontingency experiment: The effects of contingent consequences on patterns of interlocking contingencies of reinforcement. Behavior and Social Issues, 18, 41–57. Vichi, C., & Tourinho, E. Z. (2011). Consequências culturais x consequências comportamentais na literatura experimental de pequenos grupos. Acta Comportamentalia, 20, 201–215. Vieira, M. C. (2010). Condições antecedentes participam de metacontingências? (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo. 271 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira “Pare com isso menino!”: análise funcional de problemas de comportamento André A. B. Varella Universidade Católica Dom Bosco Maria Carolina Correa Martone Universidade Federal de São Carlos; Fundação Panda Carolina Coury Silveira Universidade Federal de São Carlos Iwata, B. A., Dorsey, M. F., Slifer, K. J., Bauman, K. E., & Richman, G. S. (1982). Toward a functional analysis of self-injury. Analysis and Intervention in Developmental Disabilities, 2, 3-20. “A alma não tem segredo que o comportamento não revele” Lao Tsé 272 Capítulo XVII | Análise Funcional INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A Análise do Comportamento Aplicada (ou ABA, do inglês Applied Behavior Analysis) se caracteriza como uma ciência dedicada à aplicação da Análise Experimental do Comportamento na solução de problemas socialmente relevantes (Baer, Wolf, & Risley, 1968). Enquanto uma ciência aplicada, a ABA historicamente se ocupou com diversos problemas humanos, dentre eles o estudo e desenvolvimento de intervenções para reduzir ou eliminar problemas severos de comportamento, tais como comportamentos agressivos, de automutilação, ingestão de objetos não comestíveis, entre outros. Indivíduos com autismo, deficiência intelectual, transtornos psiquiátricos e até mesmo pessoas com desenvolvimento típico apresentavam comportamentos que poderiam colocar em risco a sua saúde e de outras pessoas, o que demandava, portanto, intervenções rápidas e eficazes. A partir do final da década de 1950, começaram a ser publicados estudos sobre intervenções em problemas de comportamento, de diversas topografias. Esses primeiros estudos procuraram intervir em comportamentos como escalar móveis e locais perigosos (Risley, 1968), ferir a própria cabeça e braços com batidas (Lovaas, Freitag, Gold, & Kassorla, 1965), desferir tapas no próprio rosto e introduzir os dedos na cavidade ocular (Corte, Wolf, & Locke, 1971), entre outras topografias potencialmente perigosas. Entretanto, nesse período, a ABA ainda não havia desenvolvido recursos tecnológicos para compreender a função desses problemas de comportamento, ou seja, quais consequências mantinham esses comportamentos ocorrendo em certos contextos. Naturalmente, as intervenções nesse período não eram baseadas na função do comportamento e eram implementadas a partir do conhecimento sobre comportamento operante produzido até aquele período pela Análise Experimental do Comportamento. Estes estudos iniciais foram importantes por terem demonstrado que esses comportamentos eram operantes; ou seja, poderiam ser explicados pelos princípios da Análise do Comportamento e seriam sensíveis à manipulação de estímulos antecedentes e de suas consequências. Por exemplo, Wolf, Risley e Mees (1964) relataram sucesso na redução da frequência de birras de uma criança com autismo. As birras incluíam topografias de respostas como estapear o rosto, arrancar fios de cabelo, bater a cabeça e arranhar o rosto. Os autores obtiveram uma medida da linha de base das topografias identificadas e implementaram uma contingência de timeout (time out from positive reinforcement, ou suspensão discriminada de contingências de reforço; Ferster, 1958). Quando a criança emitia o comportamento, ela era imediatamente removida do ambiente em que estava e colocada dentro de uma sala, sozinha, até o 273 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira comportamento cessar. O procedimento de timeout poderia funcionar como uma contingência de punição: a emissão da resposta resultava na inserção do indivíduo em uma sala pequena, o que restringia drasticamente suas possibilidades de se engajar em alguma atividade reforçadora. A eficácia das técnicas de modificação do comportamento na redução de problemas comportamentais foi sendo demonstrada cumulativamente nos anos 1960 e 1970. Os procedimentos envolviam desde o uso de contingências aversivas (Kohlenberg, 1970; Pendergrass, 1972) até intervenções baseadas em reforçamento de comportamentos alternativos e socialmente adequados (Bailey, Wolf, & Philips, 1970; Bostow & Bailey, 1969). Todavia, as intervenções ainda não consideravam a função que os comportamentos-problema apresentavam, uma vez que não existiam procedimentos desenvolvidos para identificar quais consequências mantinham esses comportamentos. Quando o comportamento-alvo era identificado, as intervenções eram conduzidas na tentativa de modificá-lo; na maioria das vezes por meio de contingências aversivas, ou por reforçadores artificiais (e.g., economia de fichas) para estabelecer comportamentos alternativos e/ ou incompatíveis. Em outras palavras, pouco se sabia sobre os reforçadores que mantinham os comportamentos-problema, quais estímulos os controlavam e qual história de reforçamento estabeleceu tal aprendizagem (Mace, 1994). 274 O desconhecimento sobre as variáveis relacionadas aos problemas de comportamento tinha importantes implicações para as intervenções comportamentais. Por não considerar a função, muitas delas não eram bem-sucedidas ou não se mantinham após a retirada da intervenção, o que prolongava o tempo em que o indivíduo era exposto a situações que o levavam a emitir tais comportamentos. Nesse contexto, Carr (1977) publicou um importante trabalho de revisão dos estudos sobre intervenções em comportamentos autolesivos e levantou hipóteses que poderiam explicá-los. Os comportamentos autolesivos seriam (a) comportamentos operantes mantidos por reforçamento positivo em forma de reforço social, (b) operantes mantidos por reforçamento negativo em forma de interrupção de estimulação aversiva, ou (c) operantes que produziam autoestimulação. Ainda, outras duas hipóteses extraídas dos estudos revisados supunham que os comportamentos autolesivos (d) eram causados por alterações fisiológicas ou (e) eram produto de processos psicodinâmicos relacionados ao ego ou redução de culpa. O estudo de Carr (1977) propôs que comportamentos de autolesão poderiam ser controlados por múltiplas variáveis e, inclusive, sugeriu o desenvolvimento de modelos animais experimentais para, futuramente, permitir a validação de procedimentos de avaliação das hipóteses levantadas. Em 1982, Iwatta, Dorsey, Slifer, Bauman e Richman publicaram o que veio a ser um Capítulo XVII | Análise Funcional dos estudos mais influentes na ABA, com importantes implicações para a pesquisa e aplicação. O artigo, intitulado “Em direção a uma análise funcional da autolesão” (“Toward a functional analysis of self-injury”), foi originalmente publicado em 1982 na revista Analysis and Intervention in Developmental Disabilities e republicado em 1994 em uma edição especial no Journal of Applied Behavior Analysis (JABA). O estudo de Iwata et al. (1982/1994) ofereceu uma contribuição substancial à ABA ao propor uma importante metodologia para identificar variáveis controladoras dos comportamentos autolesivos. Com base nos resultados dessa metodologia, denominada Análise Funcional Experimental, era possível identificar as consequências que mantinham esses comportamentos. Portanto, intervenções poderiam ser planejadas a partir das variáveis que os mantinham. Se antes elas eram realizadas de forma arbitrária (no sentido de que ignoravam a função do comportamento), agora se tornava possível planejar e executar intervenções que poderiam produzir mudanças na relação do comportamento com o ambiente, aumentando consideravelmente sua eficácia. DESCRIÇÃO DO EXPERIMENTO Objetivos e Método O estudo de Iwatta, et al. (1982/1994) descreveu um protocolo de avaliação em que o comportamento dos participantes era observado de forma repetida e sistemática, em uma série de condições bem definidas. O estudo foi conduzido com nove participantes com atraso no desenvolvimento e com taxas de respostas autolesivas, que variavam entre moderadas a altas. As topografias mais frequentes observadas foram (a) bater a cabeça em algum objeto; (b) bater na própria cabeça; (c) morder-se; (d) puxar orelhas; (e) apertar os olhos; e (f) puxar cabelos. O estudo ocorreu em uma sala do hospital pediátrico ligado à Universidade de medicina Johns Hopkins. As observações foram realizadas em uma sala contígua, contendo um espelho unidirecional. De forma a avaliar os efeitos do ambiente sobre os comportamentos estudados, foi permitido que os participantes engajassem em comportamentos autolesivos; entretanto, os pesquisadores seguiam protocolos para garantir a segurança dos participantes. Por exemplo, havia acompanhamento médico constante e as sessões eram interrompidas frente a qualquer risco maior de dano físico (emissão de comportamentos autolesivos que pudessem machucar os participantes de forma mais grave). As observações mostraram que os participantes engajavam em pelos menos duas ou mais formas de comportamentos autolesivos. A ocorrência dos comportamentos foi registrada em intervalos de 10s. A variável dependente era o percentual de intervalos em que respostas autolesivas foram registradas. 275 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira Os participantes eram expostos a quatro condições, por oito sessões diárias (duas para cada condição). Um delineamento de tratamentos alternados (Barlow & Hayes, 1979) foi empregado para organizar a apresentação das quatro condições, em ordem não sistemática e que variava ao longo dos dias. Cada condição tinha a duração de 15 min. O procedimento permanecia em vigor até que fosse observada: (a) a estabilidade dos comportamentos autolesivos, (b) instabilidade nos níveis das respostas autolesivas por cinco dias seguidos em todas as condições, ou (c) que 12 dias de sessões tivessem decorrido. Cada condição tinha como objetivo avaliar o efeito de uma variável específica. As variáveis foram manipuladas de forma sistemática pela alternância das diferentes condições. Frequências elevadas de respostas autolesivas em uma determinada condição indicariam que a variável em questão estaria funcionalmente relacionada ao comportamento-alvo. As quatro condições serão descritas a seguir. Condição Desaprovação Social: Nessa condição, o experimentador e o participante entravam em uma sala com brinquedos espalhados pelo chão. O participante tinha livre acesso aos materiais e recebia uma instrução para brincar, enquanto o experimentador ficava em um canto da sala fingindo ler uma revista. Quando o comportamento autolesivo ocorria, o experimentador fornecia atenção ao participante, demonstrando preocupação ou desaprovação (e. g., “não faça assim, você vai se ma276 chucar”), com um breve e suave contato físico (e. g., tocando o ombro do participante). Quaisquer outras respostas emitidas pelo participante eram ignoradas. Esta condição, portanto, criava uma situação na qual os participantes não tinham a atenção do experimentador. Ela foi proposta considerando que desaprovação social e contato físico, contingentes a emissão de comportamentos autolesivos são situações comuns em ambientes naturais. Assim, elas poderiam inadvertidamente manter tais comportamentos por reforçamento positivo. Condição Demanda Acadêmica: O objetivo dessa condição era avaliar se as respostas autolesivas apresentavam função de fuga de demandas. Nessa condição, algumas atividades escolares foram disponibilizadas para os participantes. A escolha das atividades baseava-se em informações fornecidas pelas escolas, sendo selecionadas aquelas que os participantes raramente completavam. O experimentador solicitava a realização de alguma atividade e aguardava uma resposta por 5 segundos. As instruções atendidas pelo participante eram seguidas de elogios. Se respostas autolesivas ocorressem, a atividade era interrompida e o experimentador virava-se de costas por 30s. Embora, a consequência programada nessa condição pudesse se assemelhar a um procedimento de extinção, ela procurava avaliar se as respostas autolesivas foram mantidas por reforçamento negativo (isto é, fuga e esquiva das demandas acadêmicas, Carr, 1977; Carr, Newsom, & Binkoff, 1976; Capítulo XVII | Análise Funcional Jones, Simmons, & Frankel, 1974; Measel & Alfieri, 1976). Frequências maiores nessa condição em comparação às outras poderiam indicar que as respostas autolesivas apresentavam função de fuga de demandas. Condição Brincadeira Não-estruturada: Nessa condição, o experimentador ficava próximo ao participante e permitia que ele se movimentasse livremente pela sala, engajando em brincadeiras sociais ou solitárias. O experimentador ainda fornecia elogios e breve contato físico contingente a qualquer comportamento socialmente apropriado a cada 30 segundos. Essa etapa teve por objetivo “enriquecer” o ambiente dos participantes, de modo a diminuir a probabilidade de ocorrência de comportamentos autolesivos, funcionando como condição controle. Nessa condição não foram apresentadas demandas, havia livre acesso aos brinquedos, o experimentador fornecia atenção social constantemente e demonstrações de preocupação ou desaprovação não foram fornecidas se respostas autolesivas ocorressem (extinção). Condição Sozinho: Nesta condição, o participante foi colocado na sala de avaliação sozinho, sem acesso a interação social, brinquedos e materiais que pudessem servir como fonte reforçamento. O propósito dessa condição era simular um ambiente “empobrecido”, com poucos estímulos sociais e físicos. Assim, tal contexto poderia estabelecer a ocasião para que comportamentos autoestimulatórios ocorressem, tornando possível avaliar se as respostas autolesivas eram mantidas por reforçamento automático, ou seja, pela própria consequência sensorial produzida pela resposta. A observação de altas taxas de respostas autolesivas nessa condição sugeriria, portanto, um comportamento mantido por reforçamento automático. Resultados e Discussão Para cada participante foi calculada uma média geral da porcentagem dos intervalos no período total de 15 minutos em que ocorreram comportamentos autolesivos, além de médias dos participantes para as condições experimentais, separadamente. Assim, os dados permitiram uma análise do responder geral entre os participantes, assim como comparações entre condições por participantes diferentes. Foram identificadas variações tanto na taxa de respostas entre os participantes (com médias de 4,5% a 91,3% de intervalos com ocorrências de respostas autolesivas) quanto nas quatro condições experimentais, o que sugeriu influência das variáveis manipuladas nas condições. Para seis dos nove participantes, altas taxas de respostas autolesivas foram consistentemente associadas com uma condição experimental específica. Com base nesses resultados, os autores identificaram cinco padrões de respostas gerais para os participantes deste estudo. O primeiro padrão consistia em uma baixa apresentação de respostas autolesivas du277 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira rante a condição Brincadeira não-estruturada. Todos os oito participantes expostos a esta condição (o participante 1 foi excluído) exibiram porcentagens iguais ou abaixo de sua média geral. O segundo padrão, observado nas respostas de quatro participantes, foi uma maior ocorrência durante a condição Sozinho, indicando a autoestimulação como uma variável relevante. O terceiro padrão foi obtido com dois participantes e consistiu na baixa frequência de respostas em todas as condições experimentais, exceto a condição Demanda. O quarto padrão, identificado no participante 5, consistiu na apresentação de uma taxa mais alta de respostas autolesivas durante a condição de Desaprovação Social. O quinto e último padrão, observado em dois participantes, foi classificado como “indiferenciado” e consistiu em taxas de respostas similares entre as condições ou altas taxas em duas ou mais condições experimentais. Como previsto por Carr (1977), os padrões identificados evidenciaram que respostas autolesivas poderiam ser mantidas por diferentes reforçadores (diferentes funções). Os resultados do experimento foram importantes por demonstrarem a possibilidade de identificar variações nas taxas de respostas autolesivas ao se manipular sistematicamente algumas variáveis ambientais (e.g., retirada de demandas, atenção social). Se diferentes reforçadores poderiam manter respostas autolesivas, intervenções comportamentais deveriam considerar essas variáveis. Por exemplo, os autores suge278 rem que para um indivíduo que cutuca seu olho em função de produzir estimulação visual (reforçamento automático), o uso de massagem ocular de maneira contingente à ausência de respostas autolesivas poderia ser uma intervenção eficaz (Favell et al., 1982), visto que tal intervenção produziria a consequência reforçadora sem que o indivíduo engajasse em respostas autolesivas. Entretanto, se tais respostas autolesivas fossem mantidas por fuga de demandas (reforçamento negativo), a massagem ocular seria ineficaz. Nesse caso, intervenções que incluíssem períodos sem nenhuma demanda poderiam ser mais eficazes. Pode-se dizer que um dos achados mais relevantes deste experimento foi que a variabilidade na taxa de respostas autolesivas em um mesmo sujeito não é um processo aleatório. A utilização de condições experimentais bem definidas, análogas ao contexto natural e em um delineamento de sujeito único (que permitiu verificar efeitos da manipulação de variáveis sobre o comportamento-alvo de cada participante) foi fundamental para este achado. Foi possível, portanto, identificar variáveis relacionadas ao estabelecimento e/ou manutenção de comportamentos autolesivos a partir da comparação das taxas de respostas de uma mesma pessoa, entre diferentes condições. Deste modo, o presente estudo ofereceu uma metodologia eficaz para investigar múltiplos efeitos do ambiente na ocorrência de autolesivos. Capítulo XVII | Análise Funcional Duas limitações foram apontadas pelos autores no estudo de Iwata et al., 1982/1994. A primeira é que a metodologia pode não ter isolado completamente todas as variáveis que poderiam influenciar as respostas autolesivas. Por exemplo, para um comportamento em que atenção social funciona como reforçador, taxas altas de respostas autolesivas na condição Sozinho poderiam indicar não necessariamente ser função de reforço automático (autoestimulação), mas sim o primeiro estágio de uma curva de extinção, visto que nessa condição o reforçamento social era suspenso. Isto porque, uma resposta operante pode ocorrer em altas taxas durante os estágios iniciais de um procedimento de extinção, antes que seja vista uma diminuição significativa de sua ocorrência, e ser assim caracterizada a extinção da resposta. A segunda limitação se refere à possibilidade de a análise realizada ter sido incompleta. Por exemplo, respostas autolesivas que ocorressem majoritariamente na condição Demanda levantariam a hipótese de reforçamento negativo (fuga de demandas). Porém, alterações no comportamento a partir de alterações nas contingências (e.g., suspender o reforço do comportamento de fuga) acrescentaria maiores evidências da função de reforçamento negativo. Apesar dessas limitações, os resultados sugeriram grande utilidade da metodologia, tendo em vista a possibilidade de identificar empiricamente variáveis que afetam respostas autolesivas antes de se implementar alguma condição de tratamento (Iwata et al., 1982/1994). Além disso, a exposição dos participantes por curto período de tempo não foi maior que o período típico de situações usuais em que esses indivíduos engajavam em respostas autolesivas e, mesmo assim, o procedimento de avaliação forneceu dados para uma amplitude de variáveis que afetam estas respostas. Estes dois aspectos dão suporte à incorporação dessa metodologia em pesquisas que investiguem o tratamento de respostas autolesivas. DESDOBRAMENTOS As evidências empíricas de que respostas autolesivas poderiam ocorrer em função de diferentes fontes de reforçamento tem implicações diretas para o planejamento do tratamento de problemas de comportamento. Por exemplo, suponhamos uma pessoa que apresenta respostas autolesivas na escola, mantidas por fuga de demanda (reforçamento negativo, por ex., por escapar de atividades escolares). Alguém com pouco ou nenhum conhecimento de Análise do Comportamento poderia propor que o professor colocasse a pessoa “de castigo” todas as vezes que ela emitisse o comportamento, na expectativa de que essa consequência reduzisse o comportamento de frequência (ou seja, funcionasse como punição). Entretanto, como o reforçador do comportamento é exatamente escapar de determinadas tarefas escolares, a intervenção teria efeito 279 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira contrário: ao emitir o comportamento autolesivo, o castigo removeria a tarefa escolar (ou a atrasaria), funcionando como reforço. A intervenção, portanto, deveria considerar que o comportamento autolesivo é mantido por reforçamento negativo relacionado a tarefas escolares. A partir dessa informação, pode-se planejar intervenções como mudanças nas atividades em que o comportamento ocorre com maior frequência (tornando-as mais reforçadoras), ensinar a pessoa a pedir por breves pausas ao longo do período de realização das atividades, aumentar gradativamente a frequência de comportamentos de cooperação, entre outras possibilidades (para uma discussão sobre intervenções em comportamentos autolesivos, cf. Varella, 2016). O estudo de Iwata et al. (1982/1994) também se estendeu para outras topografias. A metodologia também se mostrou útil na identificação de variáveis ambientais relacionadas a agressões físicas (Northup et al., 1991), escapar repentinamente de cuidadores sem autorização (elopement, Piazza, Hanley, Bowman, Ruyter, Lindauer, & Saiontz, 1997), comportamentos destrutivos e opositores (Fisher, Ninness, Piazza, & Owen-Schryver, 1996), entre outros. De acordo com Beavers, Iwata e Lerman (2013), mais de 2.000 artigos foram publicados após o estudo de 1982, o que demonstra seu grande impacto na Análise do Comportamento. 280 CONSIDERAÇÕES FINAIS A metodologia da Análise Funcional Experimental desenvolvida por Iwata et al. (1982/1994) consistiu em um importante avanço em relação às intervenções baseadas nas estratégias de Modificação do Comportamento (Hanley, 2012). A partir de seus resultados, é possível aumentar as chances de sucesso da intervenção ao se tomar decisões mais fundamentadas a seu respeito, evitando escolhas de procedimentos apenas com base em palpites ou resultados obtidos com outras pessoas no passado. Ainda, segundo Hanley, conduzir uma análise funcional envolve questões importantes como considerar as particularidades do comportamento e da história de reforçamento de cada pessoa. A realização de uma análise funcional evita a implementação de contingências arbitrárias sem antes se fazer a pergunta mais importante: por que o comportamento-alvo ocorre? E a ABA, enquanto uma ciência aplicada e em constante desenvolvimento, dispõe hoje de metodologias empiricamente validadas para responder a essa pergunta. PARA SABER MAIS Hanley, Iwata, & McCord (2003). Apresenta uma excelente revisão de literatura sobre os estudos envolvendo análise funcional do comportamento até o ano 2000. Discute importantes implicações para o planejamento e condução das condições análogas. Capítulo XVII | Análise Funcional Beavers, Iwata, & Lerman (2013). Apresenta uma atualização da revisão de literatura acima, englobando 158 novos estudos, publicados entre 2001 até 2012. Hanley (2012). Discute questões de ordem práticas relacionadas à realização de avaliações funcionais do comportamento. Apresenta outras metodologias além da Análise Funcional Experimental (avaliações indiretas e descritivas) e discutindo suas vantagens e desvantagens. Iwata & Dozier (2008). Apresenta informações sobre a metodologia de análise funcional em linguagem simples e clara, fornecendo dicas e alguns detalhes importantes para o seu planejamento. Varella (no prelo). Discute algumas possibilidades de intervenções em comportamentos autolesivos a partir de estratégias de avaliação funcional do comportamento. REFERÊNCIAS Barlow, D. H., & Hayes, S. C. (1979). Alternate treatment design: one strategy for comparing the effects of two treatments in a single subject. Journal of Applied Behavior Analysis, 12, 199-210. Beavers, G. A., Iwata, B. A., & Lerman, D. C. (2013). Thirty years of research on the functional analysis of problem behavior. Journal of Applied Behavior Analysis, 46, 1-21. Bostow, D. E., & Bailey, J. S. (1969). Modification of severe disruptive and aggressive behavior using brief timeout and reinforcement procedures. Journal of Applied Behavior Analysis, 2, 31-37. Carr, E. G. (1977). The motivation of self-injurious behavior: A review of some hypotheses. Psychological Bulletin, 84, 800-816. Carr, E. G., Newsom, C. D., & Binkoff, J. A. (1976). Stimulus control of self-destructive behavior in a psychotic child. Journal of Abnormal Child Psychology, 4, 139-152. Baer, D. M., Wolf, M. M., & Risley, T. R. (1968). Some current dimensions of Applied Behavior Analysis. Journal of Applied Behavior Analysis, 1, 91-97. Corte, H. E., Wolf, M. M., & Locke, B. J. (1971). A comparison of procedures for eliminating self-injurious behavior of retarded adolescents. Journal of Applied Behavior Analysis, 4, 201-213. Bailey, J. S., Wolf., M. M., & Philips, E. L. (1970). Home-based reinforcement and the modification of pre-delinquents’ classroom behavior. Journal of Applied Behavior Analysis, 3, 223-233. Favell, J. E., McGimsey, J. F., & Schell, R. M. (1982). Treatment of self-injury by providing alternative sensory activities. Analysis and Intervention in Developmental Disabilities, 2, 83- 104. 281 André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira Ferster, C. B. (1958). Control of behavior in chimpanzees and pigeons by time out from positive reinforcement. Psychological Monographs: General and Applied, 72, 1-38. Fisher, W. W., Ninness, H. A., Piazza, C. C., & Owen-Schryver, J. S. (1996). On the reinforcing effects of the content of verbal attention. Journal of Applied Behavior Analysis, 29, 235-238. Hanley, G. P. (2012). Functional assessment of problem behavior: dispelling myths, overcoming implementation obstacles, and developing new lore. Behavior Analysis in Practice, 5, 54-72. Hanley, G. P., Iwata, B. A., & McCord, B. E. (2003). Functional analysis of problem behavior: a review. Journal of Applied Behavior Analysis, 36, 147-185. Iwata, B. A., & Dozier, C. L. (2008). Clinical application of Functional Analysis Methodology. Behavior Analysis in Practice, 1, 3-9. Iwata, B. A., Dorsey, M. F., Slifer, K. J., Bauman, K. E., & Richman, G. S. (1994). Toward a functional analysis of self-injury. Journal of Applied Behavior Analysis, 27, 197-209. (Reimpresso de Analysis and Intervention in Developmental Disabilities, 2, 3-20, 1982). Jones, F. H., Simmons, J. Q., & Frankel, F. (1974). An extinction procedure for eliminating self-destructive behavior in a 9-year-old autistic girl. Journal of Autism and 282 Childhood Schizophrenia, 4, 214-250. Kohlenberg, R. J. (1970). The punishment of persistent vomiting: a case study. Journal of Applied Behavior Analysis, 4, 241-245. Lovaas, 0. I., Freitag, G., Gold, V. J., & Kassorla, I. C. (1965). Experimental studies in childhood schizophrenia: Analysis of self-destructive behavior. Journal of Experimental Child Psychology, 2, 67-84. Mace, F. C. (1994). The significance and future of functional analysis methodologies. Journal of Applied Behavior Analysis, 27, 385-392. Measel, C. J., & Alfieri, P. A. (1976). Treatment of self-injurious behavior by a combination of reinforcement for incompatible behavior and overcorrection. American Journal of Mental Deficiency, 81, 147-153. Northup, J., Wacker, D., Sasso, G., Steege, M., Cigrand, K., Cook, J., & DeRaad, A. (1991). A brief functional analysis of aggressive and alternative behavior in outclinic settings. Journal of Applied Behavior Analysis, 24, 509-522. Pendergrass, V. E. (1972). Time out from positive reinforcement following persistent, high-rate behavior in retardates. Journal of Applied Behavior Analysis, 5, 85-91. Piazza, C. C., Hanley, G. P., Bowman, L. G., Ruyter, J. M., Lindauer, S. E., & Saiontz, Capítulo XVII | Análise Funcional D. M. (1997). Functional analysis and treatment of elopement. Journal of Applied Behavior Analysis, 30, 653-672. Risley, T. R. (1968). The effects and side effects of punishing the autistic behaviors of a deviant child. Journal of Applied Behavior Analysis, 1, 21-34. Varella, A. A. B. (no prelo). Intervenções em comportamentos de autoagressão e autoestimulação em pessoas com Transtorno do Espectro Autista. In R. Gorayeb, M. C. O. S. Miyazaki, & M. Teodoro (Orgs), Programa de atualização em psicologia clínica e da saúde (PROPSICO). Porto Alegre: Artmed Panamericana. Wolf, M. M., Risley, T., & Mees, H. (1964). Application of operant conditioning procedures to the behaviour problems of an autistic child. Behavior Research and Therapy, 1, 305-312. 283 Hernando Borges Neves Filho Recombinação de repertórios: criatividade e a integração de aprendizagens isoladas Hernando Borges Neves Filho Pontifícia Universidade Católica de Goiás Epstein, R., Kirshnit, C. E., Lanza, R. P. & Rubin, L. C. (1984). “Insight” in the pigeon: Antecedents and determinants of an intelligent performance. Nature, 308, 61-62. “Uma tarde, contrariando meus hábitos, tomei café preto e não consegui dormir. Multidões de ideias surgiram; senti-as colidindo até que pares se interligaram, formando uma combinação estável, por assim dizer” (Poincaré, 1913, p. 387) 284 Capítulo XVIII | Criatividade INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO A criatividade tem sido uma fonte inesgotável de especulações filosóficas e científicas. Seu escrutínio empírico tem sido um trabalho constante na Psicologia desde o início do século XX, e a Análise do Comportamento vem dando uma contribuição importante ao estudo deste tema a partir da análise de processos comportamentais relacionados com a origem de comportamentos novos. No início do século XX, uma das discussões mais acaloradas no meio científico tratava do que separava animais humanos de não humanos, e que tipo de diferenças eram essas (Mas, 2015). Toda essa discussão era suplantada pela efusiva eclosão da teoria da evolução de Darwin, que começava a ganhar adeptos eminentes na Psicologia (Boakes, 1984). Nesse contexto, um trabalho pioneiro e lembrado com frequência em livros texto é o de Wolfgang Köhler (1948) com chimpanzés (Pan troglodytes). Köhler expôs chimpanzés a diferentes tarefas de resolução de problemas e, em alguns casos, descreveu uma solução súbita da tarefa em questão como um “insight”. Este “insight” foi descrito por Köhler como uma topografia de resolução de problema súbita, que ocorria em um lampejo, de forma fluída e direcionada a uma meta (a solução do problema). Um exemplo deste desempenho se deu em uma situação problema na qual uma banana estava fora do alcance, suspensa por uma corda, e caixotes estavam disponíveis no ambiente. Diversos animais tinham acesso a essa situação simultaneamente. Diversos chimpanzés pularam e esticaram seus braços em direção a banana, sem alcança-la. Até que, subitamente um destes sujeitos, chamado Sultão, se aproxima de uma caixa e a carrega em direção a banana, coloca-a abaixo da posição da banana, sobe na caixa e agarra a banana diante do olhar atento da plateia (de chimpanzés e humanos). Rapidamente foram traçadas analogias antropomorfizadas que tratavam o desempenho de Sultão como similar ao “a-há!” que humanos em uma cultura ocidental costumam emitir ao resolver subitamente um problema (Jung-Beeman et al., 2004). Na época em que Köhler lançou seu livro, seus dados empíricos e suas manipulações experimentais contrastaram com a forma anedótica com a qual a inteligência animal era usualmente tratada em livros clássicos de Psicologia Comparada (Boakes, 1986; Delage & Carvalho Neto, 2010), e consequentemente seu método de teste sistemático de resolução de problema animal chamou a atenção de outros pesquisadores1. Köhler foi um pioneiro do estudo empírico da cognição animal, mas não foi o único. Pelo menos três de seus contemporâneos foram também pioneiros em suas metodologias empíricas: E. L. Thorndike, L. Hobhouse e R. Yerkes. Köhler (1948, p. 22) contrasta sua metodologia e seus dados aos dados obtidos por Thorndike com gatos em caixas problema. Köhler alinha e encontra pontos de confluência com às propostas de Hobhouse e Yerkes. Esta polarização gerou um longo debate sobre dois supostos tipos de resolução de problemas distintas: uma resolução tentativa e erro (como a obtida por Thorndike) ou uma resolução súbita por Insight (Delage & Carvalho Neto, 2006). A Universidade de Würzburg disponibiliza online em seu website algumas filmagens originais dos experimentos de Köhler (1948) com chimpanzés. 1 285 Hernando Borges Neves Filho Ao longo dos anos, e com a vasta repercussão dos trabalhos de Köhler, uma série de estudos sobre a resolução de problemas foi realizada com chimpanzés e outros animais em diferentes situações (Neves Filho, 2015). O debate acerca do “insight” chegou até mesmo a chamar a atenção de Pavlov e seus colegas, que adquiriram um casal de chimpanzés com o objetivo de replicar os achados de Köhler (para uma descrição detalhada da série de estudos de resolução de problemas em chimpanzés, realizados nos laboratórios de Pavlov, conferir Razran, 1961; Ladygina-Kots & Dembovskii, 1969; Windholz, 1984; Windholz & Lamal, 1985; Reznikova, 2007). A maioria dos estudos focava a capacidade de animais de diferentes espécies resolverem tarefas em uma primeira apresentação, de forma criativa. Uma menor parcela de estudos, não menos relevante, teve como objetivo explorar qual o efeito da aprendizagem sobre o desempenho súbito de resolução de problemas (Maier, 1931; 1937; Birch, 1945). Foi apenas uma questão de tempo até que pesquisadores de viés analítico comportamental dessem suas contribuições sobre este tópico. Project3 (Epstein, 1981). Foram abordados fenômenos comportamentais como o auto reconhecimento e a formação de self (Epstein, Lanza & Skinner, 1981), uso de memorandos (Epstein & Skinner, 1981), comunicação (Epstein, Lanza & Skinner, 1980), e até mesmo o comportamento de mentir (Lanza, Starr & Skinner, 1982). Dentre estes estudos, um que ganhou reconhecido destaque foi o que se propôs a identificar quais as variáveis históricas responsáveis pelo “insight” (Epstein, Kirshnit, Lanza & Rubin, 1984). Publicado no tradicional periódico Nature, este estudo trouxe à comunidade científica um novo processo comportamental demonstrado empiricamente, a recombinação de repertórios (ou interconexão de repertórios), e elencou com clareza qual o papel da aprendizagem na resolução súbita de um problema, e alguns dos processos comporEm geral, o termo “comportamento complexo” é pouco claro e cria uma distinção pouco útil (comportamento simples e comportamento complexo). Entretanto, os autores utilizam este termo na série de artigos do Columban Simulation Project para chamar a atenção de Psicólogos Cognitivos (Epstein, 1996). Em uma visão analítico comportamental, a dicotomia comportamento complexo vs. simples é eliminada, na medida em que se parte do pressuposto de que o que distingue diferentes comportamentos são suas variáveis de controle antecedente e consequente, e que em geral, chama-se de “complexo” comportamentos dos quais pouco se sabe sobre suas variáveis de controle (Donahoe & Palmer, 2004, p. 3). 2 O Columban Simulation Project foi uma resposta a febre cognitiva que tomou conta da psicologia experimental estadunidense na época. Neste momento das ciências cognitivas, estava em voga a metáfora do computador, que tinha como pressuposto básico o uso de um computador para simular e estudar fenômenos mentais (Cisek, 1999; Teixeira, 2008). O Columban Simulation Project visava dar uma alternativa biologicamente mais sensata e parcimoniosa: simular e estudar fenômenos tidos como mentais em organismos vivos, no caso, pombos (Epstein, 1981). O Columban Simulation Project hoje é apenas uma nota de rodapé em livros de história, mas seu pressuposto básico de estudar processos ditos mentais em organismos e não em máquinas, tem voltado a ter destaque nas ciências cognitivas, na medida em que a metáfora do computador perdeu força (Lopes, Lopes & Teixeira, 2004), e as abordagens evolutivas do comportamento vem novamente ganhando vigor (Chemero, 2009; Horik, Clayton & Emery, 2012). Um documentário de 1982 sobre o projeto, com a apresentação de B. F. Skinner, está disponível na íntegra no site de R. Epstein: http://drrobertepstein.com/index. php/videos 3 Na década de 1980, B. F. Skinner e alguns colaboradores publicaram uma série de experimentos cujo objetivo foi estudar fenômenos complexos2, ordinariamente chamados de cognitivos, em um tradicional espécime do laboratório de Análise do Comportamento: o pombo (Columba livia). Esses estudos faziam parte do que ficou conhecido como o Columban Simulation 286 Capítulo XVIII | Criatividade tamentais básicos envolvidos no desempenho criativo. DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Epstein et al. (1984) adaptaram uma das situações problemas do pioneiro trabalho de Köhler (1948) aos pombos. A tarefa consistiu em empurrar uma caixa em direção a uma banana de plástico afixada no teto da câmara experimental, subir na caixa, e bicar a banana. A banana foi escolhida sarcasticamente para mostrar que pombos, dado o treino adequado, poderiam exibir o mesmo desempenho que os chimpanzés de Köhler. A essa situação problema, deu-se o nome de teste de deslocamento de caixa (Cook & Fowler, 2014). Os autores manipularam explicitamente o treino que estes pombos receberam antes de serem expostos a situação de teste. Onze pombos participaram do experimento, e diferentes números de sujeitos receberam diferentes histórias experimentais antes de serem expostos a situação problema. Quatro sujeitos receberam o treino independente (não encadeado) de dois repertórios pré-requisito: (a) treino de empurrar direcionado (na qual uma caixa deveria ser empurrada em direção a um alvo verde), e; (b) subir na caixa e bicar um alvo (uma banana de plástico afixada no teto da câmara experimental). Todas as respostas foram consequenciadas com acesso a alimen- to, e os animais foram mantidos em regime de privação alimentar durante o período do experimento. Foram também realizadas sessões de extinção de voar em direção ao alvo. Nestas sessões o alvo ficava disponível, fora do alcance e sem a caixa, e nenhuma resposta era consequenciada. O treino da habilidade de empurrar direcionado consistia na modelagem de respostas de empurrar a caixa em direção a um alvo verde, que ficava afixado em uma das paredes da câmara, em posições alternadas a cada tentativa, na altura do piso. Também foram realizadas sessões de extinção de empurrar na ausência do alvo verde. O alvo do teste final (a banana de plástico) não esteve presente em nenhuma das sessões desta etapa. Durante o treino da habilidade de subir e bicar o alvo, a caixa permanecia fixa no piso da câmara, logo abaixo da posição onde o alvo estava afixado no teto. Tentativas de empurrar e caixa e bicar a mesma não foram consequenciadas. A posição da caixa e da banana foi aleatorizada a cada apresentação. Durante o treino, nenhum critério de aprendizagem foi utilizado, e os autores apenas afirmam que o teste foi realizado após os sujeitos emitirem respostas de empurrar direcionado e subir e bicar confiavelmente na presença de cada estímulo (empurrar na situação caixa e alvo, subir na situação caixa e banana). Posteriormente, Epstein (1996) afirma que a não utilização de critérios de aprendizagem foi 287 Hernando Borges Neves Filho intencional, para assegurar que nenhuma das duas respostas treinadas adquirisse um forte controle discriminativo durante o treino. Além dos quatro pombos que receberam o treino completo dos dois repertórios pré-requisito, dois outros sujeitos aprenderam somente a bicar o alvo, mas não a subir na caixa. Outros dois sujeitos aprenderam a subir na caixa e bicar o alvo, mas não a empurrar a caixa. Um terceiro par de sujeitos aprendeu a subir na caixa e bicar o alvo e a empurrar a caixa, mas de forma não direcionada (sem o alvo verde), e um último sujeito passou pelo treino completo (subir na caixa e bicar a banana, e empurrar direcionado), mas não recebeu as sessões de extinção de respostas de voar. Cada uma destas histórias de treino produziu um desempenho particular na situação de teste. Resultados e Discussão Os resultados dos quatro sujeitos que receberam o treino completo foram similares e consistentes entre si. No início do teste, os animais exibiram um padrão de respostas que os autores categorizaram como um estado de “confusão”. Este padrão consistia em o sujeito ficar parado, entre a caixa e o alvo, emitindo respostas de olhar alternadamente para a caixa e para a alvo. Após a “confusão”, os sujeitos passaram a ir em direção à banana e tentar alcança-la (nunca pulando ou voando), sem êxito. Após isso, novamente os sujeitos emitiram 288 os mesmos padrões de “confusão” do início do teste. Após estes momentos de “confusão” os sujeitos se aproximaram da caixa, e prontamente começaram a empurrá-la em direção à banana. Todos os sujeitos deste grupo guiavam seus empurrões em direção à banana olhando para a mesma a cada empurrão, corrigindo a rota de deslocamento da caixa se necessário. Todos os sujeitos pararam de empurrar a caixa quando ela estava abaixo da banana, ou próximo dela, e em seguida subiram na caixa e bicaram a banana, resolvendo o problema. Dos sujeitos que não receberam um treino completo dos dois repertórios pré-requisito, os que não haviam sido treinados a subir na caixa, não resolveram a tarefa, e passaram a maior parte da sessão tentando alcançar a banana esticando-se em direção a ela. No teste dos sujeitos que não aprenderam a empurrar a caixa, nenhuma resposta de empurrar foi registrada durante as sessões, logo, a tarefa não foi resolvida. Os sujeitos que não tiveram um treino de empurrar direcionado passaram a maior parte do tempo das sessões empurrando a caixa, em diversas direções, tendo inclusive passado pelo local onde estava pendurado o alvo. Um destes sujeitos resolveu a tarefa eventualmente, após 14 minutos, o outro apenas empurrou a caixa durante toda a sessão. O último sujeito, que recebeu o treino de subir a caixa e bicar o alvo e empurrar direcionado, mas não passou pelas sessões de extinção de voar em direção a banana, apresentou várias respostas em direção à Capítulo XVIII | Criatividade banana, como pular e voar, por diversos minutos, até que, após essa etapa inicial, começou a empurrar a caixa em direção à banana, subiu na caixa e bicou a banana. Os resultados deste estudo identificaram o papel da história de treino, como uma variável decisiva na resolução súbita de uma tarefa, já que os animais sem algum dos pré-requisitos comportamentais não resolveram o problema, ou o resolveram acidentalmente, ao passo que os animais que receberam o treino completo dos repertórios pré-requisitos, solucionaram a tarefa com topografia similar à clássica topografia de “insight”. Köhler foi um pioneiro ao mostrar que chimpanzés exibiam comportamentos originais e criativos em situações problemas criadas em um ambiente controlado. Epstein et al. (1984) mostraram a origem e uma forma de se construir estes comportamentos originais a partir de uma história de treino controlada. Epstein et al. (1984) também forneceram uma análise ponto a ponto da solução do problema. No início da resolução, o estado de “confusão” do sujeito é efeito do controle de duas respostas pelo contexto do problema. O alvo, a banana pendurada no teto, controla respostas de bicar, e a caixa controla respostas tanto de subir como de empurrar. A “confusão” é resultado da nova configuração dos estímulos, no caso, banana e caixa presentes, com a caixa afastada da banana. Alguns dos sujeitos começam a sessão subindo na caixa, como a caixa não está abaixo da banana, a resposta de subir não produz o reforço, portanto entra em extinção. Na extinção, o empurrar ocorre por ressurgência (Epstein & Skinner, 1980), e é controlado pela posição da banana, que adquire controle sobre o empurrar a partir de um processo que os autores chamam de generalização funcional. A generalização funcional seria distinta da generalização tradicional, já que neste caso, não há semelhança física entre os estímulos, apenas um compartilhamento de função. Ao passo que o animal empurra a caixa na direção da banana, o ambiente vai sendo progressivamente modificado, até que a caixa fique em baixo (ou próxima) da banana. Este novo estímulo (caixa em baixo da banana), produzido pelo sujeito, controla a segunda resposta, o subir, que é, na palavra dos autores, encadeada automaticamente ao empurrar, e produz a solução da tarefa. O animal para de empurrar a caixa assim que ela está próxima da banana pois ao produzir o estímulo “caixa em baixo da banana”, o subir se torna mais provável. O conjunto destes processos resultava no que os autores chamaram de recombinação de repertórios. A recombinação de repertórios é o processo comportamental pelo qual repertórios aprendidos independentemente um dos outros (ou seja, não encadeados) podem ser recombinados em uma forma ou sequência nova, dada um controle discriminativo (situação problema) adequada. A recombinação de repertórios passou a ser então uma nova maneira que a AC desenvolveu 289 Hernando Borges Neves Filho para lidar com a criatividade, ou a origem de comportamentos novos, ao lado de outros processos básicos como a generalização de estímulos, a indução, a variabilidade, a modelagem e o encadeamento de respostas. Além disso, a recombinação de repertórios, quando estudada em procedimentos de resolução de problemas, é também um modo de descrever os processos comportamentais envolvidos na solução súbita de um problema, tradicionalmente conhecido na literatura de Psicologia como um “insight”, desde que Köhler (1948) popularizou o termo a partir de seus experimentos com chimpanzés. DESDOBRAMENTOS Todos os trabalhos do Columban Simulation Project produziram muitas controvérsias. Franz de Waal, um eminente primatologista, chegou a comentar que o trabalho de auto reconhecimento em pombos (Epstein, Lanza & Skinner, 1981) é uma das “maiores bizarrices da ciência comportamental” (de Waal, 2001, p. 60)4. Diversas críticas foram também direcionadas ao traO principal ponto da crítica formulada por de Waal (2001) se pauta no fato de que primatas que apresentam o comportamento de auto reconhecimento em espelhos precisam de pouco ou nenhum treino explícito para que isso ocorra, ao passo que os pombos de Epstein, Lanza e Skinner (1981) precisaram de um treino direto de repertórios pré-requisito. A crítica passa ao largo do ponto principal do trabalho de Epstein, Lanza e Skinner (1981), que é construir em laboratório os pré-requisitos ontogenéticos para que esse desempenho seja observado, independente da espécie. O autor da crítica (de Waal, 2001) também aponta que replicações do estudo de Epstein, Lanza e Skinner (1981) não obtiveram o mesmo resultado. Considerações acerca dessas replicações podem ser encontradas no recente estudo de Uchino e Watanabe (2014) que replicaram adequadamente o trabalho original de Epstein, Lanza e Skinner (1981). 4 290 balho de “insight” (Epstein et al. 1984), em geral acusando que o mesmo se tratava de um simples encadeamento de respostas (Ellen & Pate, 1986). Esta crítica não procede, já que a rigor não se trata de um treino de encadeamento, dada a natureza independente dos treinos das habilidades pré-requisito (um treino encadeado asseguraria que a consequência de uma resposta seria também discriminativo de outra). Outra crítica (Ettlinger, 1984) aponta que não houve manipulação de variáveis paramétricas de treino (como treinos de repertórios em contextos distintos), o que sugere que o dado obtido possa ser um artefato metodológico (i.e. a resolução não passa de algo que pombos fazem por não haver outras coisas a não ser uma caixa e uma banana na situação de teste). A crítica de Ettlinger (1984) não se sustenta, graças aos dados com os pombos de Epstein et al. (1984) que não resolveram a tarefa com um treino incompleto dos repertórios pré-requisito, portanto, apesar dos autores não terem testado variáveis adicionais, o efeito do treino é claro. Sem o treino, não há resolução. Apesar destas críticas, maiores foram os impactos positivos do trabalho sobre a comunidade científica, tanto que Shettleworth (2012, pg. 217), especialista em cognição animal, coloca o trabalho de Epstein et al. (1984) como uma das maiores descobertas das ciências comportamentais do século XX, ao lado do pioneiro trabalho de Köhler (1948). Capítulo XVIII | Criatividade Desta forma, diversos trabalhos adicionais sobre a recombinação de repertórios foram publicados ao longo dos anos que se seguiram a publicação do trabalho original de Epstein et al. (1984). Com pombos, em variações do teste de deslocamento de caixa, Cook e Fowler (2014) e Neves Filho (2015) replicaram os achados originais de Epstein et al. (1984) envolvendo a recombinação de dois repertórios. Epstein (1985) e Luciano (1991) demonstraram a recombinação de três repertórios, a partir do desmembramento do treino de subir e bicar em dois repertórios independentes, e Epstein (1987) demonstrou a recombinação de quatro repertórios, adicionando uma porta que, se aberta, dava acesso a caixa. A recombinação de repertórios também foi observada em diferentes tarefas, para além do teste de deslocamento de caixa, e com diferentes espécies como: macacos-prego (Delage & Galvão, 2010; Neves Filho, 2010; Delage, 2011; Neves Filho, Carvalho Neto, Barros, & Costa, 2014), ratos albinos (Delage, 2006; Tobias, 2006; Ferreira, 2008, Leonardi, 2012; Neves Filho, Stella, Dicezare & Garcia-Mijares, 2015), corvos da Nova Caledônia (Taylor, Elliffe, Hunt & Gray, 2010; Neves Filho, 2015) e humanos (Sturz, Bodily & Katz, 2009). CONSIDERAÇÕES FINAIS A recombinação de repertórios é um processo comportamental relacionado a re- solução de problema e criatividade (Neves Filho & Carvalho Neto, 2013). A publicação do artigo de Epstein et al. (1984) trouxe uma nova linha de pesquisa para a Análise do Comportamento, e a recombinação de repertórios tem o potencial de ser um modelo animal para o estudo de comportamentos novos (Kubina, Morrison & Lee, 2011; Leonardy, Andery & Rossger, 2011; Murari & Henklain, 2013). Assim como procedimentos comportamentais bem estabelecidos, como os esquemas de reforçamento, são amplamente utilizados em pesquisas de neurociências e farmacologia (McKim, 2007), a recombinação de repertórios, como um modelo animal de criatividade, tem o potencial de servir aos mesmos propósitos. Na medida em que um procedimento produz a recombinação de repertórios, novas variáveis podem ser introduzidas, como o efeito de drogas. Será que um animal que aprenda uma das habilidades pré-requisito de um problema sob o efeito de álcool apresenta uma topografia de solução igual a um animal sóbrio? E se o animal estiver sob efeito da droga somente no teste? Estas são perguntas empíricas ainda em aberto. Algumas variáveis de treino já mapeadas indicam que se as habilidades pré-requisito são treinadas com reforços diferentes (água ou comida), a recombinação de repertórios não ocorre em pombos na tarefa de deslocamento de caixa (Neves Filho, 2015). Com macacos-prego, em uma tarefa de dois repertórios (encaixar ferramentas e alcançar alimento usando uma ferramen291 Hernando Borges Neves Filho ta) a recombinação ocorre se os repertórios forem treinados e testados em um mesmo ambiente (Neves Filho, 2010), porém não ocorre da mesma maneira se ao menos um dos repertórios é treinado em um local diferente do local onde a recombinação é testada (Neves Filho, Carvalho Neto, Barros, & Costa, 2014), o mesmo efeito de contexto distinto de treino e teste não é observado em corvos da Nova Caledônia de vida livre5 (Neves Filho, 2015). Uma série de outras variáveis ainda precisa ser analisada, e processos como a generalização funcional e o encadeamento automático precisam ser mais bem estudados e definidos (Luciano, 1991). De qualquer forma, todos estes dados sobre os efeitos de variáveis de treino sobre a recombinação de repertórios apontam que, de fato, para cada situação problema e espécie estudada, um conjunto de variáveis de treino podem ter efeitos distintos sobre a topografia de solução do problema. Diferentes tipos de treino produzem diferentes soluções, ou as inviabilizam. Desta forma, é possível, em tese, mapear que variáveis de treino produzem uma melhor recombinação, em uma tarefa específica, de modo a criar uma “tecnologia de insight”, ou uma “tecnologia da criatividade”, pautada em um método de aprendizagem que facilite Vida livre aqui indica que os animais que participaram do estudo não estavam em um laboratório. Neste estudo (Neves Filho, 2015), corvos da Nova Caledônia (Corvus moneduloides) foram capturados em seu ambiente natural e foram alojados em um aviário, no qual a coleta de dados ocorreu. Ao final da coleta, os animais foram liberados no mesmo local onde ocorreu a captura. Para mais informações sobre estudos de cognição animal em animais de vida livre, em especial corvos da Nova Caledônia, conferir Taylor, Elliffe, Hunt e Gray (2010). E para uma sugestão de algumas vantagens do estudo de animais de vida livre para a Análise do Comportamento, conferir Pritchard et al. (2016). 5 292 recombinações em diferentes tarefas. Este amadurecimento da área e do que se sabe sobre a recombinação de repertórios produz o contexto ideal para começarmos a aplicação do que sabemos, e observar, treinar e facilitar a recombinação em ambientes fora do laboratório, como escolas, ambientes de educação à distância, empresas e organizações. Este é o desafio do momento. PARA SABER MAIS Epstein (1996). Coletânea de artigos de Robert Epstein sobre a recombinação de repertórios e criatividade. No livro constam todos os experimentos do Columban Simulation Project nos quais Epstein esteve envolvido. O livro apresenta diversos comentários sobre o tema e a proposta do autor de uma “teoria generativa do comportamento”, baseada na recombinação de repertórios. Leonardy, Rossger, & Andery (2011). Artigo discutindo a importância da recombinação de repertórios para a Análise do Comportamento a partir de uma revisão de diversas dissertações de mestrado que utilizaram ratos como sujeitos. Neves Filho & Carvalho Neto (2013). Uma introdução à recombinação de repertórios e alguns exemplos interpretativos de onde podemos encontra-la em diversos produtos artísticos humanos. Murari & Henklain (2013). Artigo discutin- Capítulo XVIII | Criatividade do como a Análise do Comportamento lida com a criatividade, apresentando diversos processos básicos, incluindo a recombinação de repertórios. REFERÊNCIAS Birch, H. G. (1945). The relation of previous experience to insightful problem-solving. Journal of Comparative Psychology, 38, 367-383. Boakes, R. (1984). From Darwin to behaviourism: psychology and the minds of animals. UK: Cambridge University Press. Cisek, P. (1999). Beyond the computer metaphor: Behaviour as interaction. Journal of Consciousness Studies, 6, 125-42. Chemero, A. (2009). Radical embodied cognitive science. Cambridge: The MIT Press. Cook, R., & Fowler, C. (2014). ‘‘Insight’’ in pigeons: Absence of means–end processing in displacement tests. Animal Cognition, 17, 207-220. de Waal, F. (2001). The Ape and the sushi master. New York: Basic Books. Delage, P. E. G. A. (2006). Investigações sobre o papel da generalização funcional em uma situação de resolução de problemas (“insight”) em Rattus norvegicus. (Dissertação de Mestrado). Universidade Federal do Pará, Belém, Pará. Delage, P. E. G. A. (2011). Transferência de aprendizagem no uso de ferramentas por Macacos-Prego (Cebus cf apella). (Tese de Doutorado). Universidade Federal do Pará, Belém, Pará. Delage, P. E. G. A., & Carvalho Neto, M. B. (2006). Comportamento criativo & análise do comportamento II: Insight. Em H. J. Guilhardi, N. C. Aguirre. (Orgs.). Sobre Comportamento e Cognição: Expondo a Variabilidade Volume 18. Santo André: ESETec Editores Associados. Delage, P. E. G. A., & Carvalho Neto, M. B. (2010). Um modo alternativo de construir um operante: A aprendizagem recombinativa. Psicologia em Pesquisa, 4, 50-56. Delage, P. E. G. A., & Galvão, O. F. (2010). Generalidade da aprendizagem em situações de uso de ferramentas por um macaco-prego, Cebus Apella. Psicologia: Teoria e Pesquisa, 26, 687-694. Donahoe, J. W. & Palmer, D. C. (2004). Learning and complex behavior. Richmond: Ledgetop Publishing. Ellen, P. & Pate, J. L. (1986). Is Insight merely a response chaining? A reply to Epstein. The Psychological Record, 36, 155-160. Epstein, R. (1981). On pigeons and people: A preliminary look at the Columban Simula293 Hernando Borges Neves Filho tion Project. The Behavior Analyst, 4, 43-55. Epstein, R. (1985). The spontaneous interconnection of three repertoires of behavior in a pigeon (Columba livia). Psychological Record, 35, 131-141. Epstein, R. (1987). The spontaneous interconnection of four repertoires of behavior in a pigeon (Columba livia). Journal of Comparative Psychology, 101, 197-201. Epstein, R. (1996). Cognition, creativity and behavior: Selected essays. New York: Praeger. Epstein, R., Lanza, R. P., & Skinner, B. F. (1980). Symbolic communication between two pigeons (Columba livia domestica). Science, 207, 543-545. Epstein, R., & Skinner, B. F. (1980). Resurgence of responding after the cessation of response-independent reinforcement. Proceedings of the National Academy of Sciences USA, 77, 6251-6245. Epstein, R., & Skinner, B. F. (1981). The spontaneous use of memoranda by pigeons. Behaviour Analysis Letters, 1, 241-246. Epstein, R., Lanza, R., & Skinner, B. F. (1981). “Self-awareness” in the pigeon. Science, 212, 695. Epstein, R., Kirshnit, C. E., Lanza, R. P., & Rubin, L. C. (1984). “Insight” in the pigeon: 294 Antecedents and determinants of an intelligent performance. Nature, 308, 61-62. Ettlinger, G. (1984). Humans, apes and monkeys: The changing neuropsychological viewpoint. Neuropsychologia, 22, 685696. Ferreira, J. S. F. (2008). Comportamentos novos originados a partir da interconexão de repertórios previamente treinados: uma replicação de Epstein, Kirshnit, Lanza e Rubin, 1984. (Dissertação de Mestrado). Pontifícia Universidade Católica, São Paulo. Jung-Beeman, M., Bowden, E M., Haberman, J., Frymiare, J. L., Arambel-Liu, S.; Greenblatt, R., Reber, P. J., & Kounios, J. (2004). Neural activity when people solve verbal problems with insight. PLoS Biology, 2, e97. Horik, J. O., Clayton, N. S., & Emery, N. J. (2012). Convergent evolution of cognition in corvids, apes and other animals. In T. K. Shackelford & J. Vonk (Eds.), The Oxford handbook of comparative evolutionary psychology. New York: Oxford University Press. Köhler, W. (1948). The mentality of the apes (2nd ed.). New York: New Haven. Originalmente publicado em 1917. Kubina, R. M., Morrison, R. S., & Lee, D. L. (2011). Behavior analytic contributions to the study of creativity. The Journal of Creative Behavior, 40, 223-242. Capítulo XVIII | Criatividade Ladygina-Kots, N. N., & Dembovskii, Y. N. (1969). The psychology of primates. In M. Cole & I. Maltzman (Eds.). A Handbook of Contemporary Soviet Psychology. London: Basic Books. Lanza, R. P., Starr, J., & Skinner, B. F. (1982). “Lying” in the pigeon. Journal of The Experimental Analysis of Behavior, 38, 201-203. Leonardi, J. L., Andery, M. A. P. A., & Rossger, N. C. (2011). O estudo do insight pela análise do comportamento. Perspectivas em Análise do Comportamento, 2, 166-178. Leonardi, J. L. (2012). “Insight”: um estudo experimental com ratos. (Dissertação de Mestrado). Pontifícia Universidade Católica, São Paulo. Lopes, E. J., Lopes, R., & Teixeira, J. F. (2004). A psicologia cognitiva experimental cinquenta anos depois: a crise no paradigma do processamento de informação. Paidéia, 14, 17-26. Luciano, C. (1991). Problem solving behavior: An experimental example. Psicothema, 3, 297-317. Maier, N. R. F. (1931). Reasoning and learning. Psychological Review, 38, 332-346. Maier, N. R. F. (1937). Reasoning in rats and human beings. Psychological Review, 44, 365-378. Mas, M. (2015). El desarrollo de la psicologia comparada: de Darwin a Köhler. Boletín Informativo de la Sociedad Española de Historia de la Psicología, 54, 2-9. McKim, W. A. (2007). Drugs and behaviour: An introduction to behavioral pharmacology. New Jersey: Pearson Education. Murari, S. C., & Henklain, M. H. O. (2013). Criatividade em debate: algumas contribuições da análise do comportamento. Temas em Psicologia, 21, 17-29. Neves Filho, H. B., & Carvalho Neto, M. B. (2013). A criatividade nas artes: a recombinação de repertórios comportamentais como processo básico. Boletim Contexto, 38, 133-145. Neves Filho, H. B., Carvalho Neto, M. B., Barros, R. S., & Costa, J. R. (2014). Insight em macacos-prego (Sapajus spp.) com diferentes contextos de treino das habilidades pré-requisitos. Interação em Psicologia, 18, 333-350. Neves Filho, H. B., Stella, L. R., Dicezare, R., & Garcia-Mijares, M. (2015). Insight in the white rat: The spontaneous recombination of two repertoires. European Journal of Behavior Analysis, 16, 1-14. Neves Filho, H. B. (2010). Efeito de diferentes histórias de treino sobre a ocorrência de “Insight” em macaco-prego (Cebus spp.). (Dissertação de Mestrado). Universidade 295 Hernando Borges Neves Filho Federal do Pará, Belém, Pará. Neves Filho, H. B. (2015). Efeito de variáveis de treino e teste sobre a recombinação de repertórios em pombos (Columba livia), ratos (Rattus norvegicus) e corvos da Nova Caledônia (Corvus moneduloides). (Tese de Doutorado). Universidade de São Paulo, São Paulo. Poincaré, H. (1913). The foundations of science: Science and hypothesis, the value of science, science and method. New York: The Science Press. Pritchard, D. J., Hurly, A., Tello-Ramos, M. C., & Healy, S. D. (2016). Why study cognition in the wild (and how to test it)? Journal of the Experimental Analysis of Behavior, 105, 41-55. Razran, G. (1961). Raphael’s “idealess” behavior. Journal of Comparative and Physiological Psychology, 54, 366-367. Reznikova, Z. (2007). Animal intelligence: From individual to social cognition. UK: Cambridge University Press. Shettleworth, S. J. (2012). Do animals have insight, and what is insight anyway? Canadian Journal of Experimental Psychology, 66, 217-266. Sturz, B. R., Bodily, K. D., & Katz J. S. (2009). Dissociation of past and present experience in problem solving using a virtual environ296 ment. CyberPsychology & Behavior, 15, 1519. Taylor, A. H., Elliffe, D., Hunt, G., & Gray R. D (2010). Complex cognition and behavioural innovation in new caledonian crows. Proceedings of the Royal Society B, 277, 2637-2643. Teixeira, J. F. (2008). Mente, cérebro e cognição 3ª edição. Brasil: Vozes. Tobias, G. K. S. (2006). É possível gerar “Insight” através do ensino dos pré-requisitos por contingências de reforçamento positivo em Rattus norvegicus? (Dissertação de Mestrado). Universidade Federal do Pará, Belém, Pará. Uchino, E., & Watanabe, S. (2014). Self-recognition in pigeons revisited. Journal of the Experimental Analysis of Behavior, 102, 327-334. Windholz, G. (1984). Pavlov vs. Köhler: Pavlov’s little-known primate research. Pavlovian Journal of Biological Science, 19, 23-31. Wildholz, G., & Lamal, P. A. (1985). Köhler’s insight revisited. Teaching of Psychology, 12, 165-167. Cristiano Valério dos Santos Controlar para conhecer Cristiano Valério dos Santos Universidad de Guadalajara, Centro de Estudios e Investigación en Comportamiento Rescorla, R. A. (1968). Probability of shock in the presence and absence of CS in fear conditioning. Journal of Comparative and Physiological Psychology, 66, 1-5. “A simplificação do laboratório revela a relevância de fatores que poderíamos de outro modo deixar passar.” (Skinner, 1953/2003, p. 23). 297 Capítulo XIX | Condicionamento Pavloviano INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO DO EXPERIMENTO Alguns anos atrás, houve uma promoção de uma franquia de café na minha cidade. Por cada copo de café que você tomasse, os atendentes carimbavam um papel e, se você juntasse um número específico de carimbos, era possível ganhar prêmios. Como eu já gostava do café que eles faziam e me interessava conseguir um prêmio em particular, passei a tomar café duas ou três vezes ao dia nesse estabelecimento em vez de duas ou três vezes na semana (um testemunho de que esquemas de reforçamento funcionam ou de que necessito encontrar outro passatempo). Alguns dias depois que eu comecei meu novo regime “cafeínico”, senti que certas coisas não andavam bem no meu corpo. Pesquisei na internet algumas causas relacionadas ao que eu estava sentindo e descobri como possível causa a intoxicação por cafeína (deixarei com vocês a escolha de investigar o que é se quiserem). Acreditando que essa poderia ser a causa mais provável, resolvi mudar meu consumo do café comum para descafeinado e os sintomas desapareceram em poucos dias. Normalmente, apresento comportamentos que poderiam ser classificados como hipocondríacos, como acreditar que qualquer coisa no meu corpo é sintoma de algo muito mais grave e pensei: Poderia ser só coincidência que os sintomas tenham desaparecido? Afinal, é possível que os sin- tomas de uma doença mais grave tenham um curso de tempo predeterminado (não sei se é verdade, mas fazia sentido para mim na época). Então, como poderia ter mais certeza do meu próprio diagnóstico? Voltando a tomar café comum! Dito e feito, os sintomas voltaram. Pouco depois voltei a tomar café descafeinado por um tempo, até desintoxicar-me completamente, e os sintomas voltaram a desaparecer. Este tipo de situação na qual uma variável é introduzida e posteriormente retirada se conhece comumente como delineamento de reversão. Esse é só um exemplo anedótico de uma inferência causal, algo que todas as pessoas fazem constantemente. Por exemplo, quando alguém nos trata mal, podemos supor que essa pessoa “é assim com todo mundo” ou que “tem passado por alguma experiência desagradável nos últimos tempos”. O tipo de suposição que fazemos pode ter a ver com o grau de intimidade que temos com a pessoa: Se a conhecemos bem, talvez saibamos que ela não é assim normalmente e supomos que algo fora do comum aconteceu; se não a conhecemos bem, é possível que suponhamos, talvez erroneamente, que este é seu “temperamento normal”. A pergunta que nos interessa – e que todos deveríamos fazer antes de acabar com a reputação de alguém por algo que pode ser um evento isolado – é como podemos ter certeza de nossas suposições. No exemplo do meu problema com o café, o pequeno “experimento” que realizei 298 Cristiano Valério dos Santos comigo mesmo me deu mais confiança de que os sintomas que eu apresentava se deviam à natureza das bebidas que eu estava consumindo. Contudo, essas bebidas são produtos compostos por vários elementos e a causa dos meus sintomas pode ter sido a cafeína ou qualquer outro componente presente na bebida. Para saber com mais certeza ainda qual era o componente responsável, não bastaria que eu deixasse de tomar café; eu teria que continuar tomando as bebidas que geralmente consumia, com todos os seus componentes menos o elemento que eu achava que estava relacionado ao que me estava acontecendo, neste caso a cafeína. Por isso, tive a ideia de consumir a mesma bebida, porém sem cafeína. Como os sintomas desapareceram e a única variável alterada tinha sido a cafeína, posso dizer com boa precisão que a cafeína foi responsável pelos sintomas. Esse tipo de situações nas quais mantemos constantes todos os elementos que não nos interessam num determinado momento e que poderiam invalidar a minha inferência causal se conhece como controle experimental e é a âncora de qualquer ciência. No entanto, às vezes não é tão simples saber o que temos que controlar, principalmente quando o objeto de estudo é novo e as variáveis das quais o fenômeno é função são pouco conhecidas. O estudo sistemático do comportamento dos organismos é relativamente recente em comparação com outros objetos de estudo e, portanto, ainda é mais suscetível de padecer do problema 299 da ignorância sobre quais variáveis devem ser controladas. A revisão feita por Rescorla (1967) sobre os protocolos de controle experimental em estudos de condicionamento respondente reflete bem essa questão. O condicionamento respondente, também conhecido como condicionamento clássico ou pavloviano, refere-se a uma mudança comportamental que é resultado da relação sistemática entre dois estímulos (ver M. Lattal, 2013, para uma revisão ampla sobre o tema). Um desses estímulos evoca uma resposta no organismo com uma alta probabilidade, geralmente sem que o organismo tenha uma experiência prévia com ele, e é denominado estímulo incondicionado (US). O outro estímulo inicialmente evoca outras respostas no organismo, porém, como resultado da relação com o estímulo incondicionado, passa a evocar respostas diferentes que não evocava antes. Por exemplo, se uma pessoa ingerir uma comida que esteja contaminada com bactérias nocivas ao organismo, a presença dessas bactérias evocará uma série de respostas fisiológicas com uma probabilidade muito alta, tais como febre, náuseas, vômito e diarreia. Como essas respostas fisiológicas ocorreram como resultado da ingestão de uma comida específica (i.e., não ocorreram como resultado da ingestão de outro tipo de comida), é provável que ocorra uma mudança comportamental como resultado dessa relação: a pessoa provavelmente sentirá náusea ao ver esse alimento específico e evitará consumi-lo, mesmo que não es- Capítulo XIX | Condicionamento Pavloviano teja contaminado. Esse é, a propósito, um dos principais procedimentos usados para estudar condicionamento respondente no laboratório, conhecido como aversão a sabores (Garcia, Kimeldorf, & Koelling, 1955). Considera-se que o condicionamento respondente, portanto, é resultado da relação entre os dois estímulos. O problema neste tipo de procedimento é que a apresentação dos estímulos pode por si só produzir efeitos no comportamento que não necessariamente são resultado da relação entre eles, que é a condição necessária para se falar de condicionamento respondente. Na situação com a comida, por exemplo, é possível que o alimento por si mesmo possa causar náusea na pessoa sem que esteja contaminado (eu tenho esse problema com o aipo). Para ter certeza de que as mudanças no comportamento se devem à relação entre os estímulos e não à mera apresentação dos estímulos, pesquisadores e pesquisadoras desse fenômeno desenvolveram alguns protocolos experimentais de controle que permitem descartar os efeitos que não são resultados da manipulação de interesse. Rescorla (1967) faz uma revisão de seis desses protocolos de controle. mento do organismo. O segundo é apresentação de um estímulo condicionado novo, que não se apresenta antes das tentativas do teste para avaliar se houve condicionamento de fato, com o objetivo de estimar o efeito incondicionado do estímulo. O terceiro é a apresentação apenas do estímulo incondicionado o mesmo número de vezes que se apresenta ao grupo experimental, para avaliar possíveis efeitos de sensibilização ou habituação ao estímulo incondicionado (sensibilização e habituação se referem ao aumento ou diminuição, respectivamente, da probabilidade ou magnitude de uma resposta como resultado da mera apresentação repetida de um estímulo). O quarto é o procedimento explicitamente desemparelhado. Nesse procedimento, o estímulo incondicionado nunca é apresentado de maneira temporalmente próxima ao estímulo condicionado. O quinto é o emparelhamento reverso, no qual se apresenta o estímulo incondicionado antes do estímulo condicionado. Finalmente, o sexto é o condicionamento discriminado, no qual um estímulo condicionado é apresentado de maneira contígua ao estímulo incondicionado, enquanto que outro estímulo é apresentado explicitamente desemparelhado. O primeiro deles é apresentação apenas do estímulo condicionado a um grupo diferente de sujeitos o mesmo número de vezes que se apresenta ao grupo experimental. Este protocolo de controle foi criado para avaliar os efeitos de familiaridade com o estímulo condicionado sobre o comporta- Rescorla (1967) defendeu que um critério lógico para avaliar um procedimento de controle adequado é se o procedimento retém o maior número possível de características similares ao procedimento experimental, somente eliminando algum aspecto importante. No caso do condicionamento, 300 Cristiano Valério dos Santos tanto respondente como operante, a variável que supomos ser responsável pelas mudanças comportamentais é a relação que se estabelece entre os estímulos ou entre uma resposta e uma consequência, respectivamente. Considerando esse critério, todos os seis protocolos de controle padecem de problemas e, segundo Rescorla, todos esses problemas têm uma origem comum: A crença de que a variável mais importante no condicionamento respondente é a contiguidade temporal entre os estímulos. O primeiro protocolo, apresentação do estímulo condicionado sozinho, tem o problema de que os sujeitos do grupo controle não são expostos à mesma quantidade de apresentações do estímulo incondicionado, além de que as apresentações repetidas do estímulo condicionado sem o estímulo incondicionado podem não gerar o mesmo nível de habituação que quando se apresenta junto com o estímulo incondicionado. O segundo protocolo, apresentação de um novo estímulo condicionado, além dos problemas anteriores, também não controla o fato de os sujeitos do grupo experimental já terem a experiência com o estímulo condicionado. O terceiro protocolo, apresentação do estímulo incondicionado sozinho, tem o problema de que os sujeitos do grupo controle não são expostos à mesma quantidade de apresentações do estímulo condicionado. O quarto, o quinto e o sexto protocolos têm um problema similar: Esses três protocolos, apesar de removerem a relação positiva entre o estímulo condiciona301 do e o incondicionado, ao mesmo tempo introduzem uma relação negativa entre eles, isto é, sempre que o estímulo condicionado estiver presente, o estímulo incondicionado nunca o seguirá. Para contornar esses problemas, Rescorla (1967) propôs outro tipo de protocolo de controle, que ele chamou de verdadeiramente aleatório. Nesse caso, os dois estímulos são programados de maneira completamente aleatória e independente, de tal forma que o grupo controle é exposto à mesma quantidade de apresentações de ambos estímulos que o grupo experimental e, inclusive, alguns emparelhamentos acidentais entre estímulos podem ocorrer. A única diferença é a ausência de uma contingência temporal regular entre eles. A maior vantagem desse procedimento, segundo o autor, é que os seis protocolos descritos anteriormente, de alguma forma, foram criados para excluir fatores específicos, como a sensibilização ao estímulo incondicionado ou a familiaridade com o estímulo condicionado; o procedimento verdadeiramente aleatório permite excluir todos os fatores que não estão relacionados ao condicionamento respondente, sem ter a necessidade de especificar a priori quais seriam esses fatores. Subjacente à ideia do procedimento de controle verdadeiramente aleatório encontra-se a noção de contingência, que é definida como uma relação de dependência entre eventos. A ocorrência de um evento Capítulo XIX | Condicionamento Pavloviano A é contingente, ou depende da ocorrência de outro evento, B, se a probabilidade do primeiro condicional à presença do segundo [p(A/B)] é diferente da probabilidade do primeiro condicional à ausência do segundo [p(A/~B)]. Um aspecto importante dessa definição é que a relação de contingência se expressa num continuum que inclui desde relações negativas, quando p(A/B) é menor que p(A/~B), até relações positivas, quando p(A/B) é maior que p(A/~B). Isso abre espaço para o estudo de relações entre estímulos tanto excitatórias (i.e., quando a ocorrência do estímulo aumenta a probabilidade de ocorrência da resposta) como inibitórias (i.e., quando a ocorrência do estímulo diminui a probabilidade de ocorrência da resposta), além de situações nas quais não há contingência entre eventos [i.e., p(A/B) = p(A/~B)]. Para ilustrar a importância dessas relações, será descrito um estudo de Rescorla (1968), que foi o primeiro a realizar manipulações paramétricas dessas probabilidades, e abriu as portas para o estudo de relações de contingência negativa, como no experimento posterior de Rescorla (1969). DESCRIÇÃO DO EXPERIMENTO Objetivo e Método Até a publicação do trabalho de Rescorla (1968), existia a noção de que a contiguidade temporal entre os estímulos, definida como a ocorrência dos estímulos em proximidade temporal um com o outro, era a variável necessária e suficiente para que houvesse condicionamento respondente. O estudo de Rescorla de 1968 foi constituído de dois experimentos e o primeiro deles tinha como objetivo isolar os efeitos da contiguidade temporal dos efeitos da contingência entre os estímulos. Para alcançar esse objetivo, 24 ratos Sprague-Dawley foram expostos a um procedimento de supressão condicionada (Estes & Skinner, 1941) em caixas operantes tradicionais, com uma barra de resposta, um comedouro, uma luz para iluminação geral, um alto-falante pelo qual o experimentador poderia apresentar um tom e um gerador de choques elétricos que poderia eletrificar o piso da caixa. Nesse procedimento, os ratos foram treinados inicialmente a pressionar uma barra e recebiam pelotas de comida de acordo com um esquema de reforçamento intervalo variável (VI) 2 min. Depois de cinco dias de treino, as barras foram removidas da caixa e cinco sessões de condicionamento respondente foram realizadas. Para um grupo de ratos, denominado R-1 (n=8), 12 tons de dois minutos de duração (CS) foram apresentados mais ou menos a cada oito min e outros 12 choques elétricos de 0,5 s de duração e 0,9 mA de intensidade (US) foram apresentados aleatoriamente e de maneira independente dos tons [p(choque/tom) = p(choque/ ~tom)]. Um segundo grupo, denominado G, passou por um procedimento similar, exceto que todos os choques que ocorreriam na ausência dos tons foram eliminados. Assim, os ratos do grupo G receberam a mesma quantidade de choques na presença do tom que os ratos do grupo R-1, 302 Cristiano Valério dos Santos mas nenhum choque na ausência do tom, o que caracterizou diferentes probabilidades de choque na presença e na ausência do tom e, portanto, uma relação de contingência positiva [p(choque/tom) > p(choque/ ~tom)]. Contudo, os ratos do grupo G receberam menos choques do que os ratos do grupo R-1 e, para controlar essa diferença, um terceiro grupo, denominado R-2, foi exposto à mesma quantidade de choques que o grupo G, mas apresentados de maneira aleatória e independente do tom. Depois da fase de condicionamento, os ratos foram expostos a 10 sessões semelhantes às sessões de treino, com a exceção que houve quatro apresentações do tom sobrepostas ao esquema de reforçamento VI 2 min, sem a apresentação de choques depois de cada tom. taxa de respostas durante o estímulo condicionado em comparação com a taxa de respostas em um período equivalente antes do estímulo; quanto maior a supressão, mais forte o efeito do condicionamento. No primeiro experimento, observou-se supressão no grupo G, o qual havia sido exposto a diferentes probabilidades de choque em presença ou ausência do estímulo, e não houve supressão para os outros dois grupos, expostos ao procedimento verdadeiramente aleatório, independentemente da quantidade total de choques recebidos. No segundo experimento, esse resultado foi replicado: Quanto menor a probabilidade de choque na ausência do tom, mais forte era a supressão. Por outro lado, quando a probabilidade de choque na presença ou ausência do tom era igual, não houve supressão. No segundo experimento, Rescorla realizou um estudo paramétrico com 10 grupos de ratos. Cada grupo foi exposto a um par de probabilidades distinto, por exemplo 0,4-0,4, 0,4-0,2, 0,2-0,0, entre outros. O primeiro valor se referia à probabilidade de choque durante o estímulo condicionado (tom) e o segundo valor se referia à probabilidade de choque na ausência do estímulo condicionado. Os demais detalhes do procedimento foram como no primeiro experimento. Esses resultados apoiaram fortemente a ideia de que a contingência entre os estímulos é a variável principal na determinação do condicionamento respondente e não a ocorrência dos dois estímulos em contiguidade temporal. Resultados e Discussão A medida principal usada no estudo foi a razão de supressão, que se refere à 303 DESDOBRAMENTOS A proposta de Rescorla (1967), que inicialmente começou como uma discussão acerca dos tipos de protocolos de controle existentes em pesquisas sobre condicionamento respondente, e a sugestão de um protocolo mais adequado, serviu de base para que se questionasse uma ideia muito Capítulo XIX | Condicionamento Pavloviano arraigada em psicologia experimental até essa época: a noção de que a contiguidade temporal entre os eventos era suficiente para que se produzissem mudanças no comportamento dos organismos. Atualmente, essa discussão continua em vigor em diferentes áreas da Análise do Comportamento, no que se conhece como a discussão entre a postura molar e a postura molecular (Baum, 2002; Dinsmoor, 2001). A ideia de que o comportamento dos organismos é influenciado por contingências entre estímulos se alinha com uma postura molar de comportamento, a qual defende que tanto o comportamento como as variáveis que o afetam são fenômenos que se estendem no tempo, em contraposição com a postura molecular, que centra suas explicações em relações de contiguidade espaço-temporal. É claro que nem a postura molar ignora efeitos de variáveis locais contíguas à ocorrência de respostas específicas, como demonstrado na análise que fizeram Davison e Baum (2000) do comportamento de escolha, nem a postura molecular ignora o efeito de variáveis claramente estendidas no tempo, como a probabilidade ou a contingência. No entanto, mesmo que reconheçam o efeito dessas variáveis, os defensores de uma postura molecular buscarão explicar como os organismos são afetados por essas variáveis estendidas no tempo apelando a processos contíguos à ocorrência de respostas discretas temporalmente definidas, como o caso das teorias bifatoriais propostas para explicar o comportamento de esquiva (Dinsmoor, 2001). Por outro lado, defensores de uma postura molar buscarão encaixar o efeito variáveis localmente definidas em padrões comportamentais mais amplos, como por exemplo a análise de Rachlin (2000) sobre o autocontrole. Essas questões têm gerado debates acirrados sobre a natureza mesma dos fenômenos psicológicos e sobre a melhor maneira de estudá-los. Um segundo desdobramento importante é que a noção de contingência como diferença de probabilidades (Rescorla, 1967, 1968) abriu as portas para o estudo de outros fenômenos até então pouco discutidos, como é o caso da inibição condicionada. A inibição condicionada se refere aos efeitos inibitórios de um estímulo que foi previamente apresentado com o estímulo incondicionado em uma contingência negativa, ou seja, a probabilidade do estímulo incondicionado dada a ausência do estímulo condicionado é maior que a probabilidade do estímulo incondicionado dada a presença do estímulo condicionado. Por exemplo, se os choques ocorrem mais frequentemente na ausência de um tom que em sua presença, haveria uma contingência negativa entre o tom e o choque. Posteriormente, quando se apresenta esse estímulo junto com outro estímulo que já havia adquirido propriedades excitatórias, observa-se uma diminuição da probabilidade da resposta ante o estímulo que era excitatório (Rescorla, 1969). Antes da proposta de Rescorla (1967, 1968), o fenômeno de inibição em condicionamento respondente não tinha um lugar 304 Cristiano Valério dos Santos certo, devido em grande parte à ideia de que o condicionamento respondente era resultado somente da contiguidade temporal entre os estímulos. Se isso fosse correto, então apresentar o estímulo incondicionado na ausência do estímulo condicionado não deveria resultar em nenhum tipo de efeito e, portanto, não fazia sentido perguntar o que aconteceria nesse caso. Outro desdobramento interessante é que, embora o procedimento verdadeiramente aleatório tenha sido proposto como uma condição de controle para a aprendizagem, com a suposição de que não se aprenderia nada ao estar exposto a apresentações independentes de dois estímulos, estudos posteriores mostraram que essa suposição é falsa. Poucos anos depois dos trabalhos de Rescorla, foram encontradas evidências de que a exposição à ausência de contingência entre dois estímulos dificulta a aprendizagem posterior quando se estabelece uma relação de contingência entre os mesmos estímulos, e esse efeito parece não ser resultado somente da apresentação isolada de qualquer dos dois estímulos por si sós (Baker, 1976; Baker & Mackintosh, 1979). Este fenômeno hoje se conhece como irrelevância aprendida. CONSIDERAÇÕES FINAIS Em um texto de 1988, Rescorla argumentou que o condicionamento respondente havia mudado muito nos 20 anos 305 anteriores à publicação desse artigo, mas a forma como o tema era apresentado nos livros de Psicologia não havia acompanhado a evolução da área. Esse problema deveu-se, em parte, a que acreditamos já saber tudo o que é possível saber sobre o fenômeno. Afinal, é só um estímulo que se relaciona a outro e adquire nova função. No entanto, a natureza simples do condicionamento respondente é enganosa e ainda é necessário responder muitas perguntas. A primeira delas tem a ver com as condições que produzem o condicionamento respondente. A análise feita por Rescorla e seus experimentos posteriores junto com outros fenômenos como o bloqueio (Kamin, 1968), o sombreamento (Mackintosh, 1974), a inibição latente (Lubow, 1973) e a inibição condicionada (Rescorla, 1969), entre outros, revelam que o condicionamento respondente pode ocorrer ou não dependendo de muitos outros fatores que não só a contiguidade temporal entre os estímulos. A segunda pergunta tem a ver com o que é aprendido. Por exemplo, estudos sobre condicionamento de segunda ordem, nos quais um estímulo neutro se relaciona a um estímulo condicionado, têm sugerido que, com estímulos compostos, o comportamento do organismo é controlado por relações hierárquicas entre os estímulos, e não pela soma dos efeitos dos elementos que compõe um estímulo agindo em paralelo (Rescorla, 1980). Além disso, há evidências que sugerem que, quando um estímulo sinaliza uma relação entre outros dois estímulos (o Capítulo XIX | Condicionamento Pavloviano que se conhece como “occasion-setting”), os estímulos podem ter funções tanto excitatórias como inibitórias ao mesmo tempo com diferentes elementos da relação (Rescorla, 1980). Esses dados têm sido usados como evidência que apoia a ideia de que os estímulos, em lugar de eliciar uma resposta, como tradicionalmente se pensava, modulam sua ocorrência. Todos esses dados mencionados, em conjunto, sugerem que o fenômeno de condicionamento respondente é muito mais complexo do que se imaginava. Além disso, é amplamente reconhecido o papel que o condicionamento respondente tem tanto no desenvolvimento como no tratamento de muitos problemas psicológicos, como transtornos de ansiedade ou disfunções sexuais (Bellack, Hersen, & Kazdin, 1990). Menos conhecido, mas igualmente importante, é o papel do condicionamento respondente em fenômenos fisiológicos como a imunologia. Desde já algumas décadas, sabe-se que a resposta imunológica é afetada pela apresentação de estímulos previamente emparelhados com substâncias imunossupressoras ou facilitadoras (ver Ader, Cohen, & Felten, 1995 para uma revisão da literatura) e esse fato já foi usado como coadjuvante no tratamento de doenças autoimunes como o lúpus (Olness & Ader, 1992). Igualmente, há propostas plausíveis de desenvolvimento de tolerância à drogas que se baseiam nos princípios do condicionamento respondente (Poulos, Hinson, & Siegel, 1981). O condicionamento respondente também pode estar relacionado a fenômenos psicológicos que normalmente não pensaríamos estar relacionados. Numa revisão da literatura sobre juízos de causalidade, Allan (1993) argumentou que a maneira como julgamos se dois eventos estão relacionados ou não, se um influencia o outro, ou a efetividade de uma variável sobre outra, pode ser entendida como uma relação entre estímulos semelhante ao condicionamento respondente. Inclusive as variáveis que fazem que um estímulo condicionado adquira mais fortemente a capacidade de evocar a resposta condicionada parecem ser as mesmas que fazem com que julguemos como mais forte a relação de causalidade entre dois eventos (ver Allan, 1993 para uma revisão dos experimentos realizados sobre o tema). Especificamente relacionada a noção de contingência, uma prática muito comum no contexto clínico ou educativo é o que se conhece como reforçamento diferencial de outras respostas (DRO), que se define como a entrega do reforçador após períodos específicos de tempo durante os quais uma resposta específica não ocorreu. Essa prática é um exemplo claro de contingência negativa entre uma resposta específica e um reforçador putativo e ilustra o poder dessas contingências que até então haviam sido pouco estudadas. Por fim, embora os efeitos comportamentais de eventos independentes da res306 Cristiano Valério dos Santos posta já tivessem sido analisados em pesquisas sobre condicionamento operante, como no caso do trabalho de Skinner (1948) sobre superstição em pombos, seu uso como estratégia de controle experimental não era tão difundido, salvo honrosas exceções, como Skinner (1938) e Herrnstein e Hineline (1966). Contudo, para poder falar de condicionamento operante, também é necessário ter certeza de que as mudanças no comportamento são produto da relação de contingência entre a resposta e a consequência. Um exemplo desse tipo de procedimento é o estudo de Stein, Xue e Belluzi (1993), no qual os autores queriam estudar o condicionamento operante in vitro reforçando as respostas das células piramidais com microinjeções de dopamina. Para que a demonstração pudesse ter êxito, era necessário demonstrar que o aumento na taxa de respostas das células era resultado da contingência entre responder e receber dopamina e não devido a um aumento indiscriminado do responder pela presença de mais dopamina no sistema. Portanto, foi realizada uma condição de controle na qual as microinjeções de dopamina ocorriam de maneira aleatória, sem relação com a resposta dos neurônios. Comparando os dados dessa condição de controle com a condição na qual as microinjeções de dopamina ocorriam de maneira contingente às respostas, os autores puderam concluir que os efeitos reforçadores dos agentes dopaminérgicos podem ser verificados in vitro. 307 PARA SABER MAIS Rescorla (1969). Um dos primeiros estudos no qual as relações de contingência negativa entre estímulos foram avaliadas sistematicamente. Rescorla & Wagner (1972). Neste texto, os autores apresentam o modelo de Rescorla-Wagner para explicar os fenômenos do condicionamento respondente. Neste modelo, os autores introduzem o conceito de discrepância e defendem que o condicionamento respondente é resultado desse fenômeno. Esse conceito tem sido muito útil para diferentes modelos e teorias em diferentes áreas. Miller, Barnet, & Grahame (1995). Uma revisão dos pressupostos básicos, sucessos e fracassos do modelo de Rescorla-Wagner. Ader & Cohen (1975). Este experimento foi o primeiro a testar sistematicamente os efeitos do condicionamento respondente nas respostas imunológicas. Rescorla (1980). Neste livro, Rescorla descreve uma série de experimentos sobre condicionamento de ordem superior. Com essa preparação experimental, foi possível responder a muitas perguntas sobre o que é aprendido no caso do condicionamento respondente. Capítulo XIX | Condicionamento Pavloviano REFERÊNCIAS Ader, R., & Cohen, N. (1975). Behaviorally conditioned immunosuppression. Psychosomatic Medicine, 37, 333-340. Davison, M., & Baum, W. M. (2000). Choice in a variable environment: Every reinforcer counts. Journal of the Experimental Analysis of Behavior, 74, 1-24. Ader, R., Cohen, N., & Felten, D. (1995). Psychoneuroimmunology: Interactions between the nervous system and the immune system. The Lancet, 345, 99-103. Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75, 311-333. Allan, L. G. (1993). Human contingency judgments: Rule based or associative? Psychological Bulletin, 11, 435-448. Estes, W. K., & Skinner, B. F. (1941). Some quantitative properties of anxiety. Journal of Experimental Psychology, 29, 390-400. Baker, A. G. (1976). Learned irrelevance and learned helplessness: Rats learn that stimuli, reinforcers, and responses are uncorrelated. Journal of Experimental Psychology: Animal Behavior Processes, 2, 130-141. Garcia, J., Kimeldorf, D. J., & Koelling, R. A. (1955). Conditioned aversion to saccharin resulting from exposure to gamma radiation. Science, 122, 157-158. Baker, A. G., & Mackintosh, N. J. (1979). Preexposure to the CS alone, US alone, or CS and US uncorrelated: Latent inhibition, blocking by context or learned irrelevance? Learning and Motivation, 10, 278-294. Baum, W. M. (2002). From molecular to molar: A paradigm shift in behavior analysis. Journal of the Experimental Analysis of Behavior, 78, 95-116. Bellack, A. S., Hersen, M., & Kazdin, A. E. (Eds.). (1990). International handbook of behavior modification and therapy. New York: Plenum Press. Herrnstein, R. J., & Hineline, P. N. (1966). Negative reinforcement as shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 9, 421-430. Lubow, R. E. (1973). Latent inhibition. Psychological Bulletin, 79, 398-407. Mackintosh, N. J. (1974). The psychology of animal learning. Oxford: Academic Press. Miller, R. R., Barnet, R. C., & Grahame, N. J. (1995). Assessment of the Rescorla-Wagner model. Psychological Bulletin, 117, 363-386. Poulos, C. X., Hinson, R. E., & Siegel, S. (1981). The role of Pavlovian processes in 308 Cristiano Valério dos Santos drug tolerance and dependence: Implications for treatment. Addictive Behaviors, 6, 205-211. Rachlin, H. (2000). The science of self-control. Cambridge: Harvard University Press. Rescorla, R. A. (1967). Pavlovian conditioning and its proper control procedures. Psychological Review, 74, 71-80. Rescorla, R. A. (1968). Probability of shock in the presence and absence of CS in fear conditioning. Journal of Comparative and Physiological Psychology, 66, 1-5. Rescorla, R. A. (1969). Pavlovian conditioned inhibition. Psychological Bulletin, 72, 77-94. Rescorla, R. A. (1980). Pavlovian second-order conditioning: Studies in associative learning. Hillsdale, NJ: Erlbaum Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. In A. H. Black & W. F. Prokasy (Eds.), Classical conditioning II: Current Research and Theory (pp. 64-99). New York: Appleton-Century Crofts. Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York: Appleton Century Crofts. Skinner, B. F. (1948). Superstition in the pi309 geon. Journal of Experimental Psychology, 38, 168-172. Skinner, B. F. (2003). Ciência e Comportamento Humano. São Paulo: Martins Fontes (Originalmente publicado em 1953). Stein, L., Xue, B. G., & Belluzzi, J. D. (1993). A cellular analogue of operant conditioning. Journal of the Experimental Analysis of Behavior, 60, 41-53. Kennon A. Lattal The check is in the mail: examining how delayed reinforcement affects performance Kennon A. Lattal West Virginia University Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. “… a delay of reinforcement is not a static parameter in the effect of reinforcement on behavior” (C. B. Ferster, 1953) 310 Capítulo XX | Delay of Reinforcement INTRODUCTION TO THE RESEARCH AREA AND CONTEXT OF THE EXPERIMENT Delay of reinforcement, even in 1964, was a long-standing problem of interest in the psychology of learning (e.g., Kimble, 1961; Renner, 1964). Thorndike (1911) set the stage for future inquiry when he noted that “responses accompanied or closely followed by satisfaction to the animal” (p. 244) would be strengthened. It was left to others to explore the limits and implications of “closely” for the response-reinforcer relation. The general theme was explored by all of the major learning theorists who followed Thorndike. Guthrie (1935) emphasized the overriding importance of temporal contiguity between events in learning, but no reinforcement theorist was he! Hull (1943) discussed the problem of delay of reinforcement at length in his book Principles of Behavior, with a particular emphasis on the mechanisms responsible for maintaining behavior challenged by delays of reinforcement (see also Spence, 1947). Delay of reinforcement also appears as a research problem in Skinner’s (1938) book The Behavior of Organisms. In contrast to Hull’s attempt to infer theoretical mechanisms underpinning the delay of reinforcement gradient, Skinner’s analysis was, predictably, more empirical. Experiments concerned with imposing a temporal delay between the response that produces the reinforcer and the deliv- ery of that reinforcer are described in two places in The Behavior of Organisms. The delays investigated by Skinner (1938) were unsignaled, that is, there was no stimulus change that accompanied the delay interval. In the first experiment (described on pp. 73-74), a response released “a timing pendulum which operates the magazine at the end of the desired interval”. Skinner (Figure 6, p. 73) showed the acquisition data for eight rats using delays of 1-4 s with different pairs of rats, which, with one exception, he noted were comparable to acquisition with immediate reinforcement. It is unclear whether these delays reset if subsequent responses occurred during the delay interval, but it seems that they did not, that is, the delays were nonresetting (cf. Lattal & Gleeson, 1990). He stated that “[a] new interval must be begun [when a second response occurs] or the second response will be reinforced too quickly, but this means that the first response must go unreinforced” (p. 73). His subsequent comments suggested that he did not solve this problem in this first experiment. A little later in the book he described two other experiments involving delay of reinforcement. He began by repeating the drawback to the aforementioned procedure: “[n]o provision is made against the possible coincidence of a second response with a delayed reinforcement” (Skinner, 1938, p. 138), thereby making it likely that the obtained delay would be less than the nominal or programmed delay. He also noted a 311 Kennon A. Lattal second difficulty, having to do with the rats holding the lever down. The delay started with a lever depression, but sometimes the lever continued to be held down during the delay and was released at the end of the interval, leading Skinner to question whether this would result in immediate or delayed reinforcement. The apparatus used in this experiment was the same as that used in the experiment described above; however, he noted one change: “[t]he device has this important property: if a second response is made during the delay interval, the timing begins again, so that a full interval must again elapse before reinforcement occurs” (p. 139). Thus, instead of a nonresetting delay, in this experiment delays were resetting, that is, the delay interval restarted with each response after the one that initiated the delay. Using this resetting delay procedure, rats “were conditioned in the usual way” (p. 140; presumably by this Skinner meant with immediate reinforcement) to respond, ultimately on a fixed-interval (FI) 5-min schedule. After this training, delays of 2, 4, 6, or 8 s were in effect with different rats for three sessions. Rates of responding were reduced when the delays were in effect, with the two shorter delays reducing responding less than the two longer ones. In a final delay of reinforcement experiment, Skinner examined the effects of various changes in the training and implementation of the delays. The next major development in the experimental analysis of delay of reinforce312 ment was the research of Ferster (1953). Most learning theorists, including Skinner, focused on the detrimental effects of delaying reinforcement on learning and performance. Ferster turned the question around and asked how one might sustain behavior despite the presence of a delay between the reinforcer and the response that produced it. He conducted a series of experiments with pigeons in which he first maintained key-peck responding (pecking at small plastic disc with the beak) with variable-interval (VI) reinforcement schedules. Against this baseline, in his first and second experiments delays signaled by blackouts of the chamber occurred between the reinforcer and the response that produced it. The blackouts were used “to prevent S from responding” (p. 219), taking advantage of the fact that pigeons typically don’t peck response keys when the chamber and the key are dark. Of course, darkening the chamber was an immediate consequence of the response, making the blackout a stimulus ultimately correlated with reinforcer delivery. As a result, delay of reinforcement was confounded with the potential conditioned reinforcing function of the blackout. This confound questions this experiment, and all experiments involving signaled delays of reinforcement, as a test of a “pure” delay of reinforcement on responding. In his first experiment, Ferster observed that 60-s delays caused a “small decline” in response rates, but under a 120-s delay, responses rates fell to about half of what they were when immediate reinforcement was used. Capítulo XX | Delay of Reinforcement In his second experiment, Ferster next tried to sustain high response rates by introducing the delays gradually, increasing their duration from 1 to 60 s over a 90-hr training period. He reported that “[t]he three Ss that did maintain normal rates of response under 60-sec. delays were continued under the same procedure for several hundred experimental hours each. They exhibited no tendency to slow down” (p. 222). Responding of the fourth pigeon was not sustained, according to Ferster, because the delays “were increased too rapidly.” (p. 222). He presented no quantitative data in his report of the experiments, but relied instead on verbal descriptions of what happened, supported by only a few sample cumulative records of the pigeons’ performance. These two lines of research (Skinner, 1938; and Ferster, 1953) provide the segue to the subject of this chapter: the experiment by Azzi, Fix, Rocha e Silva and Keller (1964). An important part of the story behind the experiment by Azzi et al. is Fred Keller’s love affair with Brazil, which began with his arrival as a Fulbright Teaching Fellow at the University of São Paulo early in 1961. He was assigned as his research assistant Rodolpho Azzi, shown with Keller and two other Brazilian psychologists in Figure 1. Of Azzi, Keller (2008) observed: administration. He helped me answer queries, write reports, and evaluate my pupils’ progress. He prepared me for important meetings, posted me on new developments, and protected me from annoyances of any kind.” (p. 248) Figure 1. Photograph of (left to right) Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina Martuscelli Bori, and Andrés Aguirre with apparatus, December, 1961. Soon after Keller started teaching, he received a shipment of research equipment that he had ordered from the Grason-Stadler Company in Waltham, Massachusetts. He remembered that the apparatus “… carried no instructions with it, so we had to determine its uses by trial and error. Rodolfo [sic][Azzi] and I, together with Mario Guidi, a student “He quickly became my counselor and in our course, worked for days before guide, he acquainted me with every- we finally discovered how to automate thing I should know about my pupils, a long-term study of the effects of dif- members of the faculty, and officers of ferent delays of reinforcement on the 313 Kennon A. Lattal lever-pressing response of three white rats (named Alpha, Beta, and Gamma by Rodolfo [sic]). The results were published later in the Journal of the Experimental Analysis of Behavior” (Keller, 2008, p. 250). One can only speculate about why delay of reinforcement was the topic of the first research paper published in Journal of the Experimental Analysis of Behavior with a Brazilian first author (Azzi). Let’s go back to Skinner’s second-reported experiment on delay of reinforcement in The Behavior of Organisms. Recall that he used a resetting delay procedure such that each response after the one initiating the delay restarted the delay interval. He used a similar procedure to reduce high rate responding [“no response was ever reinforced if it had been preceded within fifteen seconds by another response” (p. 306)], thus giving birth to the differential-reinforcement-of-low-rate (DRL) schedule of reinforcement. Wilson and Keller (1953) thereafter studied the effects of DRL schedules on lever pressing of rats across a range of “delay” (i.e., DRL schedule) values. The Wilson and Keller experiment grew out of an earlier demonstration of what was basically a differential-reinforcement-of-other-behavior (DRO) schedule, in which the onset of an SD period occurred only if there were no response in the immediately preceding S-delta period for a specified time period (cf. Skinner, 1938, p. 161). A resetting delay of reinforcement contingency is essentially a DRL schedule 314 without the required response at the end of the interval, and a DRO schedule is essentially a resetting delay procedure, but without the delay requirement of a response to initiate each DRO interval (the reinforcers occur so long as the target response is absent, and if a target response does occur it resets the DRO interval). Mix all of these ideas together, add in the fact that Ferster (one of Keller’s doctoral students at Columbia) had previously studied the effects of signaled delays of reinforcement and, voila, the procedures used by Azzi et al. (1964) emerge. We cannot know precisely how the idea for the experiment developed, but it certainly, and unsurprisingly, can be closely tied to some of the earlier work of Keller and his students at Columbia. DESCRIPTION OF THE EXPERIMENT Goals and Method Azzi et al. (1964) set out to do two things: (a) investigate operant responding under conditions where the interval between a reinforcer and the response that produced it was varied and (b) compare conditions where the delay was either accompanied by a stimulus change (a signal) or occurred without any change during the delay interval (unsignaled). Thus, the experiment was basically a comparison of two different conditions - unsignaled and signaled delays of reinforcement – that had been observed in two separate experiments Capítulo XX | Delay of Reinforcement conducted by, respectively, Skinner (1938) and Ferster (1953). To this end, three rats first were trained to lever press under a fixed-ratio (FR) 1 schedule, where the reinforcer was access to water. It seems reasonable to assume that at this time neither the food pellets used with rats in many experiments by Skinner and others, nor the means for delivering these pellets – i.e., a pellet dispenser – were available in Brazil. Water was easy to obtain and Keller had brought with him what he called a “Brenner dipper”1 for delivering water reinforcers. After the initial training, “within a dimly lighted response chamber, each [rat] was exposed successively to reinforcement delays of 1, 3, 5, 7.5, 10, 15, and 20 s[econds], in that order, with a total of 150 reinforcers at each delay” (Azzi et al., 1964, p. 159). The schedule of reinforcement thus was, technically speaking, a tandem FR 1 DRO t-s schedule, where t corresponded to one of the delay values given above. A tandem (the Latin word for “one right after the other”) schedule is identical to a chained schedule in that two or more components schedules must be completed in a fixed sequence for reinforcement; however, in the chained schedule each component is associated with a different stimulus but in the tandem schedule the stimuli associated with each component are identical. In Azzi et al.’s (1964) procedure, each delay restarted if a response occurred during the Brenner was the name of the instrument maker at Columbia University who fabricated these water delivery devices. 1 delay interval (a resetting delay), and there was no stimulus change during the delay period. There followed several manipulations of delay durations for two of the rats. The third rat apparently was exposed only to a DRL 20-s schedule with immediate reinforcement. In the second, as in the first, part of the experiment, the schedule in effect technically was a tandem FR 1 DRO t-s schedule, where t was 20 s for ten days, followed by six days with t = 30 s. For half of each session, “each animal worked within a dimly lighted chamber” (p. 160). For the other half, however, “darkness was in effect during each delay interval … each time a response was made to the lever, the light in the chamber went off” (p. 160, italics original) and did not come back on until a reinforcer had been delivered. Lever presses in the dark chamber extended the darkness until the delay duration lapsed and a reinforcer occurred. Thus, in the second part of the experiment, a delay interval correlated with the presence and absence of a stimulus change were compared. Results and Discussion There were two main findings. Responding maintained under a tandem FR 1 DRO t- s schedule was a negatively decelerating function of delay duration. That is, rate of responding dropped precipitously as the delay was increased from 1 to 10 s, but it asymptoted at that point, not dropping further when delays were 15 or 20 s long. This relation is referred to as a delay of rein315 Kennon A. Lattal forcement gradient, and it is characteristic of the relation between response measures and delay duration across a wide range of delay of reinforcement and reinforcement schedule parameters (cf. Lattal, 2010). Darkening the chamber during the delay “produced an appreciable effect, regularizing and increasing the response rate [relative to that observed in the unsignaled delay condition] in all but a few instances” (Azzi et al., 1964, p. 160). The discussion addressed the role of mediating behavior in sustaining responding during the delay, an observation made earlier by Ferster (1953). In what subsequently became a standard analysis, the role of the signal was interpreted to function as a conditioned reinforcer, maintaining responses that produce it. This still is a popular interpretation of the role of the signal in signaled delay of reinforcement procedures. This interpretation, however, has more recently been questioned by interpreting the role of the signal to be one of either bridging or marking the delay (e.g., Williams, 1991), rather than strengthening the behavior that precedes it. IMPACT Both outcomes of the experiment qualify Azzi et al.’s (1964) as a seminal experiment in the study of delay of reinforcement. The delay of reinforcement gradients reported by Azzi et al. (1964) have been rep316 licated when a number of different schedules of reinforcement have been used to maintain responding (Elcoro & Lattal, 2011, FI; Jarmolowicz & Lattal, 2013, FR; Richards, 1981, DRL and VI; Sizemore & Lattal, 1978, VI) and across a wider range of delay values (Pierce, Hanford, & Zimmerman, 1972; Richards, 1981; Sizemore & Lattal, 1978). Azzi et al. also anticipated several subsequent comparisons of signaled and unsignaled delay of reinforcement, with more or less the same results: Signaled delays maintain more robust responding than do unsignaled ones (Richards, 1981). A particularly appealing feature of Azzi et al. is that the comparisons of signaled and unsignaled delays of reinforcement occurred within individual subjects. They are the first to simultaneously (within session) compare the effects of signaled and unsignaled delays of reinforcement (cf. Lattal, 1984; Lattal & Ziegler, 1982; Richards, 1981). Long after Azzi et al., Reilly and Lattal (2004) developed a method for generating delay of reinforcement gradients within individual subjects during a single session. They maintained responding on a VI schedule and, at the beginning of each session, introduced a short delay before a reinforcer was delivered. Each subsequent reinforcer was delivered after a progressively increasingly longer delay. Azzi et al.’s (1964) experiment was conducted in the Columbia University tradition of systematic parametric analysis of the controlling variables of behavior. In Capítulo XX | Delay of Reinforcement this instance, delay durations were varied across successive conditions. Because there was no return to baseline between the successive delay value increases, subsequent delays were imposed on varying rates of responding across manipulations, with unknown effects on the delay of reinforcement gradient. These delay of reinforcement gradients, however, are quite similar in shape to those obtained with rats’ lever pressing or pigeons’ keypecking maintained under other reinforcement schedules (Elcoro & Lattal, 2011; Pierce, et al., 1972; Richards, 1981; Sizemore & Lattal, 1978), suggesting that the baseline response rates may play less of a role in the form of the gradient than the delay value itself. One potential confounding variable in the experiment was that of reinforcement rate. Like so many other early experiments involving reinforcement delays, reinforcement rate under each delay value was not reported by Azzi et al. (1964). It is almost certainly the case that reinforcement rates differed as the delays were increased in the first part of the experiment and in the presence and absence of a signal in the second part. Subsequent research, however, has shown that reinforcement rate differences generally do not account for the differences in response rates brought about when delay durations are changed (Lattal, 1982; Richards, 1981; Sizemore & Lattal, 1978). Lattal and Gleeson (1990) used a procedure similar to that of both Skinner (1938) and Azzi et al. (1964) to investigate the acquisition of responding by naïve rats and pigeons under unsignaled resetting and nonresetting delays to reinforcement when the operant response was not shaped or otherwise trained, but left to develop without any such intervention by the investigators. Robust responding developed under these conditions, attesting to the power of delayed reinforcement in developing and sustaining operant behavior. This is another way of saying that immediate reinforcement is not necessary for learning to occur. That said, however, immediate reinforcement results in much more robust responding. It is an open question as to whether response acquisition is “faster” with immediate versus delayed reinforcement of responses. FINAL CONSIDERATIONS Delay of reinforcement is one of the major parameters of reinforcement that affects its efficacy in developing and maintaining behavior (Kimble, 1961). For this reason, its role both alone and in combination with other reinforcement parameters, such as reinforcer magnitude, has been investigated extensively. One outcome of such interactive analyses is delay discounting, in which systematically increasing delays of reinforcement for a larger magnitude or more probable reinforcer are pitted against a fixed, smaller magnitude or less probable reinforcer to determine, among other 317 Kennon A. Lattal things, the indifference point where either alternative is equally likely to be chosen (see Green, Myerson, & Vanderveldt, 2014, for a contemporary summary of these findings). Studies of delay discounting offer insights into how different combinations of reinforcement parameters might be scaled. Similarly, delay of reinforcement (sometimes also called “gratification” in nonbehavior-analytic experiments on the phenomenon) plays an important role in the development of self-control or self-management strategies. Indeed, the foundation of this area of research and application is the experimental analysis of delay of reinforcement. Yet another area where delay of reinforcement research has been important is in the study of conditioned reinforcement. A major theory of such reinforcement is the delay reduction theory, which suggests that stimuli function as reinforcers to the extent that they indicate a reduction in the time of access to (primary) reinforcement (Fantino, 1977). The lessons of delay of reinforcement have not been lost in applied behavior analysis, where the importance of reinforcer immediacy following appropriate behavior continues, with good reason, to be emphasized. Although immediate reinforcement may be optimal in both treatment and generally in managing human behavior, much of human behavior is maintained even though its reinforcers are delayed from 318 the responses that produce them. Basic research on delay of reinforcement suggests a number of conditions under which delays will (e.g., longer or unsignaled delays) or will not (e.g., shorter or signaled delays) reduce responding, but there has been little applied research to expand on these findings as they might relate to treatment programs (but cf. Stromer, McComas, & Rehfeldt, 2000). One particularly important unresolved issue in the analysis of delayed reinforcement with humans in either research or applied settings is that of the mediation of behavior during delays by verbal behavior. Both Ferster (1953) and Azzi et al. (1964) suggested that behavior is sustained during delays of reinforcement to the extent that certain stereotyped behavior patterns emerge during the delay that result in a chain of behavior developing such that the response that initiates the delay is followed by some regular behavior pattern (not required, but maintained by adventitious reinforcement) that ends contiguously with reinforcement. Such superstitious chains thus ensure a “connection” between the initiating operant response and the reinforcer at the end of the delay. Verbal behavior of humans, it has been suggested, also could mediate delays. Something a person does now may not have an effect for an hour, a day, or even longer, yet the two events remain linked and the person continues to engage in the behavior reinforced after the delay. Perhaps it is related to things that either the person tells himself or others tell Capítulo XX | Delay of Reinforcement him during the intervening delay interval. Or perhaps not. Some contemporary critics of such contiguity-based interpretations of delay of reinforcement have suggested that temporal proximity between response and reinforcer plays a relatively minor role in the acquisition and maintenance of responding relative to the fact that there is an overall correlation between response rate and the reinforcer that accrue, either immediately or after delays (see Baum, 1973). The Lattal and Gleeson (1990) experiment described above illustrates that learning can occur when there is only a correlation between responding and reinforcement, but not response-reinforcer contiguity. This latter point raises the broader, unanswered question of whether reinforcers occurring after a delay are more usefully characterized as delayed from specific responses or correlated with groups of responses organized as response rates or time allocated to responses of particular topographies. Lastly, but certainly not least, from an historical perspective the experiment is important because it is the first of many subsequent research reports by Brazilian behavior analysts to be published in the Journal of the Experimental Analysis of Behavior. perspectives on the use and implications of delay of reinforcement for the understanding of the reinforcement process. Lattal (2010). Reviewed basic research on delay of reinforcement conducted in the behavior-analytic tradition from Skinner to the time of his review. Renner (1964). Is an important early review of delay of reinforcement with a broad learning-theory perspective on the topic. Stromer, McComas, & Rehfeldt (2000). Considered some of the applied implications of research on delay of reinforcement. Tarpy & Sawabini (1974). Critiqued research on delay of reinforcement conducted from the time of Renner’s review until their own. REFERENCES Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. TO LEARN MORE Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental Analysis of Behavior, 20, 137-153. Commons, Mazur, Nevin, & Rachlin (1987). Is an edited volume offering a number of Commons, M. L., Mazur, J., Nevin, J. A., & Rachlin, H. (Eds.) (1987). Quantitative stu319 Kennon A. Lattal dies of operant behavior: The effect of delay and of intervening events on reinforcement value. New York: Erlbaum. Keller, F. S. (2008). At my own pace: The autobiography of Fred S. Keller. Cornwall on Hudson: Sloan Publishing. Elcoro, M., & Lattal, K. A. (2011). Effects of unsignaled delays of reinforcement on fixed-interval schedule performance. Behavioural Processes, 88, 47-52. Kimble, G. A. (1961). Hilgard and Marquis’ Conditioning and Learning. New York: Appleton Century Crofts. Fantino (1977). Conditioned reinforcement, choice, and information. In W. K. Honig & J.E.R. Staddon (Eds.), Handbook of operant behavior (pp. 326-339). New York: Prentice Hall. Ferster, C. B. (1953). Sustained behavior under delayed reinforcement. Journal of Experimental Psychology, 45, 218-224. Green, L., Myerson, J., & Vanderveldt, A. (2014). Delay and probability discounting. In F. K. McSweeney & E. S. Murphy (Eds.), The Wiley Blackwell handbook of operant and classical conditioning. Oxford: John Wiley & Sons. Guthrie, E. R. (1935). The psychology of learning. New York: Harper. Hull, C. L. (1943). Principles of Behavior. New York: Appleton-Century Crofts. Jarmolowicz, D. P., & Lattal, K. A. (2013). Delay of reinforcement and fixed-ratio performance. Journal of the Experimental Analysis of Behavior, 100, 370-395. Lattal, K. A. (1984). Signal functions in delayed reinforcement. Journal of the Experimental Analysis of Behavior, 42, 239-253. Lattal, K.A. (2010). Delayed reinforcement of operant behavior. Journal of the Experimental Analysis of Behavior, 93, 129-139. Lattal, K. A., & Gleeson, S. (1990). Response acquisition with delayed reinforcement. Journal of Experimental Psychology: Animal Behavior Processes, 16, 27-39. Lattal, K. A., & Ziegler, D. R. (1982). Briefly delayed reinforcement: An interresponse time analysis. Journal of the Experimental Analysis of Behavior, 37, 407-416. Pierce, C. H., Hanford, P. V., & Zimmerman, J. (1972). Effects of different delay of reinforcement procedures on variable-interval responding. Journal of the Experimental Analysis of Behavior, 18, 141-146. Renner, K. E. (1964). Delay of reinforcement: A historical review. Psychological Review, 61, 341-361. Reilly, M.P., & Lattal, K.A. (2004). Progressi- 320 Capítulo XX | Delay of Reinforcement ve delays to reinforcement. Journal of the Experimental Analysis of Behavior, 82, 2135. Richards, R. W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis of Behavior, 35, 145-152. versus conditioned reinforcement. Animal Learning and Behavior, 19, 264-269. Wilson, M. P., & Keller, F. S. (1953). On the selective reinforcement of spaced responses. Journal of Comparative and Physiological Psychology, 46, 190-193. Sizemore, O. J., & Lattal, K. A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30, 169-175. Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York: Appleton Century Crofts. Spence, K. W. (1947). The role of secondary reinforcement in delayed reward learning. Psychological Review, 54, 1-8. Stromer, R, McComas, J. J., & Rehfeldt, R. A. (2000). Designing interventions that include delayed reinforcement: Implications of recent laboratory research. Journal of Applied Behavior Analysis, 33, 359-371. Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: A selective review of the past decade. Psychological Bulletin, 81, 984-987. Thorndike, E. L. (1911). Animal intelligence. New York: MacMillan. Williams, B. A. (1991). Marking and bridging 321 Hiroto Okouchi How do you feel? Hiroto Okouchi Osaka Kyoiku University, Japan Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15. “We need not suppose that events which take place within an organism’s skin have special properties for that reason” (Skinner, 1953, p.257). 322 Capítulo XXI | Private Events INTRODUCTION TO THE RESEARCH AREA AND CONTEXT OF THE EXPERIMENT A lot of people, not only psychologists but also laymen, are interested in understanding the “mind.” Behavior analysts have a unique view of it. One example is that based on radical behaviorism (Skinner, 1945). A hypothetical entity that usually has been called “mind” is related with one of the behavior-analytic concepts, private events. Private events generally have been defined structurally as events that occur within the skin of a person (Catania, 1992, p.388) and functionally as events that are directly accessible to only one person (Skinner, 1953, p.257). Feelings, such as “depressed” and “excited”, are private events not only structurally but also functionally, because they occur within the skin of a person and are directly accessible only to him or her. Such feelings, in general, are regarded as “elements of mind” (The Oxford English Dictionary, 2004, pp.1047-1048). As the opposite of private events, events that occur outside the skin of a person and/or events that are directly accessible to more than the individual person may be called public events. Rat’s lever-pressing and the delivery of a food pellet during operant-conditioning experiments are typical examples of public events. The experimental analysis of behavior has accumulated an extensive body of knowledge on lawful relations among such public events (Ferster & Skinner, 1957; Honig, 1966; Honig & Staddon, 1977; Iversen & Lattal, 1991; Madden, 2013). Behavior analysts assume that private events follow the behavioral principles discovered by the experimental analysis of public events. According to this viewpoint, for example, even describing one’s own feelings is a result of contingencies of reinforcement. Skinner (1945) argued that verbal responses under the control of private stimuli are established and maintained mostly by the contingencies of reinforcement arranged by other people. Suppose that a “depressed” person (a speaker) says, “I am depressed.” If someone (a listener) listened to and understood the complaint (i.e., if the listener belonged to the same verbal community that the speaker did and could react appropriately to what the speaker said), and if the listener knew that the speaker had experienced an event that usually elicits depressed feelings (e.g., loss of a significant other), the listener may say, “I know exactly how you feel.” Behaviorally, the depressed feeling, the complaint “I am depressed,” and the words of comfort “I know exactly how you feel,” respectively, are a discriminative stimulus, a response, and a reinforcer to the speaker’s verbal behavior. As a verbal response (e.g., “red”) to a public stimulus (e.g., a red card) can be established by reinforcement given by others (e.g., “Right, that is the color of the card.”), 323 Hiroto Okouchi behavior analysts presume that describing one’s own feelings (e.g., being depressed), also is learned (e.g., Skinner, 1953, pp.257282). Skinner (1945) also argued that a person’s report of a private stimulus occurs not by direct reinforcement but through generalization. A person may describe his or her novel feeling as “depressed” if he or she has learned that the word “depressed” is used when something (e.g., a lever) was pushed down (generalization from public events to private ones, Skinner, 1957, pp.132-133) or it is used when he or she has experienced a feeling that is similar to the novel one (i.e., generalization from known private events to unknown ones). In contrast to plenty of conceptual analyses (e.g., Leigland, 2014; Schlinger, 2011; Tourinho, 2006), experimental analyses of private events have received relatively little attention. The experiment by Lubinski and Thompson (1987) is one of the rare cases in which an experimental analysis of private events has been conducted. internal milieu. Subjects were five experimentally naïve female White Carneau pigeons distributed into two groups, referred to as “manders” (two pigeons) and “tacters” (three pigeons). Two contiguous experimental chambers, separated by a transparent Plexiglas divider which allowed the pigeons to see one another, were used (see Figures 1 and 2). The manders were trained in the left chamber, the tacters in the right. Before being placed in their chambers simultaneously, each pigeon was trained individually. The tacters, which were food and water deprived during the experiment, were trained in a two-component chain in which DESCRIPTION OF THE EXPERIMENT Goals and Method The goal of Lubinski and Thompson’s (1987) experiment was to assess whether nonhuman animals could learn to interact communicatively, based on events in their 324 Figure 1. Adjoining work panels of the chambers for the two groups of pigeons. Work panels were separated by a Plexiglas divider. The manders were trained in the left chamber; the tacters were trained in the right chamber (reproduced from Lubinski & Thompson, 1987, with permission of John Wiley and Sons). Capítulo XXI | Private Events Figure 2. A two-pigeon communicative exchange based on the drug state (internal state) of one of the pigeons. From left to right, the five frames (A-E) show the successive components of the procedure. The pigeons on the left and the right in each frame were the mander and the tacter, respectively (reproduced from Lubinski & Thompson, 1987, with permission of John Wiley and Sons). the first component involved an arbitrary matching-to-sample task (the procedure of this training will be summarized later). After this training, the established chain was as follows: (a) The tacter was injected a depressant (pentobarbital), a stimulant (cocaine) or isotonic saline solution; (b) three response keys, each labeled with a letter “D”, “N”, or “Σ” were illuminated (Figure 1); (c) the tacter’s key pecks matching the injected substance (the “D” key for pentobarbital, the “Σ” key for cocaine, and the “N” key for saline) were followed by presentation of a flashing blue light above the response keys; (d) responses on a key above a food dispenser (food key) and on a key above a water dispenser (water key) were reinforced with food and water, respectively. The matching-to-sample task the tacters experienced is known as a drug discrimination procedure: Reinforce one type of activity following drug administration and reinforce some other activity following administration of either no drug or some other drug (Branch, 1991). With no differential exteroceptive stimuli correlated with any activity, choices that produced reinforcers more frequently than chance levels and could be attributed to interoceptive stimuli arising from the administrated substance (e.g., the drug or the saline solution). Thus, the tacters in the Lubinski and Thompson’s (1987) experiment were trained to “report 325 Hiroto Okouchi their feelings” by the matching-to-sample task. Approximately seven months were required for the tacters to respond reliably (i.e., at least 80% of correct responses) in this task. water deprived and 4 hr food deprived). By alternating these two conditions in an A-BA-B fashion, the tacters chose food and water indifferentially when the blue light was flashing. A second goal of the Lubinski and Thompson’s (1987) experiment was to assess whether the pigeons’ responses to their internal (private) events could function as a tact, which was examined on the final part of the experiment (described later). A tact, a unit of verbal behavior, is “a verbal operant in which a response of given form is evoked (or at least strengthened) by a particular object or event or property of an object or event” (Skinner, 1957, pp.81-82). Quoting several other authors (e.g., MacCorquodale, 1969; Skinner, 1957, pp.81-82), Lubinski and Thompson stated that tacts are not maintained by particular reinforcers, nor do they covary with the individual’s state of deprivation or aversive stimulation, but are maintained by generalized conditioned reinforcers (e.g., saying “Right” when someone correctly names the color of a red card by saying “Red”). In order to reach this second goal, therefore, Lubinski and Thompson attempted to establish the flashing blue light as a generalized conditioned reinforcer that could maintain the behavior of the tacters. The tacters were deprived of food more strictly than they were deprived of water on one day (i.e., 28 hr food deprived and 4 hr water deprived), and they were deprived of water more strictly than they were deprived of food on another day (i.e., 28 hr A mand, a more primitive unit of verbal behavior, is “a verbal operant in which the response is reinforced by a characteristic consequence and is therefore under the functional control of relevant conditions of deprivation or aversive stimulation” (Skinner, 1957, pp.35-36). Saying “Candy” is an example of a mand when reinforced by access to candy, and the response “Candy” will be more likely to occur after a period of candy/food deprivation (Skinner, 1957, p.35). The manders, which were maintained at 85% of their free-feeding weights by food deprivation, were trained in a three-component chain in which the third component involved an arbitrary matching-to-sample task. The established chain for the mander was as follows: (a) A key with English letters arranged to form words “How Do You Feel?” was illuminated (Figure 1); (b) the mander’s pecking the “How Do You Feel?” key was followed by the illumination of another key labeled “Thank You”; (c) when the mander pecked the “Thank You” key, a letter “D”, “N”, or “Σ” was projected onto a sample key; (d) pecking the sample key and then pecking the comparison key containing the correct matching response (a key labeled “P” to the letter “D”, a key labeled “C” to the letter “Σ”, and a key labeled “S” to the letter “N”) produced food. 326 Capítulo XXI | Private Events After both manders and tacters independently acquired the necessary accuracy (i.e., at least 80% of correct responses) on their chain performance, individual tacters and manders were placed in their chambers simultaneously. As Figure 2 illustrates, the behavioral interaction required of each mander-tacter pair was as follows; (a) The mander’s “How Do You Feel?” was illuminated and the mander pecked it; (b) all of the tacter’s comparison keys (i.e., the “D”, “N”, and “Σ” keys) were illuminated and the tacter pecked the comparison key correlated with the injected substance (or the tacter’s own “feelings”); (c) the “Thank You” key in the mander’s chamber was illuminated and the mander pecked it; (d) the letter (“D”, “N”, or “Σ”; i.e., the drug “name” or the tacter’s report of its feelings) previously pecked by the tacter appeared on the mander’s sample key and the blue light started to flash in the tacter’s chamber; the mander pecked the sample key and then pecked the correct comparison key; the tacter pecked the food key or the water key, producing either food or water; (e) the mander received food. If the tacter pecked a comparison key uncorrelated with the injected substance (an incorrect response), the houselights were dimmed for 4 s and the initial link of the chain (a) was reinstated. Thus, the sample stimulus presented to the mander was always correct. Both manders worked with each of the tacters. Pigeons were tested under this interaction for 40 experimental sessions. It should be noted that the Lubinski and Thompson’s (1987) experiment had two additional phases (Phases 2 and 3). In Phase 2, the tacters were injected novel drugs, chlordiazepoxide and d-amphetamine, which share pharmacological properties with pentobarbital and cocaine, respectively, as a generalization test. In Phase 3, the authors examined whether the tacters’ responses to their private events actually functioned as tacts. The tacters’ performances were tested when the tacters were placed in their experimental chamber after receiving 24 hr free access to both food and water (the tacters were satiated with food and water), and when their correct responses flashed the blue light only, but did not produce water or food anymore (the tacters’ correct responses produced only a conditioned reinforcer). Results and Discussion Results of Phase 1 Because only a single substance (pentobarbital, cocaine, or saline) was injected prior to each session, the correct choice for the tacter was the same across all trials within a session. Thus, the performance of the tacters on the first trial of a session was important in this experiment. Both the mander and the tacter responded correctly (e.g., the tacter injected the pentobarbital pecked the “D” key and the mander pecked the “P” key) on the first trial in 70100% of the sessions, whereas the percentage of a correct discrimination happening 327 Hiroto Okouchi by chance was approximately 11% (i.e., the product of the two individual performances happening by chance, i.e., .33 x .33). These results suggest that the pigeons learned to interact communicatively based on events in their internal milieu. Results of Phases 2 and 3 The performances observed in Phase 1 persisted in Phase 2, suggesting that the tacters’ responses to their private events arising from training drugs (pentobarbital and cocaine) generalized to those of similar private events arising from untrained drugs (chlordiazepoxide and d-amphetamine). The performances observed in Phases 1 and 2 persisted in Phase 3, suggesting that the tacters’ accurate responses to their private events were not maintained by particular reinforcers (food or water), nor did they covary with the tacters’ states of deprivation, but were maintained by a generalized conditioned reinforcer (the flashing blue light). The discussion of Lubinski and Thompson (1987) may be summarized as follows: (a) The tacters’ behavior involved tacting private events; (b) the tacters learned to tact private events under a continuous reinforcement schedule with 100% accuracy, that is, by a contingency in which every correct response produced a reinforcer and any incorrect response produced no reinforcer; in contrast, humans are considered to learn to tact private events by an intermittent reinforcement schedule with weak accuracy (Skinner, 1945); (c) the gen328 eralization obtained in Phase 2 qualifies as an example of extended tacts and exemplifies with nonhumans Skinner’s description of how humans come to report on novel feelings; (d) Lubunski and Thompson’s results demonstrate that covert behavior (e.g., thoughts, feelings, and images), which has been one of the candidates for nonhuman-animal experimental models (Epstein, 1984) but has resisted empirical analysis, is amenable to objective analysis; (e) the performances studied by Lubinski and Thompson may not constitute an example of “linguistic activity” as the term is usually understood, but share features with those activities seen in very young children or individuals diagnosed with developmental disabilities; (f) Savage-Rumbaugh (1984) claimed that behavior controlled by the contingencies imposed by electronic circuity rather than by another individual could not be characterized as “communication.” However, human dyadic exchanges of responses often are mediated by external events such as telephone connections and computer bulletin boards, and we are still content to refer to such exchanges as “verbal.” IMPACT The experiment by Lubinski and Thompson (1987) has received great attention (e.g., Catania, 1992, pp.219-220). In 1993, the journal Behavioral and Brain Sciences devoted space to a debate on it, with Capítulo XXI | Private Events commentaries by 27 behavioral and nonbehavioral scholars (see Lubinski & Thompson, 1993). The Lubinski and Thompson’s (1987) experiment, however, has not been replicated directly or systematically. Probably, this may be due to practical reasons. The experimental apparatus used by Lubinski and Thompson was very different from standardized operant chambers. Psychoactive drugs are not accessible to all researchers. In addition, this kind of experiments takes a long time. As described in the present chapter’s Goals and Method section, in fact, Lubinski and Thompson spent seven months to teach the tacters the drug discrimination. Two studies may be regarded as successors to Lubinski and Thompson (1987). One was conducted by DeGrandpre, Bickel, and Higgins (1992). They also used the drug discrimination procedure as Lubinski and Thompson did, and examined whether equivalence relations can emerge between interoceptive stimuli (activated by drugs) and exteroceptive stimuli. Adult humans were trained drug discriminations with triazolam (reducing self-reports of anxiety) and placebo (lactose-filled capsules) as sample stimuli and visual stimuli as comparison stimuli. When the triazolam (A1) was administered, choosing a visual stimulus B1 was correct and visual stimuli B2 and A0 incorrect; or choosing a visual stimulus C1 was correct and visual stimuli C2 and C0 incorrect. Similarly, when placebo (A2) was the sample, correct comparisons were B2 and C2. Following the establishment of A1B1, A1C1, A2B2, and A2C2 conditional relations by such a drug discrimination training, untrained B1C1 and B2C2 relations emerged. These results demonstrate that private events can emerge as members of an equivalence class as public ones do (Sidman & Tailby, 1982), and, as Lubinski and Thompson showed, provide evidence that behavioral principles operating on public events operate on private ones, too (Skinner, 1953, pp.257-258). An experiment conducted by Okouchi (2006) is another case relevant to the topic. As in the Lubinski and Thompson’s experiment, in Okouchi’ s experiment responses to private stimuli of one individual resulted in sample stimuli for another individual. Different from the Lubinski and Thompson’s experiment, however, private stimuli were not interoceptive stimuli but exteroceptive, visual, stimuli that only one individual of a pair of undergraduates could see. According to the functional definition of private events as events that are directly accessible to only one person (Skinner, 1953, p.257), events that occur outside the skin of a person can be private (Rachlin, 2003, called this type of private events as Privacy B and distinguished it from Privacy A, which are events that occur under a person’s skin). Employing the functional definition 329 Hiroto Okouchi of private events, Okouchi (2006) examined one of Skinner’s (1945) interpretations of how verbal responses under the control of private stimuli are established: the report of a private stimulus (e.g., pain) may be established by reinforcement from other people who infer the private stimulus from collateral public responses (e.g., hand to jaw, facial expressions, groans) to the stimulus. Eight of 16 participants, referred to as instructors, first learned BC conditional discriminations with the B stimuli as the samples and the C stimuli as the correct comparisons. Then, the other eight participants, referred to as learners, were exposed to modified matching-to-sample trials in which the responses of the learners were reinforced or punished not by the responses of the experimenter but by those of the instructors. AC conditional discriminations were to be established for the learners, in which the sample stimuli As were presented simultaneously with the B stimuli so that the instructors could see the Bs but not the As. According to the functional definition of private events, the A stimuli were private for the instructors. Thus, the sample stimuli As and the sample-correlated stimuli Bs corresponded, respectively, to private stimuli and their collateral overt responses in Skinner’s interpretation. Okouchi examined whether the learners’ reports (Cs) of their own stimuli (As) would be established by differential reinforcement from other people (the instructors) who could access only the collateral stimuli (Bs) and the reports (Cs). 330 In Okouchi’s (2006) experiment, two of eight pairs showed the expected performances that the learners mastered the AC conditional discriminations from the instructors who had no access to the A stimuli. Subsequently, Sonoda and Okouchi (2012) replicated the results of Okouchi using a revised procedure. They used abstract stimuli and a computer, for example, whereas Okouchi used geometric stimuli, nonsense syllables, and color stimuli and controlled the experiment manually. Sonoda and Okouchi obtained the expected performances from all of 26 pairs of undergraduates. FINAL CONSIDERATIONS Perhaps, simulating the behavior of reporting private events by nonhuman animals may be one of the most significant accomplishments of Lubinski and Thompson (1987). Epstein (1981, 1984) insisted that animal simulations, or experimental models, synthesizing so-called “complex” human behavior with nonhuman animals, could lend insight into what kinds of variables constitute some of these “complex” behaviors in humans. Epstein (1984) listed four classes of behaviors that had resisted analyses and, therefore, had been regarded as “complex”: (a) covert behaviors (“thoughts,” “feelings,” and “images”); (b) typically human behaviors (language, behavior that comes under the rubric of “self,” and problem-solving behavior); (c) behaviors controlled by temporally remote stimuli (“mem- Capítulo XXI | Private Events ory”); and (d) novel behaviors (“creativity,” and “productive thinking”). Except for the class of covert behaviors, some behaviors in each class were simulated and studied experimentally (e.g., Epstein, 1981; Epstein, Lanza, & Skinner, 1980; Epstein & Skinner, 1981). The work by Lubinski and Thompson may be regarded as a success of an animal simulation of covert behaviors or private events (“feelings”). As the title of their article implies, two practices illustrating a model of how to examine private events also may be significant accomplishments by Lubinski and Thompson (1987). First, they showed that drug discrimination procedures can be used in experiments on private events. One of the difficulties in the experimentation on private events is the manipulation of the private events. Presentation and nonpresentation of a “feeling”, for example, is not easy, whereas those of a colored light have been commonly implemented in behavioral experiments. The use of psychoactive drugs would be one of the few methods for manipulating feelings relatively reliably (but see Branch, 1991, for a discussion of difficulties in using drugs as discriminative stimuli). Second, Lubinski and Thompson conducted an experiment on private events in the context of interindividual interactions. This practice is useful because, according to the functional definition of private events (Skinner, 1953, p.257), whether an event is private or not depends on whether it is accessible to other persons or not. TO LEARN MORE DeGrandpre, Bickel, & Higgins (1992). This article reports an experiment in which human private events were manipulated by psychoactive drugs. Kohlenberg, & Tsai (1991). This book describes how private events, such as emotions, memories, cognitions, and beliefs, are conceptualized and managed in a behavior-analytic psychotherapy. Okouchi (2006). This article discusses how events outside a participant’s skin and not accessible to another participant but to an experimenter may contribute to experimental analyses of private events and reports an experiment that examined one of Skinner’s (1945) interpretations of the way in which humans learn to report private events. Rachlin (2003). This book chapter describes how teleological behaviorism views private events. Teleological behaviorism excludes internal events (events under an organism’s skin) from the analysis of behavior and looks for controlling variables of behavior widely into the organism’s temporally extended environment. Skinner (1945). This is a classic on private events. You MUST read it if you would 331 Hiroto Okouchi study private events based on a behavioral point of view. the analysis of behavior. Behaviorism, 12, 41-59. Sonoda & Okouchi (2012). This article reports experiments that replicated the results of Okouchi (2006), using a revised procedure. In Experiment 2, the learners learned to tact “private events” by reinforcement not with 100%, but with 83.3% accuracy, illustrating a laboratory analogue to daily life, in which humans are considered to learn to tact private events by a reinforcement schedule with weak accuracy (Skinner, 1945). Epstein, R., Lanza, R. P., & Skinner, B. F. (1980). Symbolic communication between two pigeons (Columba livia domestica). Science, 207, 543-545. REFERENCES Honig, W. K. (Ed.). (1966). Operant behavior: Areas of research and application. New York: Appleton-Century-Crofts. Branch, M. N. (1991). Behavioral pharmacology. In I. H. Iversen & K. A. Lattal (Eds.), Experimental analysis of behavior (Part 2, pp.21-77). Amsterdam: Elsevier. Catania, A. C. (1992). Learning (3rd ed.). Englewood Cliffs, NJ: Prentice-Hall. DeGrandpre, R. J., Bickel, W. K., & Higgins, S. T. (1992). Emergent equivalence relations between interoceptive (drug) and exteroceptive (visual) stimuli. Journal of the Experimental Analysis of Behavior, 58, 9-18. Epstein, R. (1981). On pigeons and people: A preliminary look at the columban simulation project. The Behavior Analyst, 4, 43-55. Epstein, R. (1984). Simulation research in 332 Epstein, R., & Skinner, B. F. (1981). The spontaneous use of memoranda by pigeons. Behavior Analysis Letters, 1, 241-246. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. Honig, W. K., & Staddon, J. E. R. (Eds.). (1977). Handbook of operant behavior. Englewood Cliffs, Prentice-Hall. Iversen, I. H., & Lattal, K. L. (Eds.). (1991). Experimental analysis of behavior (Part 1). Amsterdam: Elsevier. Kohlenberg, R. J., & Tsai, M. (1991). Functional analytic psychotherapy: Creating intense and curative therapeutic relationships. New York: Plenum Press. Leigland, S. (2014). Contingency horizon: On private events and the analysis of behavior. The Behavior Analyst, 37, 13-24. Capítulo XXI | Private Events Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15. Sidman, M., & Tailby, W. (1982). Conditional discrimination vs. matching to sample: An expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22. Lubinski, D., & Thompson, T. (1993). Species and individual differences in communication based on private states. Behavioral and Brain Sciences, 16, 627-680. Skinner, B. F. (1945). The operational analysis of psychological terms. Psychological Review, 52, 270-277. MacCorquodale, K. (1969). B. F. Skinner’s verbal behavior: A retrospective appreciation. Journal of the Experimental Analysis of Behavior, 12, 831-841. Skinner, B. F. (1953). Science and human behavior. New York: Macmillan. Skinner, B. F. (1957). Verbal behavior. New York: Appleton-Century-Crofts. Madden, G. J. (Ed.). (2013). APA handbook of behavior analysis (Vol.1). Washington, DC: American Psychological Association. Sonoda, A., & Okouchi, H. (2012). A revised procedure for analyzing private events. The Psychological Record, 62, 645-661. Okouchi, H. (2006). An experimental analysis of another privacy. The Psychological Record, 56, 245-257. The Oxford English Dictionary (2nd. ed.). (2004). Oxford: Clarendon Press. Rachlin, H. (2003). Privacy. In K. A. Lattal, & P. N. Chase (Eds.), Behavior theory and philosophy (pp.187-201). New York: Kluwer Academic/Plenum Publishers. Tourinho, E. Z. (2006). Private stimuli, covert responses, and private events: Conceptual remarks. The Behavior Analyst, 29, 13-31. Savage-Rumbaugh, E. S. (1984). Verbal behavior at a procedural level in the chimpanzee. Journal of the Experimental Analysis of Behavior, 41, 223-250. Schlinger, H. D. (2011). Introduction: Private events in a natural science of behavior. The Behavior Analyst, 34, 181-184. 333