Acessar PDF

Propaganda
EXPERIMENTOS CLÁSSICOS
EM ANÁLISE DO COMPORTAMENTO
ORGANIZADORES
Paulo Guerra Soares
João Henrique de Almeida
Carlos Renato Xavier Cançado
www.walden4.com.br
2016
Instituto Walden4
E71
Experimentos clássicos em análise do comportamento [recurso eletrônico]
/ organizado por Paulo Guerra Soares, João Henrique de Almeida, Carlos
Renato Xavier Cançado. - Brasília : Instituto Walden4, 2016.
333 p.
ISBN: 978-85-65721-10-3
1. Psicologia experimental. 2. Análise do comportamento. I. Soares, Paulo
Guerra, org. II. de Almeida, João Henrique, org. III. Cançado, Carlos Renato
Xavier, org. IV. Título.
CDD 150.724
Coordenadora: Seila Cibele Sitta Preto
Projeto Gráfico: Leandro Brasil Melo
Diagramação: Lorena Shimizu
Capa: Lorena Shimizu
DEDICATÓRIA
Dedicamos esse livro à Profa. Sônia dos Santos Castanheira,
ao Prof. Roosevelt Riston Starling, e ao Prof. Ernani Henrique Fazzi,
responsáveis por nosso primeiro contato com a Análise Experimental
do Comportamento.
iii
AUTORES E AUTORAS
Alina Barboza Cabral Bianco
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
Carlos Eduardo Costa
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
André Augusto Borges Varella
Doutor em Psicologia –
Universidade Federal de São
Carlos.
Carlos Renato Xavier Cançado
Doutor em Psicologia/Análise
do Comportamento – West
Virginia University, Estados
Unidos.
Andréia Schmidt
Doutora em Psicologia
Experimental – Universidade de
São Paulo.
Armando Domingos Batista
Machado
Doutor em Psicologia – Duke
University, Estados Unidos.
Candido Vinícius Bocaiuva
Barnsley Pessôa
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Carlos Augusto de Medeiros
Doutor em Psicologia –
Universidade de Brasília.
iv
Carolina Coury Silveira
Mestre em Psicologia –
Universidade Federal de São
Carlos.
Cristiano Coelho
Doutor em Psicologia –
Universidade de Brasília.
Cristiano Valério dos Santos
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Edson Massayuki Huziwara
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Elenice Seixas Hanna
Doutora em Psicologia –
University of Wales, Reino
Unido.
Ítalo Siqueira de Castro
Teixeira
Graduação em Psicologia –
Universidade de Fortaleza.
Fábio Henrique Baia
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
João Claudio Todorov
Doutor em Psicologia – Arizona
State University, Estados
Unidos.
Flávia Hauck
Mestre em Ciências do
Comportamento –Universidade
de Brasília.
João Henrique de Almeida
Doutor em Psicologia –
Universidade Federal de São
Carlos.
Hernando Borges Neves Filho
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
Kennon A. Lattal
Doutor em Psicologia
Experimental e Clínica –
University of Alabama, Estados
Unidos.
Hiroto Okouchi
Doutor em Ciências do
Comportamento – Hiroshima
University, Japão.
Isabella Guimarães Lemes
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
Lucas Ferraz Córdova
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
Marcelo Borges Henriques
Mestre em Psicologia –
Pontifícia Universidade Católica
de Goiás.
v
Márcio Borges Moreira
Doutor em Ciências do
Comportamento –Universidade
de Brasília.
Poliana Ferreira da Silva
Estudante de Graduação
(Psicologia) – Universidade de
Rio Verde.
Marco Vasconcellos
Doutor em Psicologia – Purdue
University , Estados Unidos.
Rafaela Meireles Fontes
Azevedo
Mestre em Ciências do
Comportamento – Universidade
de Brasília.
Maria Carolina Correa
Martone
Mestre em Psicologia
Experimental – Pontifícia
Universidade Católica de São
Paulo
Marília Pinheiro de Carvalho
Doutora em Psicologia Básica
– Universidade do Minho,
Portugal.
Paulo Guerra Soares
Mestre em Análise do
Comportamento – Universidade
Estadual de Londrina.
Peter Endemann
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
vi
William Ferreira Perez
Doutor em Psicologia
Experimental – Universidade de
São Paulo.
AGRADECIMENTOS
“É preciso de uma aldeia inteira para criar uma criança”1. É verdade: muito trabalho, de muitas pessoas. Em relação à escrita de um artigo científico, Killeen e Pellón (2013) indicaram que também “É preciso
de uma aldeia inteira para criar um artigo”2 (p.19): muito trabalho, certamente de muitas pessoas. O mesmo pode ser dito sobre a organização
de um livro. Gostaríamos de agradecer a todas e a todos dessa “aldeia”,
cujo trabalho permitiu que esse livro fosse criado.
Agradecemos à cada autora e a cada autor dos capítulos que
compõem esse livro. Vocês abraçaram o projeto e contribuíram de uma
forma que o nosso breve agradecimento não consegue descrever e nunca será suficiente. Para vocês, especialmente, o nosso “Muito obrigado”.
Agradecemos ao Prof. Alexandre Dittrich pela escolha da capa
desse livro e pela escrita do texto que a acompanha. Cientistas são “artistas do mundo natural” e a experimentação é um caminho central
de sua atividade. Agradecemos à Profa. Deisy das Graças de Souza por
escrever o prefácio e apresentar o livro de forma tão clara à audiência
para qual foi escrito. O conselho que ela dá para futuras e futuros analistas do comportamento é válido para todas e todos interessados no
estudo científico do comportamento, mesmo para quem tem familiaridade e trabalha há anos com a experimentação.
Agradecemos à equipe do Projeto de extensão UneDesign - Integração Universidade-Empresa do curso de Desenho Industrial com
habilitação em Programação Visual, da Universidade do Norte do Paraná, coordenada pela Profa. Seila Cibele Sitta Preto, pelo trabalho cuidaIt takes a village to raise a child.
“It takes a village to raise a paper”. Killeen, P. R., & Pellón, R. (2013). Adjuntive behaviors are operants. Learning &
Behavior, 41, 1-24.
1
2
vii
doso em cada etapa da preparação desse livro. Aos discentes Leandro
Brasil Melo pelo desenvolvimento do projeto gráfico, e Lorena Shimizu
pela diagramação e desenvolvimento projetual de capa. O trabalho foi
feito como parte de um projeto de extensão, e retrata a importância da
integração das atividades de ensino e pesquisa na relação entre a universidade e as comunidades nas quais está inserida.
Por fim, agradecemos ao Prof. Márcio Borges Moreira, que acreditou no projeto e aceitou a tarefa de publicação de um livro gratuito e
em formato eletrônico pela Editora do Instituto Walden4.
É verdade: é preciso de uma aldeia para criar um livro!
Paulo Guerra Soares
João Henrique de Almeida3
Carlos Renato Xavier Cançado4
3
4
viii
Apoio da FAPESP (Processo no: 2014/01874-7).
Apoio CAPES (PNPD).
PREFÁCIO
... even though laboratory methods are often devised not for practical
teaching but for the study of fundamental behavioral processes, the
techniques are then available for application outside the laboratory.
Murray Sidman, 1994, P.534
Tomar conhecimento da edição deste livro me deixou particularmente entusiasmada. É sempre bom contar com material de qualidade
como suporte para o ensino e, neste caso, vislumbrei a possibilidade de
ter em mãos um material muito compatível com a maneira como gosto
de trabalhar nas disciplinas que ministro para o curso de graduação em
Psicologia.
Segundo me relataram os organizadores, sua proposta era trazer
ao leitor experimentos clássicos em análise do comportamento, relatados e interpretados por pesquisadores da área, com ênfase em suas
contribuições para novas linhas de pesquisa. Gostei imediatamente da
proposta e me lembrei de outras ocasiões em que tive oportunidade
de explorar artigos de pesquisa como fontes para atividades de ensino, buscando propiciar ao aluno condições para o desenvolvimento de
uma ampla gama de habilidades, incluindo a busca pelas origens de
ideias, conceitos, procedimentos. No período em que estive na UnB,
no início da década de 90, tive oportunidade de trabalhar com meu
colega Jorge Mendes de Oliveira Castro, na disciplina Psicologia Geral
e Experimental (PGE I), para alunos do primeiro semestre do curso de
graduação em Psicologia. Discutimos muito as condições de entrada
dos alunos no curso, incluindo as possíveis ideias preconcebidas sobre
nossa disciplina, e a necessidade de colocá-los logo em contato com o
que se estuda em Psicologia e, ao mesmo tempo, mantê-los motivados
para ler e estudar o assunto. Concordamos muito rapidamente que, em
ix
vez de ler livros texto, os alunos poderiam aprender muito lendo artigos científicos, mais precisamente, relatos de pesquisa experimental,
o que lhes permitiria ter contato com autores importantes da área e
conhecer um pouco do desenvolvimento de nossa ciência. Tenho as
melhores lembranças das horas e horas que passamos escolhendo os
textos (claro que fizemos um levantamento 10 vezes maior do que seria
possível abordar em uma disciplina de um semestre) e do entusiasmo
com que trabalhamos naquela disciplina, em grande parte motivado
pelos progressos dos alunos, evidenciados nas discussões em sala, em
suas habilidades de ler e pensar, de utilizar o raciocínio científico, e de
se dar conta de que cada experimento pode trazer uma nova contribuição, mas também pode ter limitações, e que identificar os limites é
um caminho para novas ideias e novas possibilidades de investigação.
Sentíamos que estávamos criando boas condições para o desenvolvimento de pelo menos alguns dos requisitos importantes no repertório
de futuros psicólogos e, talvez, pesquisadores em psicologia.
Retornando à UFSCar, tive oportunidade de fazer parte da equipe que planejou o curso de graduação em Psicologia, implantado em
1994. Novamente me coube uma disciplina introdutória e quando comentei sobre a experiência na disciplina da UNB, meu colega Júlio de
Rose me apresentou o livro de Roger Hock: “Quarenta estudos que
transformaram a Psicologia”. O livro organizava o material em 10 capítulos, cada capítulo apresentando quatro estudos clássicos. A organização apresenta uma característica que resolvia muitos dos problemas
que eu encontrara antes, ao exigir de alunos de primeiro semestre a
leitura de um estudo experimental em toda a complexidade de seu relato original: neste livro, cada estudo é apresentado de maneira resumida – isto é, retira detalhes e complexidade do texto, sem deixar de
apresentar ao leitor as informações essenciais para a compreensão do
x
que foi feito e da justificativa para fazê-lo; além disso, o autor do livro
apresenta o contexto em que cada investigação foi concebida e conduzida; e ao final do texto, apresenta, também, de maneira resumida,
mas suficientemente informativa, as linhas de pesquisa e os desenvolvimentos subsequentes que derivaram daquele estudo seminal (isto é,
oferece uma perspectiva histórica do desenvolvimento da psicologia,
por meio do trabalho concreto de pesquisadores relevantes). Usei o
livro por vários anos, enquanto ministrei a disciplina (fui depois substituída pelo Júlio, que continuou usando o “Hock”) e estou certa que
o uso desse material, em suas sucessivas reedições, tem contribuído
muito positivamente para iniciar o desenvolvimento das concepções
do aluno sobre o que estuda a Psicologia – e sobre como essa ciência
vem sendo, e poderá continuar sendo, construída.
Experiência similar teve ocasião quando Edson Huziwara, fazendo pós-doutorado na UFSCar, se dispôs a oferecer uma turma da
disciplina optativa do curso, denominada Fenômenos e Processos Psicológicos; fui formalmente responsável pela disciplina e estive presente em todas as aulas, mas todo o trabalho foi planejado e conduzido
pelo Edson e pelo João Henrique de Almeida, um dos organizadores
deste livro. Aquela disciplina do curso de Psicologia da UFSCar permite, a cada oferta, a especificação dos tópicos abordados e Edson e
João propuseram que naquele semestre a disciplina tivesse por objetivo apresentar, de forma sucinta, a produção empírica (experimentos
clássicos) sobre diversos processos comportamentais investigados pela
análise experimental do comportamento e ensinar as habilidades necessárias para uma leitura competente de textos científicos. Os alunos
eram de uma turma avançada e liam os artigos no original, os professores realizaram um excelente trabalho de preparar cuidadosamente cada
estudo para apresentar em sala, destacando seus aspectos fundamenxi
tais e apresentando pistas para que os alunos discutissem qualidades
e limites da pesquisa em foco. Sou testemunha de que esta atividade
funcionou como reforçador poderoso para a leitura prévia dos alunos,
e, ao mesmo tempo, como modelo de leitura cuidadosa e crítica.
Reconheço que ao relatar essas experiências estou falando de
meu trabalho, em vez de falar sobre o livro que apresento aos leitores.
Mas espero ter fornecido evidências do quanto aprecio o que encontrei
nele:
- O conteúdo é específico de análise do comportamento: trata-se, assim, de uma fonte organizada de informações que podem ser
usadas no ensino de disciplinas da área.
- A seleção de artigos relevantes, que deram origem a importantes desenvolvimentos na área, pode contribuir decisivamente para que
o leitor compreenda a relevância da memória da investigação científica, a importância de se conhecer os clássicos e de se estabelecer relações entre o experimento original e a linha ou linhas de pesquisa geradas por ele e sua importância para o conhecimento atual em análise do
comportamento.
- A ênfase em estudos experimentais permite destacar aspectos
metodológicos, as possibilidades e a importância de investigação rigorosa, os necessários limites (seja do ponto de vista do controle, seja do
ponto de vista da validade interna e externa), as contribuições potenciais para a compreensão de processos comportamentais, as perguntas que deixaram de ser respondidas, ou que foram suscitadas pelos
dados. Esse conjunto de aspectos representa uma rica oportunidade
para subsidiar a avaliação crítica da pesquisa científica em análise do
xii
comportamento, e, o que é de extrema relevância para a sobrevivência das práticas científicas (investigação e intervenção) em análise do
comportamento, despertar talentos e vocações para dar continuidade
ao desenvolvimento da área.
Por todos esses aspectos, avalio que este volume pode ser uma
fonte inestimável para formação ou o aprimoramento de analistas do
comportamento.
Há algum tempo, em uma entrevista para a Associação Brasileira
de Psicologia e Medicina Comportamental (ABPMC), a entrevistadora
me perguntou que conselhos eu daria para a nova geração de analistas
do comportamento. Embora desacredite no potencial de “conselhos”
(sem outras condições críticas) para gerar ou manter comportamentos,
arrisquei alguns palpites que talvez respondessem ao interesse de alguém. Penso que os palpites valem também para jovens analistas que
busquem aprender com este livro, por isso tomo a liberdade de transcrever alguns pontos daquela fala:
Não existe nada que você possa fazer bem feito, que não exija esforço, comprometimento, dedicação e um trabalho sistemático. Em nossa
área, seja no estudo, na investigação, ou nas aplicações a problemas
humanos, não dá para fazer um trabalho de qualquer jeito, não se
pode fazê-lo rapidamente, nem superficialmente. Por isso, para quem
quer se tornar um analista do comportamento competente, seja no
desenvolvimento científico da área, seja no desenvolvimento profissional, o primeiro passo é dedicação. É preciso ler (ou melhor, estudar)
relatos originais de pesquisa; é preciso ler muito, voltar às origens, ler
os clássicos e, claro, ler bibliografia atualizada. Muitas vezes presencio
meus alunos lendo – ou escrevendo sobre o que leram, e eles tendem a
xiii
assumir que o autor que estão lendo no momento foi o primeiro a falar
daquele assunto, ou o que teve a ideia original de que trata a pesquisa. Muitas vezes, trata-se de conceitos elaborados há muito tempo,
que são encontrados em Skinner (1931, 1938, 1953), Keller e Schoenfeld
(1950), Ferster e Skinner (1957), Millenson (1967), Sidman (1960), mas
eles citam o artigo mais recente que leram, como se fosse a fonte original. É preciso estar atualizado, acompanhar o desenvolvimento da
área e para isto é preciso recorrer à literatura recente, mas também
é preciso manter o registro, a memória ou a história dos conceitos e
descobertas. Apesar de todas as exigências de referência de citação
científica, muitas vezes vemos uma deturpação em relação às origens.
Não é incomum encontrarmos, em 2016, um artigo citando um autor que publicou em 2015, como se este fosse a referência original de
um determinado assunto. É muito importante estudar os trabalhos
dos pioneiros (e se interessar por quem foram eles, sob que condições
trabalharam, onde e quando viveram), ler e conhecer o que a área já
produziu, ao mesmo tempo em se lê referências atualizadas. É preciso
tentar dominar o conhecimento produzido na área, que não é pouco;
quanto mais se conhece – os conteúdos e os caminhos que levaram
a eles, mais o analista do comportamento disporá de instrumental
teórico, conceitual e de procedimentos, para analisar e interpretar
situações novas e para pensar, gerar novos estudos, ou planejar intervenções com embasamento cientifico. As facilidades de acesso são
cada vez maiores, mas não podemos nos iludir com essa facilidade.
É muito fácil acessar dezenas de artigos pela internet e poder abrir
cada um deles com um simples toque. Mas não basta: faltam os passos
seguintes: como é que se lê essa quantidade de material, de maneira
funcional? Será preciso trabalhar muito, de forma disciplinada. Para
quem quiser ter uma boa formação como analista do comportamento,
existe muito conhecimento sedimentado para se aprender a trabalhar
xiv
e existem boas oportunidades de novos desenvolvimentos, mas para
isso é preciso estudar, se dedicar, se comprometer.
Este livro pode ser um bom começo. Neste primeiro volume da
série foram selecionados estudos experimentais sobre condicionamento respondente; sobre o papel das consequências e parâmetros de reforço (atraso do reforço; contraste comportamental; comportamento de
escolha, história comportamental, ressurgência); sobre controle de estímulos (processos atencionais, respostas de observação, responder por
exclusão, eventos privados, resolução de problemas, Teoria das Molduras Relacionais); sobre comportamento social (cooperação, cultura) e
comportamento verbal (correspondência verbal e não verbal; comportamento governado por regras); e sobre análise funcional. Todos eles
deram origem a linhas de pesquisa produtivas, responsáveis por grande parte do estado atual da pesquisa em análise do comportamento.
Os autores dos capítulos são investigadores nacionais e internacionais,
que conhecem profundamente os estudos e seus autores e estão comprometidos com a difusão e o ensino de análise do comportamento.
Por todos esses aspectos, estou certa de que o livro atende a uma
necessidade importante em nossa área, e que se tornará um oportuno
ponto de partida para iniciantes e uma excelente ocasião para revisão e
atualização para os iniciados em análise do comportamento.
Deisy G. de Souza
Universidade Federal de São Carlos
xv
SOBRE A CAPA
A ciência e a arte são as mais belas criações do comportamento
humano. Elas demonstram, cada uma à sua maneira, nossa fascinante
capacidade de transformar o mundo e de nos transformarmos ao fazêlo.
O gentil convite feito por Carlos, João e Paulo para que eu escolhesse a imagem da capa do livro que você agora lê me confrontou com
um desafio singular: ilustrar, com o auxílio da arte, o conteúdo de um
livro científico.
Minha tarefa certamente foi facilitada pelo fato de que a arte não
nos compromete com interpretações “certas”. A arte é o campo da sugestão, da metáfora, do símbolo. Assim, me lancei à tarefa sob um vago
controle temático, mas também me deixando levar pela beleza e pelo
poder evocativo das imagens.
A Osteographia, publicada pelo anatomista inglês William Cheselden em 1733, é uma das obras mais importantes da história da ilustração anatômica. Ela impressiona não apenas pela precisão, mas pela
elegância. As criaturas humanas e não-humanas que ali aparecem não
são meros auxílios da ciência, passivamente à disposição dos estudiosos: em tudo o que importa, elas parecem vivas, ativas, interagindo
com seu entorno.
O fato de serem apenas esqueletos dá às imagens seu impacto.
Seres vivos reduzidos à sua dura estrutura têm fascinado a humanidade ao longo dos séculos. Caveiras e esqueletos nos lembram de nosso
destino comum. A representação da morte como um esqueleto vivo é
comum a várias culturas.
xvi
O que nos mostra que estão mortos é o fato de serem apenas
esqueletos. O que nos mostra que estão vivos é o fato de interagirem
com o mundo. Os esqueletos que nos assombram e nos encantam na
tradição são a encarnação desencarnada da contradição: são mortos
que vivem. Se neles pouco resta do que esperaríamos encontrar em
um corpo vivo, o comportamento é seu único sinal de vida - e, como
lembrava Skinner, a história do comportamento e a história da vida
começam juntas.
O esqueleto que está na capa deste livro nos lembra ainda que
a vida é evolução - e que nós, seres vivos, estamos todos ligados por
laços de parentesco. Trata-se de uma figura simiesca, que não obstante
adota uma postura aparentemente “intencional” e verbal, tipicamente
humana. É como se interagisse com outros de sua espécie, cuja presença a imagem permite apenas subentender. Filogênese, ontogênese e
cultura estão todas na imagem - desde que nossa história nos permita
encontrá-las.
Assim como a Osteographia de Cheselden, que utilizou magistralmente a arte para fazer ciência, espero que também este livro possa mostrar, da capa à última página, quão fascinante é a jornada de
conhecimento e autoconhecimento proporcionada pela investigação
científica.
Alexandre Dittrich
Universidade Federal do Paraná
xvii
APRESENTAÇÃO
Este livro foi idealizado a partir de uma paixão comum dos três
organizadores: a Análise Experimental do Comportamento. A ideia geral consiste em apresentar, a estudantes de graduação, diversos temas
de pesquisa em Análise do Comportamento por meio de experimentos
clássicos. A análise experimental geralmente é considerada um terreno
árido, com descrições metodológicas difíceis e um certo “desprendimento” das questões do dia a dia. Estes fatores, em nossa opinião, dificultam o contato e até mesmo o interesse de estudantes iniciantes pelo
laboratório e pela pesquisa experimental sobre o comportamento.
Buscando inspiração em livros de divulgação científica, como
“Forty studies that changed Psychology” de Roger Hock, formatamos a
ideia inicial do livro. Estas ideias nos levaram a uma série de convites
a pesquisadores e pesquisadoras de diversas instituições brasileiras e
internacionais para contribuírem com a obra. Convites aceitos, o livro
começou a ganhar forma. Mais ideias foram surgindo, e foram tantos
os temas escolhidos que acabamos tendo que dividir a obra em dois
volumes. Depois de incontáveis reuniões que aproximaram Londrina,
São Carlos e Brasília, conseguimos concretizar nosso objetivo.
Em cada capítulo, autores e autoras discutem temas relevantes
na Análise do Comportamento a partir da descrição de um experimento
“clássico”. Clássico, aqui, não significa necessariamente o estudo mais
antigo, mas aquele que é reconhecidamente uma influência importante
naquela área de pesquisa, ou seja, que tenha servido de contexto para
a produção de mais conhecimento científico. Assim, em cada capítulo,
o experimento clássico serve como um pano de fundo para a apresentação do tema, e os textos foram escritos com uma linguagem leve e
acessível, buscando, sempre que possível, uma ponte entre os procedimentos metodológicos e o contexto aplicado.
xviii
Esperamos que esta obra inspire estudantes (e futuros pesquisadores e pesquisadoras!) a se enveredarem pelos caminhos fascinantes
da pesquisa experimental sobre o comportamento dos organismos. E
que essa jornada seja para estes estudantes um pouco do que foi (e continua sendo) para nós: um caminho de muito trabalho e de muitos erros
e acertos, mas, acima de tudo, um caminho muito gratificante e enriquecedor. Esperamos, também, que este material sirva como um apoio
aos professores e professoras das disciplinas de Análise Experimental
do Comportamento, como contexto para discussões sobre os temas de
pesquisa que compõe os currículos destas disciplinas.
Boa leitura!
Paulo Guerra Soares
João Henrique de Almeida
Carlos Renato Xavier Cançado
xix
SUMÁRIO
Capítulo I.............................................................................................24
Somos todos produtos da nossa história comportamental
Paulo Guerra Soares, Carlos Eduardo Costa
Capítulo II...........................................................................................36
O cheque está no correio: investigando como o reforço atrasado afeta
o desempenho
Kennon A. Lattal
Capítulo III.........................................................................................49
Quando o passado retorna: ressurgência comportamental
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Capítulo IV..........................................................................................64
Clarice Lispector, tempo e consequências: considerações sobre contraste comportamental
João Cláudio Todorov, Rafaela M. Fontes Azevedo
Capítulo V...........................................................................................78
Da frequência absoluta à frequência relativa como unidade de análise
do comportamento
Cristiano Coelho
Capítulo VI.........................................................................................95
Prestaram atenção em tudo?
Elenice S. Hanna, Márcio Borges Moreira
xx
Capítulo VII.....................................................................................109
A resposta de observação: o papel das respostas sensoriais para o estabelecimento da discriminação
Peter Endemann, Candido V. B. B. Pessôa
Capítulo VIII.....................................................................................123
Controle dos processos atencionais
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
Capítulo IX.......................................................................................139
O responder controlado temporalmente: desdobramentos da pesquisa
com a tarefa de bissecção
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
Capítulo X.........................................................................................158
Como você se sente?
Hiroto Okouchi
Capítulo XI........................................................................................171
“Esse não é um pitilics, então só pode ser aquele”: o responder por
exclusão e a aprendizagem de repertórios verbais
Adreia Schimidt
Capítulo XII......................................................................................186
Paus e pedras podem machucar, mas palavras... também! - Teoria das
molduras relacionais
João Henrique de Almeida e William Ferreira Perez
xxi
Capítulo XIII....................................................................................205
Quando o mundo interage com o que é dito sobre o mundo: o comportamento governado por regras
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
Capítulo XIV.....................................................................................222
A função do mentir em crianças: o controle operante na correspondência verbal
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
Capítulo XV......................................................................................239
Do indivíduo ao grupo: simulações experimentais de relações sociais
com animais não-humanos
Marcelo Borges Henriques
Capítulo XVI..................................................................................254
Metacontingências: investigação experimental da seleção cultural
Fábio Henrique Baia, Alina Barboza Cabral Bianco, Isabella Guimarães
Lemes, Poliana Ferreira da Silva
Capítulo XVII..................................................................................272
“Para com isso menino!”: análise funcional em problemas de comportamento
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury
Silveira
Capítulo XVII..................................................................................284
Recombinação de repertórios: criatividade e a integração de aprendizagens isoladas
Hernando Borges Neves Filho
xxii
Capítulo XIX....................................................................................297
Controlar para conhecer
Cristiano Valério dos Santos
Capítulo XX......................................................................................310
The check is in the mail: examining how delayed reinforcement affects performance
Kennon A. Lattal
Capítulo XXI....................................................................................322
How do you feel?
Hiroto Okouchi
xxiii
Paulo Guerra Soares, Carlos Eduardo Costa
Somos todos produtos
da nossa história
comportamental
Paulo Guerra Soares
Universidade Norte do Paraná; Núcleo Evoluir
Carlos Eduardo Costa
Universidade Estadual de Londrina
Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the
Experimental Analysis of Behavior, 7(5), 383-385.
“O hoje é apenas um furo no futuro, por onde o passado começa a jorrar”
Raul Seixas e Marcelo Nova
24
Capítulo I | História Comportamental
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Uma das principais afirmações da teoria da evolução por seleção natural é que
as gerações atuais de indivíduos de uma
determinada espécie são produto de um
constante processo de variação e seleção.
Assim, ao longo da história de evolução
de uma espécie, indivíduos com características menos adaptativas morreram, enquanto aqueles mais bem adaptados sobreviveram, passando seus genes às próximas
gerações. É importante lembrar que mais ou
menos adaptativa significa que, sob certos
aspectos do ambiente, certas características
favorecem mais certos indivíduos de uma
espécie do que outras. Não há características intrinsecamente melhores do que outras. Aquelas cuja consequência seja maior
chance de sobrevivência e procriação irão
aumentar de frequência na espécie. Portanto, para explicar por que os indivíduos de
uma espécie exibem alguma forma de comportamento típico (como espirros, bocejos,
náuseas ou salivação, no caso do ser humano), é imprescindível uma análise da história de seleção dessa espécie.
Este modelo de variação e seleção
dos aspectos biológicos, proposto por Charles Darwin no seu livro Origem das Espécies
(1859), é reconhecidamente uma das inspirações de B. F. Skinner na formulação do
Behaviorismo Radical (Baum, 2006; Laurenti, 2009; Skinner, 1974; 1981). Para Skin-
ner, o Behaviorismo Radical enfatiza o estudo do comportamento de cada indivíduo
(e não apenas os padrões típicos de cada
espécie). Assim, fazendo jus à analogia com
a teoria da evolução de Darwin, o comportamento atual dos indivíduos é produto de
um conjunto de relações entre o comportamento do indivíduo (selecionado na história individual) e o ambiente atual. Nesse
sentido, Skinner afirma que “Coube a Darwin descobrir a ação seletiva do ambiente, assim como cabe a nós [behavioristas]
completar o desenvolvimento da ciência do
comportamento com uma análise da ação
seletiva do meio”. (Skinner, 1974, p.60-61).
Como funciona essa relação entre a
ação do indivíduo e as variáveis ambientais? Skinner propõe que em determinadas
circunstâncias, nos comportamos no mundo de diversas maneiras (variação) e uma
ou algumas dessas maneiras de nos comportar produzem alterações no ambiente.
Estas alterações podem produzir mudanças
na probabilidade futura do comportamento
(seleção). Se as consequências do comportamento forem reforçadoras, produzirão
um aumento na probabilidade desse comportamento ocorrer sob circunstâncias semelhantes no futuro. Se as consequências
forem punidoras, produzirão uma diminuição na probabilidade da ocorrência do comportamento. Neste último caso, o indivíduo
pode se comportar em função da situação
que indica que uma consequência nociva é
provável e, assim, aprende também a evitar
estas situações. Assim, cada indivíduo, ao
25
Paulo Guerra Soares, Carlos Eduardo Costa
entrar em contato com experiências únicas
ao longo da vida, vai aprendendo determinadas maneiras de agir a partir das consequências que esse comportamento produz.
A noção de seleção do comportamento por consequências sugere que, para
que possamos explicar os comportamentos
dos indivíduos, é imprescindível uma análise da história comportamental de cada
um (Aló, 2005; Chiesa, 1994; Costa, Cirino,
Cançado & Soares, 2009; Freeman & Lattal,
1992; Skinner, 1974; Soares, Costa, Cançado & Cirino, 2013). Skinner já apontava que
“uma análise do comportamento é (...) necessariamente ‘histórica’” (1974, p. 236), pois
os comportamentos atuais são produto de
uma história de seleção que ocorre ao longo
da vida de cada indivíduo.
Neste sentido, é relativamente seguro afirmar que pessoas que passaram
por experiências diferentes ao longo da
vida, quando expostas a situações parecidas no presente, se comportam de maneiras distintas. Contudo, o que se observa é
que a grande maioria das explicações do
senso comum negligencia a história comportamental na determinação do comportamento atual (Aló, 2005; Chiesa, 1994).
Valendo-se de uma terminologia dualista/
mentalista, o senso comum explica o comportamento dos indivíduos recorrendo a
conceitos como “personalidade” ou “caráter”. A pesquisa de Simonassi, Pires, Bergholz e Santos (1984), por exemplo, identificou que observadores que desconheciam
26
a história comportamental de crianças tendiam a explicar seu comportamento atual
a partir de um viés mentalista. Por outro
lado, quando os observadores conheciam
a história comportamental das crianças,
tenderam a leva-la em consideração na explicação do comportamento atual em detrimento das causas mentais. Assim, Skinner
(1953/2003) afirmou que o “hábito de buscar dentro do organismo uma explicação
do comportamento tende a obscurecer as
variáveis que estão ao alcance de uma análise científica. Estas variáveis estão fora do
organismo, em seu ambiente imediato e em
sua história ambiental” (p. 33).
A afirmação de Skinner (1953/2003)
levanta a seguinte questão: Como podemos
analisar cientificamente os efeitos da história ambiental sobre o comportamento atual? Sidman (1960) afirmou que, em um contexto experimental, a “melhor maneira de
um experimentador especificar a história
comportamental de um organismo, na medida em que é importante para um determinado problema, é construir deliberadamente essa história no organismo” (p. 290,
itálico adicionado). Ou seja, o experimentador interessado no estudo da história comportamental deveria ser capaz de construir
diferentes histórias para seus participantes
no laboratório (Wanchisen, 1990).
Porém, até meados da década de
1960 não havia, na literatura analítico-comportamental, um conjunto de dados sistemáticos que permitisse a análise do efeito
Capítulo I | História Comportamental
de diferentes contingências passadas sobre
o comportamento atual. Nesse contexto,
mais precisamente em 1964, foi publicado
um dos primeiros estudos cujo objetivo era
a análise do efeito de diferentes histórias
comportamentais (construídas no laboratório, como sugerido por Sidman, 1960) sobre
o comportamento atual.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A pesquisa de Weiner (1964) era simples, porém engenhosa. O objetivo do estudo
foi avaliar o efeito da exposição a diferentes
contingências históricas sobre o comportamento atual. Como estratégia metodológica, foram arranjados esquemas de reforço, programações de contingência muito
utilizadas em pesquisas experimentais em
Análise do Comportamento, que permitem
a seleção de padrões estáveis de comportamento (Ferster & Skinner, 1957; Lattal, 1991;
Souza Júnior & Cirino, 2004). Os participantes da pesquisa foram seis enfermeiros de
um hospital psiquiátrico. Eles se sentavam
em frente a um monitor e a tarefa experimental consistia em pressionar um botão.
As consequências para esse comportamento eram pontos que apareciam em um
contador de pontos no monitor. Em cada
sessão, os participantes também recebiam
uma quantia fixa de dinheiro, que não era
contingente ao seu desempenho. Os participantes foram distribuídos em dois grupos:
durante a primeira fase da pesquisa (cons-
trução da história), os participantes do Grupo 1 (n=3) foram expostos a um esquema de
razão fixa (FR) 40 e os do Grupo 2 (n=3) a
um esquema de reforçamento diferencial
de baixas taxas (DRL) 20 segundos, por 10
sessões de 60 min. Para os participantes
expostos ao FR, 100 pontos eram creditados no contador a cada 40 pressões ao botão. Para os participantes expostos ao DRL,
cada resposta emitida após a passagem de
20 segundos da última resposta produzia
100 pontos no contador. Respostas emitidas antes do fim do intervalo reiniciavam o
intervalo do DRL.
Esquemas de FR, em geral, selecionam altas taxas de respostas, pois há uma
relação direta entre taxa de respostas e taxa
de reforços sob esse esquema. Por outro
lado, o esquema DRL geralmente seleciona baixas taxas de respostas, pois respostas emitidas antes de terminado o intervalo
programado produzem o reinício do intervalo. E este era exatamente o objetivo de
Weiner nesta primeira fase do experimento: estabelecer duas linhas de base - ou duas
histórias comportamentais diferentes - nas
quais padrões de comportamento distintos
(altas e baixas taxas de respostas) fossem
selecionados.
Após construir histórias comportamentais diferentes para cada grupo, era
hora de testar o efeito da exposição a estas
diferentes contingências sobre o comportamento atual, quando as contingências mudassem. Na segunda fase do experimento
27
Paulo Guerra Soares, Carlos Eduardo Costa
(teste), os participantes de ambos os grupos
foram expostos à um mesmo esquema de
reforçamento de intervalo fixo (FI) 10 segundos por 10 sessões de 60 min e, depois,
10 sessões de 30 min. Sob o esquema de FI
10 s, a primeira resposta que ocorresse após
o intervalo de 10 segundos produzia 100
pontos no contador. Respostas que ocorressem ao longo desse intervalo não tinham
consequências programadas (diferente do
que ocorria na fase anterior sob o esquema
de DRL). Assim, no esquema de FI, não importa se o indivíduo responde em altas ou
baixas taxas, pois ambos os padrões continuam a produzir pontos, desde que uma
resposta ocorra após transcorrido o inter-
valo do FI. Portanto, expor os participantes
a este esquema de reforço na fase de teste
permitiu observar se a exposição prévia ao
FR ou ao DRL teria alguma influência no
modo como eles se comportariam quando
as contingências mudassem (ou seja, quando o FI estivesse em vigor).
Resultados e discussão
E foi exatamente o que aconteceu! A
Figura 1 exibe os registros cumulativos dos
participantes do Grupo 1 (S1, S2 e S3) e do
Grupo 2 (S4, S5 e S6), durante os 15 últimos
minutos da fase de teste (FI). A análise da
Figura 1 permite constatar que, mesmo após
Figura 1. Registros cumulativos dos 15 últimos minutos da fase de teste (após 15 horas de exposição ao FI) dos participantes da pesquisa de Weiner
(1964). O painel superior exibe os registros dos participantes do Grupo 1 (história de FR) e o painel inferior exibe os registros dos participantes do Grupo
2 (história de DRL) (reproduzido com a permissão de John Wiley and Sons).
28
Capítulo I | História Comportamental
15 horas de exposição ao FI, os participantes que tinham sido expostos ao FR emitiam taxas de respostas mais altas quando
comparadas às taxas de respostas dos participantes que tinham sido expostos ao DRL.
A pesquisa de Weiner (1964) é interessante por demonstrar que, mesmo em
um delineamento simples, no qual a resposta selecionada era pressionar um botão,
o comportamento dos participantes no esquema de FI sofreu influências da história comportamental que foi construída no
laboratório. Sobre estes resultados, Weiner
afirmou que o “ponto importante é que a
história de condicionamento deve ser considerada como um possível determinante
do responder de humanos em FI” (p. 385).
Mas é possível ir mais além, e supor
que a história comportamental não seja apenas determinante do responder em FI, mas
de qualquer comportamento, dentro e fora
do laboratório. Se este for o caso, os resultados da pesquisa de Weiner (1964) permitem
inferir (baseado em dados empíricos) que as
experiências vivenciadas pelas pessoas ao
longo de sua vida podem, sim, influenciar o
comportamento presente.
Os resultados apresentados por Weiner (1964) nos permitem ainda outras considerações. A Figura 2 abaixo foi construída
a partir da Tabela 1 do artigo. O eixo y apresenta a taxa de respostas (R/min) em escala
logarítmica e o eixo x exibe a média da taxa
de respostas das três últimas sessões de his-
tória (FR para S1, S2 e S3; DRL para S4, S5 e
S6) e a taxa de respostas nas cinco últimas
sessões do experimento.
Observa-se na Figura 2 que a taxa de
respostas nas cinco últimas sessões de FI
dos participantes com história de FR foram
sempre superiores às taxas de respostas dos
participantes com história de DRL. Todavia,
há que se considerar que houve diminuição
na taxa de respostas dos participantes expostos a história de FR e aumento na taxa
de respostas dos participantes com história
de DRL, quando expostos ao FI.
Durante as três últimas sessões de
Figura 2. Taxa de respostas (R/min) em escala logarítmica na fase de
construção da história experimental (Hist - FR para S1, S2 e S3; DRL
para S4, S5 e S6) e nas cinco últimas sessões do experimento. Ver mais
detalhes no texto. (Figura construída especialmente para este capítulo
com dados apresentados em Weiner, 1964, p. 384, Tabela 1).
exposição ao FR, os participantes S1 e S3
emitiram, em média, 412 e 240 respostas
por minuto. Na última sessão de FI, eles
emitiam 64 e 55 respostas por minuto, respectivamente. Ou seja, depois de 15 horas
de exposição ao FI, houve uma redução na
taxa de respostas de aproximadamente 85%
para S1 e de 77% para S2, em relação à li29
Paulo Guerra Soares, Carlos Eduardo Costa
nha de base. Uma análise parecida também
pode ser realizada para os participantes S5
e S6, que foram expostos à história de DRL.
Durante as três últimas sessões do DRL, S5
e S6 emitiam, em média, três respostas por
minuto. A taxa de respostas na última sessão do FI foi de seis e nove respostas por
minuto, respectivamente. Pode parecer
pouca coisa, mas trata-se de um aumento na taxa de respostas de 100% para S5 e
200% para S6!
DESDOBRAMENTOS
Os resultados da pesquisa de Weiner
(1964) sugerem evidências de que: (a) é essencial a análise da história de exposição a
contingências passadas para a compreensão do comportamento atual, assim como
proposto por Skinner (1981), em analogia à
seleção natural; (b) que os efeitos da história
comportamental podem ser estudados em
laboratório, desde que haja controle sobre
a construção da história comportamental
dos indivíduos (Sidman, 1960; Wanchisen,
1990).
Especular sobre as influências da
história de vida sobre o comportamento
presente pode parecer óbvio. Todavia, como
apontado anteriormente, o senso comum
frequentemente negligencia a história comportamental quando se propõe a explicar o
porquê as pessoas se comportam da maneira como o fazem. Por exemplo, como um
leigo, que não conhece a história compor30
tamental dos indivíduos, explicaria o desempenho dos participantes da pesquisa de
Weiner (1964) durante a fase de teste? Assim
como no estudo de Simonassi et al. (1984),
provavelmente o leigo utilizaria conceitos
mentalistas, como “ansiosas”, “hiperativas”
(para os participantes com história de exposição ao FR) ou “preguiçosas”, “depressivas”
(para aqueles com história de exposição ao
DRL), ignorando completamente a história
comportamental dos participantes!
A partir da pesquisa de Weiner (1964),
diversos estudos foram conduzidos para
analisar os efeitos da história de exposição a
diferentes contingências históricas sobre o
comportamento atual, manipulando variáveis como controle de estímulos, reforçador
empregado e custo da resposta, utilizando
não-humanos (e.g. Cole, 2001; Doughty, Cirino, Mayfield, da Silva, Okouchi, & Lattal,
2005; Freeman & Lattal, 1992; LeFrancois &
Metzger, 1993) e humanos (e.g. Costa, Banaco, Longarezi, Martins, Maciel, & Sudo,
2008; Costa, Soares & Ramos, 2012; Okouchi, 2003a; 2003b; Soares, Costa, Cançado
& Cirino, 2013).
As pesquisas em laboratório sobre
história comportamental tiveram desdobramentos interessantes, também, para a
aplicação da Análise do Comportamento
(como na clínica comportamental). Neste
contexto, Marçal (2013) ressalta que
Capítulo I | História Comportamental
“Por mais que um padrão comportamental esteja trazendo problemas
a alguém, por mais que este alguém
ses e especular com base em dados empíricos é mais do que muitas abordagens em
Psicologia têm oferecido.
esteja insatisfeito com sua forma de
agir, tal comportamento foi reforçado
no passado em um ou mais contextos”
CONSIDERAÇÕES FINAIS
(p. 41).
Conhecer a história é conhecer o
comportamento. Para que se possa compreender o comportamento atual do paciente, é
imprescindível que se conheçam elementos
de sua história de vida, e que estes elementos possam ser relacionados às contingências atuais. Portanto, para a condução de
uma análise funcional do comportamento
adequada, é necessária a análise sistemática da história do paciente.
Todavia, é importante esclarecer
alguns pontos. Em primeiro lugar, quando conversamos com um cliente não temos acesso a sua história. Temos acesso ao
comportamento verbal que pode estar sob o
controle da história, pode estar sob o controle da audiência (o terapeuta) ou ambos.
Os estudos sobre história comportamental
não nos dão uma ferramenta para a atuação
aplicada da Análise do Comportamento. As
pesquisas empíricas sobre história comportamental nos permitem fazer especulações
mais bem fundamentadas (i.e., baseadas em
dados empíricos), mas que não passam de
especulações, até que a intervenção seja
feita e, eventualmente, o comportamento
mude na direção “esperada” (pelas especulações). Isso não é pouco! Levantar hipóte-
A pesquisa de Weiner (1964) foi uma
das primeiras tentativas de análise sistemática do efeito de histórias comportamentais
no laboratório. Seus resultados ressaltam a
importância do papel da história comportamental na determinação do comportamento atual. Ao constatar este fato, o analista do
comportamento deve tomar cuidado com
dois pontos. Primeiramente, a história comportamental – especialmente quando ela
não é conhecida – não deve ser transformada em uma explicação genérica do comportamento ou, como ressalta Cirino (2001), em
uma “lata de lixo” da Análise do Comportamento. Todo comportamento é explicado a
partir das contingências às quais o indivíduo foi exposto, mas para lançar mão desta
explicação histórica o analista do comportamento deve conhecer a história e quais
elementos desta história possuem relação
com seu comportamento atual.
Em segundo lugar, é importante não
atribuir à história comportamental um efeito definitivo e imutável sobre o comportamento atual (cf. Costa, Cirino, Cançado
& Soares, 2009). Ainda que a explicação
Behaviorista Radical seja essencialmente
histórica, não podemos negligenciar o papel
das contingências presentes. Uma análise
31
Paulo Guerra Soares, Carlos Eduardo Costa
cautelosa dos resultados de Weiner (1964)
ajuda a sustentar esta conclusão. Dois dos
três participantes expostos à história de FR
emitiram, na última sessão de FI, uma taxa
de respostas mais baixa em relação à linha
de base (Ver Figura 2, neste capítulo). Por
isso, procuramos sempre lembrar: somos
produtos da nossa história, mas não escravos dela!
Essas análises demonstram que, definitivamente, não se pode negligenciar a
contingência presente. A contingência de
FI 10 s, programada por Weiner (1964) durante a fase teste, estabelece um desempenho “ideal” de seis respostas por minuto
(pois uma resposta a cada 10 segundos produz reforço). Uma taxa média de respostas
como as de S1 e S2 garantiam que muitos
pontos fossem produzidos durante o FR,
mas a grande maioria dessas respostas não
produzia consequências programadas durante o FI, o que estabelece uma diminuição na taxa de respostas como algo desejável. Durante o DRL, uma taxa média de três
respostas por minuto (S4 e S5) garantia que
os reforços continuassem a ser produzidos
e que poucas perdas ocorressem. Contudo, respostas emitidas durante o intervalo
do FI não reiniciavam o intervalo como no
DRL, o que estabelece um aumento na taxa
de respostas como algo desejável. Os resultados de pesquisas posteriores sobre história comportamental (e.g., Freeman & Lattal,
1992; Soares et al., 2013) indicaram que o
comportamento é produto da história, mas,
gradualmente, fica sob controle das contin32
gências presentes.
Espera-se que o leitor possa ter compreendido a importância da consideração
dos eventos históricos sobre o comportamento atual e como o fenômeno pode ser
estudado em laboratório. Dessa forma, destaca-se um modelo causal (Skinner, 1981)
que é uma alternativa a qualquer tipo de
explicação mentalista/dualista. Quando
queremos entender – e modificar – o comportamento de um indivíduo, o primeiro
passo, sem dúvida, é conhecer a sua história comportamental!
PARA SABER MAIS
Weiner (1969). Conjunto de cinco experimentos com humanos nos quais Weiner
explora diferentes estratégias na construção da história comportamental. Os delineamentos apresentados são em grupos ou
com a exposição do mesmo participante a
diferentes esquemas de reforço em fases
sucessivas. Em linhas gerais, o artigo investiga os determinantes do comportamento
humano em um esquema de FI. O desempenho de humanos neste esquema de reforço foi a base de muita controvérsia sobre
a diferença de humanos e não humanos se
comportamento em esquemas de reforço. A
ênfase de Weiner, é claro, é na importância
da história comportamental.
Freeman & Lattal (1992). Avaliação dos
efeitos da história sobre o comportamento
Capítulo I | História Comportamental
atual de pombos usando um delineamento
no qual o sujeito é seu próprio controle (conhecido como Delineamento Experimental
de Caso Único ou delineamento intrasujeito). Nessa pesquisa, o mesmo organismo foi
exposto a duas histórias comportamentais
de maneira relativamente simultânea, sob
diferentes controles de estímulo. O resultado geral, apontou que a história exerce efeito sobre o comportamento atual, mas que
esse efeito é transitório.
REFERÊNCIAS
Okouchi (2003b). Também utilizando um
delineamento intrassujeito (esquemas de
reforçamento múltiplo), com humanos, a
pesquisa de Okouchi apontou que os efeitos
da história ficam sob o controle de estímulos e que esses efeitos podem se generalizar
para outras situações semelhantes no presente.
Chiesa, M. (1994). Radical behaviorism: The
philosophy and the Science. Boston: Autors
Cooperative.
Soares, Costa, Cançado, & Cirino (2013).
Replicação sistemática da pesquisa de Freeman e Lattal (1992) com humanos. Os resultados corroboram o de outras pesquisas
sugerindo que os efeitos da história ficam
sob o controle de estímulos; são transitórios
(embora possam ser de longa duração) e que
a regularidade nos resultados de pesquisas
com humanos em esquemas de reforçamento depende do controle experimental,
não requerendo, portanto, mudanças no
modelo de causalidade quando falamos do
comportamento humano e não humano.
Aló, R. M. (2005). História de reforçamento.
In J. Abreu-Rodrigues & M. R. Ribeiro (Eds.).
Análise do comportamento: Pesquisa, teoria e aplicação (pp. 45-62). Porto Alegre:
Artmed.
Baum, W. M. (2006). Compreender o Behaviorismo: comportamento, cultura e evolução. Porto Alegre: ArtMed.
Cirino, S. D. (2001). Detecção da história de
reforçamento: Problemas metodológicos
para lidar com a história passada. In H. J.
Guilhardi, M. B. B. P. Madi, P. P. Queiroz &
M. C. Scoz (Orgs.), Sobre comportamento
e cognição: Vol 8. Expondo a variabilidade
(pp. 137-147). Santo André: ESETec.
Cole, M. R. (2001). The long term effect of
high and low rate responding histories on
fixed-interval responding in rats. Journal of
the Experimental Analysis of Behavior, 75,
43-54.
Costa, C. E., Banaco, R. A., Longarezi, D. M.,
Martins, E. V., Maciel, E. M., & Sudo, C. H.
(2008). Tipo de reforçador como uma variável moduladora dos efeitos de história em
humanos. Psicologia: Teoria e Pesquisa, 24,
251-262.
33
Paulo Guerra Soares, Carlos Eduardo Costa
Costa, C. E., Cirino, S. D., Cançado, C. R. X.,
& Soares, P. G. (2009). Polêmicas sobre história comportamental: identificação de seus
efeitos e sua duração. Psicologia: Reflexão e
Crítica, 22, 317-326.
LeFrancois J. R, & Metzger B. (1993). Low-response-rate conditioning history and fixed-interval responding in rats. Journal of
the Experimental Analysis of Behavior, 59,
543– 549.
Costa, C. E., Soares, P. G., & Ramos, M. N.
(2012). Controle de estímulos e história
comportamental: uma replicação de Freeman e Lattal (1992). Temas em Psicologia,
20, 273-288.
Marçal, J. V. S. (2013). Behaviorismo radical e prática clínica. In A. K. C. R. de-Farias
(Org.), Análise Comportamental Clínica (pp.
30-48). Porto Alegre: Artmed.
Doughty, A. H., Cirino, S. D., Mayfield, K.
H., Da Silva, S. P., Okouchi, H., & Lattal, K.
A. (2005). Effects of behavioral history on
resistance to change. The Psychological Record, 55, 315-330.
Okouchi, H. (2003a). Effects of differences
in interreinforcer intervals between past
and current schedules on fixed-interval
responding. Journal of the Experimental
Analysis of Behavior, 79, 49-64.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton.
Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the
Experimental Analysis of Behavior, 80, 173186.
Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of
the Experimental Analysis of Behavior, 57,
5-15.
Sidman, M. (1960). Tactics of scientific research. New York: Basic Books.
Lattal, K. A. (1991). Scheduling positive reinforcers. In I. H. Iversen & K. A. Lattal (Eds.),
Experimental Analysis of Behavior, Part 1
(pp. 87-134). New York, NY: Elsevier Science.
Laurenti, C. (2009). Criatividade, liberdade
e dignidade: impactos do darwinismo no
behaviorismo radical. Scientiae Studia, 7,
251-269.
34
Simonassi, L. E., Pires, M. C. T., Bergholz,
M. B., & Santos, A. C. G. (1984). Causação no
comportamento humano: acesso à história
passada como determinantes na explicação
do comportamento humano. Psicologia: Ciência e Profissão, 4, 16-23.
Skinner, B. F. (1974). About behaviorism.
New York: Vintage Books.
Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504.
Capítulo I | História Comportamental
Skinner, B. F. (2003). Ciência e Comportamento Humano. São Paulo: Martins Fontes
(Originalmente publicado em 1953).
Soares, P. G., Costa, C. E., Cançado, C. R. X.,
& Cirino, S. D. (2013). Controle de estímulos
e história comportamental em humanos.
Psicologia: Reflexão e Crítica, 26, p. 357-366.
Souza Júnior, E. J., & Cirino, S. D. (2004) Esquemas de reforçamento. In C. E. Costa, J. C.
Luzia, & H. H. N. Sant’Anna (Orgs.), Primeiros Passos em análise do comportamento
e cognição. Vol. 2 (pp. 31-42). Santo André:
ESETec.
Wanchisen, B. A. (1990). Forgetting the lessons of history. The Behavior Analyst, 13,
31-37.
Weiner, H. (1964). Conditioning history and
human fixed-interval performance. Journal
of the Experimental Analysis of Behavior, 7,
383-385.
Weiner, H. (1969). Controling human fixedinterval performance. Journal of the Experimental Analysis of Behavior, 12, 349-373.
35
Kennon A. Lattal
O cheque está no correio1, 2:
investigando como o reforço
atrasado afeta o desempenho
Kennon A. Lattal
West Virginia University
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response
under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162.
“… um atraso do reforço não é um parâmetro estático no efeito de um reforço sobre
o comportamento”
(C. B. Ferster, 1953)
36
Capítulo II | Atraso do Reforço
INTRODUÇÃO A ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Atraso do reforço, mesmo em 1964,
era uma questão de interesse de longa data
na Psicologia da Aprendizagem (e.g., Kimble, 1961; Renner, 1964). Thorndike (1911)
preparou o palco para investigações futuras, quando afirmou que “as respostas que
eram acompanhadas ou seguidas de perto
pela satisfação do animal” (p. 244) seriam
fortalecidas. Foi deixado para outros explorarem os limites e as implicações da “proximidade” temporal para a relação resposta-reforço. O tema geral foi explorado por
todos os principais teóricos da aprendizagem que sucederam Thorndike. Guthrie
(1935) enfatizou a importância fundamental da contiguidade temporal entre eventos
para a aprendizagem, mas ele nem era um
teórico do reforçamento! Hull (1943) discutiu extensamente o problema do atraso do
reforço em seu livro Princípios do Comportamento (Principles of Behavior), com ênfase especial nos mecanismos responsáveis
pela manutenção do comportamento sob
condições de atraso do reforço (ver também
Spence, 1947). O atraso do reforço também
aparece como um problema de pesquisa no
Tradução realizada por João Henrique de Almeida, Paulo Guerra Soares e Carlos Renato Xavier Cançado. O primeiro tradutor é bolsista de
pós-doutorado FAPESP processo número 2014/01874-7.
1
Nota de tradução: “The check is in the mail” é uma expressão utilizada
para indicar a um credor que um pagamento (ainda não realizado) será
feito em breve. É uma situação em que o atraso de um reforço é, necessariamente, sinalizado (i.e., o pagamento ainda não foi recebido e seu
recebimento é sinalizado pela expressão “o cheque está no correio”).
livro de Skinner (1938) O Comportamento
dos Organismos. Diferentemente da tentativa de Hull de inferir mecanismos teóricos
subjacentes ao gradiente de atrasos do reforço, a análise de Skinner foi, previsivelmente, mais empírica.
Os experimentos em que foram impostos um atraso temporal entre a resposta
que produz o reforço e a entrega desse reforço são descritos em dois momentos em
O Coportamento dos Organismos. Os atrasos investigados por Skinner (1938) foram
não-sinalizados, isto é, não houve mudança
de estímulo que acompanhasse o intervalo
do atraso. No primeiro experimento (descrito nas pp. 73-74), uma resposta liberava
“um pêndulo que acionava o comedouro no
final do intervalo desejado”. Skinner (Figura 6, p. 73) mostrou os dados de aquisição
de oito ratos usando atrasos de 1-4 s com
diferentes pares de ratos, e, com uma exceção, notou que foram comparáveis aos de
aquisição com reforço imediato. Não está
claro se estes atrasos eram reiniciados se
as respostas subsequentes ocorressem durante o intervalo do atraso, mas parece que
eles não foram, isto é, os atrasos foram não
resetáveis3 (cf. Lattal & Gleeson, 1990). Ele
afirmou que “[um] novo intervalo deve ser
iniciado [quando ocorre uma segunda resposta] ou a segunda resposta será reforçada
rápido demais, mas isto significa que a pri-
2
Nota de tradução: os termos “signaled”, “unsignaled”, “resetting” e
“nonresetting” que qualificam atrasos do reforço foram traduzidos, respectivamente, como “sinalizados”, “não sinalizados”, “resetáveis” e “não
resetáveis”.
3
37
Kennon A. Lattal
meira resposta não seria reforçada” (p. 73).
Seus comentários subsequentes sugeriram
que ele não resolveu este problema neste
primeiro experimento.
Um pouco mais tarde no livro ele
descreveu outros dois experimentos envolvendo atraso do reforço. Ele começou
repetindo o problema do procedimento já
mencionado anteriormente: “Nenhum planejamento foi feito para evitar a possivel
coincidência de uma segunda resposta com
um reforço atrasado” (Skinner, 1938, p. 138),
tornando assim mais provável que o atraso
obtido seria menor do que o atraso programado. Ele também observou uma segunda
dificuldade, relacionada com os ratos que
mantinham a barra pressionada. O atraso
começou com uma pressão a barra, mas às
vezes a barra continuava a ser pressionada durante o atraso e era liberada no final
do intervalo, levando Skinner a questionar
se isso resultaria em reforço imediato ou
atrasado. O equipamento utilizado neste
experimento foi o mesmo utilizado no experimento descrito acima mas, no entanto,
ele apontou uma mudança: “o equipamento tem esta propriedade importante: se uma
segunda resposta é feita durante o intervalo
do atraso, a contagem do tempo recomeça,
de modo que um intervalo completo deve
decorrer novamente antes que o reforço
ocorra” (p 139. ). Assim, em vez de um atraso
não resetável, neste experimento os atrasos
eram resetáveis, isto é , o intervalo do atraso era reiniciado para cada resposta após
aquela que iniciou o atraso. Utilizando este
38
procedimento, os ratos foram condicionados “da maneira usual” (p 140; presumivelmente Skinner queria dizer com reforço
imediato) para responder, por fim, em um
esquema intervalo fixo (FI) 5 min. Após este
treino, atrasos de 2, 4, 6 ou 8 s estavam em
vigor com diferentes ratos por três sessões.
As taxas de resposta foram reduzidas quando os atrasos estavam em vigor, sendo que
com os dois atrasos mais curtos o responder foi menos reduzido em comparação aos
dois mais longos. Em um experimento final
sobre atraso do reforço, Skinner analisou os
efeitos de várias mudanças no treino e na
implementação dos atrasos.
O principal desenvolvimento susequente na análise experimental do atraso
do reforço foi a pesquisa de Ferster (1953).
A maioria dos teóricos de aprendizagem,
incluindo Skinner, focaram os efeitos prejudiciais do atraso do reforço sobre a aprendizagem e o desempenho. Ferster inverteu a
questão e perguntou se seria possível manter o comportamento apesar da presença de
um atraso entre o reforço e a resposta que o
produziu. Ele conduziu uma série de experimentos com pombos em que ele primeiro mantinha a resposta de bicar (bicar um
pequeno disco de plástico) com esquemas
de reforço intervalo variável (VI). Com essa
linha de base, em seu primeiro e segundo
experimentos, atrasos sinalizados por blackouts4 da câmara experimental ocorreram
Nota de tradução: Termo mantido como no original. O termo é utilizado para descrever situações em que as luzes da câmara experimental, e
até mesmo aquelas que iluminam os discos de resposta, são apagadas.
4
Capítulo II | Atraso do Reforço
entre o reforço e a resposta que o produziu.
Os blackouts foram utilizados “para evitar S
de respondesse” (p. 219), aproveitando-se do
fato de que pombos normalmente não bicam os discos de resposta quando a caixa e
o disco estão apagados. Claro, apagar as luzes da caixa era uma consequência imediata da resposta, fazendo com que o blackout
funcionasse como um estímulo, em última
análise correlacionado com a liberação do
reforço. Como resultado, o atraso do reforço
covariou com a potencial função reforçadora condicionada do blackout. Esta covariação permite questionar esse experimento, e
todos os experimentos envolvendo atrasos
sinalizados do reforço, como um teste dos
efeitos de um atraso do reforço”puro” sobre
o responder. Em seu primeiro experimento,
Ferster observou que atrasos de 60 s causaram uma “pequena queda” na taxas de
respostas, mas sob atrasos de 120 s, a taxa
de respostas caiu para cerca da metade de
seu valor quando o reforços imediatos eram
utilizados. Em seu segundo experimento,
Ferster tentou manter altas taxas de resposta introduzindo os atrasos gradualmente, aumentando a sua duração de 1 a 60 s ao
longo de um período de treino de 90 hr. Ele
relatou que “os três Ss que mantiveram as
taxas normais de resposta sob 60 s de atraso foram mantidos no mesmo procedimento por várias centenas de horas cada. Eles
não exibiram nenhuma tendência de desaceleração” (p. 222). O responder do quarto pombo não foi mantido, de acordo com
Ferster, porque os atrasos “foram aumentados muito rapidamente.” (p. 222). Ele não
apresentou dados quantitativos na descrição de seus experimentos, baseando-se, ao
invés disso, em descrições verbais do que
aconteceu, apoiadas apenas por alguns registros cumulativos dos desempenhos dos
pombos.
Estas duas linhas de pesquisa (Skinner, 1938; e Ferster, 1953) fornecem o contexto para o tema deste capítulo: o experimento de Azzi, Fix, Rocha e Silva e Keller
(1964). Uma parte importante da história
por trás do experimento de Azzi et al. é caso
de amor de Fred Keller com o Brasil, que começou com a sua chegada como Fulbright
Teaching Fellow na Universidade de São
Paulo no início de 1961. Foi nomeado como
seu assistente de pesquisa Rodolpho Azzi,
que aparece com Keller e outros pesquisadores e pesquisadoras do Brasil na Figura 1.
Sobre Azzi, Keller (2008) afirmou:
“Ele rapidamente se tornou meu conselheiro e guia, ele meatualizava com
tudo o que eu deveria saber sobre os
meus alunos, membros do corpo docente e funcionários da administração. Ele me ajudou a responder a perguntas, escrever relatórios, e avaliar
o progresso dos meus alunos. Ele me
preparou para reuniões importantes,
me informava sobre novos desenvolvimentos, e me protegeu de incômodos
de qualquer tipo.” (p. 248)
39
Kennon A. Lattal
Experimental Analysis of Behavior”
(Keller, 2008, p. 250).
Figura 1. Rodolpho Azzi, Fred Keller, Maria Amélia Matos, Carolina
Martuscelli Bori, e Andrés Aguirre (da esquerda para a direita) com
equipamentos, Dezembro de 1961.
Logo depois que Keller começou a lecionar, ele recebeu uma entrega de equipamento de pesquisa que ele havia adquirido
da compania Grason-Stadler em Waltham,
Massachussetts. Ele se lembrou de que o
equipamento
“... não veio com as instruções, por
isso tivemos de determinar como funcionava por tentativa e erro. Rodolfo [sic] [Azzi] e eu, juntamente com
Mario Guidi, um estudante em nosso
curso, trabalhamos durante dias antes de finalmente descobrirmos como
automatizar um estudo longo sobre
os efeitos de diferentes atrasos do reforço sobre a resposta de pressionar a
barra de três ratos brancos (nomeados de Alpha, Beta e Gamma por Rodolfo [sic]). Os resultados foram publicados mais tarde no Journal of the
40
Podemos apenas especular sobre o
porquê atraso do reforço foi o tema da primeira pesquisa publicada no Journal of the
Experimental Analysis of Behavior com
um primeiro autor brasileiro (Azzi). Vamos
voltar para o segundo experimento relatado por Skinner com atraso de reforço em
O Comportamento dos Organismos. Lembre-se que ele usou um procedimento de
atraso resetável, em que cada resposta que
ocorresse após aquela que deu início ao
atraso reiniciava o intervalo do atraso. Ele
usou um procedimento semelhante para
reduzir o responder em altas taxas [“nenhuma resposta foi reforçada se fosse precedida, no prazo de quinze segundos, por outra
resposta” (p. 306)], dando assim origem ao
esquema de reforçamento diferencial de
taxas baixas (DRL). Wilson e Keller (1953),
posteriormente, estudaram os efeitos de esquemas DRL sobre a pressão à barra de ratos sob uma série de valores do “atraso” (i.e.,
os valores do DRL). O experimento Wilson
e Keller nasceu de uma demonstração inicial do que era basicamente um esquema
de reforçamento diferencial de outros comportamentos (DRO), em que o início de um
período de SD ocorreu somente se não houvesse resposta no período S-delta imediatamente anterior por um período de tempo
especificado (cf. Skinner, 1938, p. 161). Uma
contingência de atraso de reforço resetável
é essencialmente um esquema DRL sem
a resposta requerida no fim do intervalo,
Capítulo II | Atraso do Reforço
e um esquema DRO é essencialmente um
procedimento de atraso resetável, mas sem
a exigência de uma resposta para iniciar
cada intervalo do DRO (os reforços ocorrem desde que a resposta alvo não ocorra;
se uma resposta alvo ocorrer, ela reinicia
o intervalo do DRO). Combine todas essas
ideias, adicione o fato de que Ferster (um
dos alunos de doutorado de Keller em Columbia) tinha estudado previamente os
efeitos de atrasos sinalizados do reforço e,
voilà, os procedimentos utilizados por Azzi
et al. (1964) emergem. Não podemos saber
com precisão como a ideia para o experimento foi desenvolvida mas, certamente, e
sem surpresa, pode ser intimamente ligada
a alguns dos trabalhos anteriores de Keller e
seus alunos na Universidade de Columbia.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Azzi et al. (1964) buscaram fazer duas
coisas: (a) investigar o responder operante
sob condições em que o intervalo entre o
reforçador e a resposta que o produzia era
variado e (b) comparar condições em que
o atraso fosse acompanhado por uma mudança nos estímulos (um estímulo que o
sinalizasse) ou ocorresse sem qualquer mudança durante o intervalo do atraso (não
sinalizado). Assim, o experimento era basicamente uma comparação de duas condições diferentes – atrasos do reforço não
sinalizados e sinalizados – que tinham sido
observados em experimentos diferentes
conduzidos, respectivamente, por Skinner
(1938) e Ferster (1953).
Para isso, três ratos foram incialmente treinados a pressionar uma barra em
um esquema de razão fixa (FR) 1, em que o
reforçado era acesso à água. Parece razoável
assumir que neste tempo nem pelotas de
comida usadas com os ratos em muitos dos
experimentos de Skinner e outros, nem tão
pouco os meios para liberar essas pelotas –
i.e., um comedouro – estavam disponíveis
no Brasil. Água era fácil de obter e Keller
tinha trazido consigo o que ele chamou
de um “Brenner dipper”5 para liberação de
água como reforços. Após o treino inicial,
“dentro de uma câmara com a iluminação
reduzida, cada [rato] foi exposto sucessivamente a atrasos do reforço de 1; 3; 5; 7,5; 10;
15; e 20 s[egundos], nesta ordem, com um
total de 150 reforços em cada atraso” (Azzi
et al., 1964, p. 159). O esquema de reforço
então era, tecnicamente falando, um tandem FR 1 DRO t-s, em que t correspondia a
um dos valores de atraso apresentados acima. Um esquema tandem (a palavra latina
para “um logo após o outro”) é idêntico a um
esquema de reforço encadeado em que dois
ou mais componentes do esquema precisam ser finalizados em uma sequência fixa
para que o reforço ocorra; no entanto, em
um esquema encadeado cada componente é associado com um estímulo diferente,
Nota de tradução: Um dipper é uma espécie de bebedouro; o equipamento geralmente consiste em uma haste com um recipiente côncavo
na ponta que, quando mergulhado em um líquido, retém parte do mesmo. O líquido então pode ser apresentado ao animal movimentando-se
a haste até alguma parte da câmara experimental.
5
41
Kennon A. Lattal
mas no esquema tandem o estímulo associado com cada componente é idêntico.
No procedimento de Azzi et al. (1964), cada
atraso reiniciava se uma resposta ocorresse
durante o intervalo do atraso (um atraso resetável), e não havia nenhuma mudança no
estímulo durante o período de atraso. Em
seguida, foram realizadas várias manipulações das durações do atraso para dos dois
dos ratos. O terceiro rato aparentemente foi
exposto somente a um esquema DRL 20 s
com reforços imediatos. Assim como na
primeira, na segunda parte do experimento o esquema de reforço em vigor tecnicamente era um tandem FR1 DRO ts, em que
t era 20 por dez dias, seguido por seis dias
com t=30s. Durante a metade de cada sessão, “cada animal trabalhou em uma câmara com a iluminação reduzida” (p.160). Durante a outra metade, no entanto, “ausência
de iluminação (escuridão) estava em vigor
durante cada intervalo do atraso… cada vez
que uma resposta de pressão à barra ocorria, a luz da caixa era desligada (p.160, itálicos originais) e não voltava a ser ligada até
que o reforço tivesse sido liberado. Pressões
à barra na câmara sem iluminação aumentavam o período sem iluminação até que a
duração do atraso terminasse e o reforço
fosse liberado. Assim, na segunda parte do
experimento, foram comparados um intervalo do atraso correlacionado com a presença e com a ausência de uma mudança
nos estímulos.
42
Resultados e Discussão
Houve dois achados principais. O
responder mantido sob um esquema tandem FR1 DRO ts foi uma função negativamente desacelerada da duração do atraso.
Ou seja, a taxa de respostas caiu precipitadamente quando o atraso aumentou de 1 a
10 s, mas atingiu a assíntota naquele ponto,
não caindo mais quando aos atrasos duravam 15 ou 20 s. Essa relação é chamada de
gradiente de atraso do reforço, e é característica da relação entre as medidas de uma
resposta e a duração do atraso em uma ampla variedade de atrasos do reforço e parâmetros do esquema de reforço (cf. Lattal,
2010). Escurecer a câmara durante o atraso
“produziu um efeito considerável, regularizando e aumentando a taxa de respostas
[relativo aquela observada na condição de
atraso não sinalizado] em quase todos os
casos” (Azzi et al., 1964, p. 160).
A discussão considerou o papel do
comportamento mediador em manter o responder durante o atraso, uma observação
feita anteriormente por Ferster (1953). No
que subsequentemente se tornou uma análise padrão, a mudança de estímulos (em
atrasos sinalizados dos reforços) é entendida como um reforçador condicionado que
mantém as respostas que a produziram. Isto
ainda é uma interpretação comum do papel
do estímulo que sinaliza o atraso em procedimentos de atrasos sinalizados do reforço. Essa interpretação, no entanto, tem sido
questionada recentemente interpretando-se a mudança de estímulos como tendo
Capítulo II | Atraso do Reforço
função de ligação ou marcação do atraso
(e.g., Williams, 1991), ao invés de fortalecer
o comportamento que a precede.
DESDOBRAMENTOS
Ambos os resultados do experimento qualificam Azzi et al. (1964) como um experimento seminal no estudo do atraso do
reforço. Os gradientes de atraso do reforço
apresentados por Azzi et al. (1964) tem sido
replicados quando diferentes esquemas
de reforço têm sido usados para manter o
responder (Elcoro & Lattal, 2011, FI; Jarmolowicz & Lattal, 2013, FR; Richards, 1981,
DRL e VI; Sizemore & Lattal, 1978, VI) e
com uma variação mais ampla de valores
de atraso (Pierce, Hanford, & Zimmerman,
1972; Richards, 1981; Sizemore & Lattal,
1978). Azzi et al. também anteciparam várias comparações subsequentes de atraso do reforço sinalizado e não sinalizado,
com mais ou menos os mesmos resultados:
atrasos sinalizados mantem um responder
mais robusto do que os não sinalizados (Richards, 1981). Uma característica particularmente interessante de Azzi et al. é que
as comparações dos atrasos do reforço sinalizados e não sinalizados foram intrassujeitos. Eles são os primeiros a comparar
simultaneamente (intrassessão) os efeitos
dos atrasos do reforço sinalizados e não sinalizados (cf. Lattal, 1984; Lattal & Ziegler,
1982; Richards, 1981). Muito depois de Azzi
et al., Reilly e Lattal (2004) desenvolveram
um método para obter gradientes de atraso
do reforço intrassujeitos durante uma única sessão. Eles mantiveram o responder sob
um esquema VI e, no início de cada sessão,
programaram um atraso curto antes que
um reforço fosse disponibilizado. Cada reforço subsequente foi disponibilizado após
um atraso progressivamente maior.
O experimento de Azzi et al. (1964)
foi conduzido na tradição da Universidade
de Columbia de conduzir análises paramétricas sistemáticas das variáveis controladoras do comportamento. Nesse caso, as
durações do atraso foram manipuladas em
condições sucessivas. Como não havia um
retorno à linha de base entre os aumentos
sucessivos nos valores dos atrasos, atrasos
subsequentes eram impostos sob taxas variáveis de respostas entre manipulações,
com efeitos desconhecidos sobre o gradiente de atraso do reforço. Esses gradientes de
atraso do reforço, no entanto, são um tanto
similares em sua forma aqueles obtidos com
pressões à barra de ratos ou bicar de disco
de pombos mantidos sob outros esquemas
de reforço (Elcoro & Lattal, 2011; Pierce, et
al., 1972; Richards, 1981; Sizemore & Lattal,
1978), sugerindo que a taxa de respostas
na linha de base pode ter um papel menos
importante na forma do gradiente do que o
valor do atraso em si.
Uma potencial variável estranha no
experimento foi a taxa de reforços. Como
tantos outros experimentos iniciais envolvendo atrasos do reforço, a taxa de reforços sob cada valor de atraso não foi relatada
43
Kennon A. Lattal
por Azzi et al. (1964). É quase certo que as
taxas de reforço diferiram quando os atrasos foram aumentados na primeira parte do
experimento e na presença e na ausência
de um estímulo na segunda parte. Pesquisas posteriores, no entanto, mostraram que
diferenças na taxa de reforços geralmente
não explicavam as diferenças nas taxas de
resposta observadas quando durações de
atraso são alteradas (Lattal, 1982; Richards,
1981; Sizemore & Lattal, 1978).
Lattal e Gleeson (1990) utilizaram um
procedimento semelhante aos de Skinner
(1938) e Azzi et al. (1964) para investigar a
aquisição de responder por ratos e pombos
experimentalmente ingênuos sob atrasos
do reforço não sinalizados e resetáveis e
não resetáveis quando a resposta operante não havia sido modelada ou treinada de
alguma forma, mas deixada para se desenvolver sem qualquer intervenção por parte
dos investigadores. Responder robusto se
desenvolveu sob estas condições, atestando o poder de reforço atrasado no desenvolvimento e manutenção comportamento
operante. Esta é outra maneira de dizer que
o reforço imediato não é necessário para
que a aprendizagem ocorra. Dito isto, no
entanto, o reforço imediato resulta em um
responder muito mais robusto. É uma questão em aberto se a aquisição de respostas
é “mais rápida” com reforços imediatos vs.
atrasados das respostas.
CONSIDERAÇÕES FINAIS
O atraso do reforço é um dos principais parâmetros que afetam a eficácia dos
reforços no desenvolvimento e na manutenção do comportamento (Kimble, 1961).
Por esta razão, o seu papel, tanto sozinho
como em combinação com outros parâmetros do reforço, tal como magnitude dos reforços, foi investigado extensivamente. Um
dos resultados dessas análises de interações
é o desconto do atraso, em que sistematicamente aumentar atrasos do reforço para reforços de maior magnitude ou probabilidade enquanto o atraso para outro reforço de
menor magnitude ou probabilidade é fixo
permite determinar, entre outras coisas, o
ponto de indiferença em que uma das duas
alternativas é igualmente provável de ser
escolhida (ver Green, Myerson, & Vanderveldt de 2014, para um resumo recente destes resultados). Estudos sobre desconto do
atraso oferecem insights sobre como diferentes combinações de parâmetros de reforço podem ser dimensionados. Da mesma
forma, o atraso do reforço (às vezes também
chamado de “gratificação” em experimentos não analítico-comportamentais sobre o
fenômeno) desempenha um papel importante no desenvolvimento de estratégias de
auto-gerenciamento ou de auto-controle.
Na verdade, a base desta área de pesquisa e
aplicação é a análise experimental de atraso
do reforço.
Uma outra área em que as pesquisas sobre atraso do reforço tem sido impor-
44
Capítulo II | Atraso do Reforço
tantes é o estudo do reforço condicionado.
Uma teoria fundamental sobre esse tipo reforço é a teoria da redução do atraso (delay
reduction theory), que sugere que estímulos
funcionam como reforçadores na medida
em que eles indicam uma redução do tempo de acesso ao reforço primário (Fantino,
1977).
As lições do atraso do reforço não foram perdidas na análise do comportamento
aplicada, onde a importância da imediaticidade do reforço seguindo o comportamento apropriado continua, com razão,
sendo enfatizada. Embora reforço imediato
possa ser o ideal no tratamento e na gestão do comportamento humano de maneira geral, muitos comportamentos humanos
são mantidos apesar de seus reforços serem
atrasados a partir das respostas que os produzem. A pesquisa básica sobre atraso do
reforço sugere uma série de condições sob
as quais os atrasos reduzirão (e.g., atrasos
mais longos ou não sinalizados) ou não (e.g.,
atrasos mais mais curtos ou sinalizados) o
responder, mas poucas pesquisas aplicadas
tem sido realizadas para expandir estes resultados e investigar como eles podem estar relacionados a programas de tratamento (mas cf. Stromer, McComas, & Rehfeldt,
2000).
Uma questão particularmente importante e não resolvida na análise do atraso
do reforço com humanos tanto na pesquisa
como em contextos aplicados é a questão
da mediação do comportamento durante os
atrasos pelo comportamento verbal. Ambos
Ferster (1953) e Azzi et al. (1964) sugeriram
que o comportamento é mantido durante os
atrasos do reforço na medida em que certos
padrões de comportamento estereotipado
surjem durante o atraso, o que resultaria
numa cadeia de comportamento desenvolvendo de tal modo que a resposta que
inicia o atraso é seguida por algum padrão
regular de comportamento (não necessário mas mantido por reforço acidental) que
termina contiguamente com reforço. Tais
cadeias supersticiosas, assim, garantiriam
uma “conexão” entre a resposta operante
inicial e o reforço no final do atraso. Tem
sido sugerido que o comportamento verbal
de humanos pode também mediar os atrasos. Algo que uma pessoa faz agora pode
não ter um efeito em uma hora, em um
dia, ou até mais, mas os dois eventos permanecem conectados e a pessoa continua
a se engajar no comportamento que tem o
reforço atrasado. Talvez isso esteja relacionado a coisas que ou a pessoa diz a si mesmo ou outras pessoas a durante o intervalo do atraso. Ou talvez não. Alguns críticos
contemporâneos de tais interpretações do
atraso do reforço baseadas em contiguidade
têm sugerido que a proximidade temporal
entre a resposta e reforço desempenha um
papel relativamente menor na aquisição e
manutenção de responder em comparação
ao fato de que existe uma correlação geral
entre a taxa de respostas e os reforços que
resultam, imediatamente ou após atrasos
(ver Baum, 1973). O experimento de Lattal
e Gleeson (1990) descrito acima ilustra que
45
Kennon A. Lattal
a aprendizagem pode ocorrer quando há
apenas uma correlação entre a resposta e
o reforço, mas não a contiguidade resposta-reforço. Este último ponto levanta uma
questão mais ampla, sem resposta ainda,
sobre se os reforços que ocorrem após um
atraso são mais bem caracterizados como
atrasados em relação à respostas específicas ou se são correlacionados com grupos
de respostas organizadas como taxas de
resposta ou tempo alocado à respostas de
topografias particulares. Um último ponto, mas não menos
importante, é que a partir de uma perspectiva histórica o experimento é importante
porque é o primeiro de muitos relatos de
pesquisa por analistas do comportamento
brasileiros a ser publicado no Journal of the
Experimental Analysis of Behavior.
PARA SABER MAIS
Commons, Mazur, Nevin, & Rachlin (1987).
É um volume editado que apresenta uma
série de perspectivas sobre o uso e as implicações do atraso do reforço para a compreensão do processo de reforçamento.
Lattal (2010). fez uma revisão sobre a pesquisa básica sobre atraso do reforço conduzida na tradição analítico-comportamental
de Skinner até o momento da publicação de
sua revisão.
Renner (1964). é uma importante revisão
46
inicial sobre atraso do reforço a partir de
uma perspectiva mais ampla das teorias da
aprendizagem sobre o tema.
Stromer, McComas, & Rehfeldt (2000).
consideraram algumas implicações aplicadas de pesquisas sobre atraso do reforço.
Tarpy & Sawabini (1974). analisaram criticamente pesquisas sobre atraso do reforço
conduzidas desde a publicação da revisão
de Renner até a sua própria.
REFERÊNCIAS
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha
e Silva, M. I. (1964). Exteroceptive control
of response under delayed reinforcement.
Journal of the Experimental Analysis of
Behavior, 7, 159-162.
Baum, W. M. (1973). The correlation-based
law of effect. Journal of the Experimental
Analysis of Behavior, 20, 137-153.
Commons, M. L., Mazur, J., Nevin, J. A., &
Rachlin, H. (Eds.) (1987). Quantitative studies of operant behavior: The effect of delay
and of intervening events on reinforcement
value. New York: Erlbaum.
Elcoro, M., & Lattal, K. A. (2011). Effects of
unsignaled delays of reinforcement on fixed-interval schedule performance. Behavioural Processes, 88, 47-52.
Capítulo II | Atraso do Reforço
Fantino (1977). Conditioned reinforcement,
choice, and information. In W. K. Honig &
J.E.R. Staddon (Eds.), Handbook of operant
behavior (pp. 326-339). New York: Prentice
Hall.
Ferster, C. B. (1953). Sustained behavior under delayed reinforcement. Journal of Experimental Psychology, 45, 218-224.
Green, L., Myerson, J., & Vanderveldt, A.
(2014). Delay and probability discounting.
In F. K. McSweeney & E. S. Murphy
(Eds.), The Wiley Blackwell handbook of
operant and classical conditioning. Oxford:
John Wiley & Sons.
Guthrie, E. R. (1935). The psychology of learning. New York: Harper.
Hull, C. L. (1943). Principles of Behavior.
New York: Appleton-Century Crofts.
Jarmolowicz, D. P., & Lattal, K. A. (2013). Delay of reinforcement and fixed-ratio performance. Journal of the Experimental Analysis of Behavior, 100, 370-395.
Keller, F. S. (2008). At my own pace: The autobiography of Fred S. Keller. Cornwall on
Hudson: Sloan Publishing.
Kimble, G. A. (1961). Hilgard and Marquis’ Conditioning and Learning. New York:
Appleton Century Crofts.
layed reinforcement. Journal of the Experimental Analysis of Behavior, 42, 239-253.
Lattal, K.A. (2010). Delayed reinforcement
of operant behavior. Journal of the Experimental Analysis of Behavior, 93, 129-139.
Lattal, K. A., & Gleeson, S. (1990). Response acquisition with delayed reinforcement.
Journal of Experimental Psychology: Animal
Behavior Processes, 16, 27-39.
Lattal, K. A., & Ziegler, D. R. (1982). Briefly
delayed reinforcement: An interresponse
time analysis. Journal of the Experimental
Analysis of Behavior, 37, 407-416.
Pierce, C. H., Hanford, P. V., & Zimmerman,
J. (1972). Effects of different delay of reinforcement procedures on variable-interval responding. Journal of the Experimental Analysis of Behavior, 18, 141-146.
Renner, K. E. (1964). Delay of reinforcement:
A historical review. Psychological Review,
61, 341-361.
Reilly, M.P., & Lattal, K.A. (2004). Progressive delays to reinforcement. Journal of the Experimental Analysis of Behavior, 82, 2135.
Richards, R. W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis
of Behavior, 35, 145-152.
Lattal, K. A. (1984). Signal functions in de47
Kennon A. Lattal
Sizemore, O. J., & Lattal, K. A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30, 169-175.
Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York: Appleton Century Crofts.
Spence, K. W. (1947). The role of secondary
reinforcement in delayed reward learning. Psychological Review, 54, 1-8.
Stromer, R, McComas, J. J., & Rehfeldt, R. A.
(2000). Designing interventions that include delayed reinforcement: Implications of recent laboratory research. Journal
of Applied Behavior Analysis, 33, 359-371.
Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: A selective review of the
past decade. Psychological Bulletin, 81,
984-987.
Thorndike, E. L. (1911). Animal intelligence.
New York: MacMillan.
Williams, B. A. (1991). Marking and bridging
versus conditioned reinforcement. Animal Learning and Behavior, 19, 264-269.
Wilson, M. P., & Keller, F. S. (1953). On the
selective reinforcement of spaced responses. Journal of Comparative and Physiological Psychology, 46, 190-193.
48
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Quando o passado
retorna: ressurgência
comportamental
Carlos Renato Xavier Cançado
Flávia Hauck
Ítalo S. C. Teixeira
Universidade de Brasília
Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behaviour
Analysis Letters, 3, 391-397.
A fênix é uma ave da Arábia (...). Quando percebe que envelheceu, constrói uma
fogueira para si (...) e encarando os raios do sol nascente, acende o fogo e o nutre
batendo suas asas, e ressurge de suas próprias cinzas.
(Isidoro de Sevilha, Etymologiae, Livro 12, 7:22)
49
Capítulo III | Ressurgência Comportamental
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
É bem provável que você tenha se
encontrado em uma situação em que teve
que resolver um problema como, por exemplo, responder corretamente a um exercício de cálculo, abrir uma porta emperrada,
ou escrever um texto sobre um tema com
o qual você tem pouca familiaridade. Você
“não sabe o que fazer”. Um problema pode
ser apenas uma situação em que seu comportamento não modifica o ambiente de
maneira eficiente, isto é, seu comportamento não produz consequências. É o que
os analistas do comportamento chamam de
extinção. Além da redução na frequência
de determinadas respostas, um outro efeito da extinção é o aumento na variabilidade da topografia das respostas (Antonitis,
1951). Você tenta fazer coisas diferentes,
comportar-se de outras maneiras para tentar resolver o problema. Parte do que você
faz nesse momento é, comumente, algo
bem parecido com o que você fez no passado (talvez mesmo em um passado remoto) e
que, nesse passado, “deu certo”. É parte de
sua história comportamental. É sobre essa
variação comportamental que o ambiente
irá operar, selecionando o que é usualmente descrito como a “solução do problema”,
possivelmente um “comportamento novo”
ou “criativo” (Epstein, 1996; ver especialmente, Skinner, 1981, 1984).
Em situações nas quais comportamentos atuais deixam de produzir consequências, comportamentos previamente
reforçados tendem a recorrer, um fenômeno que analistas do comportamento denominam de ressurgência (Epstein, 1983,
1985). Embora a ressurgência tivesse sido
descrita anteriormente na literatura científica (e.g., Carey, 1951; Leitenberg, Rawson &
Bath, 1970; Leitenberg, Rawson & Mulick,
1975; ver Epstein, 2015), o estudo sistemático desse fenômeno intensificou-se nos
anos 1980, especialmente após a publicação
do artigo de Epstein (1983), cujo experimento é descrito nesse capítulo. Nesse artigo,
Epstein usa um termo específico para descrever a recorrência de comportamentos
previamente reforçados durante a extinção
de outros comportamentos (i.e., ressurgência; ver também Epstein & Skinner, 1980),
define o fenômeno, descreve um procedimento para sua análise experimental, e
levanta diversas questões de pesquisa que
serviram de base para a condução de experimentos sobre a ressurgência desde então
(ver Lattal & St Peter Pipkin, 2009; e Pontes
& Abreu-Rodrigues, 2015, para revisões da
literatura).
No início de seu artigo, Epstein (1983)
define a ressurgência da seguinte maneira:
“Quando, numa dada situação, um comportamento reforçado recentemente deixa
de ser reforçado, comportamentos anteriormente reforçados em condições semelhantes tendem a recorrer” (p. 391; itálicos
adicionados). Essa definição pode parecer
50
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
geral demais, algo que talvez pudesse ter
sido descrito por meio da observação casual do comportamento no cotidiano, sem recorrer a equipamentos especiais, sem conduzir experimentos, e sequer pensar em ir
ao laboratório. Por quê recorrer a uma situação simplificada no laboratório quando o
fenômeno pode ser observado no comportamento de humanos e não humanos em
ambientes não laboratoriais? Mas é exatamente essa simplificação do laboratório em
relação a ambientes não laboratoriais, conduzida por meio do controle experimental
de variáveis, que queremos quando nosso
objetivo é descrever princípios comportamentais. A análise experimental permite
uma descrição mais precisa do fenômeno investigado e dos fatores que o levam a
ocorrer (i.e., suas variáveis de controle). Se
você conhece as variáveis que determinam
um fenômeno, pode prevê-lo com maior
precisão se você sabe que essas variáveis
estão em vigor. Além disso, se você pode
manipular essas variáveis, pode fazer com
que o fenômeno ocorra ou deixe de ocorrer (Skinner, 2003/1953). É essa a principal função de uma análise experimental do
comportamento e não seria diferente em
relação ao estudo da ressurgência. Vejamos,
então, como foi a análise experimental da
ressurgência conduzida por Epstein.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo de Epstein (1983) era ana51
lisar experimentalmente a ressurgência,
isto é, a recorrência de comportamentos
previamente reforçados quando comportamentos atuais deixavam de ser reforçados.
Metodologicamente, seria necessário que
uma resposta específica (a resposta alvo)
fosse inicialmente reforçada. Em uma segunda fase, a resposta alvo deixaria de produzir reforços e uma outra resposta (a resposta alternativa) seria reforçada. Em uma
terceira fase, a resposta alvo continua a não
produzir reforços e a ressurgência dessa
resposta poderia ser verificada quando a
resposta alternativa deixasse de produzir
reforços. Na literatura experimental, o procedimento para o estudo da ressurgência
é descrito comumente como um “procedimento de três fases” e a primeira, a segunda e a terceira fases do procedimento são
denominadas fases de Treino, Eliminação
(ou Reforçamento Alternativo) e Teste, respectivamente. Embora Epstein não tenha
feito uso desses termos, eles serão utilizados nesse capítulo para descrever as fases
de seu procedimento.
Independente dos nomes que demos
ao procedimento e às fases experimentais,
o que deve ser destacado é que Epstein
(1983) precisou construir, em laboratório,
uma história comportamental remota (i.e.,
a resposta alvo foi reforçada), uma história comportamental recente (i.e., a resposta alvo deixou de ser reforçada e apenas a
resposta alternativa passou a produzir reforços) e também modificar o ambiente de
seus sujeitos em um teste (i.e., a resposta
Capítulo III | Ressurgência Comportamental
alternativa também deixou de produzir reforços) para verificar se, e como, a ressurgência das respostas alvo ocorreria.
O experimento foi conduzido com
seis pombos, experimentalmente ingênuos, mantidos a 80% de seu peso livre por
meio de um regime de privação de comida.
Como os experimentos sobre ressurgência
são experimentos sobre os efeitos de uma
história remota sobre o comportamento
atual, o fato de os pombos terem sido experimentalmente ingênuos foi um aspecto
importante de controle experimental. Os
resultados poderiam ser diferentes (ou mesmo de difícil interpretação) se os pombos já
tivessem uma determinada história no ambiente experimental escolhido por Epstein.
O procedimento de privação de comida é
uma operação estabelecedora ou motivadora (Miguel, 2000; ver também Laraway,
Snycerski, Michael & Poling, 2003), necessária para estabelecer o acesso à comida no
ambiente experimental como consequência
e permitir que determinadas respostas sejam selecionadas e mantidas durante o experimento.
O equipamento utilizado no experimento foi uma câmara de condicionamento
operante para pombos (as sessões experimentais eram conduzidas com cada pombo
individualmente). Um dos painéis da câmara continha dois discos de resposta, localizados à direita e à esquerda no painel e
separados por 12 cm, e um comedouro localizado entre os discos (os discos de resposta
usualmente são de plástico e têm 2 cm de
diâmetro; respostas de bicar o disco fecham
um circuito elétrico que permite o registro
automático das respostas). Quando acionado, o comedouro dava acesso a grãos por
3 s (i.e., reforços). Em cada fase do experimento, descritas a seguir, as sessões experimentais duravam 60 min e o registro das
respostas foi feito por meio de um microcomputador, de registradores cumulativos,
e também de filmagens das sessões experimentais feitas com uma câmera de vídeo.
Fase de Treino: o objetivo dessa fase
foi estabelecer a resposta alvo. Para três
pombos, a resposta alvo consistiu em bicar
o disco da direita e, para os outros três, o
disco da esquerda. A resposta alvo foi mantida sob um esquema de reforçamento intervalo variável (VI) 60 s. Sob esse esquema, a primeira resposta após um intervalo
médio de 60 s produz reforços (os intervalos
entre reforços variam e sua média é igual
a 60 s; os intervalos são selecionados aleatoriamente em uma sessão). Esse esquema
produz uma taxa de respostas moderada e
constante e, por essa razão, é muito usado
para o estabelecimento de linhas de base
comportamentais em análise experimental
do comportamento. Essa fase teve a duração de 15 a 49 sessões, entre pombos, e terminou quando a taxa de respostas de cada
pombo fosse estável (embora Epstein, 1983,
não defina precisamente seu critério de estabilidade, comumente exige-se que os sujeitos sejam expostos às condições por um
número mínimo de sessões e que não haja
52
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
tendências crescentes ou decrescentes na
taxa de respostas por algumas sessões consecutivas).
Fase de Eliminação: o objetivo dessa fase foi reduzir a frequência da resposta alvo e reforçar uma resposta alternativa. Na etapa inicial dessa fase, para cada
pombo, a resposta alvo deixou de produzir
reforços (i.e., extinção estava em vigor). O
número de sessões em que a resposta alvo
esteve em extinção variou para cada pombo, entre uma e 12 sessões. A etapa final
dessa fase ocorreu em uma sessão de 60
min. Nessa sessão, o procedimento de extinção da resposta alvo esteve em vigor por
pelo menos 30 min e até que nenhuma resposta alvo ocorresse por 10 min consecutivos, para cada pombo. Então, foi reforçada
uma resposta alternativa cuja topografia
era incompatível com bicar o disco. A topografia da resposta alternativa variou entre
pombos: para um pombo, por exemplo, a
resposta alternativa consistiu em virar para
a esquerda; para outro pombo, em abaixar
a cabeça; para outro, em levantar a asa. A
resposta alternativa foi reforçada 20 vezes
em um esquema de razão fixa (FR) 1. Sob
esse esquema cada ocorrência da resposta
alternativa produzia o reforço. Após a produção de 20 reforços pela resposta alternativa, ainda nessa mesma sessão, teve início
a fase de Teste.
Fase de Teste: nessa fase, para cada
pombo, os reforços para a resposta alternativa foram descontinuados. É importante
53
destacar que, durante essa fase, a resposta
alvo também não produzia reforços. Essa
fase esteve em vigor até o término da sessão
de 60 min e teve a duração de aproximadamente 10 min para cada pombo.
Ressurgência seria evidenciada caso
ocorresse um aumento na frequência da
resposta alvo na fase de Teste em relação à
frequência dessa mesma resposta na etapa
final da fase de Eliminação. Mas vejamos
alguns aspectos do procedimento de Epstein (1983) que qualificam (em seu experimento, e em qualquer experimento sobre
ressurgência) a descrição de um aumento
na frequência de respostas alvo durante a
fase de Teste como ressurgência.
Aspectos do controle experimental:
vale destacar alguns aspectos importantes de controle experimental adotados por
Epstein (1983). Lembre-se que a câmara de
condicionamento operante tinha dois discos de resposta. Bicar um desses discos foi
definido como a resposta alvo. Respostas
de bicar o outro disco nunca produziram
reforços durante o experimento, mas foram
registradas e serviram como respostas controle. A comparação da frequência de respostas alvo e respostas controle na fase de
Teste permite diferenciar a ressurgência da
variabilidade no comportamento induzida
pela extinção. Sem o registro de uma resposta controle, um aumento na frequência
da resposta alvo na fase de Teste, que seria
descrita como ressurgência, poderia simplesmente ser um exemplo de variabilida-
Capítulo III | Ressurgência Comportamental
de induzida pela extinção. No entanto, se o
aumento na frequência da resposta alvo na
fase de Teste fosse maior do que a frequência da resposta controle, isso seria evidência de que a ressurgência é função da história de reforçamento estabelecida na fase de
Treino e não apenas induzida pela extinção.
Portanto, a ressurgência é definida operacionalmente no experimento de Epstein
como um aumento na frequência da resposta alvo durante a fase de Teste (i.e., em
relação à frequência dessa mesma resposta
durante a etapa final da fase de Eliminação) que fosse maior do que a frequência da
resposta controle nessa mesma fase.
Um outro aspecto de controle experimental importante do experimento de
Epstein (1983) é o fato de a etapa final da
fase de Eliminação e a fase de Teste terem
sido conduzidas na mesma sessão. Quando
uma resposta está em extinção, é comum
observarmos um fenômeno de recorrência
chamado de recuperação espontânea (descrito por Pavlov, e.g., Pavlov, 1927, no estudo da extinção respondente; o fenômeno é
também observado na extinção operante).
A recuperação espontânea caracteriza-se
por um aumento na frequência de respostas
no início de uma sessão de extinção em relação a frequência dessas respostas no final
da sessão de extinção imediatamente anterior. Portanto, se a transição entre a fase
de Eliminação e a fase de Teste ocorresse
entre sessões no experimento de Epstein,
não teríamos como dissociar a eventual
ressurgência da resposta alvo no início da
fase de Teste do fenômeno de recuperação
espontânea (lembre-se que a resposta alvo
estava em extinção durante toda a fase de
Eliminação, e também durante a fase de
Teste). Como a transição entre as fases de
Eliminação e Teste no experimento de Epstein ocorreu na mesma sessão, um aumento na frequência da resposta alvo no Teste
seria mais precisamente descrito como ressurgência e não como recuperação espontânea.
Finalmente, vale apontar que Epstein
(1983) conduziu a extinção da resposta alvo,
na fase de Eliminação, antes do reforçamento da resposta alternativa (e.g., Bruzek,
Thompson & Peters, 2009; Lieving & Lattal,
2003). Isso foi feito para garantir que a frequência da resposta alvo era baixa quando
as respostas alternativas fossem reforçadas.
No entanto, são comuns experimentos sobre ressurgência nos quais a extinção da
resposta alvo e o reforçamento da resposta
alternativa ocorrem simultaneamente na
fase de Eliminação (e.g., Cançado & Lattal,
2011; da Silva, Maxwell & Lattal, 2008; Podlesnik, Gimenez-Gomez & Shahan, 2006).
Resultados e Discussão
Como apontado anteriormente, o
número de sessões na fase de Treino e na
etapa inicial da fase de Eliminação variou
entre pombos. Na fase de Treino, entre
pombos, de 11 a 49 sessões foram conduzidas; na etapa inicial da fase de Eliminação,
de 1 a 12 sessões foram conduzidas.
54
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Infelizmente, Epstein (1983) não
apresentou dados da fase de Treino. Como
essa fase foi conduzida até que a taxa de
respostas alvo de cada pombo fosse estável, temos que assumir que foi isso o que
aconteceu. A taxa de respostas alvo, para
cada pombo, estava próxima de zero quando teve início o reforçamento das respostas
alternativas. Assim, Epstein demonstrou
que a exposição à extinção durante a etapa
inicial da fase de Eliminação reduziu consideravelmente a taxa de respostas alvo antes
que as respostas alternativas começassem a
ser reforçadas.
Na etapa final da fase de Eliminação,
a taxa de respostas alternativas aumentou
para cada pombo e a taxa de respostas alvo
permaneceu próxima de zero. Finalmente,
quando os reforços para respostas alternativas foram descontinuados na fase de Teste, a frequência dessas respostas diminuiu
e observou-se um aumento na ocorrência
da resposta alvo para cada pombo. Isto é, a
ressurgência de uma resposta previamente
reforçada ocorreu quando a resposta alternativa estava em extinção. A magnitude da
ressurgência (i.e., o quanto a taxa de respostas aumentou na fase de Teste em relação à
fase de Eliminação) variou entre os pombos
e aparentemente não foi influenciada pelo
número de sessões conduzidas nas fases de
Treino e Eliminação.
A condução da etapa final da fase de
Eliminação e da fase de Teste em uma mesma sessão (Epstein, 1983) permite afirmar
55
que o aumento na frequência de respostas alvo durante a fase de Teste não foi um
exemplo de recuperação espontânea. Além
disso, o registro das respostas controle permite afirmar que esse aumento na frequência de respostas alvo durante a fase de Teste
não pode ser descrito simplesmente como
variabilidade no comportamento induzida
pela extinção. Para cada pombo, o aumento na frequência da resposta alvo na fase de
Teste foi maior do que a frequência de respostas controle nessa mesma fase (apenas
um pombo emitiu uma resposta controle na
fase de Teste). Portanto, podemos afirmar
que a ressurgência é produto da história remota de reforçamento estabelecida na fase
de Treino. O fato de a resposta alvo e a resposta controle terem topografias semelhantes (ambas são respostas de bicar um disco,
e os discos estavam próximos um do outro
na câmara de condicionamento) torna esse
aspecto do procedimento ainda mais relevante e ressalta a importância da história
do organismo em determinar qual comportamento irá ocorrer (ou recorrer) quando a
extinção estiver em vigor.
Epstein (1983) destaca, contudo, que
a condução da etapa final da fase de Eliminação e da fase de Teste em uma mesma
sessão tem implicações para interpretarmos
seus resultados. Nesse contexto, ele faz referência a outro fenômeno de recorrência,
o restabelecimento (Reid, 1958; Franks &
Lattal, 1976). O restabelecimento é a recorrência de respostas previamente reforçadas
quando, em uma fase de Teste, a resposta
Capítulo III | Ressurgência Comportamental
alvo está em extinção, mas os reforços são
apresentados independentemente das respostas do organismo. O restabelecimento
evidencia o controle discriminativo do próprio reforço como variável que influencia a
recorrência de respostas. No experimento
de Epstein, a etapa final da fase de Eliminação foi conduzida por um período relativamente curto (o tempo necessário para
a emissão de 20 respostas alternativas),
na mesma sessão em que, posteriormente,
a fase de Teste foi conduzida. É possível,
portanto, que a ressurgência observada
para cada pombo nesse experimento tenha
sido parcialmente induzida pela ocorrência
de reforços na etapa final da fase de Eliminação (lembre-se que 3 s de acesso a grãos
serviram como reforços para as respostas
alvo, na fase de Treino, e para as respostas
alternativas, na fase de Eliminação). No entanto, vale ressaltar que, para cada pombo, a
ressurgência foi observada no experimento
de Epstein apenas quando os reforços para
a resposta alternativa foram descontinuados, e não enquanto esses reforços estavam
sendo produzidos. Além disso, experimentos subsequentes demonstraram que a ressurgência ocorre mesmo quando a fase de
Eliminação é conduzida por várias sessões
de duração mais longa do que aquela programada por Epstein (e.g., Lieving & Lattal,
2003; Podlesnik et al., 2006; Podlesnik &
Shahan, 2009) e quando a transição entre
as fases de Eliminação e Teste ocorre não
na mesma sessão, mas entre sessões. Nesse último caso, não há reforços disponíveis
para qualquer resposta durante toda a fase
de Teste.
DESDOBRAMENTOS
A beleza de uma ciência experimental é que os resultados de um experimento respondem algumas perguntas, mas levantam uma série de novas perguntas que
requerem estudos adicionais. Ao discutir
seus resultados, Epstein (1983) afirmou que
muitas variáveis poderiam influenciar a
ressurgência como, por exemplo, os esquemas de reforçamento que mantêm a resposta alvo e a resposta alternativa, o tipo e a
magnitude dos reforços que mantêm essas
respostas, a duração das fases de Treino e
de Eliminação (i.e., o tempo em que respostas alvo e alternativa são reforçadas) e também as condições em que a resposta alvo foi
extinta (i.e., o número de sessões) e a taxa
de respostas alvo antes do reforçamento da
resposta alternativa. Além disso, ele sugeriu que o fenômeno da ressurgência estaria possivelmente envolvido no que chamamos de criatividade e de resolução de
problemas. Com essas afirmações, Epstein
levantou uma série de questões que poderiam ser experimentalmente investigadas e
ressaltou a utilidade do conhecimento sobre o fenômeno da ressurgência para a análise de outros padrões comportamentais.
Os resultados de Epstein (1983) têm
sido replicados em diversos laboratórios
desde então, com diferentes espécies (e.g.,
ratos, Podlesnik et al., 2006; humanos, Wil56
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
son & Hayes, 1996; peixes, da Silva, Cançado & Lattal, 2014) e com algumas modificações do procedimento descrito pelo autor
(ver Pontes e Abreu-Rodrigues, 2015). As
variáveis que possivelmente influenciariam a ressurgência, indicadas por Epstein
e descritas anteriormente, vêm sendo estudadas sistematicamente desde então. Diferente do que indicaram os resultados de seu
experimento (Epstein, 1983), alguns estudos
sugerem que o número de sessões na fase
de Treino pode influenciar a magnitude da
ressurgência. Ressurgência de maior magnitude tende a ocorrer quando a fase de
Treino é conduzida por um número maior
de sessões (e.g., Bruzek et al., 2009; Doughty, Cash, Finch, Holloway & Wallington,
2010). No entanto, resultados inconsistentes entre estudos têm sido obtidos quando
a duração da fase de Eliminação é manipulada. Em alguns estudos, a magnitude da
ressurgência foi maior quando a duração
da fase de Eliminação foi menor (e.g., Leitenberg, et al., 1975; ver também Sweeney &
Shahan, 2013b). Em outros estudos, a duração da fase de Eliminação não influenciou
a magnitude da ressurgência (e.g., Lieving &
Lattal, 2003, Winterbauer, Lucke & Bouton,
2013).
Hoje sabemos que a ressurgência é
um fenômeno replicável interssujeitos e
também intrassujeitos (i.e., após a exposição repetida dos mesmos sujeitos ao procedimento de três fases; e.g., Cançado &
Lattal, 2011; Lieving & Lattal, 2003). Além
disso, sabemos que a magnitude da ressur57
gência é influenciada pela taxa de reforços
em vigor nas fases de Treino (Podlesnik &
Shahan, 2009, 2010) e Eliminação (Cançado, Abreu-Rodrigues & Aló, 2015; Sweeney
& Shahan, 2013a). Em geral, taxas altas de
reforços nessas duas fases produzem ressurgência de maior magnitude do que taxas baixas de reforços. Temos também
evidências que unidades comportamentais
mais complexas, como diferentes padrões
temporais de resposta (Cançado & Lattal,
2011) e sequências espaciais de respostas
(Sánchez-Carrasco & Nieto, 2005; Reed
& Morgan, 2006) ressurgem assim como
respostas discretas como bicar um disco,
pressionar uma barra ou um botão de respostas. Esse último achado pode ser relevante para interpretar resultados de alguns
estudos que mostram que ressurgência de
maior magnitude é observada quando, na
fase de Treino, a resposta alvo ocorre em
taxas altas do que quando ocorre em taxas
baixas (da Silva, et al., 2008; Reed & Morgan, 2007). O que esses últimos resultados
podem indicar é a ressurgência de padrões
diferentes de respostas (i.e., taxas altas e taxas baixas) estabelecidos na fase de Treino.
Por fim, vale ressaltar que a ressurgência de
respostas mantidas por contingências de
reforçamento negativo (ao invés de contingências de reforçamento positivo, como no
experimento de Epstein) tem sido demonstrada com humanos no laboratório (Bruzek
et al., 2009; Alessandri, Lattal & Cançado,
2015) e em ambientes não laboratoriais (e.g.,
Volkert, Lerman, Call & Trosclair-Lasserre,
2009).
Capítulo III | Ressurgência Comportamental
Epstein (1983) destacou a relevância
do fenômeno da ressurgência para a análise
de fenômenos como a criatividade e a resolução de problemas (ver também Epstein,
1996). Mas a ressurgência pode ser relevante também para compreender outros fenômenos, como, por exemplo, a recaída (e.g.,
de comportamentos mantidos por drogas,
Podlesnik et al., 2006; ou de outros comportamentos de relevância aplicada; Lieving,
Hagopian, Long & O’Connor, 2004; ver
também, Bouton, 2011; Podlesnik & Kelley,
2015; e St Peter, 2015). Se você pensar no
procedimento de três fases para o estudo da
ressurgência, verá que o procedimento se
adequa bem como um modelo experimental para o estudo da recaída. No laboratório com não humanos, por exemplo, podemos reforçar as respostas alvo com drogas
na fase de Treino (e.g., álcool, Podlesnik et
al.; ou cocaína Quick, Pyszczynski, Colston
& Shahan, 2011) e as respostas alternativas
com comida, na fase de Eliminação (a fase
de Teste consistiria, assim como no estudo de Epstein, em descontinuar a comida
que mantém as respostas alternativas). Em
contextos aplicados, a resposta alvo pode
ser um comportamento problema cuja frequência temos interesse em reduzir (e.g.,
agressão, autoagressão, abuso de drogas e
outras substâncias) e respostas alternativas
são comumente aquelas mais apropriadas
para o contexto em que vive o participante
e que resultam de uma intervenção comportamental como reforçamento diferencial de respostas alternativas (Marsteller &
St Peter, 2014; Volkert et al., 2009).
Recentemente, esforços de pesquisadores e pesquisadoras em contextos laboratoriais e não laboratoriais têm produzido
achados interessantes sobre a ressurgência.
Esses achados não apenas aumentam nosso
conhecimento sobre o fenômeno, mas servem como base para lidar com o fenômeno
nos mais diversos contextos. Considerando-se a data de publicação do experimento de Epstein (1983), a área de pesquisas
sobre ressurgência é relativamente jovem.
A ressurgência é um tema desafiador – é
um fenômeno transitório (Sidman, 1960) e,
como qualquer fenômeno transitório, exige
esforço de pesquisadores e pesquisadoras
na elaboração das melhores condições para
seu estudo. Análises experimentais sistemáticas dos efeitos de variáveis de controle
já conhecidas sobre a ressurgência são interessantes e necessárias. Ao conduzirmos
tais análises, certamente descobriremos
novas variáveis de controle e relações entre
essas variáveis na determinação da ressurgência.
CONSIDERAÇÕES FINAIS
Por quê estudar a ressurgência, ou a
recorrência do comportamento de maneira
geral, é interessante? Primeiramente, trata-se de um fenômeno natural e seu estudo,
por si só, se justifica. Além disso, é útil conhecer suas variáveis de controle para alterar sua probabilidade de ocorrência onde
quer que isso seja necessário. Há contextos
em que a recorrência de comportamentos
58
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
é indesejável, mas ocorrem mesmo assim
(e.g., a recorrência de comportamentos-problema e a recaída). Há outros contextos em
que seria desejável e pode não ocorrer (e.g.,
em contextos de resolução de problemas e
quando temos interesse no estabelecimento
de comportamentos novos).
e em que grau o fenômeno será observado.
Essa é uma tarefa que aguarda aqueles interessados na ressurgência e na recorrência
de comportamentos em geral.
No início de seu artigo, Epstein (1983)
afirma que o fato que comportamentos previamente reforçados tendem a recorrer
quando comportamentos atuais deixam de
produzir reforços (i.e., ressurgência) teria
“um potencial de aplicação amplo” (p. 391).
Talvez apenas recentemente, dado o acumulo de evidências experimentais sobre o
fenômeno, tenhamos passado a explorar
mais as implicações do estudo da ressurgência para uma análise experimental do
comportamento e para a aplicação dos princípios comportamentais em contextos não
laboratoriais. Durante aproximadamente
20 anos, desde a publicação do trabalho
de Epstein até a publicação de uma série
de experimentos conduzidos por Lieving e
Lattal (2003), estudos sobre a ressurgência
foram escassos e envolveram comumente
a análise de condições em que o fenômeno
ocorre ou não (ver Pontes & Abreu-Rodrigues, 2015). Recentemente, contudo, análises experimentais sistemáticas têm sido
direcionadas à descrição de variáveis que
alteram não apenas a ocorrência da ressurgência, mas também sua magnitude. Um
maior refinamento experimental permite
descrever não apenas quando o fenômeno
irá ocorrer, mas também especificar como
Lieving & Lattal (2003). Série de quatro experimentos conduzidos com pombos. Uma
das primeiras análises experimentais sistemáticas sobre a ressurgência conduzida
após a publicação do experimento de Epstein (1983).
59
PARA SABER MAIS
Podlesnik, Gimenez-Gomez, & Shahan
(2006). Experimento conduzido com ratos
sobre a ressurgência de comportamentos
previamente mantidos por álcool. Os autores apresentam nesse artigo o procedimento para o estudo da ressurgência como um
modelo experimental da recaída.
Podlesnik & Shahan (2009). Nesse artigo,
os efeitos sobre a ressurgência de taxas de
reforços diferenciais na fase de Treino (assim como sobre outros fenômenos de recorrência, como o restabelecimento e a renovação) são avaliados. Os autores propõem
uma relação entre as variáveis que determinam a ressurgência (e a recorrência em
geral) e a resistência do comportamento à
mudança.
Bruzek, Thompson, & Peters (2009). Em
dois experimentos conduzidos com humanos, a ressurgência de comportamentos
Capítulo III | Ressurgência Comportamental
mantidos previamente por contingências
de reforçamento negativo (fuga) foi estudada.
Cançado, Abreu-Rodrigues, & Aló (2015).
Em dois experimentos conduzidos com ratos, os efeitos sobre a ressurgência de taxa
de reforços diferenciais na fase de Eliminação foram avaliados parametricamente.
REFERÊNCIAS
Alessandri, J., Lattal, K. A., & Cançado, C.
R. X. (2015). The recurrence of negatively
reinforced responding of humans. Journal
of the Experimental Analysis of Behavior,
104, 211–222.
Antonitis, J. J. (1951). Response variability in
the white rat during conditioning, extinction, and reconditioning. Journal of Experimental Psychology, 42, 273-281.
Bouton, M. E. (2011). Learning and the persistence of appetite: Extinction and the
motivation to eat and overeat. Physiology &
Behavior, 103, 51–58.
Bruzek, J. L., Thompson, R. H., & Peters,
L. C. (2009). Resurgence of infant caregiving responses. Journal of the Experimental
Analysis of Behavior, 92, 327-343.
Cançado, C. R. X., Abreu-Rodrigues, J., &
Aló, R. M. (2015). Reinforcement rate and
resurgence: A parametric analysis. Revista
Mexicana de Análisis de la Conducta, 41,
84-115.
Cançado, C. R. X., & Lattal, K. A. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis
of Behavior, 95, 271-287.
Carey, J. P. (1951). Reinstatement of previously learned responses under conditions of
extinction: A study of “regression” [Abstract]. American Psychologist, 6, 284.
da Silva, S. P., Cançado, C. R. X., & Lattal,
K. A. (2014). Resurgence in Siamese fighting
fish, Betta splendens. Behavioural Processes, 103, 315-319.
da Silva, S. P., Maxwell, M. E., & Lattal, K.
A. (2008). Concurrent resurgence and behavioral history. Journal of the Experimental
Analysis of Behaviour, 90, 313-331.
Doughty, A. H., Cash, J. D., Finch, E. A.,
Holloway, C., & Wallington, L. K. (2010). Effects of training history on resurgence in
humans. Behavioural Processes, 83, 340343.
Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction.
Behaviour Analysis Letter, 3, 391–397.
Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and
possible applications. The Psychological Record, 35, 143-153.
60
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
Epstein, R. (1996). Cognition, creativity &
behavior: Selected essays. Westport, CT:
Praeger
Epstein, R. (2015). On the rediscovery of the
principle of resurgence. Revista Mexicana
de Análisis de la Conducta, 41, 19-43.
Epstein, R., & Skinner, B. F. (1980). Resurgence of responding after the cessation of
response-independent reinforcement. Proceedings of the National Academy of Sciences of the United States of America, 77, 62516253.
Franks, G. J, & Lattal, K. A. (1976). Antecedent reinforcement schedule training and
operant response reinstatement in rats.
Animal Learning & Behavior, 4, 374-378.
Laraway, S., Snycerski, S., Michael, J., &
Poling, A. (2003). Motivating operations
and terms to describe them: Some further
refinements. Journal of Applied Behavior
Analysis, 36, 407-414.
Lattal, K. A., & St. Peter Pipkin, C. (2009).
Resurgence of previously reinforced responding: Research and application. The
Behavior Analyst Today, 10, 254-266.
Leitenberg, H., Rawson, R. A., & Bath, K. B.
(1970). Reinforcement of competing behavior during extinction. Science, 169, 301303.
61
Leitenberg, H., Rawson, R. A., & Mulick, J.
A. (1975). Extinction and reinforcement of
alternative behavior. Journal of Comparative and Physiological Psychology, 88, 640652.
Lieving, G. A., Hagopian, L. P., Long, E. S.,
& O’Connor, J. (2004). Response-class hierarchies and resurgence of severe problem
behavior. The Psychological Record, 54,
621–634.
Lieving, G. A, & Lattal, K. A. (2003). Recency, repeatability, and reinforcer retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis
of Behavior, 80, 217-233.
Marsteller, T. M., & St Peter, C. C. (2014). Effects of fixed-time reinforcement schedules
on resurgence of problem behavior. Journal
of Applied Behavior Analysis, 47, 455-469.
Miguel, C. F. (2000). O conceito de operação estabelecedora na análise do comportamento. Psicologia: Teoria e Pesquisa, 16,
259-267.
Pavlov, I. P. (1927). Conditioned reflexes: An
investigation of the physiological activity of
the cerebral cortex. Londres: Oxford University Press.
Podlesnik, C. A, Jimenez-Gomez, C., &
Shahan, T. A. (2006). Resurgence of alcohol
seeking produced by discontinuing non-drug reinforcement as an animal model of
Capítulo III | Ressurgência Comportamental
drug relapse. Behavioural Pharmacology,
17, 369-374.
Podlesnik, C. A, & Kelley, M. E. (2015). Translational research on the relapse of operant
behavior. Revista Mexicana de Análisis de
la Conducta, 41, 226-251.
Podlesnik, C. A, & Shahan, T. A. (2009).
Behavioral momentum and relapse of extinguished operant responding. Learning &
Behavior, 37, 357-364.
Podlesnik, C. A., & Shahan, T. A. (2010). Extinction, relapse, and behavioral momentum. Behavioural Processes, 84, 400-411.
Pontes, T. R. N., & Abreu-Rodrigues, J. (2015).
Ressurgência comportamental: Uma revisão. Acta Comportamentalia, 23, 339-353.
Quick, S. L., Pyszczynski, A. D., Colston, K.
A., & Shahan, T. A. (2011). Loss of alternative
non-drug reinforcement induces relapse of
cocaine-seeking in rats: Role of dopamine
D(1) receptors. Neuropsychopharmacology,
36, 1015–1020.
Reed, P., & Morgan, T. A. (2006). Resurgence
of response sequences during extinction in
rats shows a primacy effect. Journal of the
Experimental Analysis of Behavior, 86, 307315.
Reed, P., & Morgan, T. a. (2007). Resurgence
of behavior during extinction depends on
previous rate of response. Learning & Beha-
vior, 35, 106–114.
Reid, R. L. (1958). The role of the reinforcer
as a stimulus. British Journal of Psychology,
49, 202-209.
Sánchez-Carrasco, L., & Nieto, J. (2005).
Resurgence of three-response sequences
in rats. Revista Mexicana de Análisis de la
Conducta, 31, 215–226.
Sidman, M. (1960). Tactics of scientific research: Evaluating experimental data in psychology. Boston: Authors Cooperative, Inc.
Skinner, B. F. (2003). Ciência e Comportamento Humano. (J. C. Todorov & R. Azzi,
Trad.). São Paulo: Martins Fontes (original
publicado em 1953).
Skinner, B. F. (1984). An operant analysis
of problem solving. Behavioral and Brain
Sciences, 7, 583-613.
Skinner, B. F. (1981). Selection by consequences. Science, 213, 501–504.
St Peter, C. C. (2015). Six reasons why applied
behavior analysts should know about resurgence. Revista Mexicana de Análisis de
la Conducta, 41, 252–268.
Sweeney, M. M., & Shahan, T. A. (2013a).
Effects of high, low, and thinning rates of
alternative reinforcement on response elimination and resurgence. Journal of the Experimental Analysis of Behavior, 100, 10262
Carlos Renato Xavier Cançado, Flávia Hauck, Ítalo S. C. Teixeira
116.
Sweeney, M. M., & Shahan, T. A. (2013b).
Behavioral momentum and resurgence :
Effects of time in extinction and repeated
resurgence tests. Learning & Behavior, 41,
414-424.
Volkert, V. M., Lerman, D. C., Call, N. A., &
Trosclair-Lasserre, N. (2009). An evaluation
of resurgence during treatment with functional communication training. Journal of
Applied Behavior Analysis, 42, 145-160.
Wilson, K. G., & Hayes, S. C. (1996). Resurgence of derived stimulus relations. Journal
of the Experimental Analysis of Behavior,
66, 267-281.
Winterbauer, N. E., Lucke, S., & Bouton,
M. E. (2013). Some factors modulating the
strength of resurgence after extinction of
an instrumental behavior. Learning and
Motivation, 44, 60-71.
63
João Cláudio Todorov, Rafaela M. Fontes Azevedo
Clarice Lispector,
tempo e consequências:
considerações sobre
contraste comportamental
João Cláudio Todorov
Rafaela M. Fontes Azevedo
Universidade de Brasília
Reynolds, G. S. (1961). Behavioral contrast. Journal of the Experimental Analysis
Behavior, 4, 57-71.
“Observo em mim mesma as mudanças de estação: eu claramente mudo com elas”
Clarice Lispector
64
Capítulo IV | Contraste Comportamental
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A noção de que o comportamento é
selecionado por suas consequências é antiga, anterior a Thorndike (e.g., 1911, 1927).
Skinner (1957/1978) inicia seu livro sobre
comportamento verbal com uma frase de
impacto: “Os homens agem sobre o mundo,
modificam-no e, por sua vez são modificados pelas consequências de sua ação” (p.15).
Consequências parecem ser a marca
registrada da Análise do Comportamento,
como demonstram alguns livros recentes
(Biglan, 2015; Madden, 2013; McSweeney &
Murphy, 2014a; Schneider, 2012). Mas consequências não seguem comportamentos
no vácuo. O contexto no qual o comportamento ocorre também é relevante (Skinner,
1953/2003). Skinner (1938) afirmou que, embora a resposta possa ocorrer em diversas situações, apenas em parte dessas situações a
sua emissão será efetiva em produzir reforços. Assim, o contexto no qual o comportamento ocorre (i.e., eventos antecedentes ao
comportamento) acaba exercendo funções
muito importantes por sinalizar quando e
quais tipos de consequências estarão disponíveis. Em função disso, o comportamento
operante deve ser sempre compreendido a
partir da contingência tríplice: Eventos que
antecedem o comportamento (estímulos
discriminativos), o próprio comportamento,
e as consequências que seguem a sua emissão (reforço ou punição; e.g., Skinner, 1938,
1953/2003).
Os estímulos discriminativos (SD)
podem ser qualquer variável presente no
contexto atual do indivíduo. São estímulos
que sinalizam a disponibilidade da consequência e dão “dicas” sobre a probabilidade
de o comportamento ser ou não reforçado
ou punido. Quando determinadas consequências estão disponíveis apenas para respostas emitidas em um determinado contexto (na presença de determinado SD) e
quando o indivíduo passa a responder apenas nesse contexto, dizemos que o responder é discriminado (Skinner, 1938). Porém,
para sabermos se o responder é discriminado ou não é preciso que haja pelo menos
dois contextos correlacionados diferencialmente com a produção da consequência
(e.g. contextos diferentes que sinalizam a
presença de tipos de consequências diferentes, ou que sinalizam presença vs. ausência de consequências, ou mesmo que sinalizam diferentes relações entre a emissão
da resposta e a apresentação do reforço). Ao
observarmos mudanças no comportamento
do indivíduo em função de mudanças nos
estímulos antecedentes poderemos afirmar
que há controle discriminativo, isto é, que o
comportamento está sob o controle de estímulos (Catania, 1999).
Controle discriminativo, portanto, se
refere à influência que o contexto exerce
sobre o comportamento (Moreira & Medeiros, 2007) e, para estuda-lo é preciso treinar
o comportamento em contextos diferentes
65
João Cláudio Todorov, Rafaela M. Fontes Azevedo
(na presença de estímulos distintos). Isto é,
é preciso expor o indivíduo a situações nas
quais a disponibilidade da consequência
é diferencialmente correlacionada a diferentes estímulos antecedentes. Por isso, o
esquema mais tradicionalmente utilizado
para investigar controle discriminativo tem
sido o esquema múltiplo.
Esquemas de reforçamento ou punição são relações condicionais entre o
comportamento dos organismos e eventos
no ambiente e são geralmente utilizados
como variáveis independentes na Análise do Comportamento (Ferster & Skinner,
1957). Assim, ao estabelecer um esquema
de reforçamento se estabelece uma relação “se, então” que indicará quais as condições (e.g. número de respostas, intervalo de tempo necessário entre as respostas,
etc.) para a apresentação da consequência.
Por exemplo, em um esquema de razão fixa
se estabelece um número fixo de respostas
que deve ser emitido pelo organismo para
que a consequência seja apresentada. Em
um esquema de reforçamento, geralmente
se estabelece também uma relação condicional com o estímulo antecedente. Assim,
a relação entre a resposta e a consequência
depende do estímulo antecedente presente
no momento: se na situação A o comportamento B ocorrer, então a consequência C
será apresentada (Todorov, 2002, 2012).
Como indicado anteriormente, um
esquema comumente utilizado para demonstrar o controle estabelecido pelos estí66
mulos antecedentes é o esquema múltiplo.
Em um esquema múltiplo, dois ou mais
esquemas de reforçamento são correlacionados a diferentes estímulos antecedentes.
Cada um desses esquemas de reforçamento
correlacionados a diferentes estímulos antecedentes compõe o que se chama de componente (Ferster & Skinner, 1957). Em um
experimento de laboratório com animais
não-humanos podemos ter, por exemplo,
um esquema múltiplo com dois componentes: em um sempre há uma luz acesa e
a emissão da resposta é sempre seguida por
comida e no outro não há luz e a resposta
nunca é seguida por comida. Têm-se, assim,
dois contextos diferentes (presença vs. ausência de luz) correlacionados com esquemas diferentes (reforço vs. extinção). Pode-se afirmar que o responder é discriminado,
nesse exemplo, se o organismo responde
mais na presença da luz do que na sua ausência.
Embora no treino discriminativo
simples seja comum a utilização de alternação de estímulos antecedentes correlacionados a reforço e extinção (e.g. Hanson,
1959; Skinner, 1938; Smith & Hoy, 1954), geralmente os experimentos com esquemas
múltiplos utilizam dois ou mais componentes nos quais diferentes esquemas de reforçamento (e.g. razão fixa ou variável, intervalo fixo ou variável) estão em vigor, sendo
cada um sinalizado por um estímulo antecedente diferente, porém, correlacionados a tipos semelhantes de consequências
(Ferster & Skinner, 1957). Por exemplo, po-
Capítulo IV | Contraste Comportamental
demos ter um esquema múltiplo com dois
componentes programados da seguinte
forma: em um componente há sempre um
tom e a consequência é produzida a partir
de um esquema de razão fixa (a cada X respostas, a comida é apresentada) e no outro
componente o tom está sempre ausente e
a consequência é produzida a partir de um
esquema de intervalo fixo (a comida é apresentada para a primeira resposta emitida
após X min). Nesse caso, pode-se afirmar
que o responder é discriminado se for observado que a taxa e o padrão de respostas
são diferenciados entre os componentes.
Uma das utilidades do esquema múltiplo é,
então, demonstrar como o comportamento
muda em função de mudanças no contexto,
dado que as mudanças no contexto sinalizam mudanças nas contingências em vigor.
Herrnstein e Brady (1958) afirmaram
que o esquema múltiplo pode ser uma boa
ferramenta para comparações intrassujeitos dentro de uma mesma sessão em função
da independência entre o desempenho nos
componentes. Porém, em diversos experimentos (inclusive no experimento de Herrnstein & Brady) tornou-se evidente que os
desempenhos entre os componentes podem
não ser independentes, isto é, o que ocorre
em um dos componentes de um esquema
múltiplo pode influenciar o comportamento que ocorre no outro componente. À mudança do comportamento em um contexto
(SD) em função de alterações nas condições
em vigor em outro contexto (diferente SD)
chama-se interação (Reynolds, 1961b). Essa
interação entre os componentes do esquema múltiplo pode ser estudada alterando-se as condições em um componente enquanto as condições no outro componente
são mantidas constantes. Assim, o objetivo
ao se estudar a interação é observar como
mudanças nas condições de um contexto
afetam o comportamento em outro contexto inalterado.
Diversos experimentos foram realizados para investigar essa interação entre
componentes (e.g. Findley, 1958, Herrick,
Myers & Korotkin, 1959, Reynolds, 1961b,
1961c) e o que se observou é que alterações
que diminuem a taxa de respostas em um
componente (e.g., extinção) geralmente
produzem aumentos na taxa de respostas
no componente inalterado. Além disso, alterações que aumentam a taxa de respostas
em um componente produzem diminuições
na taxa de respostas no componente inalterado. A esse efeito de interação foi dado
o nome de contraste comportamental (contraste positivo, no primeiro caso, e contraste negativo no segundo). Assim, contraste
comportamental se refere a uma mudança
na taxa de respostas na presença de um
estímulo que é oposta à mudança na taxa
de respostas na presença de outro estímulo
(Reynolds, 1961a).
Embora o contraste seja um efeito
comumente observado durante a formação
de uma discriminação entre dois ou mais
estímulos (e.g., quando um deles é correlacionado ao reforço e o outro a extinção),
67
João Cláudio Todorov, Rafaela M. Fontes Azevedo
o contraste ocorre também em condições
em que há reforço programado na presença
de ambos os estímulos, porém com variações na taxa de reforços entre eles. Findley
(1958), por exemplo, relatou que a taxa de
respostas em um componente, um esquema
de intervalo variável (VI) 6 min, aumentou
quando no outro componente, um VI maior
do que 6 min programava uma menor taxa
de reforços em relação ao VI 6 min.
ços e taxa de respostas pudessem ser experimentalmente isoladas para observar como
cada variável influenciava o contraste e assim, poder verificar se o fenômeno era função de mudanças na taxa de reforços ou na
taxa de respostas. Reynolds encontrou uma
solução relativamente simples e interessante para responder a sua pergunta: Diminuir a taxa de respostas sem alterar a taxa
de reforços.
Porém, até a década de 1960, o que
se observava nos experimentos realizados
sobre contraste (e.g. Herrick, et al., 1959;
Reynolds, 1961b) era que a taxa de respostas
covariava consistentemente com a taxa de
reforços (i.e., diminuições na taxa de reforços eram seguidas de diminuições na taxa
de respostas e aumentos na taxa de reforços eram seguidos por aumentos na taxa
de respostas) e não se sabia dizer qual das
duas variáveis era responsável pelo contraste comportamental. Permanecia então a
questão: A taxa de respostas no componente inalterado aumenta porque a taxa de respostas do segundo componente diminui ou
porque a taxa de reforços do segundo componente diminui? Por isso, em 1961, Reynolds resolveu conduzir um estudo para
responder a essa questão.
Para isso, Reynolds (1961a) utilizou
quatro pombos e uma caixa operante com
um disco que poderia ser iluminado por
quatro cores diferentes. Durante o experimento, cada pombo era colocado na câmara experimental e respostas de bicar o disco
produziam acesso a comida. Reynolds dividiu o seu estudo em quatro procedimentos subdivididos em várias fases. Em cada
procedimento havia um esquema múltiplo
com dois componentes e, em cada componente, o disco era iluminado por uma cor
diferente (SD). Diversos tipos de alterações
foram feitas em um dos componentes do
múltiplo a fim de verificar quais variações
nesse componente levariam a mudanças
na taxa de respostas no outro componente, que permanecia inalterado ao longo das
fases.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
A proposta de Reynolds (1961a) foi
conduzir um estudo no qual taxa de refor68
Em todos os procedimentos, inicialmente, um VI 3 min esteve em vigor em
cada componente do múltiplo. Isto é, em
média, a primeira resposta após 3 min produzia o reforço. Cada componente ficava
em vigor por 3 min e eram apresentados de
Capítulo IV | Contraste Comportamental
maneira alternada. Em cada sessão, cada
componente era apresentado 30 vezes. Os
procedimentos variaram em relação às alterações realizadas em um dos componentes, sendo no primeiro sempre mantido um
VI 3 min (de agora em diante, chamaremos
o componente mantido com o VI 3 min de
componente constante e o componente no
qual as manipulações foram realizadas de
componente alterado).
No Procedimento I, para o componente alterado foi programado um timeout
em umas das fases (todas as luzes da caixa
operante eram apagadas e não havia apresentação de reforço para nenhuma das respostas emitidas) e extinção em outra fase
(o estímulo continuava a ser apresentado,
porém, não havia apresentação do reforço).
No Procedimento II, para o componente alterado, foi programado um esquema de reforçamento diferencial de outros comportamentos (DRO¹) 50 ou 75 s para uma das
fases e extinção para outra. A programação
do DRO no Procedimento II teve como objetivo garantir que a taxa de respostas diminuísse sem que houvesse uma redução
na taxa de reforços, dado que sempre que
os pombos não respondessem (por 50 ou 75
s) o reforço seria apresentado. A ordem de
mudança para DRO ou extinção, no componente alterado, foi contrabalanceada entre os pombos (i.e., para alguns pombos o
Em um DRO, o reforço só é apresentado se o organismo cumprir o
intervalo estabelecido sem emitir determinada resposta. No presente
experimento, caso o pombo passasse 50 ou 75 s sem bicar o disco a
comida era apresentada.
1
componente foi alterado para o DRO e só
depois para extinção e para outros pombos
a ordem de alteração foi inversa). O Procedimento III foi uma combinação dos dois
procedimentos anteriores e a manipulação feita no componente alterado foi uma
combinação do timeout com o DRO, ou
seja, todas as luzes da caixa experimental
eram apagadas e reforços eram produzidos
se os pombos não respondessem durante o
intervalo do DRO. Um procedimento adicional foi realizado para controlar o efeito
do aumento na taxa de reforços sob o DRO
e, para isso, ao final da última sessão do
Procedimento III, aumentou-se o peso dos
animais (i.e., diminuiu-se a privação) e, então, no dia seguinte os animais foram novamente expostos às mesmas condições que
haviam sido programadas no Procedimento
II, no qual para o componente alterado foi
programado um DRO em uma fase, e extinção na fase seguinte.
As manipulações realizadas por Reynolds (1961a) possibilitaram a comparação
de condições nas quais a diminuição da
taxa de respostas estava correlacionada à
diminuição na taxa de reforços (i.e., alterando o segundo componente para extinção ou
timeout) e condições nas quais a diminuição da taxa de respostas não estava correlacionada à diminuição na taxa de reforços
(i.e., alterando o segundo componente para
um DRO). Dessa forma, foi possível isolar experimentalmente os efeitos da taxa
de respostas e da taxa de reforços sobre o
contraste comportamental. Se o contraste
69
João Cláudio Todorov, Rafaela M. Fontes Azevedo
dependesse de variações apenas na taxa
de respostas, em todas as condições o contraste deveria ocorrer, já que em todas haveria uma redução da taxa de resposta no
componente alterado. Porém, se é a alteração na taxa de reforços a variável relevante, então, o contraste só deveria ocorrer nas
condições nas quais houvesse variação da
taxa de reforços no componente alterado
(i.e., nas condições em que foram programados timeout ou extinção) e não deveria
ocorrer nas condições em que o DRO estava
em vigor (i.e., a taxa de reforços nessa condição não era alterada). Portanto, se a taxa
de respostas no componente constante aumentasse quando mudanças fossem feitas
no componente alterado em todas as condições, a taxa de respostas poderia ser entendida como variável mais relevante. No
entanto, se a taxa de respostas do componente constante só variasse nas condições
em que houve mudanças na taxa de reforços no componente alterado, então a taxa
de reforços seria a principal variável determinante do contraste.
Resultados e Discussão
Os resultados indicaram que alterações na taxa de reforços, e não na taxa de
respostas, em um dos componentes do múltiplo é a variável que determina o contraste
comportamental (Reynolds, 1961a). Tanto
timeout quanto extinção no componente
alterado produziram aumentos na taxa de
respostas do componente constante. Porém, quando o DRO estava em vigor no
70
componente alterado, combinado ou não
com timeout, aumentos na taxa de respostas do componente constante (independente do peso corporal dos pombos) não foram
observados. De maneira geral, o contraste
foi observado nas condições onde não havia reforços em um componente (timeout
e extinção), mas não foi observado quando
havia reforço disponível nesse componente, embora a taxa de respostas durante o
componente alterado tenha diminuído em
todas as condições.
Reynolds (1961a) propôs duas explicações para a não ocorrência do contraste
nas condições em que um DRO estava em
vigor no componente alterado. Uma explicação é que o contraste pode não ter acontecido porque, sob o DRO, pausas (i.e., não
bicar o disco) foram reforçadas e isso pode
ter induzido a ocorrência de pausas também no componente constante, em que o
VI 3 min continuava em vigor. Uma outra
explicação é que o contraste poderia não
ter ocorrido porque a diminuição na taxa de
reforços, e não de respostas, é a condição
necessária para a ocorrência do contraste
e, dessa forma, o DRO eliminou este efeito
uma vez que não houve redução na taxa de
reforços sob esse esquema, como indicado
anteriormente.
Como o aumento da taxa de respostas foi imediato no componente constante
(VI 3 min) quando o DRO foi suspenso no
componente alterado (i.e., quando extinção
estava em vigor nesse componente), Rey-
Capítulo IV | Contraste Comportamental
nolds (1961a) afirmou que a taxa de reforços
é a variável mais relevante para a ocorrência do contraste. Para Reynolds, é a alteração na frequência relativa de reforços (i.e., a
frequência de reforços na presença de um
estímulo em relação à frequência de reforços na presença de ambos os estímulos) que
causa as alterações na taxa de respostas
que descrevemos como contraste.
DESDOBRAMENTOS
O experimento de Reynolds (1961a)
sugere que as consequências que são programadas em um contexto afetam não só
o que fazemos naquele contexto, mas também o que fazemos em outros contextos.
Portanto, o que um organismo faz em uma
situação depende não só das consequências
disponíveis naquela situação, mas também
das consequências disponíveis em situações diferentes (ver também Herrnstein,
1961, 1970).
Assim, para que seja possível compreender o que um indivíduo faz em um
determinado contexto muitas vezes será
preciso observar também o que ele faz em
outras situações e que tipos de consequências ele tem disponível de uma maneira
geral e não apenas em uma determinada
ocasião. É preciso, então, adotar uma perspectiva relativa e entender que a função de
um estímulo pode ser não só a de sinalizar
as consequências disponíveis naquele contexto, mas as consequências disponíveis
naquele contexto em relação a todos os outros.
A partir da pesquisa de Reynolds
(1961a) muitas outras investigações foram
realizadas a fim de verificar o efeito da taxa
de reforços sobre a ocorrência e a magnitude do contraste, principalmente com o
objetivo de responder se a taxa de reforços seria a única variável responsável pela
ocorrência do contraste, se seria a variável
principal, e que outras variáveis e explicações seriam possíveis.
Experimentos manipulando diversos tipos de esquemas em um dos componentes, para produzir diferentes taxas
de respostas sem alterar as taxas de reforços entre os componentes foram realizados, corroborando a ideia de que a taxa
de reforços é realmente mais relevante do
que a taxa de respostas na determinação
do contraste (e.g. Bloomfield, 1967; Nevin,
1968; Reynolds, 1961d; Zuriff, 1970). Dado,
então, que a taxa relativa de reforços é
uma variável relevante para a ocorrência
do contraste, também foram estabelecidas
relações entre contraste e a Lei da Igualação (e.g. McLean & White, 1983; Williams
& Wixted, 1986). A Lei da Igualação prediz
que em situações de escolha (i.e. esquemas
concorrentes, nos quais os dois componentes são apresentados simultaneamente e
o organismo deve escolher responder em
ou outro componente) a taxa de respostas
se igualará à taxa de reforços disponíveis.
Assim, situações de escolha caracteriza71
João Cláudio Todorov, Rafaela M. Fontes Azevedo
riam o caso mais evidente de interação, já
que a maneira como eu me comporto em
relação a uma das opções necessariamente
afetará o meu comportamento em relação à
outra opção, dado que ambas as respostas
não podem ser emitidas ao mesmo tempo.
Assim como a distribuição de respostas em
esquemas concorrentes é função da distribuição dos reforços entre os componentes,
essa interação também parece ocorrer mesmo quando as opções são apresentadas de
maneira sucessiva, e não simultânea, como
é o caso dos procedimentos para o estudo
do contraste (i.e., esquemas múltiplos). Em
ambos os casos, então, temos evidencia de
como a distribuição de reforços pode afetar
a distribuição das respostas.
Outra variável que parece afetar a
ocorrência do contraste é a duração dos
componentes, e muitos estudos foram conduzidos a fim de se investigar essa relação.
De maneira geral, observa-se que a magnitude do contraste é maior quanto menor for
a duração do componente (e.g. Charman &
Davison, 1982; Hinson, Malone, McNally &
Rowe, 1978; Shimp & Wheatley, 1971; Todorov, 1972).
O estudo de Reynolds (1961a) foi
um primeiro passo para uma compreensão
mais precisa sobre a ocorrência do contraste, pois foi o primeiro a isolar os efeitos
de taxa de respostas e de reforços. Embora seus resultados tenham indicado a taxa
relativa de reforços como a principal variável responsável pela ocorrência do con72
traste, desde então diversas investigações
tem sido conduzidas a fim de se chegar a
um entendimento mais claro e a uma descrição mais acurada desse fenômeno (ver
Freeman, 1971; e Williams, 1983).
CONSIDERAÇÕES FINAIS
A conclusão de que é alteração da
taxa de reforços que produz a ocorrência do
contraste, entretanto, deve ser considerada
com cautela. Reynolds e Limpo (1968), por
exemplo, conduziram um experimento utilizando um esquema de reforçamento diferencial de taxas baixas (DRL) e observaram
que a taxa de respostas do componente
constante aumenta, apesar da taxa relativa
de reforços diminuir em relação à linha de
base.
Embora alterações na taxa relativa de
reforços pareçam estar diretamente relacionadas à ocorrência do contraste, sendo replicada em diversos trabalhos (e.g. Catania,
1961; Reynolds, 1963; Wilton & Gay, 1969),
essa pode não ser a única variável de controle (e.g. Davison & Ferguson, 1978; Wilkie
1977; Williams, 1980). O mais importante a
ser considerado na literatura sobre contraste e sobre o trabalho de Reynolds (1961a),
especificamente, é o papel que outros contextos (passados e futuros) exercem sobre o
que acontece no momento atual.
Trabalhos publicados nos anos 1960
e 1970 foram decisivos para determinar o
Capítulo IV | Contraste Comportamental
progresso da Análise do Comportamento
nessa questão, destacando a função do contexto na determinação do comportamento
e demonstrando que diversos aspectos do
contexto exercem controle sobre o comportamento dos organismos. Esses diversos
aspectos devem, então, ser considerados ao
se analisar o que um organismo faz agora e
por quê faz. Para compreender o comportamento atual de um organismo é preciso
levar em conta que seu comportamento é
influenciado não só pela contingência a
qual está exposto, mas também pelo que
mais está acontecendo no ambiente naquele momento, ou seja, todas as demais
contingências disponíveis que concorrem
simultaneamente. Assim, para entender
o que o indivíduo faz precisamos analisar
todas as outras opções do que ele poderia
estar fazendo e todas as consequências programadas para esses comportamentos concorrentes (Herrnstein, 1961, 1970).
O comportamento atual pode ser
influenciado ainda por sinais do que vai
acontecer no futuro muito próximo (Reynolds, 1961a, 1961b, 1961c; Reynolds & Limpo, 1968) e também do que já ocorreu no
passado, e assim, a ordem de ocorrência
dos eventos (o que o indivíduo acabou de
fazer e o que ele vai fazer em seguida) pode
controlar também o seu comportamento atual (e.g. Catania & Gill, 1964; Nevin &
Shettleworth, 1966; Terrace, 1966a). Dessa
forma, ao analisarmos o papel do contexto
é preciso compreendê-lo de modo amplo e
dinâmico, tendo em vista circunstâncias e
variáveis passadas, presentes e futuras que
podem atuar no controle do comportamento atual de um organismo.
Essa noção de interação entre diferentes contextos pode ser especialmente
relevante no contexto aplicado e principalmente no tratamento de comportamentos
problema. Gross e Drabman (1981) fizeram
uma revisão de estudos sobre contraste
comportamental realizados com humanos
que demonstram a ocorrência do fenômeno. Uma das evidências que se tem é de que,
embora alguns tratamentos sejam eficazes
em reduzir o comportamento problema em
determinados contextos, esse mesmo comportamento pode aumentar de frequência
em outros contextos não correlacionados
ao tratamento (e.g. redução de comportamentos inapropriados em casa, mas aumento desses mesmos comportamentos
na escola), caracterizando assim um efeito
de contraste comportamental. Então, ao se
pensar em intervenções comportamentais
é preciso sempre lembrar que os contextos
não podem ser compreendidos de maneira
isolada e que alterações em um contexto
podem acarretar mudanças comportamentais em outros contextos aparentemente
não correlacionados.
PARA SABER MAIS
Terrace (1966b). Investigou se o uso de um
treino de discriminação mais extenso e utilizando um procedimento de aprendizagem
73
João Cláudio Todorov, Rafaela M. Fontes Azevedo
sem erros pode eliminar o contraste comportamental.
in two multiple schedules. Journal of the
Experimental Analysis of Behavior, 10, 151158.
Henke, Allen, & Davison (1972). Investigaram a função da amídala cerebelosa na
ocorrência de contraste, demonstrando diferenças entre ratos com a região lesionada
e ratos sem lesões na região.
Catania, A. C. (1961). Behavioral contrast
in a multiple and concurrent schedule of
reinforcement. Journal of the Experimental
Analysis of Behavior, 4, 335-342.
Koegel, Egel, & Williams (1980). Examinaram a ocorrência de contraste em intervenções comportamentais com crianças com
diagnóstico de autismo.
Catania, C.A. (1999). Aprendizagem: comportamento, linguagem e cognição. (Trad.
Deisy das Graça de Souza). Porto Alegre:
Artmed.
Killeen (2014). Propôs uma nova teoria explicativa para a ocorrência do contraste.
Catania, A. C., & Gill, C. A. (1964). Inhibition and behavioral contrast. Psychonomic
Science, 1, 257-258.
Boyle (2015). Realizou uma investigação
translacional sobre contraste comportamental, avaliando a influência da ordem
dos contextos e de efeitos intrassessão em
adultos com deficiência intelectual.
REFERÊNCIAS
Biglan, A. (2015). The nurture effect. Oakland,
CA: New Harbinger Publications.
Boyle, M. A. (2015). A Translational Investigation of Positive and Negative Behavioral
Contrast (Tese de Doutorado). Utah State
University, Logan. Retirada de All Graduate Theses and Dissertations. (Paper 4234).
Bloomfield, T. M. (1967). Behavioral contrast and relative reinforcement frequency
74
Charman, L., & Davison, M. (1982). On the
effects of component durations and component reinforcement rates in multiple schedules. Journal of the Experimental Analysis
of Behavior, 37, 417–439.
Davison, M., & Ferguson, A. (1978). The effects of different component response requirements in multiple and concurrent
schedules. Journal of the Experimental
Analysis of Behavior, 29, 283–295.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.
Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal
of the Experimental Analysis of Behavior, 1,
Capítulo IV | Contraste Comportamental
123-144.
Gross, A. M., & Drabman, R. S. (1981). Behavioral contrast and behavioral therapy.
Behavior Therapy, 12, 231-246.
Hanson, H. M. (1959). Effects of discrimination training on stimulus generalization.
Journal of Experimental Psychology, 58,
321-334.
Henke, P. G., Allen, J. D., & Davison, C.
(1972). Effect of lesions in the amygdala on
behavioral contrast. Physiology and Behavior, 8,173-176.
Herrick R. M., Myers J. L., & Korotkin A. L.
(1959). Changes in Sd and Sdelta rates during the development of an operant discrimination. Journal of Comparative and Physiological Psychology, 52, 359–363.
Herrnstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267-272.
Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of
Behavior, 13, 243–266.
Herrnstein, R. J., & Brady, J. V. (1958). Interactions among components of a multiple
schedule. Journal of Experimental Analysis
of Behavior, 1, 293-301.
Hinson, J. M., Malone, J. C., McNally, K. A.,
& Rowe, D. W. (1978). Effects of component
length and of the transitions among components in multiple schedules. Journal of
the Experimental Analysis of Behavior, 29,
3-16.
Killeen, P. R. (2014). A theory of behavioral contrast. Journal of the Experimental
Analysis of Behavior, 102, 363-390.
Koegel, R. L., Egel, A. L., & Williams, J. A.
(1980). Behavioral contrast and generalization across settings in the treatment of
autistic children. Journal of Experimental
Child Psychology, 30, 422-437.
Madden, G. J. (2013). APA handbook of
behavior analysis. Washington, DC: American Psychological Association.
McLean, A. P., & White, K. G. (1983). Temporal constraint on choice: Sensitivity and
bias in multiple schedules. Journal of the
Experimental Analysis of Behavior, 39, 405426.
McSweeney, F. K., & Murphy, E. S. (Eds.).
(2014). The Wiley-Blackwell handbook of
operant and classical conditioning. Oxford:
John Wiley & Sons.
Moreira, M. B., & Medeiros, C. A. (2007).
Princípios Básicos de Análise do Comportamento. Porto Alegre: Artmed.
Nevin, J. A. (1968). Differential reinforcement and stimulus control of not respon75
João Cláudio Todorov, Rafaela M. Fontes Azevedo
ding. Journal of the Experimental Analysis
of Behavior, 11, 715-726.
Schneider, S. C. (2012). The science of consequences. New York: Prometheus Books.
Nevin, J. A., & Shettleworth, S. J. (1966). An
analysis of contrast effects in multiple schedules. Journal of the Experimental Analysis
of Behavior, 9, 305-315.
Shimp, C. P., & Wheatley, K. L. (1971). Matching to relative reinforcement frequency
in multiple schedules with a short component duration. Journal of the Experimental
Analysis of Behavior, 15, 205-210.
Reynolds, G. S. (1961a). Behavioral contrast.
Journal of the Experimental Analysis Behavior, 4, 57-71.
Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York:
Appleton-Century-Crofts.
Reynolds, G. S. (1961b). An analysis of interactions in a multiple schedule. Journal of
the Experimental Analysis of Behavior, 4,
107-117.
Skinner, B. F. (1978). O comportamento verbal. São Paulo: Cultrix (Obra original publicada em 1957).
Reynolds, G. S. (1961c). Contrast, generalization and the process of discrimination.
Journal of the Experimental Analysis of
Behavior, 4, 289-294.
Skinner, B. F. (2003). Ciência e comportamento humano (11ª ed.). (Trad. de J. C. Todorov e R. Azzi). São Paulo: Martins Fontes.
(Obra original publicada em 1953).
Reynolds, G. S. (1961d). Relativity of response rate and reinforcement frequency in
a multiple schedule. Journal of the Experimental Analysis of Behavior, 4, 179-184.
Smith, M. H., & Hoy, W. J. (1954). Rate of
response during operant discrimination.
Journal of Experimental Psychology, 48,
259–264.
Reynolds, G. S. (1963). Some limitations on
behavioral contrast and induction during
successive discrimination. Journal of the
Experimental Analysis of Behavior, 6, 131139.
Terrace, H. S. (1966a). Stimulus control. In
W. K. Honing (Ed.). Operant behavior: Areas of research and application. New York:
Appleton-Century-Crofts.
Reynolds, G. S., & Limpo, A. J. (1968). On
some causes of behavioral contrast. Journal
of the Experimental Analysis of Behavior, 11,
543-547.
76
Terrace, H. S. (1966b). Behavioral contrast
and the peak shift: Effects of extended discrimination training. Journal of the Experimental Analysis of Behavior, 9, 613-617.
Capítulo IV | Contraste Comportamental
Thorndike, E. L. (1911). Animal intelligence.
New York: Macmillan.
the Experimental Analysis of Behavior, 45,
47-62.
Thorndike, E. L. (1927). The law of effect.
The American Journal of Psychology, 39,
212-222.
Wilton, R. N., & Gay, R. A. (1969). Behavioral contrast in one component of a multiple
schedule as a function of the reinforcement
conditions operating in the following component. Journal of the Experimental Analysis of Behavior, 12, 239-246.
Todorov, J. C. (1972). Component duration
and relative response rates in multiple schedules. Journal of the Experimental Analysis
of Behavior, 17, 45-49.
Todorov, J. C. (2002). A evolução do conceito
de operante. Psicologia: Teoria e Pesquisa,
18, 123-127.
Zuriff, G. E. (1970). A comparison of variable-ratio and variable-interval schedules of
reinforcement. Journal of the Experimental
Analysis of Behavior, 13, 369-374.
Todorov, J. C, (2012). Metacontingências e a
análise comportamental de práticas culturais. Clínica e Cultura, 1, 36-45.
Wilkie, D. M. (1977). Behavioral contrast
produced by a signaled decrease in local
rate of reinforcement. Learning and Motivation, 8, 182-193.
Williams, B. A. (1980). Contrast, signaled
reinforcement, and the relative law of effect. American Journal of Psychology, 93,
617-629.
Williams, B. A. (1983). Another look at contrast in multiple schedules. Journal of the
Experimental Analysis of Behavior, 39, 345284.
Williams, B. A., & Wixted, J. T. (1986). An
equation for behavioral contrast. Journal of
77
Cristiano Coelho
Da frequência absoluta
à frequência relativa
como unidade de análise
do comportamento
Cristiano Coelho
Pontifícia Universidade Católica de Goiás
Herrnstein, R. J. (1961). Relative and Absolute Strength of Response as a Function of Frequency
of Reinforcement. Journal of the Experimental Analysis of Behavior, 4(3), 267-272.
“Você não veio aqui para fazer a escolha. Você já a fez. Você está aqui para tentar
entender porque fez essa escolha”
O Oráculo (The Matrix Reloaded, Irmãos Wachowski)
78
Capítulo V | Escolha
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Skinner (1950) deu os primeiros passos para uma compreensão do estudo do
comportamento de escolha na Análise do
Comportamento ao propor que responder
a um dentre dois estímulos é escolha, não
o resultado desta escolha (como propõe
o senso comum). Já preferência seria uma
medida do número de respostas em uma
alternativa em relação à outra, relacionando-se à alternação de respostas a cada estímulo disponível. Dessa forma, em vez de
tomar a escolha como um processo inferido
pré-comportamental, visão característica
de concepções que baseavam suas explicações em processos mentais vigentes à época, Skinner focou na a emissão de respostas
como a escolha em si. Com isso, caracterizou-a como um padrão comportamental
mais amplo, relacionado a outras variáveis
que não os supostos processos decisórios
internos.
Podemos dizer que bicar um dentre
dois discos disponíveis, estudar em vez de
ir para a festa na véspera da prova ou dizer
“te amo” quando solicitado pela namorada
em vez de dizer que quer terminar, seriam
as escolhas e não os produtos da escolha.
Adicionalmente, bicar mais vezes um disco que outro, ir mais vezes à balada que estudar na véspera da prova e dizer mais “te
amo” ilustrariam as preferências por cada
uma dessas alternativas, e estariam rela-
cionadas às suas respectivas consequências. Essa formulação apresentou avanços
na compreensão do controle do comportamento operante, mas ainda se concentrou
na consequenciação direta de cada resposta independentemente das consequências
para respostas alternativas. No exemplo
do pombo acima, as respostas a cada disco
eram vistas como influenciadas apenas por
seus próprios reforços, sem uma influência
direta pelos reforços disponíveis para outras alternativas. Isso teria como implicação
que, ao aumentar a frequência de reforços
em um dos discos, a taxa absoluta de respostas a esse disco aumentaria, sem interferir na taxa de respostas ao outro disco.
Mesmo assim, Skinner antecipou a noção
de igualação ao obter uma proporcionalidade nas taxas absolutas de respostas entre
dois esquemas, conforme suas respectivas
taxas absolutas de reforços.
Condições que envolviam essas situações foram exploradas de forma sistemática posteriormente por Ferster e Skinner
(1957) em experimentos sobre o comportamento em esquemas concorrentes, nos
quais dois (ou mais) esquemas de reforçamento permanecem em vigor simultaneamente para diferentes respostas incompatíveis de serem emitidas ao mesmo tempo.
Em arranjos experimentais de esquemas
concorrentes, cada esquema é vinculado a
diferentes operandos que diferem com relação à posição (como dois discos ou duas
barras), cor ou outra propriedade, e permitem a mensuração das taxas e distribuições
79
Cristiano Coelho
das diferentes respostas ao longo do tempo.
Podemos ter dois discos em uma parede da
caixa experimental dispostos lado a lado,
cada um iluminado por uma cor; respostas a um dos discos podem ser reforçadas
intermitentemente a cada 30 segundos e
respostas ao outro disco podem ser reforçadas a cada 60 segundos, por exemplo, e
as duas respostas não podem ser emitidas
ao mesmo tempo. Esse procedimento, que
passou a ser o padrão no estudo de escolha,
capta a noção básica de Skinner (1950). Os
estudos anteriores a Herrnstein (1961) concentraram-se nas análises da suspensão
dessas consequências sobre respostas concorrentes e dos efeitos de consequências,
que mostravam regularidades nos padrões
e distribuição de respostas: Ferster e Skinner (1957) investigaram sistematicamente
em várias condições que as respostas em
esquemas concorrentes com dois operandos localmente separados apresentavam os
mesmos padrões obtidos em esquemas simples; Findley (1958) estendeu esses achados
para situações experimentais com os dois
esquemas associados ao mesmo operando,
sinalizado por cores diferentes de acordo
com o esquema no qual o pombo respondia,
e as cores e o respectivo esquema modificados quando o pombo emitia uma resposta
em um disco de mudança. De acordo com
Davison (2012), estes trabalhos iniciais estavam preocupados em descrever essas regularidades em vez de se aprofundarem em
medidas quantitativas.
A busca por descrições quantitativas
80
começou a se desenvolver com Herrnstein
(1958) ao propor que devido às respostas em
esquemas concorrentes serem incompatíveis, haveria “a possibilidade de estudar escolha como um processo comportamental”
(p. 35). De acordo com ele, porém, o desenvolvimento da área carecia de dados que
explicitassem como a disponibilização de
consequências para respostas incompatíveis levaria à semelhança na proporcionalidade entre os reforços obtidos e respostas
emitidas nas duas alternativas que os dados sugeriam, isto é, como uma alternativa
com uma frequência de reforços duas vezes
maior que a outra levava a um responder
duas vezes maior naquela alternativa.
Herrnstein (1958) obteve dados de
distribuição de respostas entre dois esquemas concorrentes de razão fixa (FR),
com três pombos. Nesse experimento, de
um total de 40 respostas a serem emitidas
para cada reforço, foi manipulado o número de respostas necessárias em cada disco
para a liberação do reforço em diferentes
condições. A proporção de respostas nas
alternativas se aproximou das proporções
programadas pelos esquemas de razão, mas
a proporção de reforços obtidos variou de
maneira irregular quando a obtenção do
reforço dependida da emissão de uma resposta no esquema alternativo após serem
emitidas as respostas definidas no outro
esquema. Ao controlar sistematicamente a
distribuição de reforços, Herrnstein obteve
proporções de respostas semelhantes à de
reforços obtidos. Apesar da noção de esco-
Capítulo V | Escolha
lha como comportamento não estar particularmente traçada naquele trabalho, estava aberta a porta para o desenvolvimento
de um modelo quantitativo do estudo do
comportamento de escolha a partir da noção de igualação. Um dos grandes diferenciais de Herrnstein (1961) foi investigar essas
relações de maneira sistemática, fornecendo sustentação empírica para a análise dos
efeitos da frequência relativa de reforços
sobre a distribuição de respostas.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo do trabalho de Herrnstein (1961) foi estudar de forma paramétrica
e descrever quantitativamente o efeito da
frequência relativa de reforços em esquemas concorrentes sobre as taxas de respostas em cada componente do esquema e as
taxas relativas entre os dois esquemas. Em
um estudo paramétrico, a variável independente (e.g., frequência relativa de reforços)
é manipulada em diferentes valores permitindo que sejam obtidas diversas medidas
da variável dependente (e.g., frequência relativa de respostas), possibilitando o acesso
a uma maior amplitude da relação funcional, ou seja, como a variável dependente
se modifica com diversos valores da variável independente. Para tanto, três pombos
foram mantidos a 80% de seus pesos com
acesso livre a alimento. O experimento foi
realizado em uma caixa de condicionamento operante com dois discos de respostas lo-
calizados em uma das paredes da caixa. Os
discos podiam ser iluminados com as cores
vermelho (A - disco da esquerda) e branco
(B - disco da direita) e ficavam a uma mesma distância do comedouro, que ficava
centralizado na mesma parede dos discos.
O experimento iniciou-se com um
treino preliminar em duas sessões que terminavam após 60 reforços, no qual eram
reforçadas respostas no disco diferente
daquele para o qual havia sido disponibilizado o último reforço, de acordo com um
esquema concorrente de reforço contínuo
(CONC CRF - CRF). Este treino visou garantir uma distribuição de respostas similar e a alternância entre os dois discos, de
forma a garantir um mesmo contato com as
alternativas concorrentes em vigor. Posteriormente, Herrnstein (1961) programou reforços para duas respostas disponibilizados
independentemente de acordo com esquemas de reforço de intervalo variável (CONC
VI - VI), nos quais a liberação de reforços
em um esquema não interferia na liberação
de reforços da outra alternativa. O uso de
esquemas de intervalo variável, nos quais
o reforço é disponibilizado para a primeira
resposta após a passagem de um tempo que
varia em torno de uma média, justificou-se
por ser um esquema que, ao ser modificado, leva a consistentes alterações na taxa de
respostas. Os dois esquemas vigoravam ao
mesmo tempo, sem interferência entre si,
e os intervalos programados para cada um
deles vigoravam mesmo quando o pombo
respondia no outro esquema, porém um
81
Cristiano Coelho
reforço disponível em um dos esquemas
só era liberado quando o sujeito respondia
nesse esquema. Assim, em um dado momento poderia haver reforço disponível em
ambos os esquemas, em apenas um deles
ou em nenhum dos dois.
Herrnstein (1961) utilizou dois pares
de esquemas que em conjunto programavam um reforço a cada 1,5 minutos em todas
as condições. Este controle experimental
foi importante para garantir que as medidas
de respostas se relacionassem às frequências relativas de reforços dos dois esquemas
e não a possíveis diferenças nas taxas totais
de reforços entre as condições. Em seu trabalho, os valores dos VIs foram: VI 3 min
– VI 3 min; VI 2,25 min – VI 4,5 min; VI 1,8
min – VI 9 min; e VI 1,5 min – Extinção.
Esses pares de esquemas foram alternados
entre os dois discos (A e B), de forma que
havia condições em que o disco A ora tinha
VIs menores (maior frequência de reforços),
ora VIs maiores (menor frequência de reforços) que o disco B, além da condição VI
3 min – VI 3 min, em que foi programada
uma mesma frequência de reforços para os
dois discos. Os sujeitos foram expostos a todas essas condições e em ordens diferentes,
visando reduzir efeitos derivados da ordem
de exposição. É importante ressaltar que
cada condição foi realizada por um número
de sessões até que a emissão de respostas se
estabilizasse ao longo de cinco sessões; só
então uma nova condição era iniciada.
Herrnstein (1961) usou, em algumas
82
condições, um procedimento que evitava
que respostas de alternar entre os dois esquemas fossem reforçadas acidentalmente,
o atraso para respostas de mudança (changeover delay, COD). Como ele funciona?
Sem o COD, quando o pombo estivesse bicando em um disco e houvesse reforço disponível para respostas no disco alternativo,
a primeira resposta nesse disco alternativo
seria reforçada. Isso pode reforçar não respostas a um disco específico, mas o padrão
de alternação entre os discos (i.e., responder
em um disco e responder no outro e, assim,
sucessivamente) independente das modificações na taxa relativa de reforços. O COD
tem como função evitar que isso aconteça. Vamos supor que em um determinado
momento houvesse reforço disponível para
respostas no disco B e o pombo estivesse
respondendo no disco A. Ao alternar para
o disco B e obter o reforço disponível nesse disco, ele precisaria permanecer respondendo no disco B pelo menos pelo tempo
definido no COD (que foi de 1,5 s. no experimento) para que um reforço fosse liberado.
Resultados e discussão
Herrnstein (1961) registrou o número de reforços obtidos e respostas emitidas
em cada disco, para cada condição. Esses
dados possibilitaram diversas análises sobre os efeitos das alterações na frequência
de reforços sobre a regularidade e, principalmente (no caso de Herrnstein), a aspectos quantitativos do comportamento. Mais
especificamente, se o aumento na taxa de
Capítulo V | Escolha
reforço de uma alternativa e a consequente
redução na taxa de reforço para a outra alternativa levariam a aumentos (e reduções)
nas taxas de respostas, bem como a extensão dessas alterações em função dos esquemas do par concorrente. Para isso, em cada
condição, além das frequências absolutas de
reforços e respostas em cada um dos discos
A e B, foram calculadas a frequência relativa de reforços obtidos (proporcionalmente
o número de reforços obtidos no disco A em
relação ao total de reforços obtidos nos dois
discos, A e B) e a porcentagem de respostas
emitidas (total de respostas emitidas no disco A dividido pelo total de respostas emitidas nos discos A e B), considerando as cinco
sessões finais, com o comportamento estável. Como a frequência relativa de reforços
variou entre as condições, esses cálculos
possibilitaram verificar como se alteraria a
distribuição de respostas entre os dois discos. De maneira direta, Herrnstein investigou se a proporção de respostas se igualaria
à frequência relativa de reforços, descrita
pela equação:
(1),
na qual R e r são número de respostas e reforços, respectivamente, e 1 e 2 correspondem às alternativas. Essa equação expressa
que as respostas na alternativa 1 divididas
pelo total de respostas nas duas alternativas
(1 e 2) tendem a igualar o total de reforços
obtidos na alternativa 1 divididos pelo total
de reforços obtidos nas duas alternativas¹.
As porcentagens de respostas se
aproximaram da porcentagem de reforços
obtidos nas respectivas condições, ou seja,
a frequência relativa de respostas tendeu a
igualar a frequência relativa de reforços, nas
condições em que se utilizou o COD (que
reduziu a taxa de alternação e, consequentemente, aumentou o controle pelas contingências de cada esquema) e os desvios de
uma igualação perfeita não apresentaram
tendência sistemática da previsão teórica
de igualação. Este achado submeteu pela
primeira vez a teste quantitativo a noção de
distribuição de respostas como função da
distribuição de reforços baseada no princípio de que a alteração na frequência de reforços de uma fonte influencia as respostas
sob controle de outra fonte de reforços.
Essa influência relaciona-se a outro
achado fundamental obtido por Herrnstein
(1961) e que se constitui um dos pressupostos para a relação de igualação: a taxa de respostas apresentou uma relação linear (crescente e contínua) com a taxa de reforços
obtidos em cada alternativa e que as taxas
de respostas nos dois discos foram semelhantes na condição CONC VI 3 min - VI 3
min, quando foi programada a mesma taxa
de reforço nos dois discos. Assim, o total de
respostas nos dois discos em cada condição
ficou constante ou apresentou pequenas
variações assistemáticas. E por que essas
Em seu trabalho, Herrnstein (1961) utilizou P (para bicadas - pecking)
em vez de R e E (para comer – eating) em vez de r. No presente trabalho, a escolha de nomenclatura diferente do trabalho original deriva do
fato de ter se tornado uma das mais usadas na área.
1
83
Cristiano Coelho
variações são compatíveis com o princípio
de igualação? O aumento linear nas taxas
de respostas com o aumento da frequência
absoluta de reforços foi descrito a partir da
relação p = ke, sendo p a frequência de bicadas (respostas), e a frequência de comer
(reforços) e k uma constante, compatível
com a noção de fortalecimento da resposta proposta por Skinner (1938, p.130, citado
por Herrnstein, 1961, p. 270) de que há uma
constância entre a quantidade de reforços
obtidos e respostas emitidas em extinção.
Apesar de Skinner posteriormente abandonar a noção de constância entre essas
medidas, a equação continuou como uma
proposta de fortalecimento de respostas
baseada em um crescimento linear até atingir o máximo de respostas possíveis. Para
Herrnstein (1961), essa relação seria a única
compatível com a igualação. E por que isso
é tão importante para apreciarmos os resultados de Herrnstein? Porque ao ser aplicado
a esquemas concorrentes, envolve um pressuposto fundamental: de que há um limite
máximo de emissão de respostas e, assim, o
aumento na taxa de uma resposta (conforme o aumento na taxa de reforço) é necessariamente acompanhado pela redução nas
demais respostas. Ao revermos a descrição dos dados de taxas de respostas acima,
quando os dois esquemas eram iguais (VI
3 min – VI 3 min) as taxas de respostas se
assemelharam e, para cada um dos demais
esquemas com VIs diferentes, os pombos
responderam no VI com maior frequência
de reforço e a soma das respostas nos dois
esquemas permaneceram constantes, ou
84
sem alterações sistemáticas entre diferentes condições.
DESDOBRAMENTOS
A importância do experimento de
Herrnstein (1961) foi exatamente estabelecer um procedimento no qual era possível
se relacionar medidas quantitativas de frequências absolutas e relativas de respostas a dois discos à frequência relativa de
reforços. A relação de igualdade entre as
frequências relativas de reforços e as frequências relativas de respostas expressa
na Equação 1 foi então o primeiro grande
passo para a chamada “Lei da Igualação”
(Herrnstein, 1970), que expressa, em linhas
gerais, que a distribuição de respostas entre
alternativas tende a igualar a distribuição
de reforços obtidos nas respectivas alternativas. Além disso, dela deriva a ideia de
que quando essa distribuição de reforços é
alterada em alguma direção, a distribuição
de respostas tenderá a se alterar na mesma
medida. Assim, se duas fontes de reforços
fornecem a mesma frequência de reforços,
as respostas tenderão a se distribuir em torno de 50% para cada alternativa; se uma
das fontes passa a fornecer uma frequência
quatro vezes maior que a outra, de forma
que 80% dos reforços passam a ser obtidos
nessa fonte, a Lei da Igualação prevê que
o organismo passará a emitir em torno de
quatro vezes mais respostas nessa alternativa, conforme previsto na igualação perfeita (ou estrita) de Herrnstein (Equação 1).
Capítulo V | Escolha
Os trabalhos que se iniciaram com
o experimento de Herrnstein (1961) passaram a fornecer dados sistemáticos que foram gradativamente demonstrando que um
comportamento é influenciado não apenas
por suas consequências, mas também pelos
reforços disponíveis no ambiente para respostas alternativas e culminaram na concepção de que escolha é comportamento
e todo comportamento envolve escolha²
(Herrnstein, 1970).
Dois pressupostos quantitativos básicos propostos por Herrnstein (1970), em
decorrência dos dados que passaram a ser
sistematizados em Herrnstein (1961), relacionavam as respostas e os reforços disponíveis para diferentes respostas em uma
dada situação (Baum, 2010; Davison, 2012;
De Villiers & Herrnstein, 1976). Primeiramente, considerando-se o conjunto de respostas nesta dada situação, há um máximo
de respostas incompatíveis possíveis de serem emitidas (k) que se mantém constante
nessa situação. O outro pressupõe que esse
total de respostas é alocado entre diferentes fontes reforçadoras conforme suas respectivas proporções de reforços. Contudo,
Herrnstein (1961) considerava que o auA sugestão inicial de Herrnstein levou a questionamentos acerca de
sua amplitude, por ser inicialmente entendida como relacionada a
comportamentos operantes e respondentes e por se questionar a sua
aplicabilidade em situações nas quais a escolha é “praticamente” nula,
como, por exemplo, uma pessoa sendo ameaçada com uma arma para
abrir seu cofre. Com relação ao primeiro, os relatos encontrados restringem-se a comportamento operante. Quanto ao segundo, a situação
envolveria uma altíssima magnitude de reforço (negativo, no caso) para
a resposta de ceder à ameaça, em contraposição a uma ínfima magnitude para rebater as ameaças, de forma que a resposta (muito) mais
provável estaria sob controle das magnitudes relativas de ambas as
respostas. Dessa forma, a menção a respostas no presente texto será
referente a operantes.
2
mento linear das taxas de respostas deveria
ser obtido com o aumento das taxas absolutas de reforços também em situações que
investigavam respostas em esquemas simples. Ao se deparar com dados que contrariaram essa suposição (e.g. Catania & Reynolds, 1968) e mostravam que o aumento da
taxa de respostas com o aumento da taxa
de reforços caracterizava-se por unidades
cada vez menores (quanto mais reforços por
minuto eram providos, menor o aumento na taxa de respostas), Herrnstein (1970)
ponderou que mesmo em um esquema simples outras fontes de reforço (mesmo não
controladas pelo experimentador) estariam
em vigor, concorrendo com o esquema programado pelo experimentador. Em termos
matemáticos, essa relação pode ser aplicada a uma única resposta R1 reforçada com
uma frequência absoluta r1, em que devem
ser considerados os reforços para outros
comportamentos incompatíveis (ro), relação essa expressa na Equação 2, que ficou
conhecida como a hipérbole de Herrnstein,
por dar conta dos efeitos cada vez menores
do aumento da taxa absoluta de reforços
sobre a taxa absoluta de respostas:
(2).
As previsões derivadas desse modelo são que: a taxa de R1 pode variar de zero
até se aproximar do máximo k, conforme a
relação entre seus reforços (r1) e os outros
reforços (ro) para as respostas concorrentes;
quanto maior a frequência de reforços para
R1 em relação aos reforços disponíveis para
85
Cristiano Coelho
outras respostas, maior a frequência de R1; à
medida que o ambiente passa a prover mais
reforços para outras respostas, a frequência
de R1 diminui; o aumento da frequência absoluta de R1 é cada vez menor à medida que
se aumenta a frequência absoluta de reforços.
Para exemplificar a relação acima,
vamos supor uma situação hipotética na
qual o total de reforços para outros comportamentos é constante ao longo de diferentes
condições. Em uma condição o experimentador programa um esquema que fornece
10 reforços por hora e, hipoteticamente, o
organismo emite 50 respostas por minuto.
Ao alterarmos a condição e aumentar em
10 os reforços por hora (fornecendo então
20 reforços por hora), possivelmente as respostas aumentarão para 100 por minuto (50
respostas a mais). Se aumentarmos mais 10
reforços por hora em uma nova condição
(que passa a fornecer 30 reforços por hora),
as respostas apresentarão um aumento
menor, digamos 40 respostas por minuto
a mais, e o organismo passará a emitir 140
respostas por minuto. Caso uma nova condição programe mais 10 reforços por hora,
o aumento no número de respostas será
de 30, por exemplo, e assim por diante, até
que atinja o máximo de respostas, e então o
aumento na taxa absoluta de reforços não
produzirá aumentos nas taxas de respostas.
Como podemos ver, a cada condição o aumento na taxa de reforço foi constante (de
10 em 10), mas o aumento na taxa de respostas foi cada vez menor (50, 40, 30...), obten86
do-se 50, 100, 140, 170 até atingir o máximo.
Esse efeito das taxas de reforços sobre a taxa de respostas, porém, não apenas
é totalmente compatível com a igualação,
mas acaba sendo fundamental para que
ela ocorra, pois acaba mostrando que as
alterações nas condições estão alterando a
frequência de reforços programados pelo
experimentador relativamente aos outros
reforços providos pelo ambiente (Ro), que
permaneceram constantes ao longo das diferentes condições no nosso exemplo. Se
hipoteticamente os outros reforços tiverem
uma taxa de 10 por hora na primeira condição, igual ao programado pelo experimentador, o organismo alocará metade do tempo respondendo ao esquema programado e
metade do tempo realizando as outras atividades.
Vamos considerar agora duas situações com esquemas concorrentes. Em uma
temos dois esquemas de intervalo variável
de 30 segundos, e na outra, dois esquemas
de intervalo variável de 1 minuto, cada um
associado a um disco de respostas. Nas duas
situações, a taxa total de reforços é diferente,
considerando os dois esquemas: a primeira
com 120 reforços por hora e a segunda com
60 reforços por hora. Assim, o total de respostas emitidas nos dois discos na primeira
situação seria maior que na segunda, visto
que teria uma maior taxa absoluta de reforços. Porém, como em ambas as situações
os esquemas componentes dos respectivos
pares concorrentes são iguais, com metade
Capítulo V | Escolha
dos reforços a serem obtidos em cada fonte, a igualação prevê que o organismo distribuiria igualmente suas respostas às duas
fontes, pois o que importa para a igualação
são os valores relativos dos reforços e não
os absolutos. Mas você pode perguntar: e os
outros reforços não alterariam essa relação?
Não! De acordo com a hipérbole de Herrnstein, além dos esquemas programados
pelo experimentador, o organismo também
gastaria tempo emitindo respostas que são
controladas pelos outros reforços disponíveis nessa situação. Contudo, como os outros reforços estão constantes nessa condição, eles interfeririam da mesma maneira
(ou igualmente) nas respostas aos dois esquemas e, assim, seus efeitos se anulariam
matematicamente.
de respostas R1 aumenta, mas a emissão de
outras respostas alternativas diminui, devido a um máximo de respostas possíveis
de serem emitidas. O artigo de Herrnstein
(1961) foi um marco no estudo do comportamento de escolha ao prover dados sistemáticos e quantificação de duas alternativas
de respostas, realizando manipulações paramétricas da taxa relativa de reforços em
esquemas concorrentes de intervalo variável (CONC VI - VI) e mostrando que as alterações nessa taxa relativa de reforços eram
acompanhadas de alterações similares na
taxa relativa de resposta, desenvolvendo o
princípio de igualação. Em termos quantitativos, se aplicarmos a Equação 2 a duas
respostas concorrentes, R1 e R2, obtemos a
Equação 1³ proposta por Herrnstein (1961).
Essas previsões atualmente podem
parecer simples, mas precisamos considerar que àquela época o diferencial foi mostrar que a frequência de R1 não dependia
apenas dos reforços produzidos por ela.
Porém, isso não é tudo. Se R1 depende de
sua taxa de reforços e dos reforços para outras respostas alternativas e, consequentemente, as outras respostas são controladas
pelos seus próprios reforços e pela taxa de
reforços de R1, há uma interdependência
entre a contingência em vigor para R1 e as
contingências sob as quais estão as outras
respostas possíveis de serem emitidas na
mesma situação e incompatíveis com R1.
Dessa forma, ao se aumentar a taxa de reforços para R1 relativamente aos reforços
de outros comportamentos, não só a taxa
A concepção de Herrnstein (1961) foi
tão importante que, após sua publicação, a
Análise do Comportamento passou a desenvolver diversos trabalhos quantitativos,
não apenas para o estudo de escolha, mas
na busca de relações quantitativas entre o
comportamento e suas consequências, avaliando também a asserção de Herrnstein
(1970) de que escolha é comportamento (e
vice-versa). Passamos então a ter uma gama
de estudos que tentavam avaliar a generalidade da Lei da Igualação e extensão para
outros parâmetros do reforço, como atraso
e magnitude (e.g. Rachlin & Baum, 1969;
Há um conjunto de transformações para se chegar a essa formulação,
fora do âmbito do presente trabalho. De forma resumida, tanto k quanto ro saem da Equação 1 porque ao interagirem da mesma forma com
R1 e R2, seus efeitos são matematicamente “anulados”.
3
87
Cristiano Coelho
Logue, 1988; Logue & Chavarro, 1987; Todorov, 1973), arranjos experimentais, como a
função do COD e efeito da frequência absoluta de reforços (e.g. Shull & Pliskoff, 1967;
Todorov, Coelho & Beckert, 1993), efeitos da
história (e.g. Todorov, Oliveira-Castro, Hanna, Bittencourt de Sá & Barreto, 1983), apenas para mencionar alguns poucos exemplos. Pesquisas mostraram também que a
relação de igualação se aplicava para medidas de alocação de tempo (e.g. Baum, 1975;
Baum & Rachlin, 1969). A aplicabilidade da
proposta de Herrnstein para o estudo e intervenção sobre o comportamento humano
também foi testada (e.g. Bradshaw & Szabadi, 1978; Logue, 1988; Neef, Mace, Shea &
Shade, 1992; Pierce & Epling, 1983).
Baum (1974, 1979) observou os dados
de alguns estudos indicavam dois desvios
sistemáticos da igualação encontrados empiricamente. Um desvio foi chamado de
viés, uma persistência a apresentar uma
preferência por uma alternativa derivada
de aspectos não relacionados à distribuição de reforços. Essa preferência por uma
alternativa pode ser derivada de diferenças
na força necessária para acionar o lócus
de respostas, diferenças qualitativas nas
respostas em cada esquema (bicar x acionar um pedal), diferenças na iluminação
dos discos, dentre outros. O outro desvio,
chamado de sensibilidade, ocorre quando
a distribuição de respostas não se modifica de maneira estrita conforme a alteração
nas relações entre os reforços obtidos nos
esquemas concorrentes. Conforme pontua88
mos ao início deste tópico, para Herrnstein
(1961), a igualação implica que uma variação
na frequência relativa de reforços deve ser
acompanhada da mesma variação na frequência relativa de respostas: se em uma
fonte é obtida três vezes mais reforços que
a alternativa, para igualar o organismo emitiria três vezes mais respostas, por exemplo.
Além disso, ao se dobrar a frequência relativa de reforços para essa mesma alternativa,
a frequência relativa de respostas também
dobraria. Porém, Baum (1979) realizou uma
revisão de 23 estudos e observou dados nos
quais quando a distribuição de reforços era
alterada em uma certa medida produzia
variações menores e, em outras, variações
maiores na distribuição de respostas, as
quais Baum denominou de “subigualação”
e “sobreigualação”, respectivamente.
Diversos trabalhos (e.g. Baum, 1974,
1979; Rachlin & Baum, 1969) estenderam a
proposta de Herrnstein (1961, 1970). Ao buscar sistematizar os dados sobre igualação
envolvendo os diferentes parâmetros do reforço, Baum (1974) desenvolveu a Lei Generalizada da Igualação. Porém, derivou uma
equação baseada na relação entre razões de
respostas (respostas emitidas em uma alternativa dividida pelas respostas emitidas na
outra alternativa) e razões de reforços (reforços obtidos em uma alternativa dividido
pelos reforços obtidos na outra alternativa).
O uso de medidas de razão descrevia melhor as distribuições de reforços e respostas
por terem uma amplitude maior que proporção ou porcentagem, que tem seu limite
Capítulo V | Escolha
de 0 a 1 e 0% a 100%, respectivamente. Essa
relação é expressa na Equação 3:
(3),
sendo a e b os parâmetros obtidos empiricamente, relacionados ao viés e sensibilidade. Quando se encontra uma sensibilidade
perfeita e ausência de viés, a equação de
Baum expressa a igualação estrita de Herrnstein. A mesma relação pode ser aplicada
quando são manipuladas as magnitudes e/
ou atrasos. Quando os três parâmetros são
manipulados em um mesmo experimento,
é possível se calcular as sensibilidades às
variações de cada um deles.
Pierce e Epling (1983) avaliaram a generalidade da Lei da Igualação para a descrição do comportamento humano e sugerem que os resultados com humanos seriam
compatíveis com a igualação. Além disso,
observaram que pesquisas com humanos
que não encontraram dados sistemáticos
compatíveis com a igualação (e.g. Oscar-Berman, Heyman, Bonner & Ryder, 1980)
apresentavam especificidades metodológicas que não permitiriam uma adequada
análise da igualação. Em primeiro lugar,
esses experimentos com humanos geralmente utilizaram poucas sessões e dados
de comportamento sem o controle já estabelecido pela contingência, ou seja, dados
de transição, ao passo que a lei se dirige a
dados de distribuição de respostas em estado estável.
A discussão levantada por Pierce e
Epling (1983) mostra alguns dos cuidados
necessários para se falar em igualação e sua
aplicabilidade ao comportamento humano, em concordância com os pressupostos
desenvolvidos por Herrnstein (1961, 1964,
1970) e compatível com a literatura. Dois
exemplos da aplicabilidade da igualação
com humanos em contextos diferentes podem contribuir para que visualizemos a extensão dos efeitos de Herrnstein (1961).
Bradshaw e Szabadi (1976) realizaram uma investigação, ao longo de seis meses, com uma pessoa diagnosticada como
maníaca depressiva. No experimento, diferentes operandos estavam associados com
diferentes VIs, que foram utilizados para
manipular a taxa de reforço, testando uma
função derivada da Equação 1 acima. Essa
mensuração, realizada em situações com
diferenças de “humor” (normal, depressivo,
maníaco), mostrou que a taxa de respostas aumentava com aumentos na taxa de
reforço na forma prevista pela Equação 1,
atingindo o máximo k. Contudo, conforme
o “humor”, o máximo de respostas emitidas
diferiu, com taxas máximas mais altas obtidas em quando o paciente estava maníaco,
e as mais baixas quando estava depressivo.
Neef, Mace, Shea e Shade (1992) avaliaram a Lei da Igualação em um contexto
educacional com reforçadores de mesma
“qualidade” e “qualidade” diferente. Três
estudantes especiais tiveram que resolver problemas matemáticos apresentados
89
Cristiano Coelho
concorrentemente e com reforços de acordo com esquemas de VI. Na condição com
reforços qualitativamente semelhantes, o
tempo alocado a cada esquema variou conforme previsto na igualação. Um dado interessante foi que os autores não obtiveram
igualação com reforços qualitativamente
diferentes. De fato, a proposta de igualação,
tal como proposta por Herrnstein, se adequa a escolha com mesmos reforçadores.
A ideia de igualação repercutiu também no desenvolvimento dos trabalhos
sobre escolhas entre reforçadores com diferentes atrasos e magnitudes, desenvolvidos na área de autocontrole (e.g. Mazur,
1987; Rachlin & Green, 1972). A noção básica para essa extensão foi a Lei Generalizada
da Igualação, com a demonstração de que
a distribuição de respostas é alterada conforme os pressupostos básicos da ideia de
Herrnstein (1961) quando são manipulados
atraso e magnitude de reforço. Além disso,
análises quantitativas da perda de valor reforçador de consequências atrasadas mostraram-se compatíveis com a equação de
igualação (Ainslie & Haslam, 1992) ao serem
aplicadas ao estudo do comportamento de
não humanos (e.g. Mazur, 1995) e humanos
(e.g. Coelho, Hanna & Todorov, 2003; Rachlin, Raineri & Cross, 1991).
A Lei da Igualação, tal como proposta por Herrnstein (1961), se adequa a escolha
com mesmos reforçadores. Propostas posteriores (e.g. Rachlin, 1989) tentaram interpretar o parâmetro de sensibilidade da Lei
90
Generalizada da Igualação como o nível de
semelhança funcional ou de complementariedade entre os reforços disponibilizados
pelas duas fontes. Em alguns casos, essa interpretação prevê que a diminuição de uma
frequência de reforços levaria à diminuição
nas duas respostas concorrentes e permite
descrever adequadamente as alterações na
distribuição de respostas. Mas essa é outra
longa história4!
CONSIDERAÇÕES FINAIS
Sem dúvida, a contribuição mais
clara de Herrnstein (1961) foi sua proposta
de estabelecer relações quantitativas precisas entre comportamento e suas consequências. Essas relações não só validam,
mas principalmente, acrescentam-se aos
achados sobre a regularidade dessas relações. Ao longo de seus estudos, Herrnstein procurou aprofundar essas relações,
focando nos efeitos das consequências e
questionando princípios de racionalidade,
sistematizados em uma compilação de textos finalizada após sua morte (Herrnstein,
Rachlin & Laibson, 1997). Essa compilação
de textos mostra como as pesquisas realizadas por ele iniciadas a partir de Herrnstein
(1961) foram indicando as falhas nas previsões da Psicologia e da Economia baseadas
Algumas referências a respeito, além de Rachlin (1989): Rachlin, H.,
Kagel, J. H., & Battalio, R. C. (1980). Substitutability in time allocation.
Psychological Review, 87(4), 355. Rachlin, H., Green, L., Kagel, J. H., &
Battalio, R. C. (1976). Economic demand theory and psychological studies of choice. Psychology of Learning and Motivation, 10, 129-154.
4
Capítulo V | Escolha
no pressuposto de que as escolhas visam o
máximo de resultados. Esses dados mostram a igualação na base da dinâmica das
escolhas. E há muito mais para buscarmos
e satisfazer nossa curiosidade. Os números?
Eles não são o comportamento em si, apenas uma forma (dentre as diversas) de descrevê-lo e permitir-nos conhecer de uma
maneira mais precisa as regularidades do
comportamento.
Considero que para além da quantificação, o pressuposto de que nosso comportamento é afetado também pelas contingências concorrentes é uma das grandes
contribuições da sistematização dessa área.
Ela permeia direta ou indiretamente intervenções que passaram a ser adotadas em
diferentes contextos, nos quais fomos deixando de punir comportamentos-problema e passamos a reforçar comportamentos
socialmente desejáveis. Diferentes formas
de intervenção baseadas em reforço diferencial e até a noção de reforço para comportamentos clinicamente relevantes tipo 2
(CRB2) na Psicoterapia Analítica Funcional
(Kohlenbergh & Tsai, 2001) tem embutidas
noções que se aproximam daquela investigada a partir do experimento de Herrnstein
(1961).
Podemos ilustrar sua repercussão
pelo fato de que Herrnstein (1961), juntamente com outro trabalho clássico sobre
escolha (Herrnstein, 1970) foi um dos cinco trabalhos publicados no Journal of the
Experimental Analysis of Behavior (JEAB)
mais citados no Journal of Applied Behavior Analysis (JABA) entre 1983 e 2003
(Elliot e cols., 2005). Ao lado do artigo seminal de Michael (1982) sobre operações
estabelecedoras, a Lei da Igualação permaneceu como um dos principais tópicos de
interesse na área aplicada. Conforme Elliot e cols. (p. 560) “Claramente, igualação
e operações estabelecedoras são tópicos de
contínuo interesse para analistas aplicados
do comportamento e devem ser abrangidos
em programas de treinamento. Igualação e
operações estabelecedoras tem provado ser
úteis em conceituar e tratar uma amplitude
de comportamentos-problema”.
PARA SABER MAIS
Baum (2010). Descreve um tutorial baseado
na igualação como alocação de tempo entre
atividades. No texto são discutidos aspectos referentes à
Borges, Todorov, & Simonassi (2006). Descreve experimentos com diferentes manipulações, mostrando como as condições
para a obtenção de igualação com humanos
dependem da programação experimental.
Garcia-Mijares & Silva (1999). Apresenta
de forma didática as noções de igualação.
Madden & Perone (1999). Avaliaram a Lei
Generalizada da Igualação e, mais especificamente, a sensibilidade comportamental.
Os dados mostraram que a sensibilidade foi
91
Cristiano Coelho
maior quando havia uma resposta de observação.
Todorov, Coelho, & Beckert (1993). Realizaram um conjunto de experimentos com
pombos, nos quais variaram a frequência
relativa e frequência absoluta de reforços.
Os dados reforçam que o pressuposto de
que a igualação depende somente da frequência relativa de reforços e da função do
COD na separação das respostas aos esquemas.
REFERÊNCIAS
Ainslie, G., & Haslam, N. (1992). Hyperbolic
discounting. In G. Loewenstein & J. Elster, J.
(Eds.), Choice over time. New York: Russell
Sage Foundation.
Baum, W. M. (1974). On two types of deviation from the matching law: Bias and undermatching. Journal of The Experimental
Analysis of Behavior, 22, 231-242.
Baum, W. M. (1975). Time allocation in human vigilance. Journal of the Experimental
Analysis of Behavior, 23, 45-53.
Baum, W. M. (1979). Matching, undermatching, and overmatching in studies of choice. Journal of the Experimental Analysis of
Behavior, 32, 269-281.
Baum, W. M. (2010). Dynamics of choice: A
tutorial. Journal of the Experimental Analy92
sis of Behavior, 94, 161-174.
Baum, W. M., & Rachlin, H. (1969). Choice as
time allocation. Journal of the Experimental
Analysis of Behavior, 12, 861-874.
Borges, F. S., Todorov, J. C., & Simonassi, L.
E. (2006). Comportamento humano em esquemas concorrentes: escolha como uma
questão de procedimento. Revista Brasileira de Terapia Comportamental e Cognitiva,8, 13-24.
Bradshaw, C. M., & Szabadi, E. (1978). Changes in operant behavior in a manic-depressive patient. Behavior Therapy, 9, 950-954.
Catania, A. C., & Reynolds, G. S. (1968). A
quantitative analysis of the responding
maintained by interval schedules of reinforcement. Journal of the Experimental
Analysis of Behavior, 11, 327-383.
Coelho, C., Hanna, E. S., & Todorov, J. C.
(2003). Magnitude, atraso e probabilidade
de reforço em situações hipotéticas de risco.
Psicologia: Teoria e Pesquisa, 19, 269-278.
Davison, M. (2012). The matching law (Edição revisada de Davison, M., & McCarthy,
D. (1988). The matching law: A research review. Hillsdale, NJ: Lawrence Erlbaum Associates).
De Villiers, P. A., & Herrnstein, R. J. (1976).
Toward a law of response strength. Psychological Bulletin, 83, 1131.
Capítulo V | Escolha
Elliott, A. J., Morgan, K., Fuqua, R. W.,
Ehrhardt, K., & Poling, A. (2005). Self- and
cross-citations in the Journal of Applied
Behavior Analysis and the Journal of the
Experimental Analysis of Behavior: 1993–
2003. Journal of Applied Behavior Analysis,
38, 559-563.
Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of
Behavior, 13, 243-266.
Ferster, C. & Skinner (1957). Schedules of
reinforcement. New York: Appleton Century-Crofts.
Kohlenberg, R. J., & Tsai, M. (2001). Psicoterapia Analítica Funcional. São Paulo: ESETEC.
Herrnstein, R. J., (1997). The matching law:
Papers in psychology and economics. Cambridge: Harvard University Press.
Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal
of the Experimental Analysis of Behavior, 1,
123-144.
Logue, A. W., & Chavarro, A. (1987). Effect
on choice of absolute and relative values of
reinforcer delay, amount, and frequency.
Journal of Experimental Psychology: Animal Behavior Processes, 13, 280.
Garcia-Mijares, M., & Silva, M. T. A. (1999).
Introdução à teoria da igualação. Sobre
comportamento e cognição, 4, 40-53.
Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral
and Brain Sciences, 11, 665-679.
Herrnstein, R. J. (1958). Some factors influencing behavior in a two-response situation. Transactions of the New York Academy of Sciences, 21, 35-45.
Madden, G. J., & Perone, M. (1999). Human
sensitivity to concurrent schedules of reinforcement: Effects of observing schedule-correlated stimuli. Journal of the Experimental Analysis of Behavior, 71, 303-318.
Herrnstein, R. J. (1961). Relative and Absolute strength of Response as a Function of
Frequency of Reinforcement. Journal of the
Experimental Analysis of Behavior, 4, 267272.
Herrnstein, R. J. (1964). Secondary reinforcement and rate of primary reinforcement.
Journal of the Experimental Analysis of
Behavior, 7, 27-36.
Mazur, J. E. (1987). An adjusting procedure for studying delayed reinforcement. In
M. L. Commons, J. E. Mazur, & J. A. Nevin
(Eds.), Quantitative Analysis of Behavior:
Vol 5. The effect of delay and intervening
events on reinforcement value. Hillsdale, NJ:
Lawrence Erlbaum. (pp. 55-73).
Mazur, J. E. (1995). Conditioned reinforcement and choice with delayed and uncer93
Cristiano Coelho
tain primary reinforcers. Journal of the Experimental Analysis of behavior, 63, 139-150.
Michael, J. (1982). Distinguishing between
discriminative and motivational functions
of stimuli. Journal of the Experimental
Analysis of Behavior, 37, 149-155.
Neef, N. A., Mace, F. C., Shea, M. C., & Shade, D. (1992). Effects of reinforcer rate and
reinforcer quality on time allocation: Extensions of matching theory to educational settings. Journal of Applied Behavior
Analysis, 25, 691-699.
Oscar-Berman, M., Heyman, G. M., Bonner, R. T., & Ryder, J. (1980). Human neuropsychology: Some differences between
Korsakoff and normal operant performance. Psychological Research, 41, 235-247.
Pierce, W. D., & Epling, W. F. (1983). Choice,
matching, and human behavior: A review of
the literature. The Behavior Analyst, 6, 57.
Rachlin, H. (1989). Judgment, decision, and
choice: A cognitive/behavioral synthesis.
New York: WH Freeman/Times Books/
Henry Holt & Co.
Rachlin, H., & Baum, W. M. (1969). Response rate as a function of amount of reinforcement for a signalled concurrent response. Journal of the Experimental Analysis of
Behavior, 12, 11-16.
Rachlin, H., & Green, L. (1972). Commit94
ment, Choice and self-control. Journal of
the Experimental Analysis of Behavior, 17,
15-22.
Rachlin, H., Raineri, A., & Cross, D. (1991).
Subjective probability and delay. Journal of
the Experimental Analysis of Behavior, 55,
233-244.
Shull, R. L., & Pliskoff, S. S. (1967). Changeover delay and concurrent schedules: Some
effects on relative performance measures.
Journal of the Experimental Analysis of
Behavior, 10, 517-527.
Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57,
193-216.
Todorov, J. C. (1973). Interaction of frequency and magnitude of reinforcement on concurrent performances. Journal of the Experimental Analysis of Behavior, 19, 451-458.
Todorov, J. C., Oliveira-Castro, J. M., Hanna,
E. S., Bittencourt de Sá, M. C. N., & Barreto, M. D. Q. (1983). Choice, experience, and
the generalized matching law. Journal of the
Experimental Analysis of Behavior, 40, 99111.
Todorov, J. C., Coelho, C., & Beckert, M. E.
(1993). Efeito da frequência absoluta de reforços em situação de escolha: um teste do
pressuposto da relatividade na lei generalizada de igualação. Psicologia: Teoria e Pesquisa, 9, 227-42.
Elenice S. Hanna, Márcio Borges Moreira
Prestaram atenção
em tudo?
Elenice S. Hanna
Universidade de Brasília
Márcio Borges Moreira
Centro Universitário de Brasília; Instituto Walden4
Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis
of Behavior, 4, 203-208.
“Da mesma forma que podemos atentar para um objeto sem olhar para ele, assim
também podemos olhar para um objeto sem prestar-lhe atenção”
Skinner (1953/2003, p. 138)
95
Capítulo VI | Atenção
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Ao perguntar para várias pessoas que foram à mesma sala de cinema no
mesmo horário, o que lhes chamou mais
atenção, respostas variadas apareceriam.
Alguns incluiriam no relato determinados
personagens, suas personalidades ou as interações entre eles. Outros falariam dos cenários, cidades ou construções. Poderíamos
ainda encontrar aqueles que focam seus
relatos nas cenas de suspense, na forma
como foram produzidas, na iluminação ou
nos aspectos negativos. Uma pessoa menos
atenta ao filme, como o dono do cinema,
poderia ainda ter se interessado pelo número de pessoas que havia na sala e no que
elas estavam consumindo.
Em situações cotidianas nem sempre o comportamento de uma pessoa fica,
do ponto de vista de um observador externo (o diretor do filme, por exemplo) ou do
próprio indivíduo, sob controle dos mesmos estímulos que antecedem ou que estão
presentes quando um determinado comportamento ocorre. Dito de outra forma, diferentes indivíduos podem prestar atenção
a diferentes aspectos, ou diferentes estímulos, de um mesmo ambiente. Diz-se, nessas
situações, que o organismo prestou ou não
atenção ao evento, que atentou ou não a
uma ou mais propriedades relevantes do estímulo. É importante ressaltar que, em Análise do Comportamento, estímulo é “qual-
quer evento físico, combinação de eventos
ou relação entre eventos. O vocabulário do
estímulo classifica os aspectos do ambiente
…” (Catania, 1998/1999, p. 402). Quando falamos de uma propriedade de um estímulo,
falamos de alguma qualidade mensurável
de um estímulo, por exemplo, cor, forma,
cheiro, tamanho, textura, etc. O conceito
de ambiente, por sua vez, pode ser definido
como o “conjunto de circunstâncias físicas
no qual o organismo, ou uma parte referida
desse organismo, existe” (Johnston & Pennypacker, 2009, p. 29).
O uso do conceito de atenção em
muitos casos, entretanto, pode inverter “...
a direção da ação ao sugerir que não é o estímulo que controla o comportamento do
observador, mas é o observador que atenta
para o estímulo e assim o controla” (Skinner, 1953/2000, p. 135). Nessa perspectiva,
a “falta de atenção” não explica o controle inadequado de estímulos, é apenas uma
forma resumida de se referir à ausência de
controle por determinados elementos ou
dimensões de estímulos sobre o comportamento. É importante lembrar que falar de
controle do comportamento é falar de variáveis que tornam um determinado comportamento mais ou menos provável (não significa, necessariamente, falar de “obrigar”
alguém a fazer algo).
Conhecer as variáveis que aumentam as chances de haver coerência entre
o que se quer ensinar dos estímulos antecedentes e o que será aprendido é funda96
Elenice S. Hanna, Márcio Borges Moreira
mental para o ensino de diversos processos
comportamentais complexos. A aprendizagem de conceitos, por exemplo, é base para
o desenvolvimento do pensamento e da
linguagem humana. Quando aprendemos o
conceito de “vermelho” ou de um “número”, interagimos com eventos que são compostos por outras propriedades. Um objeto
vermelho ou unitário possui forma, peso,
tamanho, apenas para citar algumas das
possíveis propriedades. Mas como ocorre
o processo que permite que determinado
comportamento fique sob controle da cor
ou o número, por exemplo, dentre tantos
aspectos dos objetos que contêm cor e numerosidade? Perguntando em uma linguagem mais coloquial, como prestamos atenção apenas à cor ou ao número dos objetos?
O experimento que é tema deste capítulo foi publicado por George Reynolds
em 1961 com o título de “Atenção no pombo” e inspirou uma série estudos relevantes para a compreensão da atenção e do
controle do comportamento por estímulos compostos. Em estudos sobre controle
do comportamento operante por estímulos antecedentes, o ensino é realizado por
meio de procedimentos chamados de treino
discriminativo. A base de um treino discriminativo é o reforçamento diferencial da
resposta emitida na presença de estímulos
diferentes (Dinsmoor, 1995). Na presença
de um objeto vermelho (S+), a resposta de
dizer “vermelho” (R) é seguida por alguma
reação de aprovação do professor (SR+),
mas não terá esta consequência se o objeto
97
for amarelo (S–). Responder “vermelho” faz
parte de duas contingências: uma na qual
a resposta produz reforçamento e outra em
que produz extinção, gerando a discriminação entre os objetos de cores diferentes
(i.e., vermelho e amarelo). Discriminar esses
objetos é responder diferencialmente na
presença de cada um, isto é, dizendo “vermelho” diante do S+ (objeto vermelho), mas
não diante do S– (objeto amarelo).
A discriminação está presente em
muitos exemplos do que chamamos de “conhecimento” e de “atenção”. Quando se diz
que alguém reconheceu o brinquedo vermelho ou prestou atenção no vestido vermelho, supõe-se que ele(a) diferencie (discrimine) as cores. No entanto, afirmações
como essas são meras inferências (Sidman,
1979), como as evidências apresentadas por
Reynolds (1961) permitem discutir. Passemos, então, para o estudo clássico que
apresentou estas evidências e em seguida
veremos como este tema tem relação com
outros assuntos interessantes.
DESCRIÇÃO DOS EXPERIMENTOS
Os experimentos de Reynolds (1961)
foram inspirados, dentre outros experimentos, pela pesquisa realizada por Lashley
(1938), na qual respostas de ratos de saltar
em direção a um cartão contendo a figura
de um triângulo f‌oram reforçadas com comida e as respostas de saltar em direção a
Capítulo VI | Atenção
um cartão contendo a figura de triângulo invertido foram punidas pela queda do
animal em uma rede de segurança. Após
realizar esse treino discriminativo, Lashley
realizou testes nos quais apenas metade das
figuras eram apresentadas aos ratos. Nesses testes, não se observou consistência no
comportamento de saltar dos animais, isto
é, as “partes” dos triângulos apresentadas
nos testes como estímulos antecedentes
exerceram controles diferentes para diferentes animais. No entanto, estes responderam de forma coerente com o treino quando
apenas a metade inferior de cada figura era
apresentada.
Experimento 1 - Objetivo e Método
Com base nos resultados da pesquisa
de Lashley (1938), o objetivo do experimento de Reynolds (1961) foi avaliar os efeitos
da variação e eliminação de características
dos estímulos sobre a aprendizagem de discriminações de estímulos – dizemos que
uma discriminação de estímulos foi estabelecida quando o indivíduo se comporta de
maneira diferente na presença de estímulos
antecedentes diferentes.
No Experimento 1 (Reynolds, 1961),
dois pombos foram colocados em câmaras experimentais que continham discos
de resposta onde ora era apresentado um
triângulo sobre um fundo vermelho (ΔR) e
ora um círculo sobre um fundo verde (OG),
Figura 1. Diagrama do treino discriminativo e dos estímulos decompostos utilizados no teste em extinção de Reynolds (1961; painel da esquerda) e
resultados do Experimento 1 (painel da direita). O gráfico do painel da direita é uma adaptação da Figura 1 de Reynolds (p. 204).
98
Elenice S. Hanna, Márcio Borges Moreira
de forma imprevisível. Bicadas no disco
ΔR eram seguidas por comida (reforço),
após transcorridos 3 min em média desde a
apresentação do último reforço (i.e., um esquema de reforçamento intervalo variável,
VI, 3 min). Respostas de bicar no disco OG
não eram reforçadas (extinção). Esta etapa
do procedimento consistiu de um treino
discriminativo (Figura 1). Após a etapa de
treino discriminativo, iniciava-se uma segunda etapa do experimento, chamada de
teste em extinção. Nesta etapa Reynolds
(1961) programou um teste no qual os componentes dos estímulos utilizados durante
o treino discriminativo eram apresentados
separadamente, ou seja, o disco de resposta
continha ora o triângulo, ora o círculo, ora
era iluminado por vermelho e ora por verde. O teste foi realizado em extinção, isto
é, bicadas no disco, independentemente de
qual estímulo estivesse presente no disco,
não eram seguidas pela apresentação de
comida. O teste em extinção foi uma verificação do que os pombos haviam aprendido durante o treino discriminativo. Portanto, procedimentos de treino são tarefas de
aprendizagem e procedimento de teste em
extinção são procedimentos de avaliação
dessa aprendizagem.
Resultados e Discussão
No início do treino discriminativo,
ambos os pombos bicavam no disco tanto
na presença do ΔR quanto na presença do
OG. No entanto, à medida que o treino discriminativo continuava, as respostas iam se
99
concentrando no disco cujas bicadas produziam comida, isto é, os animais passaram
a bicar nos disco quase que exclusivamente
na presença do triângulo sobre fundo vermelho (Figura 1). Neste caso, dizemos que
o controle discriminativo foi estabelecido:
respostas de bicar ocorriam na presença do
triângulo sobre fundo vermelho e ocorriam
com baixa frequência na presença do círculo sobre fundo verde.
Durante o teste em extinção, na qual
os componentes dos estímulos utilizados
no treino foram apresentados separadamente, Reynolds (1961) verificou que, para o
pombo 105, a maioria das respostas de bicar
ocorreu na presença do triângulo, enquanto para o pombo 107 a maior parte das respostas ocorreu na presença da cor vermelha
(Figura 1). Mesmo tendo sido submetidos ao
treino discriminativo com os mesmos estímulos compostos, o comportamento de
cada um dos animais, durante o teste, foi
controlado por uma propriedade específica diferente do estímulo (triângulo para
o pombo 105 e cor vermelha para o pombo 107). Reynolds argumentou apenas que
o responder de cada um dos pombos ficou
sob controle de um dos muitos aspectos de
cada estímulo, não sugerindo possíveis determinantes das diferenças individuais no
controle de estímulos observado no comportamento dos pombos - até porque seus
dados não permitiam explicar o controle de
estímulos desenvolvido pelos animais. Os
analistas do comportamento acham mais
produtivo ficar provisoriamente sem uma
Capítulo VI | Atenção
explicação do que inventar um explicação
que não seja baseada nas interações entre o
organismo e o ambiente. Por exemplo, Reynolds poderia ter dito: “O pombo 105 bicou
mais vezes na presença do triângulo durante os testes porque ele prestou mais atenção a este aspecto do estímulo durante o
treino”. No entanto, propor uma explicação
como essa não explica nada, é apenas outra forma de dizer que o pombo bicou mais
vezes na presença do triângulo. Mesmo se
aceitássemos a explicação “bicou mais na
presença do triângulo porque prestou mais
atenção a esse aspecto”, ainda teríamos que
explicar por que ele prestou mais atenção a
esse aspeto. Os estudos que foram desencadeados após a publicação do artigo de
Reynolds (1961), entretanto, mostraram que
o objetivo do estudo original foi cumprido e
inspirou muitos outros estudos que nos ajudam a compreender melhor como diferentes controles de estímulos se estabelecem.
Experimento 2 - Objetivo e Método
Reynolds (1961) realizou um segundo experimento, com os mesmos pombos,
fazendo combinações de estímulos ainda
mais complexas. No Experimento 2, havia
as seguintes combinações de forma e cor
nos discos de resposta durante o treino discriminativo: triângulo sobre fundo vermelho, círculo sobre fundo vermelho, triângulo sobre fundo azul, círculo sobre fundo
azul. Além disso, em alguns momentos uma
lâmpada amarela, posicionada na lateral da
câmara experimental, se acendia e em outros momentos uma lâmpada verde, posi-
cionada no mesmo local que a amarela, se
acendia. Durante o treino discriminativo do
Experimento 2, as respostas de bicar o disco
foram reforçadas em esquema de intervalo
fixo (FI) 3 min quando a lâmpada amarela
estava acesa e o fundo do disco era vermelho (independentemente se continha círculo ou triângulo) e quando a luz verde estava
acesa e o disco continha um triângulo (independentemente da cor do fundo do disco). Veja que neste treino discriminativo, o
comportamento do pombo de bicar no disco deveria ficar sob controle de uma relação mais complexa (i.e., composta por mais
elementos) entre os estímulos presentes do
que aquela programada no Experimento 1:
cor da lâmpada lateral, cor do fundo do disco e forma projetada no disco.
Resultados e Discussão
Após cerca de 100 horas de treino discriminativo, o comportamento dos
pombos ficou sob controle dos estímulos
programados, isto é, eles bicavam no disco quando a luz amarela e o fundo do disco vermelho estavam presentes e quando
luz verde e o triângulo estavam presentes;
quando a luz amarela e círculo sobre fundo azul estavam presentes, por exemplo, os
pombos praticamente não bicavam o disco
de resposta. Após o treino discriminativo,
Reynolds (1961) realizou vários testes em
extinção alterando a configuração dos estímulos como, por exemplo, extinção das respostas durante as mesmas configurações de
estímulos do treino; extinção das respostas
com as duas lâmpadas laterais apagadas; e
100
Elenice S. Hanna, Márcio Borges Moreira
extinção das respostas com as duas lâmpadas laterais acesas simultaneamente.
Os resultados desse segundo experimento replicaram os resultados do primeiro: controle por aspectos específicos da
configuração de estímulos. Nas palavras de
Reynolds (1961, p. 208):
No segundo experimento, nenhum
dos pombos atentou para a cor da lâmpada lateral. O responder deles foi controlado
apenas pela presença ou ausência da lâmpada lateral amarela, ou, de acordo com
análise posterior, pela intensidade da iluminação da lâmpada lateral.
DESDOBRAMENTOS
Centenas, talvez milhares, de pesquisas foram e continuam sendo realizadas
com o intuito de sabermos cada vez mais
sobre os fatores que determinam quais os
aspectos do ambiente que controlarão o
comportamento de diferentes organismos
e em quais situações (e.g., Barros, Galvão,
Brino, Goulart, & McIlvane, 2005; Carter &
Werner, 1978; de Rose, de Souza & Hanna,
1996; Debert, Huziwara, Faggiani, de Mathis
& McIlvane, 2009; Dube & McIlvane, 1999;
Johnson & Cumming, 1968; Lovaas, Koegel
& Schreibman, 1979). Em outras palavras,
ainda hoje estudamos o que pode levar algumas pessoas a prestarem atenção a certos
aspectos de seu ambiente e outras pessoas a
prestarem atenção a outros aspectos. A seguir, apresentamos dois experimentos que
101
demonstraram controle discriminativo por
parte da configuração de estímulos e avançaram o conhecimento sobre o tema.
O primeiro experimento, conduzido
por Wilkie e Masson (1976), foi uma replicação sistemática do experimento de Reynolds (1961) com controles mais refinados e
também utilizando pombos como sujeitos
experimentais. A primeira parte do estudo
foi idêntica ao Experimento 1 de Reynolds
(i.e., treino com estímulos compostos e teste com os elementos dos estímulos compostos). Na fase de teste, os seis pombos
responderam quase que exclusivamente
na presença da cor previamente correlacionada com o reforço (i.e., teriam atentado para cor e não para a forma). Embora as
bicadas dos pombos de Wilkie e Masson
não tenham ficado sob controle de aspectos diferentes do estímulo composto, como
no estudo de Reynolds, a evidência de controle por apenas uma das propriedades do
estímulo composto (cor) é um resultado semelhante ao (i.e., uma replicação do) estudo
original.
A replicação (Wilkie & Mason, 1976)
confirmou que os animais não humanos
não atentam para todas as propriedades
de um estímulo composto, mas os autores
ainda foram além para avaliar se o teste em
extinção era um contexto adequado para
identificar o controle de estímulos aprendido durante os treinos. Wilkie e Masson, em
uma segunda etapa do estudo, realizaram
um novo treino discriminativo para avaliar
Capítulo VI | Atenção
se a situação de teste em extinção mascarou o possível controle exercido pela outra
propriedade do estímulo (forma). Neste segundo treino, bicadas no disco foram reforçadas na presença das duas formas (triângulo e círculo), mas sem o fundo colorido
correspondente aos estímulos compostos
do primeiro treino. Se as formas não tivessem adquirido nenhuma função comportamental no primeiro treino, a aprendizagem
na presença de cada forma deveria ser semelhante no segundo treino. No entanto, já
na primeira sessão de treino os pesquisadores observaram que a frequência do responder na presença da forma previamente
correlacionada com reforço aumentou mais
rapidamente que na presença da forma correlacionada com extinção. Embora se pudesse pensar, a partir do primeiro teste, que
os pombos prestaram atenção somente à
cor, os resultados do segundo treino discriminativo mostraram que as formas também
exerceram algum controle sobre o comportamento.
Este é um dos aspectos mais interessantes da pesquisa científica e que depende
da curiosidade de pesquisadores e pesquisadoras: seu caráter cumulativo. Reynolds
(1961) demonstrou atenção seletiva à determinados aspectos dos estímulos. Wilkie e
Masson (1976) confirmaram esse resultado
e ainda mostraram que o contexto no qual
se avalia a atenção às diferentes propriedades do estímulo pode levar a conclusões
diferentes sobre a extensão do controle de
estímulos.
Nas décadas de 1960 e 1970, muitos
estudos sobre controle de estímulos realizados em laboratório utilizaram pombos
como sujeitos. O sistema visual das aves,
dentre outras vantagens, permite empregar
diversos estímulos visuais com variação
de cores, diferentemente dos roedores que
são sensíveis aos raios UV e “cegos” para
grande parte das frequências que seres humanos enxergam. Nesses estudos, os estímulos visuais são projetados nos discos de
resposta ou em outros locais da câmara experimental para estudo do comportamento
operante de pombos.
Uma pergunta comumente feita
quando fenômenos importantes são estudados empiricamente em laboratório com
não humanos é sobre a sua generalidade para o comportamento humano. Nesse
sentido, Touchette (1969) realizou um treino
discriminativo com sete garotos de 12 a 17
anos com atraso severo no desenvolvimento, utilizando linhas com diferentes inclinações (45° e 135°). O treino iniciava com o reforçamento de respostas quando uma parte
pequena da linha (semelhante à um ponto)
aparecia na parte debaixo (para cinco participantes) ou de cima (para outros dois participantes) do painel de apresentação dos
estímulos (Figura 2, Pré-treino). Em seguida, os participantes aprendiam as discriminações com as linhas inclinadas (Figura
2, Treino), devendo responder na chave da
esquerda na presença de uma linha com 45°
de inclinação e na chave da direita na presença de uma linha com 135° de inclinação.
102
Elenice S. Hanna, Márcio Borges Moreira
Durante o teste para avaliar o controle de estímulos, Touchette (1969) considerou as linhas como estímulos compostos e separou cada linha em duas partes,
apresentando ora a parte inferior ora a
parte superior (Figura 2, Teste). Note que
esta separação não alterava a inclinação
da linha, que era a propriedade que o experimentador esperava que controlasse o
comportamento dos participantes. No entanto, o controle parcial foi observado mais
uma vez para a maioria dos participantes,
que responderam consistentemente apenas
para uma das partes (superior ou inferior)
da linha com a inclinação correlacionada
com reforçamento (Figura 2, painel da direita), replicando os achados de Reynolds
(1961) e Wilkie e Masson (1976). Além de
mostrar a generalidade do fenômeno do
controle parcial com humanos e para estímulos mais simples (como linhas), Touchette mostrou a importância de aprendizagens
anteriores para compreender o controle de
estímulos (veja também esse efeito de his-
tória em Johnson & Cumming, 1968, e Ray,
1969). A história experimental construída
durante o pré-treino com estímulos em posições diferentes (superior ou inferior), foi
uma variável importante para compreender
o controle de estímulos observado no teste.
Em geral, o responder foi apropriado (i.e.,
consistente com o treino) apenas quando
as partes das linhas apresentadas no teste
correspondiam à posição dos estímulos do
Pré-treino. Em outras palavras, o início do
treino que exigiu atenção para a (ou controle pela) parte de cima ou debaixo da chave
determinou para qual parte da linha inclinada o participante atentou nas etapas subsequentes do procedimento.
Um tema de pesquisa em Análise
do Comportamento bastante relacionado
com os achados de Reynolds (1961) é a superseletividade (overselectivity). Diz-se que
houve superseletividade de estímulos ou
controle de estímulos restrito quando se observa que um dado comportamento fica sob
Figura 2. Estímulos utilizados em cada etapa do estudo de Touchette (1969; painel da esquerda) e porcentagens de acertos obtidas no teste para cada
participante (painel da direita). Figura construída com base na descrição do estudo.
103
Capítulo VI | Atenção
o controle de apenas uma propriedade do
estímulo quando deveria, do ponto de vista
do experimentador, ficar sob o controle de
relações entre diferentes propriedades desse estímulo ou de outras propriedades. Por
exemplo, se o pai faz a barba e o filho não
o reconhece mais como sendo seu pai, dizemos que houve superseletividade de estímulos (estímulo barba, neste caso).
A superseletividade (Lovaas, Schreibman, Koegel, & Rehm, 1971) ou controle restrito de estímulos é observada em humanos
com desenvolvimento típico (e.g., Verneque
& Hanna, 2012), mas com mais frequência
em crianças com desenvolvimento atípico
(e.g., Lovaas & Schreibman, 1971; Lovaas et
al., 1971; Lovaas, et al., 1979), especialmente
em indivíduos com diagnóstico de autismo. Lovaas e colaboradores (e.g., Lovaas &
Schreibman, 1971; Lovaas et al., 1971) ensinaram crianças com desenvolvimento típico e com diagnóstico de autismo a discriminar estímulos compostos e mostraram que
a maioria das crianças com diagnóstico de
autismo respondeu a apenas um dos componentes dos estímulos quando eles foram
apresentados separadamente no teste (i.e.,
superseletividade). Uma proporção menor
de crianças com atraso do desenvolvimento
do estudo de Lovaas et al. (1971) apresentou
superseletividade, enquanto as crianças
com desenvolvimento típico responderam
a todos os componentes do estímulo composto. Lovaas et al. (1979) discutem como
a superseletividade pode estar relacionada
com falhas no desenvolvimento da lingua-
gem, do comportamento social e a outras
deficiências na aprendizagem de pessoas
no espectro autista.
Os estudos de Lovaas e colaboradores (e.g., Lovaas & Schreibman, 1971; Lovaas
et al., 1971; Lovaas et al., 1979) foram considerados bastante relevantes para a época,
quando havia escassez de conhecimento
sobre a falta de responsividade a elementos críticos do ambiente em indivíduos com
diagnóstico de autismo e por ter desencadeado investigações sobre as condições
que reduzem a superseletividade. Lovaas e
Schreibman (1971), por exemplo, mostraram
que ao reforçar respostas na presença dos
componentes apresentados separadamente, crianças com diagnóstico de autismo
passaram a responder a todos os elementos
do estímulo composto. Outros estudos (e.g.,
Allen & Fuqua, 1985; Schreibman, Charlop,
& Koegel, 1982) mostraram que não é necessário decompor o estímulo e ensinar separadamente as discriminações de cada elemento para ampliar o controle de estímulos
(i.e., para reduzir a superseletividade). Estes
estudos utilizaram, durante a fase de ensino, configurações de estímulos compostos
S+ e S- que variavam um componente do
composto por vez (diferença única) e compararam com a condição de ensino que programa estímulos compostos com todos os
componentes diferentes (diferenças múltiplas). Veja na Figura 3 exemplos de estímulos criados com diferenças múltiplas (painel direito) e estímulos com diferença única
(painel esquerdo). Na configuração com di104
Elenice S. Hanna, Márcio Borges Moreira
ferenças múltiplas, estímulos S+ e S- possuem maior diferença física e o responder
sob controle de um único componente do
estímulo tem a mesma probabilidade de reforçamento seja qual for o elemento. Nesse
caso, atentar para qualquer um dos elementos do estímulo composto é suficiente para
produzir 100% dos reforços. Em contraste,
para a configuração que possui apenas um
elemento diferente, responder sob controle dos elementos iguais tem baixa probabilidade de ser seguido por reforço, uma vez
que ele também está presente nos estímulos “incorretos”, isto é, aqueles não correlacionados com reforçamento. Se o elemento
diferente é variado ao longo do treino (utilizando-se diferentes S- como os da Figura
3), as discriminações por mais componentes se desenvolvem.
No entanto, configurações com diferença única (crítica) produzem mais erros
durante a etapa de ensino e seu uso pode
não ser uma estratégia eficiente para indivíduos com baixa resistência à frustração e
Figura 3. Exemplo de configuração de estímulos S+ e S- com diferença
única e com diferenças múltiplas.
105
em tarefas com alta complexidade em relação ao repertório inicial de estudantes (e.g.,
Anderson & Rincover, 1982). Nesses casos,
procedimentos especiais que combinam o
ensino de discriminações com os elementos separados e compostos com diferenças
críticas e/ou a programação de aumentos
graduais na semelhança física entre os estímulos (fading, veja o estudo de Terrace,
1963) podem ser utilizados na metodologia
de ensino. Os estudos de Dube e McIlvane
(1999) e de Duarte e Baer (1997) são exemplos destes procedimentos. O primeiro ensinou discriminações entre palavras e o segundo entre faces.
CONSIDERAÇÕES FINAIS
Em muitas atividades humanas,
é necessário atentar e discriminar diversos eventos e ignorar outros. Reynolds
(1961) iniciou uma série de investigações
que mostraram que o atentar e as discriminações que aprendemos dependem das
contingências de reforçamento às quais
somos expostos. Quando estas contingências permitem o responder sob controle de
qualquer componente ou propriedade do
evento antecedente para que o reforçamento ocorra, variabilidade e controle restrito
por um dos elementos comumente resulta.
A ocorrência dessa variabilidade depende,
entretanto, de condições antecedentes históricas e presentes, além de características
do organismo. O conhecimento das variáveis independentes que ampliam o controle
Capítulo VI | Atenção
de estímulos (atenção) tem possibilitado o
desenvolvimento de metodologias efetivas
para modificar o padrão de controle de estímulo muitas vezes denominado de “patológico” (Sidman, 1960).
Pesquisas sobre controle de estímulos realizadas com não humanos, como as
de Reynolds (1961), dentre muitas outras,
foram e continuam sendo essenciais para
que pesquisas sobre controle de estímulos
com humanos fossem e continuem sendo realizadas – toda vez que uma criança
apresenta dificuldades para aprender a ler,
por exemplo, temos ali uma possível aplicação para o conhecimento sobre controle
de estímulos. O conhecimento acumulado
produzido tanto por pesquisas com não humanos quanto por pesquisas com humanos
foi essencial para que tecnologias de ensino
eficazes fossem produzidas e aplicadas nos
mais diversos contextos. Graças a todo esse
histórico de produção de conhecimento de
base empírica, analistas do comportamento
têm a possibilidade, hoje em dia, de auxiliar
professores a elaborar estratégias de ensino
que otimizam a aprendizagem de leitura e
escrita de crianças no ensino regular; que
possibilitam melhora na qualidade de vida
de crianças diagnosticadas com algum tipo
de atraso no desenvolvimento, incluindo
desempenhos acadêmicos; e que auxiliam
no desenvolvimento de softwares educacionais mais eficazes, apenas para citar alguns exemplos.
PARA SABER MAIS
da Hora & Benvenuti (2007). Os pesquisadores avaliaram os efeitos de um procedimento conhecido como resposta de observação diferencial sobre o desempenho de
um menino autista em uma tarefa de matching-to-sample (MTS) que utilizou sílabas
e palavras como estímulos. A resposta de
observação diferencial impedia que o responder da criança aos estímulos comparação fosse baseado em apenas uma das sílabas da palavra apresentada como modelo.
Gomes & Souza (2008). Nesta pesquisa
avaliou-se o desempenho de pessoas diagnosticadas com autismo em tarefas de emparelhamento com o modelo por identidade. Buscou-se, na pesquisa, identificar os
efeitos da organização dos estímulos sobre
a aprendizagem dos participantes.
Hanna, Karino, Araújo, & Souza (2010).
Será que aprendemos a ler novas palavras
mais rapidamente treinando a leitura com
palavras semelhantes ou diferentes? Será
que aprendemos a ler novas palavras mais
rapidamente treinando com silabas ou letras? Essa pesquisa tentou responder a essas perguntas.
Alves, de Assis, Kato, & Brino (2011). Nesta
pesquisa investigou-se a aprendizagem de
leitura recombinativa após procedimentos
de esvanecimento de sílabas das palavras
de ensino em pessoas com atraso no desenvolvimento cognitivo.
106
Elenice S. Hanna, Márcio Borges Moreira
REFERÊNCIAS
Alves, K. R. S., de Assis, G. J. A, Kato, O. M.,
& Brino, A. L.F. (2011). Leitura recombinativa após procedimentos de fading in de sílabas das palavras de ensino em pessoas com
atraso no desenvolvimento cognitivo. Acta
Comportamentalia, 19, 183-203.
Anderson, N. B. & Rincover, A. (1982). The
generality of overselectivity in developmentally disabled children. Journal of Experimental Child Psychology, 34, 217-230.
Barros, R. S., Galvão, O. F., Brino, A. L. F.,
Goulart, P. R. K., & McIlvane, W. J. (2005).
Variáveis de procedimento na pesquisa sobre classes de equivalência: contribuições
para o estudo do comportamento simbólico. Revista Brasileira de Análise do Comportamento, 1, 15-27.
Carter, D. E., & Werner, T. J. (1978). Complex learning and information processing
by pigeons: A critical analysis. Journal of
the Experimental Analysis of Behavior, 29,
565-601.
Catania, A. C. (1998/1999). Aprendizagem:
comportamento, linguagem e cognição. Porto Alegre: Artmed.
da Hora, C. L., & Benvenuti, M. F. L. (2007).
Controle restrito em uma tarefa de matching-to-sample com palavras e sílabas:
avaliação do desempenho de uma criança
diagnosticada com autismo. Revista Brasi107
leira de Análise do Comportamento, 3, 2945.
Debert, P., Huziwara, E. M., Faggiani, R. B.,
de Mathis, M. E. S., & McIlvane, W. J. (2009).
Emergent conditional relations in a go/no-go procedure: Figure-ground and stimulus-position compound relations. Journal of
Experimental Analysis of Behavior, 92, 233243.
Dinsmoor, J. A. (1995). Stimulus control: Part
I. The Behavior Analyst, 18, 51–68.
Duarte, A. M. M., & Baer, D. M. (1997). Overselectivity in the naming of suddenly and
gradually constructed faces. In D. M. Baer
& E. M. Pinkston (Eds.), Environment and
behavior (pp. 210-218). Oxford: Westview
Press.
Dube, W. V., & McIlvane, W. J. (1999) Reduction of stimulus overselectivity with
nonverbal differential observing responses.
Journal of Applied Behavior Analysis, 32,
25-33.
Gomes, C. G. S., & Souza, D. G. (2008). Desempenho de pessoas com autismo em tarefas de emparelhamento com o modelo
por identidade: efeitos da organização dos
estímulos. Psicologia: Reflexão e Crítica, 21,
418-429.
Hanna, E., Karino, C., Araújo, V., & Souza,
D. (2010). Leitura recombinativa de pseudopalavras impressas em pseudoalfabeto:
Capítulo VI | Atenção
similaridade entre palavras e extensão da
unidade ensinada. Psicologia USP, 21, 275311.
Johnson, D. F., & Cumming, W. W. (1968).
Some determiners of attention. Journal of
the Experimental Analysis of Behavior, 11,
157-166.
Johnston, J. M., & Pennypacker, H. S. (2009).
Strategies and Tactics of Behavioral Research. New York: Routledge.
Lashley, K. S. (1938). The mechanism of vision: XV. Preliminary studies of the rat’s capacity for detail vision. Journal of General
Psychology, 18, 123-193.
Lovaas, O. I., Schreibman, L., Koegel, R. L.,
& Rehm, R. (1971) Selective responding by
autistic children to multiple sensory input.
Journal of Abnormal Psychology, 77, 211222.
Lovaas, O. I., Koegel, R. L., & Schreibman,
L. (1979). Stimulus overselectivity in autism:
a review of research. Psychological Bulletin,
86, 1236-1254.
Lovaas, O. I., & Schreibman, L. (1971). Stimulus overselectivity of autistic children in
a two stimulus situation. Behavioral Research & Therapy, 9, 305-310.
Ray, B. A. (1969). Selective attention: The
effects of combining stimuli which control
incompatible behavior. Journal of the Expe-
rimental Analysis of Behavior, 12, 539-550.
Reynolds, G. (1961). Attention in the pigeon. Journal of the Experimental Analysis of
Behavior, 4, 203-208.
Sidman, M. (1979). Remarks. Behaviorism, 7,
123-126.
Sidman (1960). Normal sources of pathological behavior. Science, 132, 61-68.
Skinner, B. F. (1953/2003). Ciência e comportamento humano (J. C. Todorov & R.
Azzi, Trads.). São Paulo: Martins Fontes.
Terrace, H. S. (1963). Errorless transfer of a
discrimination across two continua. Jour-nal of the Experimental Analysis of Behavior, 6, 223–232.
Touchette, P. E. (1969). Tilted lines as complex stimuli. Journal of the Experimental
Analysis of Behavior, 12, 211-214.
Verneque, L., & Hanna, E. S. (2012). Tempo
de exposição a estímulos multidimensionais e topografias de controle de estímulo.
Revista Brasileira de Análise do Comportamento, 8, 12-25.
Wilkie, D. M., & Masson, M. E. (1976). Attention in the pigeon: a reevaluation. Journal of
the Experimental Analysis of Behavior, 26,
207-212.
108
Peter Endemann, Candido Pessôa
A resposta de observação: o
papel das respostas sensoriais
para o estabelecimento da
discriminação
Peter Endemann
Universidade de São Paulo
Candido V. B. B. Pessôa
Paradigma Centro de Ciências do Comportamento
Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P Hendry
(Ed.), Conditioned reinforcement (pp. 237-260). Homewood, IL: The Dorsey press.
“A seleção natural atuou sobre o sistema sensorial por meio das consequências impostas aos comportamentos guiados por esse sistemas”
Nilsson (2009)
109
Capítulo VII | Resposta de Observação
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A elaboração do conceito de resposta de observação se deu com o objetivo de
abordar um conjunto de práticas e pressupostos envolvendo a experiência sensorial dos organismos a partir de uma perspectiva comportamental. De modo geral, a
experiência sensorial, compreendida pelo
ver, ouvir, sentir cheiros ou gostos ou sentir a textura de um objeto pelo tato, é tradicionalmente definida por habilidades
tais como a diferenciação e associação de
objetos. De uma perpectiva comportamental, essa experiência foi definida em termos
de discriminação e generalização, isto é,
pelo controle diferencial de respostas por
estímulos do ambiente. Segundo Skinner
(1938/1991), “pode-se dizer que um organismo ‘percebe que dois estímulos são diferentes’ se alguma diferença, qualquer que seja
ela, pode ser identificada no comportamento sob controle daqueles estímulos” (p. 169).
Essas respostas diferenciais são produzidas em um treino discriminativo ou treino
de reforçamento diferencial. Nesse treino,
respostas são reforçadas na presença de
um estímulo (S+ ou SD) e não reforçadas na
presença de outro estímulo (S- ou S-delta).
Nas décadas de 1930 e 1940, o papel
das respostas sensoriais no estabelecimento da discriminação foi empiricamente investigado. Posições opostas entre os diversos pesquisadores da época deram origem a
um longo debate, conhecido como Controvérsia Continuidade vs. não Continuidade.
Foi a partir desse debate que Wyckoff (1952,
1969) elaborou seu problema de pesquisa e
o procedimento experimental para seu estudo.
De um modo geral, o papel das respostas sensoriais foi inserido nos estudos
sobre a discriminação por Karl Lashley
(1929). Essa inserção se deu partir de um
princípio fundamental da Gestalt, a seletividade. Com base nesse princípio, os organismos não percebem ou atentam ao ambiente como um todo, mas apenas a partes
restritas desse ambiente. Segundo autores
como Lashley (1929, 1938, 1942) e Krechevsky (1932, 1937, 1938), o sujeito experimental, ao ser exposto a um treino discriminativo, poderia atentar seletivamente a
estímulos irrelevantes1 para a discriminação
e permanecer respondendo sobre controle
acidental desses estímulos. Nesses casos, o
sujeito poderia não estar aprendendo nada
sobre as contingências de discriminação
programadas. Em síntese, o sujeito poderia,
em função do controle seletivo de estímulos irrelevantes, permanecer em situação
não discriminada mesmo sendo exposto e
produzindo os reforçadores programados a
depender de sua correlação com aqueles esO controle da resposta por estímulos irrelevantes e seu efeito no estabelecimento da discriminação tem sido investigado ao longo das últimas décadas por diversos pesquisadores (e.g. Dinsmoor, 1985; Dopson,
Esber & Pearce, 2010; Endemann, 2013; Hall, 1976; Krechevsky, 1932;
Lawrence, 1949; Mackintosh, 1965; Serna & Carlin, 2001; Spence, 1936;
Trobalon, Miguelez, McLaren & Mackintosh, 2003; Wagner, Logan,
Haberlandt & Price, 1968; Wyckoff, 1952; Zeaman & Denegre, 1967).
1
110
Peter Endemann, Candido Pessôa
tímulos. Exemplos de estímulos irrelevantes poderiam ser a temperatura, o tamanho
ou a textura da caixa experimental em um
treino discriminativo entre as cores verde e
vermelho.
Respostas a estímulos irrelevantes ao
longo do treino discriminativo foram chamadas de tentativas de solução e, segundo
Lashley (1929, 1938, 1942), são parte de uma
gama de atividades e da história do sujeito.
Essas tentativas de solução foram analisadas por Krechevsky (1932, 1938) sob o rótulo
de “hipóteses”. Essas respostas, registradas
sobretudo no início do treino discriminativo, foram discutidas por Lashley e por Krechevsky com base em outro princípio da
Gestalt, o da “organização sensorial”.
O estabelecimento da discriminação
envolveria, assim, uma série de controles
independentes em função do contato sensorial e seletivo com os estímulos presentes. Essa série de controles antecederiam o
contato e o controle diferencial das respostas pelos estímulos S+ e S-. Lashley exemplifica esses controles como “respostas à
posição, à alternação, a dicas oriundas dos
movimentos do pesquisador e que comumente precedem as respostas aos estímulos
correlacionados” (Lashley, 1929, p. 135). O
termo “estímulos correlacionados” utilizado
por Lashley se refere tanto a S+ como a S-,
pois ambos conservam correlações de +1 e
-1 com o reforço, respectivamente2.
Em conclusão, supondo uma priori111
dade da seletividade frente ao treino discriminativo e ao estabelecimento da discriminação, os autores (e.g., Lashley, 1929,
1938) apontavam para a necessidade de se
investigar não apenas o estabelecimento de
respostas diferenciais, mas também de respostas sensoriais que tinham como função
colocar o organismo em contato com os estímulos S+ e S-, relevantes para a diferenciação da resposta. Não se questionava uma
definição comportamental de discriminação, mas a natureza do processo pelo qual o
organismo passava a responder diferencialmente quando exposto ao treino de reforçamento diferencial. Para os autores citados
anteriormente (e.g., Krechevsky, 1932, 1938;
Lashley, 1938) , o estabelecimento da discriminação seria um processo de natureza
descontínua.
Por outro lado, Kenneth W. Spence (1936, 1940, 1945) e Skinner (1938/1991)
assumiam a discriminação como um processo contínuo, envolvendo o acúmulo de
pequenas diferenças entre as respostas na
presença de S+ e S-, em função do reforçamento diferencial (Skinner não participou
ativamente do debate, o que lhe rendeu
críticas, e.g., Krechevsky, 1938). Contudo,
a concepção de que a discriminação seria
Em um treino discriminativo, a correlação dos estímulos é correta e
comumente tratada da seguinte maneira: S+ correlacionado ao reforço
e S- correlacionado à extinção. A extinção se refere à ausência de reforço e, desse modo, o S- é correlacionado, negativamente, ao reforço.
Assim, em um treino discriminativo, podemos nos referir tanto ao S+
como S- como “estímulos correlacionados”. Em termos de probabilidade de a resposta (ou cadeia de respostas) produzir o reforço, temos probabilidade de 100% e 0%, respectivamente, sob o S+ e sob o S-. Estímulos que, de fato, não são correlacionados com o reforço são aqueles que
mantem correlação nula (zero) e a probabilidade de a resposta produzir
o reforço em sua presença é 50% (i.e., ao acaso).
2
Capítulo VII | Resposta de Observação
um processo contínuo de acúmulos de pequenas diferenças foi defendida por Spence). Essa concepção ficou, então, conhecida
como continuísta.
Com o objetivo de se investigar os
processos básicos envolvidos na discriminação, tornar o treino mais eficaz e evitar o
controle acidental das respostas por estímulos irrelevantes, tanto Skinner (1938/1991)
como Spence (1936) estabeleceram algumas
soluções procedimentais. Segundo Skinner,
os experimentos deveriam ser conduzidos
“em caixas à prova de som, escuras, com paredes lisas” (p. 55). Segundo Spence (1936),
uma vez que o interesse é no processo de
diferenciação das respostas aos estímulos
correlacionados com o reforço, o ambiente
experimental bem como a resposta sensorial aos estímulos correlacionados devem
ser os mais simples possível.
Segundo Spence (1936), todos estímulos que incidam sobre o aparato sensorial do organismo quando sua resposta é
reforçada adquirem ou perdem tendências
excitatórias. Assim, ao longo do treino discriminativo, possíveis controles da resposta
por estímulos irrelevantes vão sendo gradualmente eliminados e os estímulos correlacionados com o reforço (i.e., S+ e S-) passam
a controlar diferencialmente a resposta, em
um processo gradual e contínuo.
As posições opostas sobre o processo
de discriminação foram submetidas a uma
série de experimentos nas décadas de 1930
e 1940 (e.g. Ehrenfreund, 1948; Krechevsky,
1932, 1937, 1938; Lashley, 1929, 1938, 1942;
McCulloch & Pratt, 1934; Spence, 1936,
1940, 1945). Nesses experimentos, a principal manipulação (variáveis independentes)
foi o controle e variações em parâmetros
dos estímulos (e.g., quantidade e posição
dos estímulos no ambiente experimental,
variação em suas propriedades físicas – brilho, frequência, textura, etc. – variação em
sua correlação com o reforço) e o desempenho analisado (variável dependente) foi
o número de “acertos” e “erros”. O desempenho foi registrado antes que os sujeitos
atingissem o critério, ou seja, no período em
que os sujeitos se mantinham respondendo tanto na presença do S+ quanto na do
S-. Nesse período, as respostas não discriminadas (em relação aos S+ e S-) produzem
as consequências programadas ao acaso,
ou seja, as respostas produzem reforços em
aproximadamente 50% das vezes. Esse período foi chamado de período pressolução.
A manipulação de parâmetros dos
estímulos e a análise das respostas no período pressolução foram realizadas em conjunto com uma manipulação bem engenhosa. Diversos pesquisadores aplicaram uma
reversão na correlação dos estímulos com o
reforço ainda no período pressolução, isto é,
o estímulo que era S+ passava a ser S- e vice-versa. A justificativa dessas reversões no
período pressolução era que caso a discriminação se estabelecesse por um processo
contínuo, a reversão deveria afetar o número de respostas (acertos e erros) emitidas no
112
Peter Endemann, Candido Pessôa
período pressolução, em comparação a um
grupo controle para o qual a reversão não
era conduzida. Se a discriminação fosse um
processo descontínuo, a reversão dos estímulos no período pressolução não afetaria
necessariamente o número de respostas,
uma vez que essas poderiam ser emitidas
sob controle de outras partes do ambiente (estímulos irrelevantes) que não aquelas
que foram correlacionadas ao reforço.
De todas as manipulações dos parâmetros dos estímulos, a posição na qual o
estímulo era apresentado em um treino de
discriminação visual teve um papel peculiar para o problema de pesquisa de Wyckoff (1969). Ehrenfreud (1948), com base nos
dados inconclusivos dos experimentos até
então realizados, decidiu expor dois grupos
de sujeitos ao mesmo treino discriminativo
e reversão dos estímulos no período pressolução. A única diferença entre os grupos
foi a posição na qual os estímulos eram
apresentados no campo de visão dos sujeitos. Os resultados obtidos por Ehrenfreud
refletem os resultados obtidos ao longo de
todo o debate: quando os estímulos eram
apresentados bem a frente do sujeito, em
uma posição a partir da qual o contato era
favorecido ao longo de todo o treino, os resultados davam maior suporte àqueles que
defendiam a discriminação como um processo contínuo. Quando os estímulos eram
apresentados em outra posição do campo
visual, os resultados davam maior suporte àqueles que defendiam discriminação
como um processo não contínuo.
113
Apesar de o artigo de Ehrenfreud ter
sido publicado em 1948, o efeito da posição
do estímulo já vinha sendo debatido desde
a década de 1930. Ao longo do debate, Spence (1940, 1945), de forma bastante coerente,
analisou a situação experimental dos estudos e inseriu uma questão interessante em
seus argumentos. Segundo Spence, a mera
presença dos estímulos na situação experimental não garante que esses estímulos
incidam no aparato sensorial do sujeito. Segundo Spence, “caso o aparato sensorial do
animal não seja forçado a receber os estímulos correlacionados com o reforço desde
o início do treino, as associações não serão
formadas” (Spence, 1940, p. 276). Nessas situações,
“o animal é requerido a aprender, em
adição à resposta diferencial, uma
resposta perceptual apropriada que o
conduza para a recepção dos estímulos correlacionados ... o animal deve
aprender a orientar e fixar a cabeça
e os olhos afim de receber os estímulos correlacionados” (Spence, 1940, p.
276).
Essas respostas foram chamadas de
respostas de orientação dos órgãos receptores.
Ao inserir a necessidade do aprendizado de uma resposta de orientação dos receptores no debate, Spence (1940, 1945) admite que o animal pode estar respondendo
a estímulos irrelevantes e não estar apren-
Capítulo VII | Resposta de Observação
dendo nada sobre os estímulos correlacionados (i.e., S+ e S-). Mas, nesse caso, segundo Spence (1945), não estaria ocorrendo o
estabelecimento da discriminação sobre o
qual seus interesses estavam centrados. O
autor insistiu, portanto, na simplificação do
ambiente experimental.
Após revisar o debate, Wyckoff levanta críticas ao modelo defendido por Spence
(1940, 1945). Sem necessariamente tomar
um partido no debate, Wyckoff (1952) aponta que a simplificação do ambiente experimental, de modo a minimizar a necessidade
de aprendizado de respostas de orientação
dos receptores (como definidas por Spence),
poderia impor limites ao valor preditivo do
modelo continuísta e de teorias sobre o estabelecimento da discriminação. Segundo
Wyckoff, nem em situações cotidianas nem
em situações controladas de laboratório
seria possível precisar se os animais serão
expostos aos estímulos correlacionados ao
reforço. Em sua tese de doutorado, Wyckoff, manipulou a necessidade de se aprender
a resposta de orientação dos receptores,
além daquelas respostas que produzem (ou
não) o reforço, em um treino discriminativo.
Wyckoff finalizou o doutorado em 1951, publicou um artigo teórico em 1952 e, apenas
em 1969, um artigo que descreve seu estudo
experimental. Os objetivos e o método desse estudo serão descritos a seguir.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O objetivo principal do experimento
de Wyckoff (1969) foi analisar o papel das
respostas de orientação dos receptores no
estabelecimento de uma discriminação. Diferentemente de como essas respostas eram
discutidas, Wyckoff as definiu como respostas que colocam o organismo em contato com estímulos correlacionados com o reforço. Para diferenciá-las das respostas que
produzem o reforço (e.g., bicar um disco em
experimentos com pombos, pressionar uma
barra em experimentos com ratos, chamadas de respostas efetivas), Wyckoff as nomeou de respostas de observação (RO).
Com base na função da RO (i.e., colocar o organismo em contato com os estímulos correlacionados ao reforço) e nos
princípios do condicionamento operante
descritos por Skinner (1938/1991), Wyckoff
(1969) investigou se a produção de estímulos discriminativos teria um efeito reforçador sobre a RO em um treino discriminativo. Essa investigação, segundo Wyckoff
(1952), forneceria um tratamento comportamental ao que vinha sendo nomeado de experiência sensorial e resposta de orientação
dos receptores.
Frente à dificuldade de se registrar a
orientação dos órgãos receptores de sujeitos experimentais, Wyckoff (1969) foi engenhoso e coerente com a definição funcional
da RO. Em seu experimento, usou pombos
114
Peter Endemann, Candido Pessôa
como sujeitos experimentais. Na caixa experimental, um pedal foi posto no piso e
os estímulos correlacionados com o reforço (S+ ou S-) só eram apresentados caso o
pombo o pressionasse. Assim, os pombos
só entravam em contato com os estímulos
ao pressionar o pedal. Os estímulos ficavam
expostos durante todo o tempo em que o
sujeito estivesse pisando o pedal, o que, por
sua vez, definiu a medida a ser registrada
e analisada por Wyckoff: a duração da resposta de observação.
No experimento, foram utilizados 20
pombos mantidos sob um regime de privação de comida. Os pombos foram distribuídos em dois grupos, (Controle e Experimental). Além do pedal, a caixa experimental
continha um disco que podia ser iluminado
de branco, vermelho ou verde e um comedouro retrátil (para apresentação de comida).
Em uma fase preliminar, que durou
45 min, houve a adaptação dos pombos
de ambos os grupos às condições experimentais. Durante os primeiros 15 min dessa fase, o disco foi iluminado de branco e
a primeira bicada no disco produzia acesso
a um comedouro por 4 s em um esquema
de intervalo fixo (FI) 30 s. Durante os 30
min restantes dessa fase, o disco foi iluminado de verde ou de vermelho em períodos
sucessivos de 30 s. As respostas de bicar o
disco davam acesso ao comedouro da mesma forma que nos primeiros 15 min dessa
fase (i.e., sob um FI 30 s). Nesta fase preli115
minar, não havia contingências para pisar
no pedal e tampouco uma correlação entre
as luzes verde e vermelha e o acesso ao comedouro. Os pombos do Grupo Controle
foram expostos a estas condições durante
todo o experimento.
Na Fase Experimental (treino discriminativo), aplicadas apenas aos pombos no
Grupo Experimental, houve cinco sessões
de 75 min e uma de 15 min. Durante as sessões desta fase, respostas de bicar o disco foram mantidas sob um esquema FI 30 s. Esse
esquema se alternava com um esquema de
extinção a cada 30 s. Durante a extinção,
bicadas no disco não produziam acesso ao
comedouro. Durante a fase experimental, a
luz vermelha era correlacionada ao FI 30 s
(i.e., aos reforços) a luz verde era correlacionada à extinção. Entretanto, as luzes verde ou vermelha eram produzidas somente
enquanto o pombo pisasse no pedal, isto é,
quando emitisse a RO. Se o pombo emitisse
a RO e o esquema em vigor fosse a extinção, o disco era iluminado de verde. Quando o pombo pisasse no pedal e estivesse em
vigor o esquema FI 30 s, a luz vermelha se
acendia no disco. Caso o sujeito não emitisse a RO, o disco permanecia iluminado de
branco tanto quando o esquema em vigor
era o FI30 s quanto quando o esquema em
vigor era extinção e as respostas de bicar o
disco produziam o reforço a depender de
qual esquema estava em vigor. Em resumo,
pisar o pedal, emitindo a RO, transformava
um esquema misto FI 30 s extinção em um
esquema múltiplo FI 30 s extinção3.
Capítulo VII | Resposta de Observação
Após as seis primeiras sessões da
Fase Experimental, o Grupo Experimental foi subdividido em três subgrupos A, B
e C. O subgrupo A permaneceu no treino
discriminativo (reforçamento diferencial) e,
assim, a RO continuava a produzir as luzes
verde e vermelha e essas, por sua vez, se
mantinham relacionadas com a extinção e
reforço, respectivamente. Para o subgrupo
B, a relação dos estímulos com o reforço foi
invertida (o estímulo relacionado ao FI 30
s passou a ser o verde e o estímulo relacionado à extinção passou a ser o vermelho); e
o subgrupo C retornou à condições semelhantes aos últimos 30 min da fase preliminar (reforçamento não-diferencial), nas
quais as luzes, apesar de produzidas pela
pressão no pedal, não estavam mais correlacionadas ao reforço (i.e., reforço poderia
ser produzido com a mesma probabilidade
diante da luz verde e vermelha, se o pedal
estivesse pressionado, e branca, se o pedal
não estivesse pressionado).
Resultados e Discussão
Como indicado anteriormente, Wyckoff (1969) registrou o tempo em que o pedal era pressionado, isto é, a duração das
respostas de observação. Com isso, ele analisou variações na duração da RO em função da produção ou não dos estímulos correlacionados com o reforço nos diferentes
Em um esquema múltiplo, dois ou mais esquemas de reforço se alternam e cada um é apresentado conjuntamente a um estímulo diferente.
Em um esquema misto, os esquemas de reforço se alternam, mas não
há estímulos correlacionados diferencialmente com os esquemas em
vigor (Machado, 1982).
3
subgrupos. A duração da RO para o Grupo
Controle foi relativamente alta inicialmente, mas rapidamente diminuiu, permanecendo baixa até o fim do experimento. Para
o Grupo Experimental, a duração da RO
também começou alta para todos os pombos e assim permaneceu para o subgrupo
A, que se manteve no treino discriminativo.
Para o subgrupo B, a duração da RO diminuiu logo que a correlação dos estímulos
foi invertida, mas aumentou assim que a
discriminação foi novamente estabelecida.
Para o subgrupo C, que retornou às condições da fase preliminar após o treino discriminativo (as luzes verde e vermelha podiam
ser produzidas, mas não havia correlação
diferencial com o reforço), a duração da RO
diminuiu em relação à fase em que havia
correlação entre as luzes verde e vermelha
e o reforço.
Em conclusão, Wyckoff (1969) afirmou que a exposição e o contato dos sujeitos com os estímulos discriminativos teve
um efeito reforçador sobre a RO (i.e., pressão ao pedal). Assim, Wyckoff confirmou
que a produção de estímulos discriminativos para a resposta de bicar um disco estabeleceu e manteve a RO. Com base em seus
resultados, Wyckoff (1952, 1969) afirmou
que (1) a probabilidade da RO aumenta ou
permanece alta sob as condições de reforço
diferencial implementadas no treino discriminativo; (2) quando a correlação dos estímulos é invertida, a probabilidade da RO
diminui temporariamente e depois retorna
a um valor alto; e (3) a probabilidade da RO
116
Peter Endemann, Candido Pessôa
diminui ou permanece baixa em situações
de reforço não-diferencial, nas quais os estímulos produzidos pela RO não são correlacionados ao reforço.
Os resultados obtidos autorizaram
Wyckoff (1969) a discutir o papel da RO no
estabelecimento da discriminação tendo
como base os princípios operantes descritos por Skinner (1938/1991). Segundo Wyckoff (1952, 1969), a RO é uma resposta operante cuja consequência é a produção dos
estímulos discriminativos. Definir a resposta de observação por sua função e não por
sua topografia permitiu a Wyckoff delinear
um experimento que facilmente registrou
as respostas de observação. Foi esta genialidade que tornou seu estudo um clássico
na Análise do Comportamento e permitiu
ampliar o uso do conceito de discriminação
para situações em que os estímulos discriminativos não estão claramente dispostos
sobre o aparato sensorial dos indivíduos.
Um aspecto importante da RO vale
ser ressaltado. A emissão da RO tem como
única consequência a produção dos estímulos discriminativos e, portanto, não altera a obtenção dos reforços programados
para uma determinada resposta. A obtenção dos reforços pode ocorrer sem a emissão da RO (i.e., na presença da luz branca).
Em uma discriminação sucessiva (i.e., em
que os estímulos correlacionados com reforço e com extinção se alternam), como
delineada por Wyckoff (1969), todos os reforços programados podiam ser produzidos
117
sem que os pombos emitissem uma única
vez a RO. Esse aspecto levou a alguns desdobramentos importantes na investigação
sobre o estabelecimento da discriminação,
sobre os efeitos comportamentais de reforços condicionados e sobre atenção. Esses
desdobramentos são discutidos a seguir.
DESDOBRAMENTOS
No procedimento de Wyckoff (1969),
chamado de delineamento (ou procedimento) de resposta de observação, o fortalecimento da RO não ocorreu em função direta
da produção do estímulo reforçador primário (i.e., acesso a comida). Como visto, no
estudo de Wyckoff, o valor de reforçador
condicionado das luzes verde e vermelha
foi adquirido em função de suas correlações com os esquemas de reforço (i.e., FI 30
s) e extinção que, por sua vez, controlaram
o aumento na duração da RO. Por meio desse delineamento, vários autores têm investigado essa (correlação) e outras condições
(e.g. temporais) necessárias para o estabelecimento do valor reforçador condicionado
de determinados estímulos.
Como esperado, posições e hipóteses
opostas sobre o reforço condicionado foram
propostas. Um amplo debate se mantém até
os dias atuais. As duas principais hipóteses
são conhecidas como a hipótese da redução da incerteza e a hipótese da redução
do atraso. Autores que propõem a hipótese
da redução da incerteza (e.g. Berlyne, 1957)
Capítulo VII | Resposta de Observação
defendem que a condição necessária para o
estabelecimento e controle da RO é a redução na incerteza gerada pelas respostas aos
estímulos não-correlacionados (estímulos
irrelevantes, tais como a luz branca do esquema misto no estudo de Wyckoff, 1969).
Os autores que propõem a hipótese da redução do atraso (e.g. Fantino, 1977; Fantino
& Logan, 1979), defendem que a condição
necessária para o estabelecimento do valor
reforçador condicionado de um estímulo é
a redução temporal relativa sinalizada pelo
estímulo correlacionado com o reforço primário.
Dinsmoor (1983) discute algumas
questões referentes à RO e apresenta, além
de novas possibilidades de investigação
sobre reforçamento condicionado, um refinamento do estudo de Wyckoff (1969) e do
conceito de resposta de observação. Como
descrito anteriormente, Wyckoff registrou
e analisou a duração da RO em função da
correlação dos estímulos com o reforço.
Dinsmoor, Browne, Lawrence, e Wasserman (1971) registraram e analisaram separadamente a duração da RO nos diferentes
componentes (i.e., na presença dos diferentes estímulos) em um treino de reforçamento diferencial. Os autores notaram que
a duração da RO é maior na presença do S+
do que na presença do S-. Essa assimetria
na duração da RO entre S+ e S- foi definida
pelos autores como observação seletiva e
gerou novas pesquisas sobre o reforço condicionado e sobre o papel da RO no estabelecimento da discriminação (e.g. Dinsmoor
1985; Dinsmoor, Mueller, Martin, & Bowe,
1982).
Com o desenvolvimento de novas
tecnologias, especialmente a de rastreamento dos movimentos oculares, o conceito
de resposta de observação tem sido submetido à novos refinamentos e discussões (e.g.
Endemann, 2008, 2013; Pessôa, 2010; Tomanari, Balsamo, Fowler, Farren, & Dube,
2007; Tomanari & Pergher, 2003). O registro
de parâmetros dos movimentos sacádicos4
(pico de velocidade, amplitude, curvatura) e
da fixação (frequência, duração) tem permitido a análise de novas medidas da RO. De
posse dessas novas medidas, o papel da RO
tem sido analisado em diferentes situações
básicas e aplicadas envolvendo discriminações simples e condicionais, formação de
classes de estímulos equivalentes (e.g. Dube
et al., 1999; Serna & Carlin, 2001), treinamento de habilidades como leitura e resolução de problemas (e.g. Endemann, Pessôa,
Perez & Tomanari, 2010).
CONSIDERAÇÕES FINAIS
Com o objetivo de trazer a discriminação para o campo da análise do comportamento operante, Skinner (1938/1991) deMovimentos sacádicos são os movimentos oculares rápidos, antecedidos e precedidos pela fixação e acomodação dos estímulos no centro
da retina (e.g. Krauzlis, 2008; Madelain, Paeye & Darcheville, 2011; Salthouse & Ellis, 1980). Segundo Krauzlis (2008), um aspecto importante
dos movimentos sacádicos é que “são seletivamente guiados por objetos de interesse do observador, apesar do fato de haver usualmente
no ambiente vários outros objetos distratores” (Krauzlis, 2008, p. 789,
itálico acrescentado).
4
118
Peter Endemann, Candido Pessôa
fendeu que a discriminação e a experiência
sensorial a ela subjacente deveriam ser definidas e analisadas com base em apenas
uma classe de respostas (i.e., aquela que,
pela produção diferencial do reforço, fica
sob controle de estímulos discriminativos).
Wyckoff (1969) foi original em estabelecer
medidas interdependentes entre duas classes de resposta (i.e., a que produz diretamente o reforço e a que produz os estímulos
discriminativos) e em avaliar experimentalmente a resposta de observação bem como
o entrelaçamento desta com a resposta
que produz o reforço. Esse entrelaçamento é mediado por um estímulo com duas
funções: Função reforçadora condicionada para a resposta de observação e função
discriminativa para a resposta que produz o
reforço (e.g., Pessôa & Sério, 2006).
lares). Neste estudo, apresentam-se com
mais detalhes os estudos experimentais e
argumentos da Controvérsia continuidade
vs. não-continuidade.
Pessôa & Sério (2006). Análise teórica sobre as duas contingências envolvidas no
estabelecimento da discriminação. Os autores discutem as duas funções adquiridas
pelo estímulo correlacionado com o reforço: Discriminativo, para a resposta efetiva,
e reforçador condicionado, para a resposta
de observação.
PARA SABER MAIS
Tomanari (2009). Ampla revisão dos estudos sobre a resposta de observação desde
pesquisas precursoras com ratos expostos
a labirintos até investigações mais recentes
sobre o tema. O autor apresenta aspectos
relevantes do delineamento experimental
tais como número de operanda e as diferentes espécies utilizadas nos estudos.
Dinsmoor (1985). Análise teórica sobre o
papel da resposta de observação no estabelecimento da discriminação, em que o autor
critica as posições de Skinner e Spence. O
autor apresenta uma série de estudos sobre
controle de estímulos, destacando o papel
da observação seletiva (desenvolvido desde
o estudo de Dinsmoor et al., 1971).
Pessôa & Tomanari (2015). Diferenciam o
procedimento de resposta de observação
elaborado por Wyckoff (1969) da importância da resposta de observação por ele definida funcionalmente, dando destaque às
possibilidades de pesquisas aplicadas para
a facilitação da aquisição de respostas de
observação.
Endemann (2013). Análise experimental e
teórica sobre o efeito de variações nos estímulos irrelevantes para a aquisição e manutenção da resposta de observação visual
(registrada por meio dos movimentos ocu119
REFERÊNCIAS
Berlyne, D. E. (1957). Uncertainty and conflict: A point of contact between informa-
Capítulo VII | Resposta de Observação
tion theory and behavior concepts. Psychological Review, 64, 329-333.
Dinsmoor, J. A. (1983). Observing and conditioned reinforcement. Behavioral and
Brain Sciences, 6, 693-728.
Dinsmoor, J. A. (1985). The role of observing
and attention in establishing stimulus control. Journal of the Experimental Analysis of
Behavior, 43, 365-381.
Dinsmoor, J. A., Browne, M. P., Lawrence, C. E., & Wasserman, E. A. (1971). A new
analysis of Wyckoff’s observing response.
Proceedings of the 79th Annual Convention,
American Psychological Association (pp.
679-680).
Dinsmoor, J. A., Mueller, K. L., Martin, L. T.,
& Bowe, C. A. (1982). The acquisition of observing. Journal of the Experimental Analysis of Behavior, 38, 249-263.
Dopson, J. C., Esber, G. R., & Pearce, J. M.
(2010). Differences in the associability of
relevant and irrelevant stimuli. Journal of
Experimental Psychology: Animal Behavior
Processes, 36, 258–267.
Dube, W. V., Lombard, K. M., Farren, K. M.,
Flusser, D. S., Balsamo, L. M., & Fowler, T. R.
(1999). Eye tracking assessment of stimulus
overselectivity in individuals with mental
retardation. Experimental Analysis of Human Behavior Bulletin, 17, 8-14.
Ehrenfreund, D. (1948). An experimental
test of the continuity theory of discrimination with pattern vision. Journal of Comparative and Physiological Psychology, 41,
408-422.
Endemann, P. (2008). Resposta de observação e movimento dos olhos em uma situação
de discriminação simples simultânea. (Dissertação de Mestrado). Universidade de São
Paulo, São Paulo.
Endemann, P. (2013). Aprendizado sobre a
(ir)relevância dos estímulos. (Tese de doutorado) Universidade de São Paulo, São Paulo.
Endemann, P., Pessôa, C. V. B. B., Perez, W.
F., & Tomanari, G. Y. (2010). Identificação de
operantes verbais constituintes da leitura
por meio da análise dos movimentos dos
olhos. Psicologia: Teoria e Pesquisa, 27, 139148.
Fantino E. (1977). Conditioned reinforcement: Choice and information. In W.K. Honig & J.E.R. Staddon (Eds.), Handbook of
operant behavior (pp. 313–339). Englewood
Cliffs, NJ: Prentice-Hall.
Fantino, E., & Logan, C. A. (1979). The experimental analysis of behavior: A biological
perspective. New York: W. H. Freeman.
Hall, G. (1976). Learning to ignore irrelevant
stimuli variations within and between displays. Quarterly Journal of Experimental
Psychology, 28, 247-253
120
Peter Endemann, Candido Pessôa
Krauzlis, R. J. (2008). Eye movements. In
L. R. Squire & D. Berg (Eds.), Fundamental
Neuroscience (pp. 775-792). Amsterdam: Elsevier.
Krechevsky, I. (1932). Hypotheses in rats.
Psychological Review, 39, 516-532.
Krechevsky, I. (1937). A note concerning
“the nature of discrimination learning in
animals.” Psychological Review, 44, 97-104.
Krechevsky, I. (1938). A study of the continuity of the problem-solving process. Psychological Review, 45, 107-133.
Lashley, K. S. (1929). Brain mechanisms and
intelligence. Chicago: University of Chicago
Press.
Lashley, K. S. (1938). The mechanism of vision: XV. Preliminary studies of the rat’s capacity for detail vision. Journal of General
Psychology, 18, 123-193.
Lashley, K. S. (1942). An examination of the
continuity theory as applied to discrimination learning. Journal of Genetic Psychology,
26, 241-265.
Lawrence, D. H. (1949). Acquired distinctiveness of cues: I. Transfer between discriminations on the basis of familiarity with
the stimulus. Journal of Experimental Psychology, 39, 770-784.
Mackintosh, N. J. (1965). Selective attention
121
in animal discrimination learning. Psychological Bulletin, 64, 124-50.
Madelain L., Paeye C., & Darcheville, J. C.
(2011). Operant control of human eye movements. Behavioural Processes, 87, 142–148.
Nilsson, D.E., (2009). The evolution of eyes
and visually guided behaviour. Philosophical Transactions of the Royal Society, 364,
2833–2847.
Pearce, J. M., Esber, G. R., George, D. N., &
Haselgrove, M. (2008). The nature of discrimination learning in pigeons. Learning &
Behavior, 36, 188-199.
Pessôa, C. V. B. B. (2010). Efeito de diferentes
treinos de discriminação sobre as fixações
dos olhos de humanos. (Tese de doutorado).
Universidade de São Paulo, São Paulo.
Pessôa, C. V. B. B., & Sério, T. M. A. P. (2006).
Análise do comportamento de observação.
Revista Brasileira de Análise do Comportamento, 2, 143-153.
Pessôa, C. V. B. B., & Tomanari, G. Y. (2015).
Procedimento de resposta de observação e
comportamento de observação. Perspectivas em Análise do Comportamento, 6, 8998.
Salthouse, T. A., & Ellis, C. L. (1980). Determinants of eye-fixation duration. American
Journal of Psychology, 93, 207-234.
Capítulo VII | Resposta de Observação
Serna, R. W., & Carlin, M. T. (2001). Guiding
visual attention in individuals with mental
retardation. In L. M. Glidden (Ed.), International review of research in mental retardation, 24 (pp. 321-357). San Diego, CA: Academic Press.
Skinner, B. F. (1938). The behavior of organisms: an experimental analysis. New York:
Appleton-Century-Crofts.
Spence, K. W. (1936). The nature of discrimination learning in animals. Psychological
Review, 43, 437-449.
Spence, K. W. (1940). Continuous versus
non-continuous interpretations of discrimination learning. Psychological Review, 47,
271-288.
Spence, K. W. (1942). The basis of solution
by chimpanzees of the intermediate size
problem. Journal of Experimental Psychology, 31, 257-271.
Spence, K. W. (1945). An experimental test
of the continuity and noncontinuity theories of discrimination learning. Journal of
Experimental Psychology, 35, 253-266.
Tomanari, G. Y. (2009). Resposta de observação: Uma reavaliação. Acta Comportamentalia, 17, 259-277.
Tomanari, G. Y., Balsamo, L. M., Fowler,
T. R., Farren, K. M., & Dube, W. V. (2007).
Manual and ocular observing behavior in
human subjects. European Journal of Behavior Analysis, 8, 29-40.
Tomanari, G. Y., & Pergher, N. K. (2003).
Observing behavior and eye movements in
a Wyckoff observing response procedure.
Paper presented at the Annual Meeting of
the Association for Behavior Analysis, São
Francisco.
Trobalon, J.B., Miguelez, D., McLaren, I. P
.L., & Mackintosh, N. J. (2003). Intradimensional and extradimensional shifts in spatial learning. Journal of Experimental Psychology: Animal Behavior Processes, 29,
143-152.
Wagner, A. R., Logan, F. A., Haberlandt, K.,
& Price, T. (1968). Stimulus selection in animal discrimination learning. Journal of Experimental Psychology, 76, 171-180.
Wyckoff, L. B. (1952). The role of observing
responses in discrimination learning: Part I.
Psychological Review, 59, 431-442.
Wyckoff, L. B. (1969). The role of observing
responses in discrimination learning. In D.
P Hendry (Ed.), Conditioned reinforcement
(pp. 237-260). Homewood, IL: The Dorsey
Press.
Zeaman, D. & Denegre, J. (1967). Variability
of irrelevant discriminative stimuli. Journal
of Experimental Psychology, 73, 574-580.
122
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
Controle dos processos
atencionais
Edson Massayuki Huziwara
Universidade Federal de Minas Gerais
Candido V. B. B. Pessôa
Paradigma Centro de Ciências do Comportamento
Holland, J. G. (1958). Human vigilance. Science, 128 (3315), 61-67.
“Life is what happens to you while you’re busy making other plans”
John Lennon
123
Capítulo VIII | Atenção
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Notícias a respeito de pessoas diagnosticadas com o Transtorno do Déficit de
Atenção e Hiperatividade (TDAH) tornaram-se consideravelmente frequentes nos
dias atuais. Segundo o Manual Diagnóstico
e Estatístico de Transtornos Mentais (DSM-IV-TR™), o TDAH apresenta como característica principal um “padrão persistente
de desatenção e/ou hiperatividade-impulsividade, mais frequente e grave do que
aquele tipicamente observado nos indivíduos em equivalente estágio de desenvolvimento” (APA, 2002, p. 112). Estima-se que
3% a 6% das crianças em idade escolar de
todo o mundo tenham sido diagnosticadas
com o referido transtorno (Faraone, Sergeant, Gillberg, & Biederman, 2003; Rohde,
Miguel Filho, Benetti, Gallois, & Kieling,
2004), constituindo-se assim em uma das
principais causas de encaminhamento para
os serviços de saúde (Rohde, Barbosa, Tramontina, & Polanczyk, 2000; Rohde et al.,
2004).
Iniciar este capítulo apresentando
considerações acerca do TDAH tem por objetivo ilustrar como questões relacionadas
a processos atencionais estão em evidência
na Psicologia contemporânea. A produção
de conhecimento sobre tais processos continua sendo fundamental para o desenvolvimento de intervenções eficazes (Ketzer,
Gallois, Martinez, Rohde, & Schmitz, 2012;
Reinhardt & Reinhardt, 2013).
O interesse pelos processos atencionais justifica-se não somente pelos aspectos patológicos nele envolvidos, mas também por sua aparente importância nas mais
variadas situações de nossa vida cotidiana.
Por exemplo, um jogador que não se mantiver atento ao jogo reduz suas possibilidades
de vitória; um aluno que não se mantiver
atento à aula, reduz suas possibilidades de
aprender a tarefa; ou, ainda, um motorista que não se mantiver atento ao trânsito,
aumenta suas possibilidades de causar ou
sofrer um acidente.
Estudos sobre processos atencionais
conduzidos nas décadas de 1940 e 1950
utilizavam situações nas quais indivíduos
eram requisitados a detectar a ocorrência de
determinados eventos críticos, porém pouco frequentes, em tarefas longas e propositalmente monótonas. Mackworth (1948),
por exemplo, realizou um experimento no
qual a tarefa dos participantes era observar um mostrador de um relógio analógico.
Em grande parte do tempo, o único ponteiro apresentado nesse mostrador realizava
movimentos em ritmo regular, movendo-se
apenas uma vez por segundo. Os eventos
críticos que deveriam ser detectados pelos
participantes consistiam em movimentos
duplos do ponteiro, ou seja, ocasiões em
que o ritmo era alterado e o ponteiro movia-se duas vezes em um único segundo. Esses
eventos críticos ocorriam 24 vezes em cada
hora de sessão, em intervalos variáveis de
124
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
tempo. O procedimento tinha como objetivo simular situações em que, por exemplo,
um marinheiro observa um sonar para detectar a presença de submarinos inimigos.
Holland (1958) destacou a similaridade desta situação com a de um trabalhador em
uma fábrica que inspeciona produtos em
uma linha de produção para detectar itens
com defeito que raramente aparecem. Nessas situações, apesar da baixa probabilidade de ocorrência de um evento crítico, sua
detecção seria de extrema importância e,
portanto, marinheiros ou trabalhadores deveriam manter-se atentos durante todo o
tempo de execução da tarefa.
Muitos estudos utilizando tarefas
experimentais similares àquela proposta por Mackworth (1948) foram conduzidos. Em geral, os resultados demonstraram que a acurácia em detectar os eventos
críticos diminuía ao longo do tempo (e. g.,
Adams, 1956; Bakan, 1955; Bartlett, Beinert,
& Graham, 1955; Deese & Ormond, 1953;
Fraser, 1950; Mackworth, 1948; 1950). Mais
especificamente, todos ou quase todos os
eventos críticos apresentados no início da
sessão eram detectados. No entanto, principalmente depois dos 30 primeiros minutos,
apenas aproximadamente 30% dos participantes continuavam a detectar na mesma
proporção os eventos que ocorriam. Outro
resultado comum nessas pesquisas era uma
correlação positiva entre a quantidade absoluta de eventos críticos apresentados e a
porcentagem total de eventos detectados
– i.e., em média, 46% dos eventos críticos
125
eram detectados quando 10 apresentações
por hora eram realizadas; no entanto, 88%
dos eventos eram detectados quando 40
apresentações por hora eram realizadas
(Deese & Ormond, 1953). De acordo com
Deese e Ormond, o desempenho altamente
acurado no início da tarefa seria um reflexo dos altos níveis de atenção ou vigilância1 apresentados pelos indivíduos. Ainda
segundo Deese e Ormond, com o passar do
tempo e a consequente fadiga, os níveis de
atenção ou vigilância diminuiriam e isso
produziria uma queda na quantidade de detecções. A correlação positiva entre quantidade absoluta de apresentações de eventos
críticos e porcentagem de detecções, por
sua vez, era explicada fazendo referência
à diferentes níveis de expectativa. Dizia-se
que quanto maior a quantidade de eventos
críticos apresentados até um determinado
momento da sessão, maior também seria a
expectativa de que um próximo evento crítico fosse apresentado dentro de um curto
espaço de tempo. Portanto, a alta expectativa da próxima apresentação de um evento
crítico manteria altos níveis de atenção e
vigilância durante a tarefa, apesar da fadiga
ocasionada pelo decorrer do tempo.
Acerca de tais explicações, baseadas
em constructos teóricos como atenção, vigilância ou expectativa, Holland (1958) argumentou:
Optou-se por traduzir a palavra inglesa “vigilance” por “vigilância”.
Outras possibilidades de tradução, talvez mais provocativas, seriam
“concentração” ou “atenção focada”, termos que aparecem como sinônimos de “vigilance” na edição eletrônica do Oxford Dictionary.
1
Capítulo VIII | Atenção
Esses conceitos dão a aparência de explicar os dados em virtude da sintaxe
das frases. Diz-se que o participante
faz uma detecção porque ele está, naquele momento, vigilante e atento ou
esperando um sinal. Mas, os conceitos
não são menos misteriosos do que os
fenômenos que se propõem a explicar.
Resta a tarefa de descobrir os eventos
que influenciam a vigilância, a atenção ou a expectativa. (p. 62).
Ainda de acordo com Holland (1958),
as diferenças nas quantidades de detecções
realizadas no início ou final da sessão, assim
como a correlação positiva entre quantidade absoluta e percentual de eventos críticos
detectados, como ocorrido, por exemplo,
em Deese e Ormond (1953), são formas de
descrever padrões comportamentais dos
participantes e, como tal, não necessitariam de constructos mentais como atenção,
vigilância ou expectativa para serem explicados.
Diante desse contexto, o desafio estava assim posto: Como estudar o fenômeno da detecção de eventos críticos e explicar resultados muito regulares sem recorrer
a constructos mentais (e.g., expectativa)?
Holland (1958) acreditava que a precisão
em detectar eventos críticos poderia estar
relacionada à emissão de um conjunto de
respostas que aumentaria a possibilidade
de sucesso em tal tarefa, sendo estas denominadas de respostas de observação.
Wyckoff (1952; 1969) definiu respostas de
observação como aquelas que produzem
os estímulos discriminativos para outras
respostas. Manter-se observando o visor
por longos períodos de tempo ou identificar prontamente quais os vários estímulos presentes durante a execução da tarefa
são exemplos de respostas de observação,
uma vez que um evento detectado seria o
estímulo discriminativo para relatar esse
evento e as respostas de observação seriam
mantidas pela produção destes estímulos
discriminativos. Holland foi a primeira pessoa a manipular experimentalmente a frequência e a distribuição temporal das respostas de observação. O seu experimento,
adiante relatado, tornou-se assim um dos
mais clássicos sobre processos atencionais
realizado sob a orientação teórica da Análise do Comportamento.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Holland (1958) teve dois objetivos. O
primeiro foi verificar se a detecção de sinais
seria um reforçador para respostas de observação. O segundo foi medir as respostas
de observação em situações similares às
usadas por Mackworth (1948), para possibilitar uma reinterpretação dos eventos
ocorridos na situação analisada em termos
comportamentais, sem o uso de constructos como expectativa ou atenção.
No experimento de Holland (1958),
a tarefa experimental consistia em par126
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
ticipantes – jovens alistados na marinha
americana – observarem um mostrador
retangular com um ponteiro inicialmente
posicionado na extremidade esquerda. No
início da sessão, o participante era instruído a detectar e relatar o máximo de ocasiões nas quais o ponteiro se movesse da
extremidade esquerda para a extremidade
direita do mostrador (ver Figura 1). O relato
de movimentos do ponteiro era feito pelo
participante ao apertar um botão de relato,
que também recolocava o ponteiro no lugar original. No fim da sessão era informado ao participante quantos sinais ele havia
detectado e o tempo médio de detecção. A
novidade no procedimento proposto por
Holland consistiu em inserir um botão que,
quando pressionado, acendia uma lâmpada
localizada atrás do mostrador, iluminando-o por 0,07s (resposta de observação). Após
esse curto período, a lâmpada era apagada e a única forma de iluminar o mostrador e poder observar o ponteiro novamente
era uma nova pressão ao botão. As sessões
ocorriam em uma sala escura, de maneira
que a única forma de detectar as mudanças
no ponteiro era emitir a resposta de pressionar a lâmpada. Quando um movimento do
ponteiro era detectado, o participante deveria apertar outro botão para informar que
havia detectado um movimento do ponteiro. Este segundo botão tinha duas consequências: (1) acionava um contador de eventos
e (2) recolocava o ponteiro no lugar original,
à esquerda do mostrador, o que possibilitava que um novo movimento do ponteiro
ocorresse. O procedimento permitiu medir
127
Figura 1. Representação do mostrador apresentado aos participantes
no experimento de Holland (1958). A parte esquerda da figura mostra
a posição inicial do ponteiro, antes da ocorrência do evento crítico. A
parte direita mostra a posição do ponteiro depois de ocorrido o evento
crítico. A seta cinza representa o sentido do movimento executado pelo
ponteiro.
com precisão a ocorrência das respostas de
observação – i.e., pressões no botão que iluminava o mostrador – ao longo do experimento.
A questão acerca dos efeitos reforçadores da detecção de eventos críticos
foi solucionada utilizando conhecimentos provenientes de uma das áreas mais
exaustivamente estudadas em Análise do
Comportamento, a saber, os esquemas de
reforço. Esquemas são regras que especificam sob quais condições determinadas
respostas produzem consequências. De
crucial importância para o presente contexto foram experimentos que demonstraram que a taxa de respostas e o padrão
temporal de respostas é determinado por
esquemas (Catania, 1999; Ferster & Skinner, 1957). Mais precisamente, os estudos
encontraram essa modulação de maneira
tão regular, independente do organismo ou
da resposta sob análise, que se torna possível prever o padrão comportamental diante
de cada diferente esquema de reforço utilizado (Machado, 1982; Skinner, 1956). Se,
sob um determinado esquema de reforço,
Capítulo VIII | Atenção
a resposta assume um padrão de emissão
típico do esquema, pode-se concluir que a
contingência de reforço pela qual o reforço
é produzido no esquema está controlando
aquela resposta.
Com base nesse conhecimento, para
fazer com que a oportunidade de realizar
uma detecção (i.e., pressionar o botão que
relatava um movimento do ponteiro) se tornasse contingente à emissão de um determinado padrão de respostas de observação
(i.e., pressionar o botão para o acendimento da lâmpada), Holland (1958) utilizou diferentes esquemas de reforço para a produção de movimentos dos ponteiros pela
emissão de respostas de observação. Caso
os padrões de respostas emitidos pelos participantes no botão que acendia a lâmpada
fossem similares àqueles usualmente descritos quando utilizados os diferentes esquemas de reforço, a hipótese das funções
reforçadoras da detecção de eventos críticos estaria comprovada.
Holland (1958) utilizou três diferentes
esquemas de reforço para avaliar o padrão
de emissão das respostas de observação: um
esquema de intervalo fixo (FI), um esquema
de razão fixa (FR) e um esquema de reforço
diferencial de taxas baixas (DRL). Sob o FI,
uma resposta é reforçada após transcorrido
um período fixo de tempo, contado a partir
de um evento ambiental relevante como a
obtenção do reforço ou o início da sessão;
as respostas que ocorrem antes do final do
período não são reforçadas. Em esquemas
FI, o padrão de respostas é caracterizado
por baixas taxas no início do intervalo e
um aumento na taxa de respostas à medida
que se aproxima o seu final (para uma discussão das exceções a este padrão veja, por
exemplo, Okouchi, 2002). No experimento
de Holland, cinco participantes foram primeiramente expostos a um FI 30s por oito
sessões de 40 min. Ou seja, a primeira resposta de observação (i.e., pressionar o botão
para o acendimento da luz) emitida após 30
s produzia não somente o acendimento da
lâmpada por 0,07s, mas também o movimento do ponteiro no mostrador e a consequente oportunidade de detecção do evento crítico. Em seguida, o valor do intervalo
foi aumentado para 1, 2, 3, e, finalmente, 4
min, com oito sessões sucessivas sob cada
valor do FI.
Sob o FR, a produção do reforço depende apenas da emissão de um número
fixo de respostas, que é contado a partir de
um evento ambiental relevante, como a obtenção do reforço ou o início da sessão. Assim sendo, nesse esquema, a obtenção do
reforçador não está vinculado à passagem
do tempo, existe uma relação direta entre
a taxa de respostas emitida e a taxa de reforços obtida. Talvez por este motivo, o padrão de respostas em FR seja caracterizado
por taxas altas e constantes durante toda a
sessão, sendo muitas vezes possível visualizar pausas no responder que ocorrem tipicamente após cada reforço (diferentes das
pausas após o reforço em um FI, a taxa de
respostas na retomada de um FR inicia-se
128
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
já constante, enquanto em FI ela tende a ser
positivamente acelerada). Holland (1958)
primeiramente expos, por seis sessões de
40 min, sete participantes a um FR 36, ou
seja, a oportunidade de detecção ocorreu
somente após a emissão da 36ª resposta de observação. Então, o valor do FR foi
aumentado, também em blocos de seis sessões, para 60, 84, 108, 150 e, finalmente, 200
respostas por detecção.
Por fim, sob o DRL, uma resposta é
reforçada somente quando emitida após
um intervalo de tempo especificado sem ela
ocorrer. Ao considerar que o esquema reforça diferencialmente o espaçamento temporal entre as respostas, o padrão de respostas
emitidas pelos participantes irá se adequar
ao valor temporal estipulado, mais precisamente, quanto maior for o tempo exigido
para a não ocorrência de respostas, menor será a taxa de respostas. Dessa forma,
o padrão tipicamente obtido sob o DRL é o
de baixas taxas de respostas, com espaçamento temporal entre elas e com ocasionais
emissões de “jorros” de várias respostas
com baixíssimo intervalo. Dois participantes foram expostos a um DRL 30 s, ou seja,
uma resposta de observação iria provocar
o movimento do ponteiro e a consequente
oportunidade de detecção se, e somente se,
fosse precedida por um período mínimo de
30s sem que essa mesma resposta de observação tivesse sido emitida. As sessões
tinham duração de 4h.
Para atingir o segundo objetivo, ve129
rificar como seriam as respostas de observação em uma situação similar à usada por
Mackworth (1948), Holland (1958) usou esquemas de reforço baseando-se nas apresentações de eventos críticos usados por
Mackworth. Nas situações testadas por
Mackworth, os intervalos entre os eventos
críticos (duplos movimentos no ponteiro do
relógio) eram ¾, ¾, 1½, 2, 2, 1, 5, 1, 2, 2, 3 e
10 min em ciclos que ocorriam a cada meia
hora. Na análise do comportamento, um esquema de reforço que ocorre em intervalos
variáveis é denominado esquema de intervalo variável (VI). Sob esse esquema uma
resposta é reforçada quando emitida após
intervalos que variam ao redor de uma média de tempo estabelecido. O VI produz tipicamente uma taxa moderada e constante
de respostas nos intervalos entre reforços.
No caso dos intervalos usados por Mackworth, em média, a cada 1 minuto haveria
um evento crítico para ser detectado. Outro aspecto do procedimento do estudo de
Mackworth era a de que o evento crítico ficava disponível para ser detectado por apenas um breve período de tempo. Em análise
do comportamento, quando o reforço está
disponível para ser consumido por apenas
um determinado período de tempo, chama-se esse período de contenção limitada
(limited hold). Quando se usa a contenção
limitada comumente observa-se o aumento da taxa de respostas em relação à uma
condição sem contenção limitada. Holland
usou uma contenção limitada de 1¼ s. Isto
é, neste caso em que foi usada a contenção
limitada após o movimento do ponteiro, se
Capítulo VIII | Atenção
o participante não detectasse o movimento nesse intervalo de tempo, o ponteiro retornaria automaticamente para a direita e
o participante perderia a oportunidade de
relatar o evento.
Resultados e Discussão
Os padrões de respostas de observação descritos para os participantes em cada
um dos esquemas de reforço utilizados por
Holland (1958) – FI, FR, DRL – foram extremamente similares àqueles usualmente
encontrados em experimentos anteriores
em outros tipos de respostas que também
usaram esquemas de reforço (e.g., Ferster
& Skinner, 1957). Apenas para ilustrar os
efeitos dos diferentes esquemas de reforço
sobre a emissão das respostas de observação, ao comparar os padrões de respostas
de observação nos diferentes esquemas de
reforço, foi possível verificar que, enquanto
o participante sob FR, independentemente
do valor do esquema, emite 600 respostas
em menos de cinco minutos de sessão, o
participante sob DRL emite aproximadamente 290 respostas em 50 minutos de sessão. Tais resultados demonstraram que a
detecção de eventos críticos, de fato, exerce
um papel reforçador para a emissão das respostas de observação, como previa o autor.
Dessa forma, os resultados obtidos
por Holland (1958) demonstraram que os
padrões de ocorrências das respostas de
observação, consideradas em muitos contextos como sendo o reflexo de processos
mentais complexos, podem ser explicados
a partir de conceitos propostos pelo condicionamento operante, fazendo-se referência aos esquemas de reforço que mantêm
essas respostas. De acordo com o autor, não
haveria a necessidade de recorrer a níveis
mentais de explicação, a constructos teóricos como atenção, vigilância ou expectativa, uma vez que o controle exercido pelos
diferentes esquemas de reforço pôde ser diretamente demonstrado no nível comportamental.
O segundo objetivo proposto por
Holland (1958), verificar como seriam as
respostas de observação em uma situação
similar à usada por Mackworth (1948), também trouxe um resultado importante. Assim
como no experimento de Mackwhoth, dois
tipos diferentes de desempenho foram observados entre os participantes de Holland
que foram expostos ao VI com contenção
limitada. Na mesma proporção dos participantes de Mackworth, aproximadamente
30% dos participantes de Holland detectaram todos os movimentos do ponteiro que
eram programados durante o experimento.
Para os outros 70%, a quantidade de eventos detectados teve um declínio acentuado
ao longo da sessão. O que Holland pôde
demonstrar com seu experimento é que
esse declínio foi causado pela diminuição
da emissão de respostas de observação.
Essas respostas de observação, como visto
na parte anterior do experimento, são controladas pelo esquema de reforço em vigor.
Holland demonstrou que os participantes
130
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
que detectaram todos os reforços ao longo
da sessão partiram de uma taxa inicial de
emissão das respostas de observação mais
alta do que os participantes que diminuíram as detecções ao longo da sessão Provavelmente, esse “ponto de partida” com
que cada participante iniciou a emissão de
respostas (alta ou baixa taxa de respostas)
seja devido à história pregressa de reforço
de respostas de observação de cada um.
Os participantes que partiram de uma taxa
mais baixa de emissão de respostas de observação detectaram menos movimentos
no ponteiro. Essa menor detecção é, em
outras palavras, uma menor taxa de reforços. Uma menor taxa de reforços gera uma
menor taxa de respostas (Ferster & Skinner,
1957). Assim, os participantes que já iniciaram o experimento com uma baixa taxa
inicial de emissão de respostas de observação entraram num círculo vicioso de menor
emissão de respostas gerando menor taxa
de reforço e menor taxa de reforço gerando
menor emissão de respostas.
Holland (1958), portanto, demonstrou que a detecção de um evento crítico
(i.e., o movimento do ponteiro) pode controlar a frequência de emissão das respostas de observação (i.e., pressionar o botão
para o acendimento da lâmpada). Vale ressaltar que estudos anteriores explicavam a
ocorrência de tais respostas de observação
como sendo o reflexo de estados mentais
complexos como atenção, vigilância ou expectativa (e.g., Adams, 1956; Bakan, 1955;
Bartlett et al., 1955; Deese & Ormond, 1953;
131
Fraser, 1950; Mackworth, 1948, 1950). Ao
analisar o conjunto dos resultados obtidos
por Holland, foi possível comprovar a hipótese do autor de que é possível explicar
os padrões de ocorrência de tais respostas
a partir dos princípios do condicionamento
operante, especialmente do esquema de reforço em vigor.
Os mesmos princípios sobre o condicionamento operante foram utilizados por
Holland (1958) para reinterpretar alguns dos
achados mais recorrentemente descritos
em experimentos sobre atenção e vigilância até a data de publicação de seu artigo.
O primeiro desses achados refere-se à diminuição na quantidade de detecções feitas pelos participantes ao longo da sessão,
que seria explicado pelo declínio dos níveis
de atenção em função da fadiga (Deese &
Ormond, 1953; Mackworth, 1948, 1950). De
acordo com Holland, a explicação para tal
fato estaria relacionada à taxa de reforço.
Ao longo da sessão, a taxa de emissão de
respostas de observação se adéqua à quantidade de reforços apresentados. Assim, se
a quantidade de apresentações do estímulo reforçador for baixa ou o intervalo entre
reforços for demasiado longo, haverá um
declínio na taxa de respostas de observação
(e.g., Kelleher, Riddle, & Cook, 1962). Em
decorrência da menor taxa de respostas de
observação, menor também será a quantidade de eventos críticos detectados.
Capítulo VIII | Atenção
DESDOBRAMENTOS
Um aspecto a ser destacado acerca do procedimento utilizado por Holland
(1958) refere-se à considerável diferença
entre as respostas que normalmente são
identificadas como respostas de observação
e a resposta instrumental utilizada no referido experimento. Em uma análise extremamente crítica, poder-se-ia argumentar
que o fenômeno comportamental observado por Holland seria de natureza diferente
daquela observada em experimentos sobre
atenção e vigilância, restabelecendo o papel
dos constructos mentais na explicação do
comportamento. Sobre essa questão, o autor afirma:
Em outros estudos sobre vigilância,
o comportamento de observação foi
provavelmente a fixação do olhar ou
os movimentos com a cabeça, bem
como respostas talvez ainda mais sutis. Seria interessante estender a técnica apresentada aqui para algumas
destas respostas, mesmo considerando que, para muitas questões, a topografia da resposta pode não ser tão
importante e os métodos ora utilizados sejam perfeitamente suficientes.
(p. 62).
Portanto, o autor parece concordar
que a resposta de pressionar um botão para
acender uma lâmpada é consideravelmente
diferente de mover o rosto em direção a um
mostrador e permanecer observando-o por
longos períodos de tempo, respostas normalmente relacionada à vigilância. No entanto, de acordo com Holland (1958), uma
vez demonstrada a função reforçadora da
detecção de eventos críticos, elas poderiam
aumentar a probabilidade de ocorrência de
toda e qualquer resposta de observação, independente de qual topografia fosse requerida.
Talvez até de modo contraditório à
afirmação sobre as topografias de respostas, trabalhos posteriores ao de Holland
(1958) estiveram relacionados a criar formas
de registrar e medir o comportamento de
olhar enquanto uma resposta de observação. Em 1968, juntamente com Stephen R.
Schroeder, Holland publicou um artigo no
qual os autores utilizaram um equipamento
que permitiu registrar a frequência e a duração dos movimentos dos olhos dos participantes quando estes observavam partes
específicas em uma tela contendo quatro
mostradores, todos idênticos ao utilizado
no experimento de Holland descrito nesse
capítulo. Neste novo experimento, os participantes também foram instruídos a detectar movimentos de ponteiros em qualquer
um dos quatro mostradores e a manipulação experimental feita também utilizou diferentes esquemas de reforço. Por exemplo,
ao utilizar um FR, um movimento de ponteiro ocorria somente após a 36ª ocasião na
qual o participante tivesse olhado para um
dos mostradores, isto é, emitido a resposta de observação. Os resultados obtidos por
Schroeder e Holland demonstraram que os
132
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
padrões de movimento dos olhos em direção aos mostradores foram sensíveis aos
diferentes esquemas de reforço utilizados
(i.e., FR, FI e DRL).
pectos da segurança no trabalho (e.g., Abernathy & Lattal, 2014; Howell, Johnston, &
Goldstein, 1966).
A similaridade dos resultados obtidos
por Schroeder e Holland (1968), utilizando o
registro movimentos dos olhos, com aqueles descritos em Holland (1958), utilizando o
registro de pressões a um botão, pareceu indicar que a função reforçadora da detecção
de eventos críticos realmente independe
da topografia das respostas e, talvez ainda
mais importante, que a resposta instrumental utilizada em 1958 era, de fato, comparável com as respostas tipicamente identificadas com a atenção (i.e., olhar). Desde
então, uma vasta quantidade publicações
acerca das relações entre as respostas de
observação e o comportamento de olhar
tem sido produzida (e.g., Doran & Holland,
1971; Dube, Balsamo et al., 2006; Dube, Dickson et al., 2010; Huziwara, de Souza, &
Tomanari, 2016; Huziwara, Silva, Perez, &
Tomanari, 2015; Perez, Endemann, Pessôa,
& Tomanari, 2014; Pessoa, Huziwara, Perez,
Endemann, & Tomanari, 2009; Schroeder,
1969a, 1969b, 1970, 1997; Serna & Carlin,
2001).
CONSIDERAÇÕES FINAIS
Em relação à importância do estudo
de Holland (1958) para a manutenção da
atenção em tarefas de vigilância, Holland
(1958) é citado em diversos experimentos da
área, como na manutenção da atenção durante a navegação de barcos (Thomas, 1980)
e aviões (Lewis, 1973) e, em geral, para as133
Como mencionado no início deste capítulo, o TDAH atualmente se constitui em
um sério problema a ser solucionado. Sagvolden, Aase, Johansen e Russell (2005), por
exemplo, apontavam a escassez de dados
sobre tratamentos médicos eficazes para
o subtipo déficit de atenção do TDAH. No
que concerne às contribuições da Análise
do Comportamento, os padrões comportamentais usualmente característicos de pessoas com diagnóstico de déficit de atenção
são, ao menos em parte, explicados a partir
dos gradientes de atraso de reforço (Catania, 2005). Baseado em extensa literatura,
Catania explica que uma das causas do que
chamamos déficit de atenção pode estar relacionada à dificuldade de controle por reforços condicionados. Nos termos do experimento de Holland (1958), caso a distância
temporal entre a identificação de um evento crítico e o reforço obtido por essa identificação for demasiado longa, o movimento
do ponteiro pode não adquirir uma função
reforçadora para manter a resposta de prestar atenção ao (iluminar o) mostrador. Um
valor da distância temporal eficiente varia
entre indivíduos e, assim, no caso do experimento de Holland, pessoas que necessitassem intervalos temporais muito pequenos entre os reforços poderiam deixar de
Capítulo VIII | Atenção
emitir as respostas de observação ao longo
do experimento. Nos limites da revisão de
literatura realizada para o presente capítulo, não encontramos estudos que se apoiem
diretamente no achado de Holland de que
esquemas de reforços influenciariam diretamente a quantidade de atenção em uma
tarefa (para exceção, veja Goldberg & Konstantareas, 1979). Assim, parece permanecer
essa lacuna a ser perseguida sobre a relação
entre os padrões comportamentais gerados
e mantidos por diferentes esquemas de reforço e os padrões comportamentais característicos do déficit de atenção.
Ao considerar todos os aspectos presentes no experimento de Holland (1958),
torna-se possível verificar que a engenhosidade do autor, ao propor uma nova forma
de análise, permitiu a formulação de explicações mais parcimoniosas sobre processos comportamentais. Essa busca por explicações parcimoniosas, como alternativa
para explicações por vezes tão misteriosas
quanto o próprio fenômeno a ser explicado,
é marca dos trabalhos desenvolvidos pelo
autor e, certamente, um exemplo a ser seguido.
PARA SABER MAIS
Pessoa, Huziwara, Perez, Endemann, &
Tomanari (2009). Replicação sistemática dos resultados descritos por Schroeder
(1969a; 1969b; 1970) sobre o comportamento
de olhar em tarefas de discriminação sim-
ples. Os principais resultados referem-se a
uma aparente diminuição no tempo empregado para observar os estímulos ao longo
das sucessivas tentativas de treino.
Dube, Balsamo, Fowler, Dickson, Lombard, & Tomanari (2006). Avaliação do
comportamento de olhar em tarefas de
discriminação condicional utilizando procedimento de emparelhamento de acordo
com o modelo. Resultados sugerem que os
participantes com maiores porcentagens de
acertos em tarefas que envolvem o aprendizado de discriminações condicionais também apresentam maior quantidade de tempo empregado na observação dos estímulos
apresentados.
Artigos de Revisão. Para uma revisão sobre
o controle operante dos movimentos dos
olhos veja Pessôa (2010). Para uma revisão
sobre o papel das respostas de observação como fenômenos atencionais consulte
Rico, Goulart, Hamasaki e Tomanari (2012)
ou Benvenuti, Barros e Tomanari (2014).
REFERÊNCIAS
Abernathy, W. B., & Lattal, D. (2014). Organizational Behavior Management, past,
present, and future. In F. K. Macksweeney
e E. S. Murphy (Eds.), The Willey Blackwell
handbook of classical and operant conditioning, (pp. 645-668). Chichester, WS: John
Willey & Sons, Ltd.
134
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
Adams, J. A. (1956). Vigilance in the detection of low-intensity visual stimuli. Journal
of Experimental Psychology, 52, 204-208.
American Psychiatric Association – APA
(2002). Manual diagnóstico e estatístico de
transtornos mentais - DSM-IV-TR™. 4ª ed.
rev. Porto Alegre: Artmed.
Bakan, P. (1955). Discrimination decrement
as a function of time in a prolonged vigil.
Journal of Experimental Psychology, 50,
387-390.
Bartlett, S. C., Beinert, R. L., & Graham, J.
R. (1955). Studies of visual fatigue and efficiency in radar observation. United States
Air Force Wright Air Development Center
Technical Report, 55-100.
Benvenuti, M. F., Barros, T., & Tomanari, G.
Y. (2014). Atenção, observação e a produção
do comportamento simbólico e do responder relacional. In J. C. de Rose, M. S. C. A.
Gil e D. G. de Souza (Orgs.), Comportamento simbólico: Bases conceituais e empíricas,
(pp. 57-93). São Paulo: Cultura Acadêmica.
Deese, J., & Ormond, E. (1953). Studies of detectability during continuous visual search.
United States Air Force Wright Air Development Center Technical Report, 53-88.
Doran, J., & Holland, J. G. (1971). Eye movements as a function of response contingencies measured by blackout technique. Journal of Applied Behavior Analysis, 4, 11-17.
Dube, W. V., Balsamo, L. M., Fowler, T. R.,
Dickson, C. A., Lombard, K. M., & Tomanari, G. Y. (2006). Observing behavior topography in delayed matching to multiple samples. The Psychological Record, 56, 233-244.
Dube, W. V., Dickson, C. A., Balsamo, L. M.,
Odonnell, K. L., Tomanari, G. Y., Farren, K.
M., Wheeler, E. E., & Mcilvane, W. J. (2010).
Observing behavior and atypically restricted stimulus control. Journal of the Experimental Analysis of Behavior, 94, 297-313.
Faraone, S. V., Sergeant, J., Gillberg, C., &
Biederman, J. (2003). The worldwide prevalence of ADHD: Is it an American condition? World Psychiatry, 2, 104-113.
Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto
Alegre: Artmed.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. East Norwalk: Appleton-Century-Crofts.
Catania, C. A. (2005). Attention-deficit/
hyperactivity disorder (ADHD): Delay-of-reinforcement gradients and other behavioral mechanisms. Behavioral and Brain
Sciences, 28, 397-468.
Fraser, D. C. (1953). The relation of an environmental variable to performance in a
prolonged visual task. Quarterly Journal of
Experimental Psychology, 5, 31-32.
135
Capítulo VIII | Atenção
Goldberg, J. O., & Konstantareas, M. M.
(1981). Vigilance in hyperactive and normal
children on a self-paced operant task. Journal of Child Psychology and Psychiatry, 22,
53-63.
Holland, J. G. (1958). Human vigilance.
Science, 128, 61-67.
Howell, W. C., Johnston, W. A., & Goldstein,
I. L. (1966). Complex monitoring and its relation to the classical problem of vigilance.
Organizational Behavior and Human Performance, 1, 129-150.
Huziwara, E. M., de Souza, D. G., & Tomanari, G. Y. (2016). Patterns of eye movement
in matching-to-sample tasks. Psicologia:
Reflexão e Crítica, 29.
Huziwara, E. M., Silva, M. J. M., Perez, W.
F., & Tomanari, G. Y. (2015). Analyzing the
stimulus control acquisition in simple discrimination tasks through eye movement.
Psicologia: Reflexão e Crítica, 28, 603-612.
Kelleher, R. T., Riddle, W. C. & Cook, L.
(1962). Observing response in pigeons. Journal of the Experimental Analysis of Behavior, 5, 3-13.
Ketzer, C. R., Gallois, C., Martinez, A. L.,
Rohde, L. A., & Schmitz, M. (2012). Is there
an association between perinatal complications and attention-deficit/hyperactivity
disorder-inattentive type in children and
adolescents? Revista Brasileira de Psiquia-
tria, 34, 321-328.
Lewis, M. F. (1973). Frequency of anti-collision observing responses by solo pilots as a
function of traffic density, ATC traffic warnings, and competing behavior. Recuperado
em http://libraryonline.erau.edu/online-full-text/faa-aviation-medicine-reports/
AM73-06.pdf
Machado, L. M. C. M. (1986). Esquemas de
reforçamento positivo: Esquemas simples.
Psicologia, 12, 1-15.
Mackworth, N. H. (1948). The breakdown of
vigilance during prolonged visual search.
Quarterly Journal of Experimental Psychology, 1, 6-21.
Mackworth, N. H. (1950). Researches in the
measurement of human performance. Medical Research Council Special Report Series, 268.
Okouchi, H. (2002). Individual differences
in human fixed-interval performance. The
Psychological Record, 52, 173-186.
Perez, W. F., Endemann, P., Pessoa, C. V.
B. B., & Tomanari, G. Y. (2014). Assessing
stimulus control in a discrimination task
with compound stimuli: evaluating testing
procedures and tracking eye fixations. The
Psychological Record, 65, 83-88.
Pessoa, C. V. B. B. (2010). Efeitos de diferentes
treinos de discriminação sobre as fixações
136
Edson Massayuki Huziwara, Candido V. B. B. Pessôa
do olhos de humanos. (Tese de doutorado).
Instituto de Psicologia da Universidade de
São Paulo.
Pessoa, C. V. B. B., Huziwara, E. M., Perez, W. F., Endemann, P., & Tomanari, G.
Y. (2009). Eye fixations to figures in a four-choice situation with luminance balanced
areas: Evaluating practice effects. Journal of
Eye Movement Research, 2, 1-6.
Reinhardt, M. C., & Reinhardt, C. A. (2013).
Attention deficit-hyperactivity disorder,
comorbidities, and risk situations. Jornal de
Pediatria, 89, 124-130.
Rico, V. V., Goulart, P. R. K., Hamasaki, E.
I. M., & Tomanari, G. Y. (2012). Percepção e
atenção. In M. M. C. Hübner e M. B. Moreira. (Orgs.). Fundamentos de psicologia: Temas clássicos de psicologia à luz da Análise
do Comportamento. 1ed, (pp. 155-210). Rio
de Janeiro, RJ: Guanabara Koogan.
Rohde, L. A., Barbosa, G., Tramontina, S., &
Polanczyk, G. (2000). Transtorno de déficit
de atenção/hiperatividade. Revista Brasileira de Psiquiatria, 22, 7-11.
Rohde, L. A., Miguel Filho, E. C., Benetti, L.,
Gallois, C., & Kieling, C. (2004). Transtorno de déficit de atenção/hiperatividade na
infância e na adolescência: Considerações
clínicas e terapêuticas. Revista de Psiquiatria Clínica, 31, 124-131.
Sagvolden, T., Aase, H., Johansen, E. B., &
137
Russell, V. A. (2005). A dynamic developmental theory of attention-deficit/hyperactivity disorder (ADHD) predominantly
hyperactive/impulsive and combined subtypes. Behavioral and Brain Sciences, 28,
397-468.
Schroeder, S. R. (1969a). Effects of cue factors on selective eye movements and choices during successive discriminations. Perceptual and Motor Skills, 29, 991-998.
Schroeder, S. R. (1969b). Fixation and Choice selectivity during discrimination transfer. Psychonomic Science, 17, 324-325.
Schroeder, S. R. (1970). Selective eye movements to simultaneously presented stimuli
during discrimination. Perception & Psychophysics, 7, 121-124.
Schroeder, S. R. (1997). Selective eye fixations during transfer of discriminative stimulus control. In D. M. Baer, & E. M. Pinkston (Orgs.), Environment and Behavior, (pp.
97–110). Boulder, CO: Westview.
Schroeder, S. R., & Holland, J. G. (1968).
Operant control of eye movements. Journal
of Applied Behavior Analysis, 1, 161-166.
Serna, R., & Carlin, M. T. (2001). Guiding
visual attention in individuals with mental
retardation. International Review of Research in Mental Retardation, 24, 321-357.
Skinner, B. F. (1956). A case history in scien-
Capítulo VIII | Atenção
tific method. American Psychologist, 11, 221233.
Thomas, T. W. (1980). The effects of fatigue
on vigilance in sailing. (Dissertação de mestrado). The University of British Columbia.
Wyckoff Jr., L. B., (1952). The role of observing responses in discrimination learning:
Part I. Psychological Review, 59, 431-442.
138
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
O responder controlado
temporalmente:
desdobramentos da pesquisa
com a tarefa de bissecção
Marilia Pinheiro de Carvalho
Marco Vasconcelos
Armando Machado
Universidade do Minho, Portugal
Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psychology: Animal Behavior Processes, 3, 216-228.
“O que é, pois, o tempo? Se ninguém mo pergunta, sei o que é; mas se quero explicá-lo a quem mo pergunta, não sei.”
(Santo Agostinho, Confissões)
139
Capítulo IX | Bissecção Temporal
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Em fins da década de 1970, já era sabido que as respostas de animais não-humanos podem ser controladas por intervalos de tempo. Por exemplo, as pesquisas
seminais de Pavlov (1927) sobre condicionamento respondente demonstraram que,
quando comida era entregue sucessivamente em intervalos fixos de tempo, a salivação de cães sistematicamente antecipava
os momentos de entrega. Dá-se a esse efeito
o nome de condicionamento temporal (Catania, 1999). A Figura 1 abaixo ilustra um
procedimento de condicionamento temporal e resultados hipóteticos.
Figura 1. Diagrama hipotético de um procedimento de condicionamento respondente temporal. Comida (*) é apresentada sucessivamente em
intervalos fixos de tempo (T). Tipicamente, salivação condicionada
ocorre instantes antes de a comida ser apresentada.
Em um outro estudo clássico, desta
vez com um procedimento de condicionamento operante, Stubbs (1968, Experimento 2) demonstrou que pombos eram capazes
de discriminar estímulos com duração de
MPC e MV contaram com a bolsa de investigação UMINHO/
BI/249/2015 e com a bolsa de investigador IF/01624/2013, respectivamente, ambas da Fundação para a Ciência e Tecnologia (FCT), Portugal.
AM beneficiou da bolsa de licença sabática SFRH/BSAB/113653/2015
da FCT e de uma bolsa da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP: 2015/06491-1) para Professor Convidado na
Universidade Federal de São Carlos, Brasil. Este capítulo foi parcialmente financiado pela FCT e pelo Ministério da Educação e Ciência
através de fundos nacionais, e cofinanciado pelo FEDER sob o acordo
de parceria PT2020 (UID/PSI/01662/2013).
1
2 s a 20 s2. A tarefa consistia em uma discriminação condicional na qual o estímulo
modelo era uma luz que ficava acesa durante um intervalo de tempo variável, e os estímulos comparação eram um disco verde
e um disco vermelho apresentados simultaneamente após o estímulo modelo. Para
receber comida, os pombos deviam bicar o
disco verde se o modelo durasse de 2 a 10 s,
e o disco vermelho se o modelo durasse de
12 a 20 s. Como os estímulos de 2 a 10 s são
os mais curtos das durações treinadas, e os
estímulos de 12 a 20 s são os mais longos,
podemos dizer que respostas no disco verde
são respostas ‘curto’ e que respostas no disco vermelho são respostas ‘longo’.
Stubbs (1968) mediu a proporção
de vezes em que os sujeitos responderam
‘longo’ (i.e., bicaram o disco vermelho) em
função de cada uma durações apresentadas. Dá-se o nome de função psicométrica
à função que relaciona a proporção de uma
das respostas (e.g., “longo”) à duração dos
estímulos (Church, 2002; Richelle & Lejeune, 1980). Se a discriminação fosse perfeita, a função psicométrica deveria assumir
a forma de um degrau (ver painel de cima
da Figura 2): Nenhuma resposta ‘longo’ seria emitida após os estímulos de 2 a 10 s
[P(‘longo’) = 0], e apenas respostas ‘longo’
seriam emitidas após os estímulos de 12 a
20 s [P(‘longo’) = 1].
Stubbs (1968) conduziu três experimentos com intervalos temporais
variando entre 1 e 40 s. Para fins didáticos, ilustramos apenas o caso do
Experimento 2, com intervalos entre 2 e 20 s.
2
140
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
A Figura 2 abaixo (painel de baixo)
esquematiza a tendência geral dos dados
individuais obtidos por Stubbs (1968). A
proporção de respostas ‘longo’ aumentou de
2 a 20 s, confirmando que os pombos eram
capazes de discriminar os estímulos mais
curtos dos estímulos mais longos. Contudo,
o aumento na proporção de respostas foi
gradual, ao invés de ser abrupto e em forma de degrau: A função psicométrica tinha
uma forma ogival, com mínimo e máximo
nas durações extremas de 2 e 20 s, respectivamente.
Figura 2. Painel de cima: Função psicométrica hipotética em forma de
degrau. Painel de baixo: Esquematização do padrão geral das funções
psicométricas obtidas em uma discriminação entre 2 e 20 s por Stubbs
(1968, Experimento 2).
141
Curiosamente, a proporção de respostas ‘longo’ para as durações de 10 e 12 s
esteve próxima de 0.5, ou seja, em cerca de
metade das vezes os sujeitos respondiam
‘curto’ e na outra metade das vezes respondiam ‘longo’ para cada uma destas durações – a despeito de terem sido treinados
a responder ‘curto’ para 10 s e ‘longo’ para
12 s. Com base nestes resultados, Stubbs
(1968) sugeriu que os sujeitos estabeleceram um critério de decisão para responder:
Respondiam ‘curto’ para durações menores
do que o critério e respondiam ‘longo’ para
durações maiores do que o critério. Ainda
de acordo com o autor, o critério estaria
ente 10 e 12 s e quanto mais próxima uma
duração estivesse dele, maior a incerteza
em classificá-la como ‘curta’ ou ‘longa’ – a
incerteza traduz-se em proporções de respostas ‘longo’ próximas de 0.5, como Stubbs
observou nos pombos.
O critério que divide as durações
mais curtas das mais longas também pode
ser tomado como a duração que, do ponto
de vista do sujeito, está equidistante das
durações treinadas. A esta duração, percebida como “o meio do caminho”, por assim
dizer, dá-se o nome de ponto de igualdade
subjetiva (PIS). A pergunta que naturalmente se coloca é qual duração corresponde ao
PIS. A pergunta é relevante porque o valor
do PIS dá pistas sobre a métrica usada pelos
animais para “medir” as durações dos estímulos. Falar da métrica é falar da relação
entre o tempo objetivo (medido pelo relógio) e o tempo subjetivo (inferido a partir do
Capítulo IX | Bissecção Temporal
comportamento). Será a métrica do tempo
subjetivo linear, logarítmica, recíproca, ou
de outro tipo? A Figura 3 abaixo ilustra as
três primeiras métricas.
Tome o caso de uma discriminação
entre 1 s e 4 s. Em uma transformação linear, y = ax + b (painel da esquerda na Figura
3; no nosso exemplo, assumimos que a = 1 e
b = 1), 1 s (x1) é representado subjetivamente
como 2 (y1) e 4 s (x2) é representado como
5 (y2). O PIS é a duração x equivalente ao
valor médio de 2 e 5 da representação subjetiva (ver a seta que projeta no eixo do x o
valor médio da representação subjetiva). A
derivação na Figura 3 (painel da esquerda)
mostra que, se o sujeito usa uma métrica linear, o PIS é a média aritmética (MA) de 1
e 4 s.
Em uma transformação logarítmica,
y = ln(x) (painel central na Figura 3; logarítmo na base e), 1 s (x1) é representado como
zero (y1) e 4 s (x2) como 1.39 (y2). A derivação (painel central) mostra que se o sujeito
usa uma métrica logarítmica, o PIS é a média geométrica (MG) de 1 e 4 s.
Por fim, em uma transformação recíproca, y = 1/x (painel da direita na Figura 3),
1 s (x1) é representado como 1 (y1) e 4 s (x2)
é representado como 0.25 (y2). A derivação
(painel da direita) mostra que, se o sujeito
usa uma métrica recíproca, o PIS é a média
harmônica (MH) de 1 e 4 s.
Generalizando, se ao estimar a duração de n estímulos, t1, t2, ..., tn, os sujeitos usam uma métrica linear, o PIS é
Figura 3. Painel da esquerda: Transformação linear da duração x. Painel central: Transformação logarítmica da duração x. Painel da direita: Transformação recíproca da duração x.
142
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
igual à média aritmética dos estímulos
DESCRIÇÃO DO EXPERIMENTO
t1 + t2 +  + tn 

 MA =
 ; se usam uma métrica
n


Objetivo e método
logarítmica, o PIS é igual à média geométrica dos estímulos ( MG
= n t1 × t2 ×× tn ) ;
e se usam uma métrica recíproca, o PIS é
igual à média harmônica dos estímulos

n
 MH = 1 1
1

t1 + t2 +  + tn





Church e Deluty (1977) determinaram empiricamente o PIS em um dos estudos mais influentes na área do controle
temporal do responder (timing). Eles usaram uma tarefa psicofísica clássica, a tarefa de bissecção, para medir o valor do PIS
em diversas discriminações temporais. Os
resultados revelaram algumas das propriedades centrais do responder controlado
temporalmente em animais não-humanos
e essas propriedades definiram aquilo que
qualquer modelo teórico de timing deve explicar. Para além disso, o estudo de Church e Deluty identificou pela primeira vez
questões importantes sobre a natureza do
controle por estímulos temporais e sobre
a natureza do que é aprendido em tarefas
temporais, sugeriu procedimentos para
analisá-las empiricamente, e avançou com
respostas provisórias a essas questões. Todas elas permanecem em aberto.
A tarefa de bissecção temporal é uma
tarefa de discriminação condicional. Para
ilustrar, considere uma tentativa de treino
típica no estudo de Church e Deluty (1977)
com ratos. Durante o intervalo entre tentativas (ITI, do inglês inter-trial interval), uma
luz de iluminação geral ficava acesa por 30
segundos. Terminado o ITI, a luz geral apagava-se por 2 ou 8 s – o período na escuridão sinalizava o intervalo de tempo a estimar e era o estímulo modelo da tentativa.
Ao fim do intervalo, duas barras de resposta
eram introduzidas na caixa, uma na esquerda e outra na direita do painel de respostas.
Os ratos deviam pressionar uma das duas
barras condicionalmente à duração do intervalo. Respostas corretas (e.g., pressionar
a barra da esquerda após 2 s e a barra da direita após 8 s) eram reforçadas com acesso
a comida e respostas incorretas não produziam consequências (extinção). Para facilitar a descrição, a partir de agora vamos simplesmente dizer que os ratos aprenderam a
responder ‘curto’ após a duração mais curta,
e ‘longo’ após a duração mais longa – independentemente de formalmente as respostas serem pressionar a barra da esquerda ou
da direita.
Quatro grupos de ratos (N = 8) foram
treinados em diversas discriminações ao
longo de seis fases experimentais. Para os
nossos propósitos, é suficiente considerar
apenas as quatro primeiras fases. Na Fase
143
Capítulo IX | Bissecção Temporal
I, todos os grupos aprenderam a discriminação entre 2 e 8 s. Na Fase II, os grupos A
e B aprenderam a discriminação entre 1 e 4
s, e os grupos C e D a discriminação entre 4
e 16 segundos. Na Fase III, os grupos A e B
aprenderam a discriminação entre 4 e 16 s,
e os grupos C e D a discriminação entre 1 e
4 s. Na Fase IV, todos grupos aprenderam a
discriminação entre 3 e 12 s. A Tabela 1 resume as discriminações aprendidas por cada
rações de treino (e.g., no caso da discriminação entre 2 e 8 s, MH = 3.2 s, MG = 4 s e
MA= 5 s). Também nas tentativas de teste,
os sujeitos deviam responder ‘curto’ ou ‘longo’ condicionalmente à duração apresentada na tentativa, mas nenhuma resposta era
reforçada. Concluído o treino discriminativo e o teste de generalização de uma fase
experimental, iniciava-se a fase seguinte.
Tabela 1. Discriminações temporais aprendidas por cada grupo de ratos nas quatro primeiras fases do estudo de Church e Deluty (1977). Em cada célula,
a posição da duração de treino representa a resposta correta. Por exemplo, ‘1 s – 4 s’ significa que, para receber comida, os sujeitos deviam responder
‘esquerda’ após 1 s, e ‘direita’ após 4 s. Adaptado de Church e Deluty (1977).
grupo em cada fase. Doravante, chamaremos as durações treinadas em cada discriminação de ‘durações de treino’.
Cada fase começava com o treino
discriminativo e terminava com um teste
de generalização. O treino discriminativo
incluía apenas tentativas com as durações
de treino, como as descritas acima. O teste de generalização incluía, para além das
tentativas de treino, tentativas de teste em
que eram apresentadas cinco durações intermediárias3 às durações de treino – três
destas durações correspondiam às médias
harmônica, geométrica e aritmética das duAs durações de teste estavam aproximadamente em progressão geométrica, ou seja, cada duração depois da primeira era obtida multiplicando a anterior por uma constante.
3
Com os dados do teste de generalização, Church e Deluty (1977) obtiveram a
função psicométrica e o PIS de cada discriminação treinada. Como o PIS é a duração
que separa os modelos ‘curtos’ dos modelos
‘longos’, ele também pode ser visto como a
duração em que o sujeito divide ao meio,
ou bissecta, o intervalo ente as durações de
treino (e.g., o intervalo entre 2 e 8 s). Daí o
nome do procedimento, bissecção temporal.
Resultados e discussão
A Figura 4 (painel da esquerda) apresenta as funções psicométricas médias
(n=8) obtidas por Church e Deluty (1977) em
144
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
cada uma das quatro discriminações. Todas
as funções psicométricas tinham valores
mínimo e máximo próximos das duraçõs
de treino de cada discriminação e formato
ogival, evidenciando que os pombos eram
capazes de discriminar as diferentes durações.
O painel central da Figura 4 apresenta as mesmas funções psicométricas, mas,
agora, o eixo do x está com as durações
em unidades logarítmicas. No eixo do x, os
valores 1 e 7 correspondem às durações de
treino curta e longa, respectivamente. Os
valores 3, 4 e 5 correspondem às médias
harmônica, geométrica e aritmética das durações de treino de cada discriminação, respectivamente.
A partir das funções psicométricas,
os autores calcularam o PIS de cada discriminação ajustando uma reta aos pontos
correspondentes às três durações centrais
[pontos com coordenadas (3, y), (4, y) e (5,
y)]. Eles escolheram estes pontos porque
se concentravam próximos ao ponto com
coordenadas (x, 0.50), o PIS. Conhecidos
os parâmetros da reta (inclinação e interseção-y), calculou-se o PIS. O painel central
na Figura 4 apresenta os PISs obtidos em
função da média geométrica das durações
treinadas em cada discriminação – para a
discriminação entre 1 e 4 s, MG = 2 s; para 2
e 8 s, MG = 4 s; para 3 e 12 s, MG = 6 s; para
4 e 16 s, MG = 8 s. A figura também mostra
quais seriam os PISs esperados no caso de
eles estarem nas médias4 harmônica e aritmética das durações de treino (ver as linhas
tracejadas na figura). Os resultados mostraram que os PISs praticamente se sobrepuseram às médias geométricas, revelando
que, do ponto de vista dos ratos, a duração
que bissecta o intervalo entre as durações
de treino é a média geométrica das mesmas.
Também à partir das retas ajustadas
às funções psicométricas, os autores calcularam o limiar diferencial de cada discriminação. O limiar diferencial, também denominado de diferença mínima perceptível
(just noticeable difference ou JND), indica
quanto um estímulo de comparação deve
diferir de um estímulo padrão em uma dada
dimensão física para ser percebido como
Figura 4. Painel da esquerda: Funções psicométricas médias obtidas por Church e Deluty (1977). Painel central: Funções psicométricas obtidas por
Church e Deluty (1977) graficadas em uma escala comum em unidades logarítmicas. Painel da direita: PISs médios em função da média geométrica das
durações treinadas em cada discriminação. A linha contínua (MG) indica a média geométrica das durações treinadas. As linhas tracejadas (MH e MA)
indicam as médias harmônica e aritmética, respectivamente.
145
Capítulo IX | Bissecção Temporal
diferente. Se o JND é pequeno, uma pequena diferença entre os estímulos é suficiente
para discriminá-los, se é grande, os estímulos devem diferir bastante para serem discriminados. Para obter o JND de cada rato,
os autores identificaram em cada reta as
durações correspondentes aos pontos com
coordenadas (x1, 0.75) e (x2, 0.25) e depois
calcularam JND = (x1-x2)/2.
Esperamos naturalmente que o JND
seja maior nas discriminações com as durações mais longas. Por exemplo, esperaríamos que ele fosse maior na discriminação
entre 4 e 16 s do que na discriminação entre
1 e 4 s. É fácil percebermos que, por ser uma
medida absoluta da discriminabilidade dos
estímulos, o JND é afetado pela ordem de
grandeza dos estímulos em questão. Conclusões gerais sobre a discriminabilidade
dos estímulos, portanto, deveriam basear-se em uma medida relativa.
A Fração de Weber, obtida dividindo o JND pelo valor do estímulo padrão, t
(FW=JND/t), é frequentemente usada como
um índice relativo da discriminabilidade.
Para calcular a Fração de Weber em cada
discriminação, Church e Deluty (1977) assumiram que o PIS era o estímulo padrão, ou
seja, o critério em relação ao qual os sujeitos
categorizavam as durações como curtas ou
longas. Como em todas as discriminações
A média harmômica é sempre inferior ou igual à média geométrica
que, por sua vez, é sempre inferior ou igual à média aritmética, ou seja,
MH ≤ MG ≤ MA. A igualdade ocorre quando os números são todos
iguais.
4
o PIS estava muito próximo da média geométrica das durações de treino, os autores
assumiram que t = MG em cada discriminação.
As Frações de Weber obtidas eram
relativamente constantes (M = 0.23) e não
diferiram estaticamente entre si. Estes resultados revelaram que, para qualquer ordem de grandeza dos estímulos temporais,
um estímulo deve diferir em cerca de 23%5
do estímulo padrão para ser discriminável.
Em outras palavras, a discriminabilidade
entre duas durações depende de sua diferença relativa e não da sua diferença absoluta. Church e Deluty (1977) verificaram
que, à semelhança de muitas outras dimensões do estímulo, a discriminação da duração também segue a Lei de Weber.
Se a Fração de Weber é constante, é
de se esperar que os sujeitos respondam de
maneira semelhante para durações distintas que representem a mesma proporção
de tempo transcorrido (ou que estejam na
mesma razão). Para ilustrar, voltemos ao
caso das discriminações 1 s vs. 4 s e 4 s vs.
16 s. Na primeira, os sujeitos aprenderam a
responder ‘longo’ após 4 s e a MG = 2 s. Na
segunda, aprenderam a responder ‘longo’
após 16 s e a MG = 8 s. Em ambos os casos,
a proporção entre a duração de treino mais
longa (4 ou 16 s) e a correspondente média
Na literatura em tarefas temporais com animais não-humanos, há
evidencia da Fração de Weber variando entre 0.20 e 0.30 (Richelle &
Lejeune, 1980).
5
146
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
geométrica é de 2. Assim, como a Fração de
Weber é constante, a proporção de respostas
‘longo’ emitidas para cada uma dessas duas
durações longas deveria ser igual: P(‘longo’)
aos 4 s na discriminação 1 s vs. 4 s deveria
ser igual a P(‘longo’) aos 16 s na discriminação 4 s vs. 16 s. O mesmo aconteceria para
as outras durações usadas nos testes.
Church e Deluty (1977) confimaram
este resultado: As proporções de respostas
‘longo’ eram iguais para durações que representavam a mesma proporção em relação à
média geométrica e, portanto, as funções
psicométricas das quatro discriminações
sobrepuseram-se (conferir o painel central
na Figura 4).
A sobreposição das funções psicométricas ilustra uma das propriedades mais
robustas da discriminação temporal em
animais, a propriedade escalar: Tarefas de
bissecção com durações de treino na mesma proporção (1:4 em todas as tarefas em
análise no estudo) induzem funções psicométricas que se sobrepõem quando graficadas na mesma escala. Church e Deluty
(1977) verificaram que a discriminação temporal dos estímulos obedece à propriedade
escalar.
DESDOBRAMENTOS
Responder relacional vs. responder absoluto. Retomemos o nosso exemplo
com o treino discriminativo entre 1 e 4 s.
147
Para facilitar a descrição, dissemos até aqui
que os sujeitos aprendem a responder ‘curto’ para 1 segundo e ‘longo’ para 4 s, quando,
em verdade, eles aprendem, por exemplo, a
pressionar a barra da esquerda após 1 s e a
barra da direita após 4 s. Existe uma diferença fundamental entre afirmar que os sujeitos respondem que uma duração é curta
e a outra é longa, e afirmar que respondem
‘esquerda’ e ‘direita’ em função das durações. A primeira afirmação implica que os
sujeitos respondem com base no valor relativo das durações – isto é, aprendem que 1 s
é curto relativamente a 4 s, que 4 s é longo
relativamente a 1 s e, adicionalmente, quais
respostas emitir para os estímulos curto e
longo; a segunda afirmação implica que
os sujeitos respondem com base no valor
absoluto das durações – isto é, aprendem
quais respostas emitir após 1 e 4 s.
O responder com base no valor relativo dos estímulos, ou o responder relacional, influenciou fortemente o programa de
trabalhos da escola da Gestalt em princípios
do século XX e é um dos tópicos de pesquisa mais antigos da psicologia experimental. Há evidência de responder relacional
controlado pelo brilho (Kohler, 1918/1938),
pelo tamanho (Gulliksen, 1932) e pela forma
(Saldanha & Bitterman, 1951) dos estímulos,
embora interpretações alternativas sejam
possíveis (e.g., Spence, 1936, 1937). Mas será
que animais não-humanos respondem relacionalmente em discriminações temporais?
O estudo de Church e Deluty (1977)
Capítulo IX | Bissecção Temporal
iniciou a linha de pesquisa neste tópico e,
assim, levantou outra questão fundamental no estudo do timing, designadamente,
o quê um animal aprende na tarefa de bissecção. Vejamos como os autores atacaram
o problema. Volte à Tabela 1 e considere as
tarefas realizadas pelos grupos A e B nas
Fases II e III. Na Fase II, ambos os grupos
aprenderam a responder ‘esquerda’ após
1 s e ‘direita’ após 4 s. Se, por um lado, os
sujeitos aprenderam a responder ao valor
relativo das durações, a contingência pode
ser resumida com o esquema ‘curto→esquerda, longo→direita’. Se, por outro lado,
aprenderam a responder ao valor absoluto
das durações, a contingência pode ser resumida como ‘1s→esquerda, 4s→direita’.
A Fase III foi planejada para testar
as duas possibilidades. Ambos os grupos
aprenderam a discriminação entre 4 e 16 s,
mas o mapeamento entre a resposta correta
e a duração do estímulo diferiu entre grupos. Um grupo aprendeu a responder ‘esquerda’ após 4 s e ‘direita’ após 16 s. Observe que se manteve o mapeamento relativo
‘curto→esquerda, longo→direita’ para este
grupo e, por isso, vamos chamá-lo de grupo
Relativo. O outro grupo, em contrapartida,
aprendeu a responder ‘direita’ após 4 s e ‘esquerda’ após 16 s. Neste caso, manteve-se
o mapeamento absoluto ‘4s→direita’ e, por
isso, chamamo-lo de grupo Absoluto.
Church e Deluty (1977) raciocinaram
que, se o responder na discriminação temporal é baseado no valor relativo das durações, o grupo Relativo deveria aprender a
Fase III mais rapidamente do que o grupo
Absoluto. Se, pelo contrário, o responder é
Figura 5. Painel da esquerda. Proporção de acertos para a duração de 4 s obtida nos grupos Relativo e Absoluto por Church e Deluty (1977). Painel
central. Porcentagem de acertos de um sujeito do grupo Relativo para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016). Painel
da direita. Porcentagem de acerto de um sujeito do grupo Absoluto para as durações de 6 e 18 s na fase B do experimento de Carvalho et al. (2016).
148
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
baseado no valor absoluto, o grupo Absoluto
deveria aprender mais rapidamente do que
o grupo Relativo. Os autores compararam a
porcentagem de respostas corretas dos grupos ao longo das sessões de treino da Fase
III, mas analisaram apenas o desempenho
para a duração de 4 s. Os resultados na Figura 5 (painel a) revelaram que o grupo Relativo respondia corretamente em mais de
90% das tentativas ao fim de quinze sessões
de treino, mas o grupo Absoluto respondia
corretamente em menos de 70% das tentativas. Além disso, já na primeira sessão de
treino, o desempenho do grupo Relativo era
mais alto do que o do grupo Absoluto. Com
base nestes resultados, os autores concluíram que os sujeitos aprendem a responder
ao valor relativo das durações em tarefas de
discriminação temporal.
Em nosso laboratório, replicamos
com pombos o experimento de Church e
Deluty (1977). Ensinamos aos animais as
discriminações entre 2 s vs. 6 s e 6 s. vs. 18
segundos e usamos um disco verde e outro
vermelho como estímulos de comparação.
Nossos resultados (painéis b e c na Figura
5; Carvalho & Machado, 2012; Carvalho,
Machado, & Tonneau, 2016), contudo, não
corroboraram aqueles obtidos por Church e
Deluty com ratos. Ao invés, eles mostraram
que (a) na primeira sessão de treino, o desempenho do grupo Absoluto era mais alto
do que o do grupo Relativo na duração de
6 s (a duração comum ao treino das duas
fases e que em nosso procedimento equivalia à duração de 4 s no estudo de Church
149
e Deluty) e (b) ambos os grupos tinham um
desempenho similar e elevado no final do
treino.
Para melhor fundamentar a comparação dos grupos, nós simulamos o desempenho na tarefa com o modelo Learning to
Time (LeT; Machado, 1997; Machado, Malheiro, & Erlhagen, 2009) e, posteriormente,
constratamos as simulações com os dados
empíricos. O LeT é um modelo comportamental que descreve a aquisição e o estado
estável de respostas controladas temporalmente com base em processos de reforçamento, extinção e generalização.
De acordo com o LeT, o início do
estímulo modelo ativa uma série de estados comportamentais que estão ligados às
duas respostas operantes. A velocidade de
ativação dos estados (λ) varia de tentativa
para tentativa e provem de uma distribuição normal, λ ~ N (média = μ, desvio padrão =σ). Quando o sujeito emite uma resposta ao fim do estímulo modelo, a força
do elo associativo entre a resposta emitida
e o estado ativo no momento da resposta é
alterada dependendo da consequência da
resposta: Se foi reforçada, a força aumenta;
se foi extinta, a força diminui. A Figura 6
esquematiza o modelo.
Vejamos o caso da discriminação
‘2s→verde, 8s→vermelho’. Em uma tentativa com um estímulo modelo de 2 s e λ
= 1, o estado n = 2 está ativo no momento
em que o sujeito emite uma resposta, ‘ver-
Capítulo IX | Bissecção Temporal
Figura 6. Diagrama dos componentes do modelo Learning to Time
(LeT) – estados comportamentais, elos associativos e respostas operantes – aplicado à uma tarefa de bissecção temporal. A cor e o tracejado
dos elos indicam a força de ligação entre os estados e as respostas: Linhas pretas contínuas indicam força “elevada”, linhas pretas tracejadas indicam força “intermediária” e linhas cinzas pontilhadas indicam
força “baixa”. Portanto, o estado n = 2 está fortemente ligado a ‘verde’ e
fracamente ligado a ‘vermelho’, e o estado n = 8 está fracamente ligado
a ‘verde’ e fortemente ligado a ‘vermelho’, por exemplo.
de’ por exemplo. A resposta é reforçada e,
portanto, a força do elo entre o estado n=2 e
‘verde’ aumenta e a força do elo entre o estado n=2 e ‘vermelho’ diminui . Se o sujeito
responder ‘vermelho’, a resposta é extinta,
o elo de n=2 e ‘vermelho’ diminui e o elo de
n=2 e ‘verde’ aumenta. Veja na Figura 6 o
elo “forte” (linha preta) de n=2 com ‘verde’ e
o elo “fraco” (linha cinza pontilhada) de n=2
com ‘vermelho’.
Em uma tentativa com um estímulo
modelo de 8 s e λ = 1, o estado n = 8 está
ativo no momento em que o sujeito emite
a resposta ‘vermelho’. A resposta é reforçada, a força do elo entre o estado n = 8 e
‘vermelho’ aumenta e a força do elo entre
o estado n = 8 e ‘verde’ diminui. Raciocínio
semelhante ao já descrito acima aplica-se
ao efeito da extinção da resposta ‘verde’
emitida após 8 s.
O parâmetro λ é uma variável aleatória, e, portanto, o estado ativo ao fim de
um dado estímulo modelo varia de tentativa para tentativa. Contudo, a ativação dos
estados correlaciona-se com a passagem
do tempo e, assim, estados iniciais (e.g., n
= 1, 2, 3) estarão mais provavelmente ativos
durante as respostas ao estímulo de 2 s, e
estados subsequentes (e.g., n = 6, 7, 8) estarão mais provavelmente ativos durante as
respostas ao estímulo de 8 s. Com o treino,
as forças de ligação de todos os estados ativos durante as respostas são alteradas, de
modo que os estados iniciais estarão mais
fortemente ligados a ‘verde’ e os estados
posteriores estarão mais fortemente ligados
a ‘vermelho’. O resultado são dois gradientes de forças de ligação, um para a resposta
‘verde’ e outro para a resposta ‘vermelho’
(observe a gradação da espessura dos elos
associativos na Figura 6). Em cada tentativa, o sujeito emitirá a resposta que tiver o
elo mais forte com o estado ativo ao fim do
estímulo modelo.
Como você deve ter observado, o
LeT assume que as respostas do sujeito são
controladas pela duração absoluta do estímulo modelo (i.e., 2 s ou 8 s) e não pela
sua duração relativa (i.e., ‘curto’ ou ‘longo’).
Ao comparar as simulações do LeT com o
desempenho dos pombos, pudemos avaliar qual é a forma de controle de estímulos
predominante na tarefa de bissecção temporal. As simulações foram genericamente
semelhantes ao desempenho dos pombos
tanto qualitativa, quanto quantitativamente (compare os painéis d e e com os painéis
b e c, respectivamente, na Figura 5). Os resultados dos estudos conduzidos por Carvalho e colaboradores (2012, 2016), portanto,
150
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
sugerem de maneira bastante robusta que o
responder na tarefa de bissecção temporal
é baseado no valor absoluto das durações.
Permanece por identificar sob quais condições os animais aprendem a responder com
base na duração relativa dos estímulos temporais.
Efeitos contextuais na tarefa de bissecção.
Para além dos estudos empíricos,
os pesquisadores do timing também têm
conduzido pesquisas teóricas. Em particular, eles têm proposto vários modelos matemáticos para explicar o desempenho em
tarefas temporais. Dois dos modelos mais
influentes são o LeT, já apresentado, e o
Scalar Expectancy Theory (SET; Gibbon,
1977, 1991; Gibbon & Church, 1984; Gibbon,
Church, & Meck, 1984).
Os dois modelos diferem nos seus
pressupostos sobre o que é aprendido na
tarefa de bissecção temporal. Para compreendermos estas diferenças, tomemos uma
tarefa em que os sujeitos devem responder
‘vermelho’ após 1 s e ‘verde’ após 4 s. De
acordo com o SET, os sujeitos aprendem
apenas as contingências ‘1s→escolher vermelho’ e ‘4s→escolher verde’. O LeT, pelo
contrário, assume que os sujeitos aprendem ‘1s→escolher vermelho e evitar verde’
e ‘4s→escolher verde e evitar vermelho’.
Para testar os pressupostos dos modelos, Machado e Keen (1999) desenvolve151
ram a tarefa de dupla bissecção temporal.
Como o nome da tarefa sugere, os sujeitos
são treinados em duas bissecções temporais.
A primeira é semelhante à que acabamos de
descrever entre 1 e 4 s. Na segunda, aprendem a responder ‘azul’ após 4 s e ‘amarelo’
após 16 s. Para o SET, os sujeitos aprendem
‘4s→escolher azul’ e ‘16s→escolher amarelo’. Para o LeT, eles aprendem ‘4s→escolher azul e evitar amarelo’ e ‘16s→escolher
amarelo e evitar azul’. Aprendidas as duas
discriminações, é conduzido um teste com
durações que variam entre 1 e 16 s e no qual
as opções de reposta são ‘verde’ e ‘azul’.
Os modelos diferem nas previsões
que fazem do desempenho no teste. De
acordo com o SET, os sujeitos deveriam
distribuir aleatoriamente suas respostas
entre ‘verde’ e ‘azul’ durante o teste, porque
no treino prévio eles apenas aprenderam
‘1s→escolher vermelho, 4s→escolher verde, 4s→escolher azul, 16s→escolher amarelo’ e, portanto, não deveriam apresentar
vieses em favor de uma ou outra resposta
em função das diferentes durações. Como
consequência, a proporção de respostas
‘verde’ não deveria variar com as durações
de teste.
De acordo com o LeT, os sujeitos
deveriam preferir ‘verde’ conforme as durações de teste aumentassem porque no
treino prévio os sujeitos aprenderam (a)
a evitar ‘azul após as durações mais longas (próximas de 16 s) e (b) a evitar ‘verde’
após as durações mais curtas (próximas de
Capítulo IX | Bissecção Temporal
1 s). No teste, dada a escolha entre ‘verde’ e
‘azul’, a proporção de respostas ‘verde’ deveria aumentar com o aumento na duração
dos estímulos.
Diversos estudos usaram a tarefa de
dupla bissecção temporal (Arantes & Machado, 2008; Machado & Arantes, 2006;
Machado & Keen, 1999; Machado & Oliveira, 2009; Machado & Pata, 2005; Oliveira &
Machado, 2008, 2009; Vieira de Castro &
Machado, 2012; Vieira de Castro, Machado,
& Tomanari, 2013) e sistematicamente confirmaram as previsões do LeT. A Figura 7
apresenta os resultados obtidos por Machado e Pata (2005) com pombos. Dá-se o nome
de efeito de contexto a este padrão de resultados, porque as respostas no teste são determinadas pelo contexto original em que
os sujeitos aprenderam a escolher ou evitar
consideramos um treino discriminativo em
que as probabilidades de reforço das respostas corretas para cada duração de treino
eram iguais. Church e Deluty (1977) usaram
um esquema de Razão Fixa (FR) 1 para as
respostas ‘curto’ e ‘longo’. Sob este esquema,
verificamos que o PIS está usualmente na
média geométrica das durações de treino. A
linha contínua na Figura 8 ilustra uma função psicométrica hipotética para um treino
discriminativo entre 1 e 4 s no qual as respostas ‘curto’ e ‘longo’ tinham igual probabilidade de reforço. Observe que o PIS da
função é igual a 2 s.
uma resposta em função das durações.
Agora, o que aconteceria com o PIS,
em particular, e com a função psicométrica,
de um modo geral, se conduzíssemos um
treino discriminativo em que uma resposta
tem maior probabilidade de reforço do que
a outra? Por exemplo, o que aconteceria se a
probabilidade de reforço da resposta ‘longo’
fosse de 1.0 e a probabilidade de reforço da
resposta ‘curto’ fosse de 0.2? De maneira semelhante, o que aconteceria se a magnitude
do reforço fosse maior para a resposta ‘longo’ do que para a resposta ‘curto’? Em ambos os casos, esperaríamos que a proporção
de respostas ‘longo’ aumentasse, resultando
em uma função psicométrica que está deslocada para a esquerda da função que consideramos anteriormente, e cujo PIS está
abaixo de 2 s. A linha pontilhada na Figura
8 ilustra o efeito.
Efeitos da probabilidade do reforço
na função psicométrica. Até agora, apenas
De maneira similar, quando a probabilidade de reforço da resposta ‘longo’ fosse
Figura 7. Efeito de contexto obtido por Machado e Pata (2005) com
pombos em uma tarefa de dupla bissecção temporal.
152
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
discrepâncias nas probabilidades e nas magnitudes de reforço. Tais resultados seriam
consistentes com a Lei da Igualação (Herrnstein, 1970) e aproximariam o responder
em discriminações temporais do responder
observado em outros procedimentos que
envolvem escolha. Mais pesquisa sobre o
tópico é claramente necessária.
Figura 8. Funções psicométricas hipotéticas para diferentes probabilidades de reforço na discriminação entre 1 e 4 s. Em cada linha da
legenda, o valor à esquerda representa a probabilidade de reforço da
resposta ‘curto’ e o valor à direita representa a probabilidade de reforço
da resposta ‘longo’.
menor do que a probabilidade de reforço da
resposta ‘curto’, a proporção de respostas
‘longo’ diminuiria, a função psicométrica
deslocar-se-ia para a direita e o PIS seria
superior a 2 s. A linha tracejada na Figura 8
ilustra o efeito.
Até o momento, contudo, os resultados experimentais são escassos e inconsistentes. Stubbs (1976), por exemplo, reportou
deslocamentos consistentes com as previsões em uma tarefa em que a probabilidade
relativa de reforço diferia entre as respostas
‘curto’ e ‘longo’ (ver também Raslear, 1985).
Outros estudos que manipularam a magnitude do reforço, no entanto, revelaram
tanto resultados consistentes quanto resultados inconsistentes com as previsões (e.g.,
Galtress & Kirkpatrick, 2010).
Caso ocorram de fato, os deslocamentos da função psicométrica indicariam
que a distribuição das respostas entre as
duas opções (‘curto’ e ‘longo’) é sensível às
153
CONSIDERAÇÕES FINAIS
O estudo de Church e Deluty (1977)
é hoje considerado um clássico da pesquisa em timing. Por um lado, foi pioneiro na
implementação de uma tarefa de bissecção
temporal recorrendo a um procedimento
psicofísico clássico (i.e., o método de estímulos constantes). Anteriormente, Stubbs
(1968, 1976) tinha utilizado um procedimento similar, mas, ao invés de reforçar apenas
as repostas para as durações mais curta e
mais longa, reforçava também as respostas
para as durações intermediárias. Church e
Deluty, por sua vez, foram os primeiros a
reportar funções psicométricas e PISs obtidos em testes de generalização e sem reforçamento das respostas para as durações
intermediárias. Por outro lado, e porventura mais importante, o estudo de Church e
Deluty deu lugar a uma série de questões
consideradas ainda hoje centrais para a
nossa compreensão da percepção temporal
tanto em humanos como em animais não
humanos.
Como discutido anteriormente, o PIS
Capítulo IX | Bissecção Temporal
na média geométrica sugere uma escala
logarítmica para o tempo subjetivo, combinada com uma regra de decisão baseada
na diferença entre tempos subjetivos. Contudo, logo após o estudo de Church e Deluty (1977), outros autores mostraram como o
PIS na média geométrica pode ser obtido a
partir de uma escala linear e de uma regra
de decisão baseada na razão entre os tempos subjetivos (ver Gibbon, 1991). As questões sobre a métrica da escala subjetiva do
tempo – logarítmica versus linear – e sobre
a regra de decisão permanecem em aberto (e.g., Jozefowiez, Machado, & Staddon,
2013). Da mesma forma, há evidência de responder relacional em algumas circunstâncias (e.g., Zentall, Weaver, & Clement, 2004),
muito embora nosso laboratório tenha encontrado evidências sólidas de responder
absoluto, pelo menos em pombos. Ainda, a
tarefa de bissecção abriu a porta para procedimentos mais complexos como a dupla
bissecção. Esta última tem sido usada para
estudar efeitos de contexto na percepção
temporal, testando previsões contrastantes
de dois modelos proeminentes da área, o
SET e o LeT. Por fim, ainda não são claros
os efeitos da manipulação da probabilidade
e da magnitude do reforço na função psicométrica. Os resultados obtidos por alguns
autores apontam para deslocamentos da
função induzidos por estas manipulações
(Galtress & Kirkpatrick, 2010; Raslear, 1985;
Stubbs, 1976), mas o assunto permanece por
esclarecer cabalmente.
tância do trabalho de Church e Deluty (1977)
são as linhas de pesquisa que abriu. Trinta
e nove anos após a sua publicação, as sugestões nele contidas permanecem atuais e
alvo de forte disputa e investigação.
PARA SABER MAIS
Carvalho & Machado (2012); Carvalho,
Machado, & Tonneau (2016). Em ambos
os artigos, os autores reproduziram o estudo original de Church e Deluty (1977) com
procedimentos que melhoraram o desenho
experimental e a análise de dados para estudar a questão do responder relacional vs.
responder absoluto. Nos artigos, os autores
também apresentam uma revisão detalhada do trabalho de Church e Deluty (1977).
Carvalho, Machado, & Vasconcelos (2016).
Os autores revisam as principais tarefas experimentais usadas na pesquisa em timing
e os principais resultados obtidos até hoje.
Propõem uma abordagem integrativa dos
resultados que se baseia na interação de
gradientes de generalização temporal.
Richelle & Lejeune (1980). Livro de referência na área do timing, escrito por dois dos
principais pesquisadores da área. Resume
os principais procedimentos, resultados e
propriedades do responder controlado por
intervalos de tempo.
A melhor prova do sucesso e impor154
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
REFERÊNCIAS
cesses, 3, 216-228.
Arantes, J., & Machado, A. (2008). Context
effects in a temporal discrimination task:
Further tests of the Scalar Expectancy Theory and Learning-to-Time models. Journal
of the Experimental Analysis of Behavior,
90, 33-51.
Galtress, T., & Kirkpatrick, K. (2010). Reward
magnitude effects on temporal discrimination. Learning and Motivation, 41, 108-124.
Gibbon, J. (1977). Scalar expectancy theory
and Weber’s law in animal timing. Psychological Review, 84, 279-325.
Carvalho, M. P., & Machado, A. (2012). Relative versus absolute stimulus control in the
temporal bisection task. Journal of the Experimental Analysis of Behavior, 98, 23-44.
Gibbon, J. (1991). Origins of scalar timing.
Learning and Motivation, 22, 3-38.
Carvalho, M. P., Machado, A., & Tonneau,
F. (2016). Learning in the temporal bisection
task: Relative or Absolute? Journal of Experimental Psychology, 42, 67-81.
Gibbon, J., & Church, R. M. (1984). Sources
of variance in an information processing
theory of timing. In H. L. Roitblat, T. G. Bever, & H. S. Terrace (Eds), Animal Cognition
(pp. 465-488). Hillsdale, NJ: Lawrence Erlbaum Associates.
Carvalho, M. P., Machado, A., & Vasconcelos, M. (2016). Animal timing: a synthetic
approach. Animal Cognition, 1-26.
Catania, A. C. (1999). Aprendizagem: Comportamento, Linguagem e Cognição (4ª ed.).
Porto Alegre: Artes Médicas.
Church, R. M. (2002). Temporal learning.
In H. Pashler, & R. Gallistel (Eds), Stevens’
Handbook of Experimental Psychology,
Third Edition: Volume 3, Learning, Motivation, and Emotion (pp. 365-393). New York,
NY: Wiley.
Church, R. M., & Deluty, M. (1977). Bisection of temporal intervals. Journal of Experimental Psychology: Animal Behavior Pro155
Gibbon, J., Church, R. M., & Meck, W. H.
(1984). Scalar Timing in Memory. Annals of
the New York Academy of Sciences, 423, 5277.
Gulliksen, H. (1932). Studies of transfer of
response: I. Relative versus absolute factors
in the discrimination of size by the white
rat. Journal of Genetic Psychology, 40, 37-51.
Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of
Behavior, 13, 243-266.
Köhler, W. (1918/1938). Simple structural
functions in the chimpanzee and in the chicken. In W. D. Ellis (Ed), A source book of
Capítulo IX | Bissecção Temporal
gestalt psychology (pp. 217-227). New York:
Harcourt, Brace & World. (Trabalho original
publicado em alemão em 1918).
Machado, A. (1997). Learning the temporal
dynamics of behavior. Psychological Review, 104, 241-265.
Machado, A., & Arantes, J. (2006). Further
tests of the Scalar Expectancy Theory (SET)
and the Learning-to-Time (LeT) model in a
temporal bisection task. Behavioural Processes 72, 195-206.
Machado, A., & Keen, R. (1999). Learning
to Time (LeT) or Scalar Expectancy Theory (SET)? A critical test of two models of
timing. Psychological Science, 10, 285-290.
Machado, A., Malheiro, M. T., & Erlhagen,
W. (2009). Learning to time: A perspective. Journal of the Experimental Analysis of
Behavior, 92, 423-458.
Machado, A., & Oliveira, L. (2009). Dupla
bissecção temporal: testes críticos de dois
modelos de timing. Acta Comportamentalia, 17, 25-60.
Machado, A., & Pata, P. (2005). Testing the
scalar expectancy theory (SET) and the learning-to-time model (LeT) in a double bisection task. Learning & Behavior, 33, 111122.
Oliveira, L., & Machado, A. (2008). The effect of sample duration and cue on a double
temporal discrimination. Learning and Motivation, 39, 71-94.
Oliveira, L., & Machado, A. (2009). Context
effect in a temporal bisection task with the
choice keys available during the sample.
Behavioural Processes, 81, 286-292.
Pavlov, I. (1927). Conditioned reflexes. London: Oxford University Press.
Raslear, T. G. (1985). Perceptual bias and
response bias in temporal bisection. Perception & Psychophysics, 38, 261-268.
Richelle, M., & Lejeune, H. (1980). Time in
animal behaviour. Oxford: Pergamon Press
Ltd.
Saldanha, E. L., & Bitterman, M. E. (1951).
Relational learning in the rat. The American
Journal of Psychology, 64, 37-53.
Santo Agostinho. (2004). Confissões, Livro
XI, XIV, 17 (2ª ed.). Lisboa: Imprensa Nacional da Casa da Moeda.
Spence, K. W. (1936). The nature of discrimination learning in animals. Psychological
Review, 43, 427-449.
Spence, K. W. (1937). The differential response in animals to stimuli varying within
a single dimension. Psychological Review,
44, 430-444.
Stubbs, D. A. (1968). The discrimination of
156
Marilia Pinheiro de Carvalho, Marco Vasconcelos, Armando Machado
stimulus duration by pigeons. Journal of the
Experimental Analysis of Behavior, 11, 223238.
Stubbs, D. A. (1976). Response bias and the
discrimination of stimulus duration. Journal of the Experimental Analysis of Behavior, 25, 243-250.
Vieira de Castro, A. C., & Machado, A. (2012).
The interaction of temporal generalization
gradients predicts the context effect. Journal of the Experimental Analysis of Behavior, 97, 263-279.
Vieira de Castro, A. C., Machado, A., & Tomanari, G. Y. (2013). The context effect as
interaction of temporal generalization gradients: Testing the fundamental assumptions of the Learning-to-Time model. Behavioural Processes, 95, 18-30.
157
Hiroto Okouchi
Como você se sente?
1, 2
Hiroto Okouchi
Universidade Osaka Kyoiku, Japão
Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of
interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15.
“Nós não precisamos supor que eventos que ocorrem dentro da pele de um organismo tem propriedades especiais por essa razão”
(Skinner, 1953, p.257).
158
Capítulo X | Eventos Privados
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Muitas pessoas, não somente os psicólogos mas também os não especialistas
em Psicologia, estão interessados em compreender a “mente”. Analistas do comportamento têm uma perspectiva única sobre ela,
baseada no Behaviorismo Radical (Skinner,
1945).
A entidade hipotética que geralmente tem sido chamada de “mente” está
relacionada com um dos conceitos analítico-comportamentais, os eventos privados.
Eventos privados têm sido geralmente definidos estruturalmente como eventos que
ocorrem dentro da pele de uma pessoa (Catania, 1992, p.388) e, funcionalmente, como
eventos que são diretamente acessíveis a
apenas uma pessoa (Skinner, 1953, p.257).
Sentimentos, como “depressão” e “entusiasmo”, são eventos privados não só estruturalmente, mas também funcionalmente,
porque ocorrem dentro da pele de uma pessoa e estão diretamente acessíveis apenas
para ele ou ela. Tais sentimentos, em geral, são considerados como “elementos da
mente” (Dicionário de Inglês Oxford, 2004,
pp.1047-1048).
Tradução realizada por João Henrique de Almeida, Carlos Renato Xavier Cançado e Paulo Guerra Soares. O primeiro tradutor é bolsista de
pós-doutorado FAPESP processo número 2014/01874-7.
1
O artigo descrito nesse texto foi traduzido para a língua portuguesa
por Júlio de Rose e está publicado: Lubinski,D. & Thompson, T. (2010)
Um modelo animal de comunicação interpessoal de estados interoceptivos (privados). Revista Brasileira de Análise do Comportamento, 6,
229-252.
2
Em oposição aos eventos privados,
eventos que ocorrem fora da pele de uma
pessoa e/ou eventos que são diretamente acessíveis a mais do que um indivíduo
podem ser chamados de eventos públicos.
O pressionar de uma barra por um rato e a
entrega de uma pelota de comida, durante
um experimento de condicionamento operante, são exemplos típicos de eventos públicos. A análise experimental do comportamento tem acumulado um extenso corpo
de conhecimento sobre as relações sistemáticas entre tais eventos públicos (Ferster &
Skinner, 1957, Honig, 1966; Honig & Staddon, 1977; Iversen & Lattal, 1991; Madden,
2013).
Analistas do comportamento presumem que eventos privados obedecem os
mesmos princípios comportamentais revelados pela análise experimental de eventos públicos. De acordo com este ponto de
vista, por exemplo, até mesmo descrever
nossos próprios sentimentos é um resultado de contingências de reforçamento.
Skinner (1945) argumentou que as respostas verbais sob controle de estímulos privados são estabelecidas e mantidas principalmente pelas contingências de reforço
“arranjadas” por outras pessoas. Suponha
que uma pessoa “deprimida” (um falante),
diga: “Estou deprimido.” Se alguém (um ouvinte) ouviu e entendeu a reclamação (isto
é, se o ouvinte pertencesse a uma mesma
comunidade verbal que o falante e pudesse
reagir de forma adequada ao que o falante disse), e se o ouvinte soubesse que o fa159
Hiroto Okouchi
lante tinha experimentado um evento que
normalmente provoca sentimentos de depressão (por exemplo, a perda de um ente
querido), o ouvinte poderia dizer: “Eu sei
exatamente como você se sente.” Comportamentalmente, o sentimento de depressão,
a queixa “estou deprimido”, e as palavras de
conforto “Eu sei exatamente como você se
sente”, respectivamente, são um estímulo
discriminativo, uma resposta e um reforçador do comportamento verbal do falante.
Uma resposta verbal (e.g., “vermelho”) a um
estímulo público (e.g., um cartão vermelho)
pode ser estabelecida pelo reforço dado por
outros (e.g., “Correto, esta é a cor do cartão.”). Os analistas do comportamento supõe que descrever os próprios sentimentos
(e.g., estar deprimido), também é aprendido
(e.g., Skinner, 1953, pp.257-282).
Skinner (1945) também demonstrou
que o relato de uma pessoa sobre um estímulo privado não ocorre por reforço direto,
mas por meio de generalização. Uma pessoa
pode descrever seu sentimento novo como
“deprimido(a)” se ele ou ela aprendeu que a
palavra “deprimido(a)” é usada quando algo
(e.g. uma barra) foi empurrado para baixo
(generalização de eventos públicos para os
privados, Skinner, 1957, pp.132-133) ou a
palavra é usada quando ele ou ela experimenta um sentimento semelhante ao sentimento novo (i.e. generalização de eventos
privados conhecidos para aqueles desconhecidos).
Apesar da grande quantidade de
160
análises conceituais (e.g., Leigland, 2014;
Schlinger, 2011; Tourinho, 2006), análises
experimentais de eventos privados têm
recebido relativamente pouca atenção. O
experimento conduzido por Lubinski e
Thompson (1987) é um dos raros casos em
que foi praticada uma análise experimental
de eventos privados.
DESCRIÇÃO DO EXPERIMENTO
Objetivos e Método
O objetivo do experimento de Lubinski e Thompson (1987) foi avaliar se animais não-humanos poderiam aprender a
interagir comunicativamente, com base em
eventos em seu ambiente interno.
Figura 1. Painéis adjacentes de trabalho das caixass para os dois grupos
de pombos. Os painéis de trabalho foram separados por uma divisória
de acrílico Os mandadores foram treinados na caixa esquerda; os tateadores foram treinados na caixa direita (figura reproduzida da tradução
de Lubinski & Thompson, com permissão da ReBAC e JEAB).
Capítulo X | Eventos Privados
Figura 2. Uma comunicação entre dois pombos com base na ingestão de drogas (estado interno) de um dos pombos. Da esquerda para a direita, os cinco
quadros (A-E) mostram os componentes sucessivos do procedimento. Os pombos à esquerda e à direita em cada quadro eram o mandador e o tateador,
respectivamente (reproduzida da tradução de Lubinski & Thompson, 1987, com permissão da ReBAC e JEAB).
Os sujeitos foram cinco pombos
White Carneau fêmeas, experimentalmente ingênuas, distribuídos em dois grupos,
denominados “mandadores” (dois pombos)
e “tateadores” (três pombos).
Duas caixas experimentais contíguas, separadas por uma divisória de acrílico transparente, que permitiu que os pombos vissem um ao outro, foram usadas (ver
Figuras 1 e 2). Os mandadores foram treinados na caixa esquerda, os tateadores na
direita. Antes de serem colocados em suas
caixas simultaneamente, cada pombo foi
treinado individualmente.
Os tateadores, que estavam privados
de água e comida durante o experimento,
foram treinados em uma cadeia comportamental com dois componentes, em que o
primeiro componente compreendia uma tarefa pareamento ao modelo arbitrária (arbitrary matching-to-sample )(o procedimento deste treino será resumido em seguida).
Após o treino, a cadeia comportamental estabelecida era a seguinte: (a) O tateador era
injetado com um depressor (pentobarbital),
um estimulante (cocaína) ou uma solução
salina isotônica; (b) três discos de resposta,
cada um marcado com a letra “D”, “N”, ou
“Σ” foram iluminados (Figura 1); (c) bicadas
correspondentes à substância injetada (o
disco “D” para o pentobarbital, o disco “Σ”
para a cocaína, e o disco “N” para a solução
161
Hiroto Okouchi
salina) foram seguidas pela apresentação de
uma luz azul piscando acima dos discos de
resposta; (d) as respostas em um disco acima de um comedouro (disco da comida) e
em um disco acima de um bebedouro (disco da água) foram reforçadas com comida e
água, respectivamente.
A tarefa de pareamento ao modelo
que os tateadores experimentaram é conhecida como um procedimento de discriminação de drogas (drug discrimination):
reforçar um tipo de comportamento após a
administração de uma droga e reforçar outro comportamento após a administração
de nenhuma droga ou alguma outra droga (Branch, 1991). Na ausência de qualquer
estímulo diferencial exteroceptivo correlacionado com qualquer comportamento,
escolhas produziam reforçadores mais frequentemente do que ao acaso e poderiam
ser atribuídas a estímulos interoceptivos
decorrentes da substância administrada
(e.g., a droga ou a solução salina). Assim,
os tateadores no experimento de Lubinski
e Thompson (1987) foram treinados para
“relatar seus sentimentos” pela tarefa de
pareamento ao modelo. Foram necessários
aproximadamente sete meses para os tateadores responderem de forma consistente
(i.e., pelo menos 80% de respostas corretas)
nesta tarefa.
Um segundo objetivo do experimento Lubinski e Thompson (1987) foi avaliar
se as respostas dos pombos aos seus eventos internos (privados) poderiam funcionar
162
como um tato, o que foi estudado na parte
final do experimento (descrito em seguida).
Um tato, uma unidade do comportamento
verbal, é “um operante verbal em que uma
resposta de determinada forma é evocada
(ou pelo menos fortalecida) por um determinado objeto ou evento ou propriedade
de um objeto ou evento” (Skinner, 1957,
pp. 81-82). Citando vários outros autores
(e.g., MacCorquodale, 1969; Skinner, 1957,
pp.81-82), Lubinski e Thompson afirmam
que tatos não são mantidos por reforços
específicos, nem mudam com o estado de
privação ou de estimulação aversiva do indivíduo, mas são mantidos por reforçadores
condicionados generalizados (e.g., dizendo
“Correto” quando alguém nomeia com precisão a cor de um cartão vermelho dizendo
“Vermelho”). A fim de alcançar este segundo objetivo, Lubinski e Thompson tentaram
estabelecer a luz azul intermitente como
um reforçador condicionado generalizado
que pudesse manter o comportamento dos
tateadores. Os tateadores foram privados
de comida de forma mais rigorosa do que
eles foram privados de água em um dia (i.e.,
privação de comida por 28 hr e privação de
água por 4hr), e eles foram privados de água
de forma mais rigorosa do que eles foram
privados de comida em outro dia (i.e., privação de água por 28 hr e privação de comida
por 4hr). Alternando essas duas condições
de uma forma A-B-A-B, os tateadores escolhiam comida e água indiferenciadamente
quando a luz azul estava piscando.
Um mando, uma unidade mais pri-
Capítulo X | Eventos Privados
mitiva do comportamento verbal, é “um
operante verbal em que a resposta é reforçada por uma consequência particular, e está,
portanto, sob controle funcional das condições relevantes de privação ou de estimulação aversiva” (Skinner, 1957, pp.35 -36).
Dizer a palavra “Doce” é um exemplo de um
mando quando reforçado pelo acesso a doces, e a resposta “Doce” será mais provável
de ocorrer após um período de privação de
doces ou comida (Skinner, 1957, p.35). Os
mandadores, que foram mantidos sob privação de comida a 85% de seu peso com
livre acesso a comida, foram treinados em
uma cadeia comportamental com três componentes, em que o terceiro componente
envolvia uma tarefa de pareamento ao modelo arbitrário. A cadeia estabelecida para
o mandador era a seguinte: (a) foi iluminado um disco com letras em Inglês dispostas
para formar as palavras (Figura 1); “Como
você se sente?”; (b) as bicadas do mandador
ao disco “Como você se sente” foram seguidas pela iluminação de um outro disco rotulado “Obrigado”; (c) quando o mandador
bicava o disco “Obrigado”, a letra “D”, “N”,
ou “Σ” era projetada em um disco modelo;
(d) bicar o disco modelo e, em seguida, bicar
o disco de comparação contendo a resposta com a correspondência correta (o disco
“P” para a letra “D”, o disco “C” para a letra
“Σ”, e o disco “S”para a letra”N”) produziam
comida. Depois de ambos os mandadors e
tateadores adquirirem independentemente
a precisão necessária (i.e., pelo menos 80%
de respostas corretas) no encadeamento,
tateadores e mandadors individuais fo-
ram colocados nas suas caixas simultaneamente. Como a Figura 2 ilustra, a interação comportamental necessária de cada par
mandador-tateador foi: (a) foi iluminado o
disco do mandador “Como você se sente?” e
o mandador bicava esse disco; (b) foram iluminados todos os discos de comparação do
tateador (i.e., os discos “D”, “N”, e “Σ”) e o tateador bicava o disco de comparação correlacionado com a substância injetada (ou os
próprios “sentimentos” do tateador); (c) foi
iluminado o disco “Obrigado” na caixa do
mandador e o mandador bicava esse disco;
(d) a letra (“D”, “N”, ou “Σ”, i.e., o “nome” da
droga ou o relato do tateador de seus “sentimentos”) previamente bicada pelo tateador
aparecia no disco modelo do mandador e a
luz azul começava a piscar a caixa do tateador; o mandador bicava o disco modelo e,
em seguida, bicava do disco de comparação
correto; o tateador bicava o disco da comida
ou da água, produzindo comida ou água; (e)
o mandador recebeu comida. Se o tateador
bicasse o disco de comparação não correlacionado com a substância injectada (uma
resposta incorreta), as luzes da caixa eram
escurecidas por 4 s e o elo inicial da cadeia
(a) era reiniciado. Assim, o estímulo modelo
apresentado ao mandador sempre foi correto. Ambos os mandadors trabalharam com
cada um dos tateadores. Os pombos foram
testados nessa interação por 40 sessões experimentais.
Deve-se notar que o experimento
de Lubinski e Thompson (1987) apresentava duas fases adicionais (Fases 2 e 3). Na
163
Hiroto Okouchi
Fase 2, os tateadores foram injetados com
novas drogas, clordiazepóxido e d-anfetamina, que possuem propriedades farmacológicas em comum com o pentobarbital
e cocaína, respectivamente, como um teste de generalização. Na Fase 3, os autores
examinaram se as respostas dos tateadores
aos seus eventos privados funcionavam
realmente como tatos. Foram testados os
desempenhos dos tateadores quando foram
colocados em suas caixas experimentais
depois de receberem 24 horas de acesso livre a alimento e água (os tateadores foram
saciados com alimento e água), e quando
suas respostas corretas produziam apenas a
luz azul piscando, mas que não produziam
água ou comida (as respostas corretas dos
tateadores produziam apenas reforçadores
condicionados).
Resultados e Discussão
Resultados da Fase 1.
Como apenas uma única substância
(pentobarbital, cocaína, ou salina) foi injetada antes de cada sessão, a escolha correta para o tateador foi a mesma em todas as
tentativas em uma sessão. Assim, o desempenho dos tateadores na primeira tentativa
de uma sessão foi importante neste experimento. Tanto o mandador quanto o tateador responderam corretamente (e.g., o tateador que recebeu o pentobarbital e bicou o
disco “D”, e o mandador bicou o disco “P”)
na primeira tentativa em 70-100% das sessões, enquanto que a porcentagem de uma
discriminação correta acontecer por acaso
164
era de aproximadamente 11% (i.e., o produto
dos dois desempenhos individuais acontecendo por acaso, i.e., 0,33 x 0,33). Estes
resultados sugerem que os pombos aprenderam a interagir comunicativamente com
base em eventos do seu ambiente interno.
Resultados das Fases 2 e 3.
Os desempenhos observados na
Fase 1 persistiram na Fase 2, sugerindo que
as respostas dos tateadores aos seus eventos privados decorrentes do treino com as
drogas (pentobarbital e cocaína) generalizaram para os eventos privados semelhantes decorrentes de drogas não utilizadas no
treino (clordiazepóxido e d-anfetamina).
Os desempenhos observados nas Fases 1 e
2 persistiram na Fase 3, sugerindo que as
respostas precisas dos tateadores aos seus
eventos privados não foram mantidas pelos
reforçadores específicos (comida ou água), e
não covariaram com os estados de privação
dos tateadores, mas foram mantidas por um
reforço condicionado generalizado (a luz
azul piscando).
A discussão do artigo de Lubinski
e Thompson (1987) pode ser resumida da
seguinte forma: (a) o comportamento dos
tateadores envolveu tatear os eventos privados; (b) os tateadores aprenderam a tatear eventos privados sob um esquema de
reforçamento contínuo com 100% de precisão, isto é, por meio de uma contingência
em que cada resposta correta produzia um
reforçador e qualquer resposta incorreta
Capítulo X | Eventos Privados
não produzia reforçadores; por outro lado,
considera-se que humanos aprendem a tatear eventos privados sob um esquema de
reforçamento intermitente com baixa precisão (Skinner, 1945); (c) a generalização obtida na Fase 2 configura-se como um exemplo de tatos extendidos e exemplifica com
não-humanos a descrição de Skinner de
como humanos aprendem a relatar novos
sentimentos; (d) os resultados de Thompson e Lubunski demonstram que o comportamento encoberto (e.g., pensamentos,
sentimentos e imaginação), que tem sido
um dos candidatos para análise por meio
de modelos experimentais com não-humanos (Epstein, 1984), mas tem resistido à
análise empírica, é passível de uma análise
objetiva; (e) os desempenhos estudados por
Lubinski e Thompson podem não consistir
em um exemplo de “atividade lingüística”,
como o termo é geralmente entendido, mas
compartilham características com aqueles
comportamentos observados em crianças
muito novas ou indivíduos com diagnóstico de deficiências de desenvolvimento;
(f) Savage-Rumbaugh (1984) afirmou que o
comportamento controlado por contingências impostas por circuitos eletrônicos ao
invés de por um outro indivíduo não poderia ser caracterizado como “comunicação”.
No entanto, as trocas diádicas humanas de
respostas muitas vezes são mediadas por
eventos externos, tais como ligações telefônicas e quadros de avisos no computador, e
nós estamos satisfeitos em nos referirmos a
essas trocas como “verbais”.
DESDOBRAMENTOS
O experimento de Lubinski e Thompson (1987) recebeu grande atenção (e.g., Catania, 1992, pp.219-220). Em 1993, a revista
Behavioral and Brain Sciences dedicou um
número para um debate sobre o mesmo,
com comentários de 27 estudiosos da análise do comportamento e de outras abordagens (ver Lubinski & Thompson, 1993).
O experimento de Lubinski e Thompson (1987), no entanto, não foi replicado
diretamente ou sistematicamente. Provavelmente, isto pode ser devido a razões de
ordem prática. O equipamento utilizado
por Lubinski e Thompson era muito diferente de caixas operantes padrão. As drogas psicoativas não são acessíveis a todos
os pesquisadores. Além disso, este tipo de
experimento demora muito tempo. Conforme descrito na parte de Objetivos e Método
deste capítulo, de fato, Lubinski e Thompson passaram sete meses para ensinar os
tateadores a discriminação entre as drogas.
Dois estudos podem ser considerados como sucessores Lubinski e Thompson
(1987). Um foi realizado por DeGrandpre,
Bickel, e Higgins (1992). Eles também usaram o procedimento de discriminação de
drogas como Lubinski e Thompson fizeram,
e examinaram se relações de equivalência
podem surgir entre os estímulos interoceptivos (ativados por drogas) e os estímulos
exteroceptivos. Humanos adultos foram
treinados em discriminações de drogas com
165
Hiroto Okouchi
triazolam (reduzindo auto-relatos de ansiedade) e placebo (cápsulas cheias de lactose)
como estímulos modelo, e estímulos visuais
como estímulos de comparação. Quando o
triazolam (A1) foi apresentado, a escolha
de um estímulo visual B1 era a correta, enquanto a escolha dos estímulos visuais B2 e
A0 eram incorretas; ou quando escolher um
estímulo visual C1 era a escolha correta e a
escolha dos estímulos visuais C2 e C0 incorretas. Da mesma forma, quando o placebo (A2) era o modelo, as comparações corretas eram B2 e C2. Após o estabelecimento
das relações condicionais A1B1, A1C1, A2B2,
A2C2 por meio desse treino de discriminação de drogas, as relações não treinadas
B1C1 e B2C2 emergiam. Estes resultados
demonstram que eventos privados podem
emergir como membros de uma classe equivalente, da mesma forma que ocorre com os
estímulos públicos (Sidman & Tailby, 1982)
e, como Lubinski e Thompson mostraram,
fornecem evidências de que os princípios
comportamentais que operam em eventos
públicos funcionam também com os eventos privados (Skinner, 1953, pp.257-258).
Outro exemplo relevante para o tema
é um experimento realizado por Okouchi
(2006). Como no experimento de Lubinski
e Thompson, no experimento de Okouchi
respostas a estímulos privados de um indivíduo configuravam estímulos modelos
para outro indivíduo. Diferente do experimento de Lubinski e Thompson, no entanto, estímulos privados não eram estímulos
interoceptivos mas exteroceptivos, isto é,
166
estímulos visuais que apenas um indivíduo
de um par de estudantes de graduação podia ver. De acordo com a definição funcional de eventos privados como eventos que
são diretamente acessíveis a uma só pessoa
(Skinner, 1953, p.257), eventos que ocorrem
fora da pele de uma pessoa podem ser privados (Rachlin, 2003, chamou esse tipo de
evento privado de Privacidade B e o distinguiu da Privacidade A, que são eventos que
ocorrem sob a pele de uma pessoa).
Empregando a definição funcional
de eventos privados, Okouchi (2006) examinou uma das interpretações de Skinner
(1945) de como respostas verbais sob controle de um estímulo privado são estabelecidas: o relato de um estímulo privado
(e.g., dor) pode ser aprendido por meio de
reforços providos por outras pessoas que
inferem o estímulo privado das respostas
públicas colaterais (e.g., a mão no queixo,
expressões faciais, gemidos) ao estímulo.
Oito dos 16 participantes, descritos como
instrutores, aprendiam primeiro discriminações condicionais BC com os estímulos
B como os modelos e os estímulos C como
comparações. Em seguida, outros oito participantes, descritos como aprendizes, foram expostos a um procedimento de pareamento ao modelo modificado em que as
respostas dos aprendizes foram reforçadas
ou punidas não pelas respostas do experimentador, mas pelas respostas dos instrutores. As discriminações condicionais AC
deveriam ser estabelecidas para os aprendizes, em que os estímulos modelos As foram
Capítulo X | Eventos Privados
apresentados simultaneamente com os estímulos B para que os instrutores pudessem
ver os Bs, mas não os As. De acordo com a
definição funcional de eventos privados, os
estímulos A eram privados para os instrutores. Assim, os estímulos modelo As e os
estímulos modelo correlacionados Bs correspondiam, respectivamente, a estímulos
privados e suas respostas públicas colaterais na interpretação de Skinner. Okouchi
examinou se os relatos dos aprendizes (Cs)
de seus próprios estímulos (As) seriam estabelecidos pelo reforço diferencial provido
por outras pessoas (os instrutores) que poderiam ter acesso apenas aos estímulos colaterais (BS) e aos relatos (CS).
No experimento de Okouchi (2006),
dois de oito pares de participantes apresentaram o desempenho previsto, no qual
aprenderam as discriminações condicionais AC dos instrutores que não tinham
acesso aos estímulos A. Posteriormente,
Sonoda e Okouchi (2012) replicaram os resultados de Okouchi utilizando um procedimento modificado. Eles utilizaram estímulos abstratos e um computador, por
exemplo, enquanto Okouchi havia usado
estímulos geométricos, sílabas sem sentido,
e estímulos coloridos e havia controlado a
apresentação no experimento manualmente. Sonoda e Okouchi obtiveram os desempenhos esperados de todos os 26 pares de
alunos de graduação.
CONSIDERAÇÕES FINAIS
Talvez, simular o comportamento de
relatar eventos privados por animais não-humanos tenha sido uma das realizações
mais significativas de Lubinski e Thompson (1987). Epstein (1981, 1984) insistiu que
as simulações animais, ou modelos experimentais, sintetizando o chamado comportamento humano “complexo” em animais,
poderiam dar insights sobre que tipos de
variáveis constituem alguns desses comportamentos “complexos” em seres humanos. Epstein (1984) listou quatro classes
de comportamentos que tinham resistido
a essas análises e, portanto, tinham sido
considerados como “complexos”: (a) comportamentos encobertos (“pensamentos”,
“sentimentos” e “imaginações”); (b) comportamentos tipicamente humanos (linguagem, comportamentos que são descritos
sob a rubrica do “self”, e o comportamento
de resolução de problemas); (c) os comportamentos controlados por estímulos temporalmente remotos (“memória”); e (d) novos
comportamentos (“criatividade” e “pensamento produtivo”). Exceto pela classe de
comportamentos encobertos, alguns comportamentos de cada uma dessas classes
foram simulados e estudados experimentalmente (e.g., Epstein, 1981; Epstein, Lanza,
& Skinner, 1980; Epstein & Skinner, 1981). O
trabalho de Lubinski e Thompson pode ser
considerado um sucesso de uma simulação
animal de comportamentos encobertos ou
eventos privados ( “sentimentos”).
167
Hiroto Okouchi
Como o título do artigo de Lubinski
e Thompson (1987) sugere, duas práticas
que ilustram um modelo de como examinar eventos privados também podem ser
realizações significativas deste trabalho.
Em primeiro lugar, eles mostraram que os
processos de discriminação de drogas podem ser utilizados em experimentos sobre
eventos privados. Uma das dificuldades na
experimentação sobre eventos privados é
a manipulação dos mesmos. Apresentação e não apresentação de um “sentimento”, por exemplo, não é fácil, ao passo que
apresentações de uma luz colorida têm
sido comumente implementadas em experimentos comportamentais. O uso de drogas psicoativas seria um dos poucos métodos para manipular sentimentos de forma
relativamente confiável (mas ver Branch,
1991, para uma discussão sobre as dificuldades em usar drogas como estímulos discriminativos). Em segundo lugar, Lubinski
e Thompson conduziram um experimento sobre eventos privados no contexto das
interações entre indivíduos. Esta prática é
útil porque, de acordo com a definição funcional de eventos privados (Skinner, 1953,
p.257), se um evento é privado ou não, depende se ele é acessível a outras pessoas ou
não.
PARA SABER MAIS
DeGrandpre, Bickel, & Higgins (1992). Esse
artigo relata um experimento em que eventos privados humanos foram manipulados
168
por meio de drogas psicoativas.
Kohlenberg, & Tsai (1991). Este livro descreve como eventos privados, como emoções, memória, cognições e crenças são
conceituados e manejados em uma psicoterapia analítico comportamental.
Okouchi (2006). Este artigo mostra como
eventos fora da pele do participante e não
acessíveis a outros participantes, mas a um
experimentador podem contribuir para a
análise experimental dos eventos privados,
e relata um experimento que investigou
uma das interpretações de Skinner (1945)
da maneira em que os humanos aprendem
a relatar eventos privados.
Rachlin (2003). Esse capítulo de livro descreve como o behaviorismo teleológico
compreende os eventos privados. O behaviorismo teleológico exclui eventos internos (eventos sob a pele do organismo) de
uma análise do comportamento e busca por
variáveis controladoras do comportamento
de forma ampla no ambiente temporalmente estendido do organismo.
Skinner (1945). Esse é um clássico sobre
eventos privados. Você PRECISA ler se
você estuda eventos privados a partir de
uma perspectiva comportamental.
Sonoda, & Okouchi (2012). Esse artigo relata experimentos que replicam os resultados
de Okouchi (2006), utilizando um procedimento modificado. No Experimento 2, os
Capítulo X | Eventos Privados
aprendizes aprenderam a tatear “eventos
privados” por reforçamento não com 100%
mas com 83,3% de precisão, ilustrando um
análogo de laboratório da vida diária, em
que se entende que os humanos aprendem
a tatear eventos privados sob um esquema
de reforçamento com fraca acurácia (Skinner,1945).
ence, 207, 543-545.
REFERÊNCIAS
Honig, W. K. (Ed.). (1966). Operant behavior: Areas of research and application. New
York: Appleton-Century-Crofts.
Branch, M. N. (1991). Behavioral pharmacology. In I. H. Iversen & K. A. Lattal (Eds.),
Experimental analysis of behavior (Part 2,
pp.21-77). Amsterdam: Elsevier.
Catania, A. C. (1992). Learning (3rd ed.).
Englewood Cliffs, NJ: Prentice-Hall.
DeGrandpre, R. J., Bickel, W. K., & Higgins,
S. T. (1992). Emergent equivalence relations between interoceptive (drug) and exteroceptive (visual) stimuli. Journal of the
Experimental Analysis of Behavior, 58, 9-18.
Epstein, R. (1981). On pigeons and people:
A preliminary look at the columban simulation project. The Behavior Analyst, 4, 43-55.
Epstein, R. (1984). Simulation research in
the analysis of behavior. Behaviorism, 12,
41-59.
Epstein, R., Lanza, R. P., & Skinner, B. F.
(1980). Symbolic communication between
two pigeons (Columba livia domestica). Sci-
Epstein, R., & Skinner, B. F. (1981). The
spontaneous use of memoranda by pigeons.
Behavior Analysis Letters, 1, 241-246.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.
Honig, W. K., & Staddon, J. E. R. (Eds.).
(1977). Handbook of operant behavior. Englewood Cliffs, Prentice-Hall.
Iversen, I. H., & Lattal, K. L. (Eds.). (1991).
Experimental analysis of behavior (Part 1).
Amsterdam: Elsevier.
Kohlenberg, R. J., & Tsai, M. (1991). Functional analytic psychotherapy: Creating
intense and curative therapeutic relationships. New York: Plenum Press.
Leigland, S. (2014). Contingency horizon:
On private events and the analysis of behavior. The Behavior Analyst, 37, 13-24.
Lubinski, D., & Thompson, T. (1987). An
animal model of the interpersonal communication of interoceptive (private) states.
Journal of the Experimental Analysis of Behavior, 48, 1-15.
169
Hiroto Okouchi
Lubinski, D., & Thompson, T. (1993). Species and individual differences in communication based on private states. Behavioral and Brain Sciences, 16, 627-680.
MacCorquodale, K. (1969). B. F. Skinner’s
verbal behavior: A retrospective appreciation. Journal of the Experimental Analysis
of Behavior, 12, 831-841.
Skinner, B. F. (1945). The operational analysis of psychological terms. Psychological
Review, 52, 270-277.
Skinner, B. F. (1953). Science and human
behavior. New York: Macmillan.
Skinner, B. F. (1957). Verbal behavior. New
York: Appleton-Century-Crofts.
Madden, G. J. (Ed.). (2013). APA handbook
of behavior analysis (Vol.1). Washington,
DC: American Psychological Association.
Sonoda, A., & Okouchi, H. (2012). A revised
procedure for analyzing private events. The
Psychological Record, 62, 645-661.
Okouchi, H. (2006). An experimental analysis of another privacy. The Psychological
Record, 56, 245-257.
The Oxford English Dictionary (2nd. ed.).
(2004). Oxford: Clarendon Press.
Rachlin, H. (2003). Privacy. In K. A. Lattal,
& P. N. Chase (Eds.), Behavior theory and
philosophy (pp.187-201). New York: Kluwer
Academic/Plenum Publishers.
Savage-Rumbaugh, E. S. (1984). Verbal behavior at a procedural level in the chimpanzee. Journal of the Experimental Analysis of
Behavior, 41, 223-250.
Schlinger, H. D. (2011). Introduction: Private events in a natural science of behavior.
The Behavior Analyst, 34, 181-184.
Sidman, M., & Tailby, W. (1982). Conditional discrimination vs. matching to sample:
An expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22.
170
Tourinho, E. Z. (2006). Private stimuli, covert responses, and private events: Conceptual remarks. The Behavior Analyst, 29,
13-31.
Andréia Schmidt
“Esse não é um pitilics,
então só pode ser aquele”: o
responder por exclusão e a
aprendizagem de repertórios
verbais
Andréia Schmidt
Universidade de São Paulo
Dixon, L. S. (1977). The nature of control by spoken words over visual stimulus selection. Journal
of the Experimental Analysis of Behavior, 27, 433-442.
“- Mamãe, por que é que eu me chamo Marcelo?
(...) Por que é que não escolheram marmelo?
- Porque marmelo é nome de fruta, menino!
- E a fruta não podia chamar Marcelo, e eu chamar marmelo?”
(Ruth Rocha – Marcelo, Martelo, Marmelo)
171
Capítulo XI | Responder por Exclusão
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Um dos fenômenos mais interessantes que ocorre no desenvolvimento humano é, sem dúvida, a aprendizagem da
linguagem. Apesar de bebês entenderem algumas palavras ditas por adultos já aos sete
ou oito meses de idade, e até mesmo executarem algumas ordens simples nessa idade
(e.g., “dar tchau”), as primeiras palavras só
serão faladas aproximadamente ao final do
primeiro ano de vida. Ao longo do segundo
ano ocorre um aumento lento do vocabulário, mas o ritmo de aprendizagem de novas palavras parece ocorrer cada vez mais
rápido e, aproximadamente aos três anos, a
maioria das crianças com desenvolvimento
típico já serão capazes de falar frases completas, e em geral de acordo com as normas
da língua falada por sua comunidade verbal
(Nelson, 2007).
O que sempre intrigou pesquisadores
e pesquisadoras é como as crianças podem
aprender tanto em tão pouco tempo, apenas pela exposição à sua comunidade e sem
o ensino formal das inúmeras unidades
verbais (e.g., palavras ou frases) que compõem as práticas verbais dessa comunidade. Diversos pesquisadores da Psicolinguística e da Psicologia do Desenvolvimento se
dedicaram ao estudo desse tema, sobretudo a partir das décadas de 1960 e 1970 (e.g.,
Bloom, 1970; Brown, 1973; Menyuk, 1969). A
compreensão dos processos envolvidos na
aprendizagem de vocabulário, além do seu
valor em si, é importante para o desenvolvimento de intervenções comportamentais
para pessoas com dificuldades na aprendizagem de repertórios verbais, como aquelas
com diagnóstico de autismo, de deficiência
intelectual ou de atrasos de linguagem.
De acordo com Baer, Wolf e Risley
(1968), o desenvolvimento de intervenções
baseadas nos princípios da Análise Experimental do Comportamento era o foco das
primeiras pesquisas de Análise Aplicada
do Comportamento. Muitas estavam focadas no ensino de diversos repertórios comportamentais a indivíduos com deficiência
intelectual, inclusive repertórios verbais.
Várias pesquisas sobre intervenções para
indivíduos com desenvolvimento atípico
foram publicadas na década de 1970 e uma
delas, em especial, chamou a atenção por
demonstrar um processo de aprendizagem
que ocorria a partir de um procedimento
de ensino de discriminações condicionais.
A pesquisa de Dixon (1977) demonstrou a
ocorrência do responder por exclusão, um
fenômeno comportamental que, mais tarde,
foi relacionado por pesquisadores e pesquisadoras da Psicolinguística à aprendizagem
rápida de vocabulário observada em crianças antes dos três anos.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Dixon (1977) investigou o proces172
Andréia Schmidt
so envolvido na aprendizagem de relações
entre palavras ditadas e figuras em tarefas
de emparelhamento ao modelo (ou pareamento de acordo com o modelo – em inglês
matching to sample), por jovens com diagnóstico de deficiência intelectual. Nesse
tipo de tarefa, um estímulo modelo é apresentado ao participante (e.g., uma palavra é
ditada: “Bola”) e ele deve selecionar, dentre
alguns estímulos disponíveis (e.g., figuras
ou objetos tridimensionais: um carrinho,
um peão e uma bola) aquele que corresponde ao modelo. Essa tarefa envolve uma
discriminação condicional: o objeto “correto” dependerá da palavra que foi ditada, ou
seja, a bola será o S+ (objeto correto) apenas
quando a palavra ditada for “bola” (estímulo
condicional), mas não (S-) quando a palavra
ditada for “Carrinho”, por exemplo. A autora
partiu de dados da literatura da época que
mostravam que (a) pessoas com deficiência
intelectual apresentavam dificuldades em
aprender vocabulário; e (b) procedimentos
de ensino por emparelhamento ao modelo
poderiam ser mais eficientes quando uma
das alternativas de escolha já era conhecida
do participante e servia de contraste para
a nova aprendizagem (Vincent-Smith, Bricker, & Bricker, 1974). O objetivo do estudo
de Dixon era testar um procedimento de
ensino de relações palavra-figura para pessoas com deficiência intelectual, baseado
no princípio de que, a partir do ensino de
uma relação, outras poderiam ser aprendidas mais facilmente em função do controle
por exclusão exercido pela relação previamente treinada.
173
Participaram do estudo oito jovens
com deficiência intelectual. A tarefa dos
jovens era selecionar uma figura (dentre
duas disponíveis) de acordo com a palavra
ditada pela pesquisadora. Foram utilizados
três conjuntos de estímulos, cada conjunto
composto por três figuras e seus respectivos
nomes ditados. Os conjuntos eram compostos por letras gregas (Conjuntos 1 e 3) ou
por símbolos japoneses (Conjunto 2). Cada
participante foi exposto aos três conjuntos,
um de cada vez. Antes de iniciar o procedimento com cada conjunto de estímulos,
foi conduzido um pré-teste para avaliar se
os participantes eram capazes de aprender
rapidamente as relações nome-figura com
os estímulos do conjunto. Se eles aprendessem muito rapidamente essas relações, isto
é, a partir de um número pequeno de exposições, o efeito do procedimento testado em
fases subsequentes do estudo poderia ser
obscurecido, uma vez que esses participantes poderiam ter desenvolvido na sua história estratégias específicas de aprendizagem
que não a de exclusão, objeto de estudo da
pesquisa. No pré-teste foram conduzidos
no mínimo dois blocos de 12 tentativas em
que o nome de cada estímulo era ditado por
quatro vezes não consecutivas (a ordem dos
estímulos ditados ao longo das tentativas
era aleatória), e duas figuras eram colocadas em frente ao participante para que ele
apontasse aquela que correspondia à palavra ditada. Desempenhos corretos produziam elogios e fichas que poderiam ser
trocadas por outros reforçadores no final
da sessão. Caso o participante apresentas-
Capítulo XI | Responder por Exclusão
se mais que 75% de acertos em pelo menos
dois de três blocos de tentativas, seria excluído do estudo, o que aconteceu com quatro jovens (além dos oito que finalizaram o
estudo). Os oito participantes que apresentaram menos de 75% de acertos nos blocos
de pré-teste com cada conjunto de figuras
seguiram para a fase de treino, descrita na
sequência.
Na Fase de treino a pesquisadora ensinava cada participante a relacionar uma
palavra ditada a uma figura do conjunto
(e.g., a palavra ditada “Pi” e a figura da letra
grega π). Na primeira tentativa da primeira
sessão de treino, a pesquisadora colocava
diante do participante duas figuras, uma
considerada correta (S+), que seria relacionada à palavra ditada, e outra incorreta (S-),
que era uma das outras duas figuras do
conjunto. No exemplo da relação “Pi”- π, na
primeira tentativa a pesquisadora apontava
para a figura π e dizia: “Este é o Pi. Aponte para o Pi”. Nas tentativas seguintes, ela
apresentava as duas figuras e pedia que o
participante apontasse para a figura de “Pi”.
Respostas corretas (a escolha da figura π)
eram seguidas de elogios e fichas. Os blocos
de treino dessa fase eram compostos por 18
tentativas nas quais o estímulo modelo (palavra ditada) era sempre o mesmo e os estímulos de comparação eram o S+ (π) e um
S-, que se alternava nas tentativas entre θ
e Y.
Após o participante ter apresentado
ao menos 16 respostas corretas em 18 ten-
tativas, eram apresentadas as chamadas
sondas de exclusão (exclusion probes). Em
um bloco de 18 tentativas, eram apresentadas 12 tentativas de linha de base (i.e., em
que a palavra ditada era aquela treinada
na fase anterior) e seis tentativas de sonda.
Nas sondas de exclusão, uma nova palavra
era ditada (e.g., “Theta” ou “Upsilon”) e os
estímulos disponíveis eram a figura relacionada à palavra modelo na fase anterior (e.g.,
a letra grega π) e o estímulo anteriormente
com função negativa (e.g., θ ou Y). Caso o
participante tivesse aprendido a relação “Pi”
- π, ao ouvir a palavra completamente nova
deveria selecionar outra figura, não aquela
anteriormente relacionada à “Pi”. Respostas
corretas nessa fase produziam elogios e fichas, tanto nas tentativas de linha de base,
quanto nas sondas de exclusão.
Após a sessão de sondas de exclusão,
os participantes passavam para a fase seguinte, a de sondas de discriminação (discrimination probes). Em cada sessão, era
apresentado um bloco de 18 tentativas, das
quais 12 eram tentativas de linha de base e
seis tentativas de discriminação, nas quais
o modelo era uma das palavras novas ditadas nas sondas de exclusão (e,g., “Theta” ou
“Upsilon” – três tentativas para cada palavra), e os estímulos de comparação disponíveis eram as duas figuras que tinham função negativa na fase de treino (e.g., θ e Y).
Nessa fase, a autora tinha como objetivo verificar se, ao relacionar os estímulos auditivo e visual “novos” nas sondas de exclusão,
esse desempenho se manteria em uma ten174
Andréia Schmidt
tativa em que a palavra não treinada fosse
ditada como modelo e em que os estímulos
disponíveis para escolha fossem apenas os
dois não diretamente treinados. A pergunta
implícita nesses testes era: será que os participantes realmente aprenderam as relações “Theta”- θ e “Upsilon”- Y nas sondas
de exclusão, ou será que eles selecionaram
as figuras corretas diante dos modelos novos apenas porque haviam aprendido que
a figura π não era Theta ou Upsilon? As
sessões de sondas de discriminação eram
apresentadas até que o participante apresentasse 100% de respostas corretas no bloco, até o máximo de quatro sessões. Se os
participantes atingissem o critério em uma
ou duas sessões, isso indicaria que eles realmente haviam aprendido as novas relações
entre os estímulos não treinados nas sondas de exclusão. Mas, se o critério não fosse
atingido nas quatro sessões possíveis, ou se
fossem necessárias mais de duas sessões,
seria possível deduzir que os participantes
não aprenderam as novas relações nas sondas de exclusão, mas apenas relacionaram
os modelos novos às figuras não treinadas
sob controle da alternativa incorreta (a figura π), como se tivessem estabelecido uma
espécie de regra: “se a palavra ditada for ‘Pi’,
a figura certa é π; se a palavra ditada não for
‘Pi’, a figura correta é a outra”.
Todas as fases (pré-teste, fase de treino, fase de sondas de exclusão e fase de
sondas de discriminação) foram realizadas
com todos os três conjuntos de estímulos. A
ordem dos conjuntos, porém, variou entre
175
os participantes.
Resultados e Discussão
Na Fase de treino, todos os participantes aprenderam a primeira relação ensinada rapidamente, na maioria dos casos em
uma única sessão. O desempenho de maior
interesse, porém, era se os participantes
responderiam ou não por exclusão na Fase
de sondas de exclusão, ou seja, se diante de
palavras nunca antes ditadas, selecionariam a figura que, nas tentativas de ensino
(Fase de treino), funcionavam como S-. Foi
exatamente isso o que ocorreu. Na sessão
de sondas de exclusão, todos os participantes selecionaram a figura não treinada (e.g.,
θ ou Y) quando a palavra nova era ditada,
e continuaram respondendo corretamente nas tentativas de linha de base. Esse resultado demonstrou que os participantes
aprenderam a relação que foi treinada explicitamente (e.g., “Pi” e π) e que relacionaram a nova palavra à figura não treinada
nas tentativas de sonda.
As sondas de discriminação, porém,
indicaram que, apesar dos participantes
terem relacionado os estímulos modelo e
comparação não treinados nas sondas de
exclusão (“Theta” e θ, e “Upsilon” e Y), essas novas relações não se estabeleceram de
forma tão estável quanto aquela treinada
inicialmente. Apenas dois dos participantes atingiram o critério de desempenho nas
sondas de discriminação realizadas com o
primeiro conjunto de estímulos: um deles
Capítulo XI | Responder por Exclusão
na primeira sessão de sondas de discriminação e o outro apenas na quarta sessão.
Os demais participantes não atingiram o
critério de 100% de acertos no bloco, mesmo após quatro sessões. No entanto, foi
verificada melhora no desempenho dos
participantes nas sondas de discriminação
com o segundo conjunto de estímulos: seis
participantes atingiram 100% de acertos nas
sondas de discriminação com, no máximo,
quatro sessões, sendo que três desses seis
participantes atingiram esse resultado em
uma única sessão. Somente dois participantes foram expostos ao último conjunto
de estímulos, uma vez que os demais apresentaram um alto desempenho com os estímulos no pré-teste realizado. Ambos os
participantes atingiram 100% de acertos
nas sondas de discriminação já na primeira
sessão.
Diante desses resultados, Dixon
(1977) argumentou que o controle exercido
pelas palavras novas nas sondas de exclusão era, aparentemente, a rejeição da figura
treinada, isto é, daquela relacionada no treino a uma outra palavra. Nesse caso, o que
estaria controlando a escolha dos participantes nas sondas de exclusão não era uma
relação entre a nova palavra e a figura não
treinada, mas a exclusão da alternativa já
treinada diante de uma nova palavra. Essa
hipótese foi fortalecida pelos resultados nas
sondas de discriminação. Ao remover a alternativa treinada (a figura π) e apresentar
juntas as figuras não diretamente treinadas,
a maioria dos participantes não atingiu o
critério de 100% de acertos nas sondas de
discriminação, a despeito de terem relacionado corretamente as palavras novas às figuras não treinadas em 100% das sondas de
exclusão.
É interessante notar, porém, que a
exposição ao segundo conjunto de estímulos promoveu melhora no desempenho
dos participantes, uma vez que um número
maior deles atingiu o critério de desempenho estabelecido nas sondas de discriminação. Esse resultado sugere que ocorreu uma
espécie da “aprendizagem da tarefa” pelos
participantes.
DESDOBRAMENTOS
Os resultados do estudo de Dixon
(1977) chamaram a atenção de pesquisadores interessados em desenvolver procedimentos de ensino automatizados para
indivíduos com deficiência intelectual,
particularmente aqueles ligados ao grupo
de pesquisa liderado por Larry Stoddard
(Wilkinson, de Souza, & McIlvane, 2000).
O desempenho por exclusão pareceu a esses pesquisadores especialmente interessante por se constituir em um desempenho
emergente. Isto significa que, sem ensino
direto, os participantes do estudo de Dixon
estabeleceram duas novas relações entre
estímulos auditivos e visuais, além daquela diretamente ensinada, o que pareceria
um avanço em relação aos procedimentos
utilizados até então. Os procedimentos de
176
Andréia Schmidt
ensino que envolviam tarefas de emparelhamento ao modelo empregados na época
costumavam apresentar aos participantes
um estímulo modelo novo e dois ou mais
estímulos de comparação também desconhecidos. O participante poderia acertar ou
errar a primeira tentativa e a aprendizagem
das relações dependia da sua exposição a
várias tentativas desse tipo com cada estímulo modelo, o que se constituía em um
procedimento longo e que expunha o participante a uma quantidade grande de erros.
Esse tipo de procedimento é chamado de
procedimento por tentativa e erro. O procedimento de ensino por exclusão apresentava vantagens por produzir aprendizagem de
forma mais rápida e com menor exposição
do participante a erros, cujos efeitos prejudiciais foram amplamente discutidos pela
literatura (Terrace, 1963). Além disso, a melhora do desempenho dos participantes de
Dixon (1977) nas sondas de discriminação
ao longo do procedimento, com a exposição
dos jovens aos diferentes conjuntos de estímulos, indicava que a exposição repetida
do indivíduo às tentativas de exclusão poderia gerar aprendizagem consistente das
relações entre estímulos.
Procedimentos de ensino baseados
no desempenho por exclusão foram, então, desenvolvidos e extensamente testados ao longo das décadas seguintes. McIlvane e Stoddard (1981), por exemplo, foram
bem sucedidos em ensinar um jovem com
deficiência intelectual a selecionar alguns
alimentos diante de palavras ditadas. Em
177
estudos posteriores, esses resultados foram
replicados e ampliados, inclusive com o registro de respostas de nomeação dos estímulos visuais por parte dos participantes,
somente a partir de tentativas de exclusão
(e.g., McIlvane, Kledaras, Lowry, & Stoddard, 1992; McIlvane, Munson, & Stoddard,
1988). Estudos sobre procedimentos de ensino baseados em exclusão foram testados
em comparação a procedimentos de ensino por tentativa e erro, e se mostraram
superiores a estes em relação à rapidez de
aprendizagem dos repertórios ensinados,
com a produção de um número menor de
erros por parte dos aprendizes (Ferrari, de
Rose, & Mcllvane, 1993, 2008).
Os bons resultados obtidos com procedimentos de ensino baseados em exclusão para o ensino de relações auditivo-visuais para crianças e jovens com deficiência
intelectual motivaram muitos pesquisadores a adaptá-los para o ensino dessas e de
outras relações para diferentes populações:
leitura, para crianças com dificuldades nessa área (e.g., de Souza & de Rose, 2006), relações entre palavras e figuras para crianças
surdas com implante coclear (e.g., Almeida-Verdu, Huziwara, de Souza, de Rose, Bevilacqua, Lopes Jr et al., 2008; Battaglini, Bevilacqua, & de Souza, 2012), relações entre
nomes e faces para idosos com demência
(Ducatti & Schmidt, 2016) e nomeação de
estímulos para crianças com diagnóstico de
autismo (Greer & Du, 2015).
Paralelamente aos resultados obtidos
Capítulo XI | Responder por Exclusão
nos procedimentos de ensino, questões de
natureza básica surgiram e têm sido extensamente investigadas. Uma delas se refere
à generalidade do fenômeno: todos os indivíduos apresentariam desempenho por
exclusão?
Inúmeras pesquisas, realizadas nos
últimos 40 anos, têm confirmado a generalidade do fenômeno com pessoas de diferentes idades (crianças, jovens, adultos
e idosos) e condições de desenvolvimento
(desde indivíduos com desenvolvimento
típico, até crianças com desenvolvimento
atípico e idosos com demência). A confirmação da generalidade desse fenômeno em
indivíduos com diferentes condições de desenvolvimento levou alguns pesquisadores
a questionar se o desempenho por exclusão
seria, como afirmavam alguns autores da
Psicolinguística (e.g., Markman & Wachtel,
1988), um fenômeno diretamente relacionado à aquisição de repertórios verbais. Os
dados obtidos com crianças pré-verbais e
crianças que não tinham repertório verbal
completamente desenvolvido foram as primeiras evidências de que a linguagem não
parecia ser uma condição necessária para
ocorrência de desempenhos por exclusão.
O estudo desse fenômeno com não humanos poderia resolver essa questão uma vez
que, se não humanos demonstrassem desempenho por exclusão, ficaria descartada
a hipótese da linguagem como condição
para ocorrência do fenômeno.
Diferentes espécies de não humanos
passaram por procedimentos que testavam
o responder por exclusão a partir de diferentes metodologias. Primatas não humanos (Beran & Washburn, 2002; Campos,
Brino, & Galvão, 2013; Tomonaga, 1993),
cães (Kaminski, Call, & Fischer, 2004; Zaine,
Domeniconi, & Costa, 2014), leões marinhos
(Kastak & Schusterman, 2002), algumas
espécies de pássaros (Clement & Zentall,
2003; Schloegl, Dierks, Gajdon, Huber, Kotrschal, & Bugnyar, 2009) e ratos (Souza &
Schmidt, 2014) têm demonstrado desempenho por exclusão em diferentes tipos de
tarefa envolvendo discriminações simples
e condicionais. Souza e Schmidt (2016), por
exemplo, submeteram ratos Wistar a uma
tarefa de discriminação simples simultânea, na qual duas figuras geométricas (um
triângulo e uma linha) eram apresentadas
lado a lado em uma caixa de condicionamento operante, mas apenas a escolha de
uma delas era seguida pela apresentação
de água. Uma das figuras, portanto, tinha
função discriminativa na tarefa (S+) e outra não (S-). Após os animais terem atingido
o critério de 80% de respostas corretas em
três sessões consecutivas, foram apresentadas sondas de exclusão, nas quais o S- era
apresentado junto a uma figura geométrica
completamente nova. Cinco dos seis ratos
selecionaram consistentemente a figura
nova (ao menos duas de três tentativas),
rejeitando (excluindo) a figura treinada previamente como S-. Para garantir que os animais não selecionaram a figura desconhecida em função de uma eventual preferência
por estímulos novos (viés de novidade, ou
178
Andréia Schmidt
neofilia), foram apresentadas tentativas em
que a figura treinada como S+ foi apresentada junto a outro estímulo completamente
novo e todos os animais selecionaram o estímulo treinado como S+.
O conjunto de resultados obtidos em
diferentes pesquisas sobre exclusão com
não humanos indica que esse desempenho
não é um fenômeno típico de humanos e,
portanto, parece ser um processo comum
a diferentes espécies. Autores da Psicolinguística argumentam que os desempenhos
demonstrados por não humanos nessas situações podem ser indícios de capacidades
cognitivas que estão presentes também em
humanos e que, coordenadas com outros
processos, tornariam os humanos especialmente eficientes na aprendizagem da linguagem (Markman & Abelev, 2004). Essa
discussão parece longe de ser resolvida e
o estudo do desempenho por exclusão em
não humanos é ainda um campo promissor
para o entendimento das bases evolutivas
do processo de aprendizagem de repertórios verbais.
Outra questão que permanece em
aberto diz respeito à aprendizagem de relações entre estímulos a partir do desempenho por exclusão. Apesar de todos os participantes de Dixon (1977) terem respondido
por exclusão, nas sondas de discriminação apenas dois deles atingiram o critério
estabelecido, um dos quais somente após
quatro blocos de tentativas. Esses resultados foram replicados com outras crianças
179
e jovens, com deficiência (Costa, McIlvane, Wilkinson, & de Souza, 2001; McIlvane
& Stoddard, 1981) e com desenvolvimento
típico (Domeniconi, Costa, de Souza, & de
Rose, 2007; Schmidt, Franco, Lotério, & Gomes, 2016; Wilkinson & McIlvane, 1997). Os
resultados obtidos nessas pesquisas indicaram claramente que apenas um número
reduzido de indivíduos aprende e mantém
as relações estabelecidas a partir de uma ou
de poucas tentativas de exclusão. Estudos
realizados para estabelecer o número mínimo de tentativas de exclusão necessárias
para a aprendizagem de relações entre estímulos (e.g., Costa, Grisante, Domeniconi,
de Rose, & de Souza, 2013) também têm encontrado resultados muito variáveis, o que
levou pesquisadores a investigar variáveis
que podem facilitar ou dificultar a aprendizagem por exclusão, ou mesmo o desempenho inicial por exclusão (e.g., Antoniazzi, Domeniconi, & Schmidt, 2014; Costa, de
Rose, & de Souza, 2010; Wilkinson & McIlvane, 1994). Os resultados desses estudos
são ainda inconclusivos, uma vez que as
variáveis manipuladas (e.g., conhecimento
anterior dos estímulos não treinados e tipos
de estímulos empregados) não produziram
melhora na aprendizagem a partir de poucas exposições a tentativas de exclusão. São
necessárias pesquisas adicionais que possam indicar variáveis que possam facilitar a
aprendizagem de relações entre estímulos a
partir de tentativas de exclusão.
Capítulo XI | Responder por Exclusão
CONSIDERAÇÕES FINAIS
Na mesma época em que Dixon
(1977) publicou sua pesquisa, pesquisadoras
ligadas à Psicolinguística publicaram um
estudo demonstrando o desempenho por
exclusão na aprendizagem do nome de cores com crianças com desenvolvimento típico (Carey & Bartlett, 1978). Nesse estudo,
Carey e Bartlett nomearam o desempenho
por exclusão de “mapeamento rápido” (fast
mapping), um processo de reconhecimento
imediato e parcial do significado de novas
palavras, que incluía (mas não se resumia
ao) desempenho por exclusão. Muitos estudos têm sido realizados sob essa perspectiva teórica na tentativa de compreender a
aprendizagem de vocabulário em crianças
pequenas (e.g., Bion, Borovsky, & Fernald,
2013; Horst & Samuelson, 2008; Markman,
1989, entre inúmeros outros). Os resultados
desses estudos e de outros realizados por
analistas do comportamento têm mostrado
que outras variáveis, além da presença de
um estímulo conhecido junto ao estímulo
desconhecido em um episódio de exclusão, são fatores que auxiliam o indivíduo
a relacionar uma palavra desconhecida ao
seu referente (e.g., pistas sociais, linguísticas ou perceptuais) e que essas diferentes
pistas têm diferentes pesos no desempenho
estudado, a depender da idade e da experiência do indivíduo com sua comunidade
verbal (Levine, Strother-Garcia, Golinkoff,
& Hirsh-Pasek, no prelo). A despeito dos
resultados já encontrados por analistas do
comportamento e por psicolinguistas, po-
rém, muitas questões ainda permanecem
em aberto.
Pode-se destacar, por exemplo, que
os estudos sobre como o desempenho por
exclusão está envolvido na aprendizagem
de repertórios verbais têm sido feitos predominantemente a partir de relações entre
substantivos e estímulos concretos (figuras
ou objetos tridimensionais). Há poucos estudos sobre o tema envolvendo propriedades de estímulos (e.g., adjetivos – Malerbo
& Schmidt, no prelo; Ribeiro, 2013) ou ações
(e.g., verbos – Costa et al., 2010; Fonseca,
2016). Para que seja possível afirmar que o
desempenho por exclusão é um dos principais processos envolvidos na aprendizagem rápida de vocabulário, são necessários
estudos que ampliem os dados obtidos com
verbos e adjetivos, e que outras categorias
gramaticais sejam também estudadas.
Além disso, são necessários estudos
que procurem simular situações mais naturais de interações verbais entre a criança
e sua comunidade verbal para entender de
que maneira o desempenho por exclusão
ocorre nessas situações. Em situações de laboratório, utilizando-se palavras isoladas, o
desempenho por exclusão tem se mostrado
um fenômeno robusto e que auxilia fortemente as crianças a relacionar palavras aos
seus estímulos correspondentes. Esses resultados são fundamentais para se compreender o papel do desempenho por exclusão
na aprendizagem de repertórios verbais,
mas é preciso ponderar que, nas interações
180
Andréia Schmidt
naturais entre adultos e crianças, dificilmente a criança ouvirá palavras isoladas e
terá diante de si um único objeto ou figura desconhecidos. Nestas interações palavras desconhecidas aparecem no meio de
frases, músicas e histórias e o desempenho
por exclusão é um, mas provavelmente não
o único processo envolvido. Entender se, e
como, o desempenho por exclusão ocorre
nas interações verbais da criança com a sua
comunidade é um desafio ainda longe de
ser vencido. O enfrentamento desse desafio
certamente passa pela união de esforços de
pesquisadores de diferentes áreas em um
empreendimento conjunto para compreender melhor as peculiaridades da aprendizagem do comportamento verbal.
PARA SABER MAIS
Costa, Domeniconi, & de Souza (2014). Revisão de um conjunto de pesquisas realizadas com crianças sobre o responder por
exclusão, mostrando as regularidades encontradas nos dados e discutindo os métodos empregados.
Costa, de Rose, & de Souza (2010). Estudo
experimental com crianças com desenvolvimento típico que mostra que, em uma
tarefa de exclusão, as crianças não ficam
apenas sob controle da novidade dos estímulos modelo e comparação, mas também
de outras dicas presentes no modelo, como
o gerúndio, que indica que o comparação
correto provavelmente é uma ação em cur181
so, e não uma figura estática, ainda que ambos sejam desconhecidos.
Schloegl, Bugnyar, & Aust (2009). Revisão
dos estudos sobre exclusão com não humanos, analisando não apenas os resultados
obtidos, mas também os métodos empregados com cada espécie e qual o significado
desses resultados para a compreensão da
cognição animal.
Zaine, Domeniconi, & de Rose (2016). Estudo experimental que investigou o desempenho por exclusão em quatro cães em tarefas
de discriminação simples com estímulos
tridimensionais. O estudo relata que todos
os cães responderam por exclusão e que
três deles também demonstraram aprendizagem das novas relações após exposição a
sucessivas tentativas de exclusão.
REFERÊNCIAS
Almeida-Verdu, A. C. M., Huziwara, E. M.,
de Souza, D. G., de Rose, J. C. C.,Bevilacqua,
M. C., Lopes Jr., J., et al. (2008). Relational
learning in children with deafness and cochlear implants. Journal of the Experimental Analysis of Behavior, 89, 407-424.
Antoniazzi, M., Domeniconi, C., & Schmidt,
A. (2014). Efeito da pré-exposição ao objeto
no desempenho por exclusão e na aprendizagem da relação nome-objeto. Acta Comportamentalia, 22, 23-36.
Capítulo XI | Responder por Exclusão
Baer, D. M., Wolf, M. M., & Risley, T. R.
(1968). Some current dimensions of applied
behavior analysis. Journal of Applied Behavior Analysis, 1, 91-97.
Battaglini, M. P., Bevilacqua, M. C., & de
Souza, D. G. (2012). Desempenho de seleção
e nomeação de figuras em crianças com deficiência auditiva com implante coclear. Temas em Psicologia, 20, 189-202.
Beran, M. J., & Washburn, D. A. (2002).
Chimpanzee responding during matching
to sample: Control by exclusion. Journal of
the Experimental Analysis of Behavior, 78,
497–508.
Bion, R., Borovsky, A., & Fernald, A. (2013).
Fast mapping, slow learning: Disambiguation of novel word-object mappings in relation to vocabulary learning at 18, 24, and 30
months. Cognition, 126, 39-53.
Bloom, L. (1970). Language development:
Form and function in emerging grammars.
Cambridge, Mass: MIT Press.
Brown, R. (1973). A first language: The earlier
stages. Harmondsworth: Penguin Books.
Carey, S. & Bartlett, E. (1978). Acquiring a
single new word. Papers and Reports on
Child Language Development, 15, 17–29.
Campos, R. S., Brino, A. L. F., & Galvão, O.
F. (2013). Expansão de repertório de relações
arbitrárias em Sapajus sp. via exclusão. Te-
mas em Psicologia, 21, 31-48.
Clement, T. S., & Zentall, T. R. (2003). Choice
based on exclusion in pigeons. Psychonomic Bulletin & Review, 10, 959-964.
Costa, A. R. A., de Rose, J. C., & de Souza, D.
G. (2010). Interferência de variáveis de contexto em sondas de exclusão com substantivos e verbos novos. Acta Comportamentalia, 18, 35-54.
Costa, A. R. A., Domeniconi, C., & de Souza,
D. G. (2014). Controle de estímulos, mapeamento simbólico emergente e aquisição de
vocabulário. In J. C. de Rose, M. S. C. A. Gil,
& D. G. de Souza (Orgs.), Comportamento
simbólico: Bases conceituais e empíricas (pp.
269-308). Marília / São Paulo: Oficina Universitária / Cultura Acadêmica.
Costa, A. R. A., Grisante, P. C., Domeniconi,
C., de Rose, J. C. C. & de Souza, D. G. (2013).
Nomeação de estímulos novos a partir da
seleção por exclusão. Paidéia, 23, 217-224.
Costa, A. R. A., McIlvane, J. W., Wilkinson,
K. M., & de Souza, D. G. (2001). Emergent
word-object mapping by children: Further
studies using the blank comparison technique. The Psychological Record, 51, 343-355.
de Souza, D. G., & de Rose, J. C. C. (2006).
Desenvolvendo programas individualizados para ensino de leitura e escrita. Acta
Comportamentalia, 14, 77-98.
182
Andréia Schmidt
Domeniconi, C., Costa, A. R. A., de Souza,
D. G. & de Rose, J. C. (2007). Responder por
exclusão em crianças de 2 a 3 anos em uma
situação de brincadeira. Psicologia: Reflexão e Crítica, 20, 342-350.
Ducatti, M., & Schmidt, A. (2016). Learning
conditional relations in elderly people with
and without neurocognitive disorders. Psychology & Neuroscience, 9, 240-254.
Ferrari, C., de Rose, J. C. & McIlvane, W. J.
(2008). A comparison of exclusion and trial-and-error procedures: Primary and secondary effects. Experimental Analysis of Human Behavior Bulletin, 29, 9-16.
Ferrari, C., de Rose, J. C. & McIlvane, W. J.
(1993). Exclusion vs. selection training of
auditory-visual conditional relations. Journal of Experimental Child Psychology, 56,
49-63.
Fonseca, J. (2016). Responder por exclusão
em crianças com atraso de linguagem. (Dissertação de Mestrado). Universidade de São
Paulo.
Greer, R. D., & Du, L. (2015). Experience and
the onset of the capability to learn names
incidentally by exclusion. The Psychological
Record, 65, 355-373.
Horst, J. S. & Samuelson, L. K. (2008). Fast
mapping but poor retention in 24-month-old infants. Infancy, 13, 128-157.
183
Kaminski, J., Call, J. & Fischer, J. (2004).
Word learning in a domestic dog: Evidence
for “fast mapping”. Science, 304, 1682-1683.
Kastak, C. R., & Schusterman, R. J. (2002).
Sea lions and equivalence: Expanding classes by exclusion. Journal of the Experimental Analysis of Behavior, 78, 449-465.
Levine, D., Strother-Garcia, K., Golinkoff, R.
M., & Hirsh-Pasek, K. (in press). Language
development in the first year of life: What
deaf children might be missing before cochlear implantation. Otology & Neurotology.
Markman, E. M. (1989). Categorization and
naming in children: Problems of induction.
Boston: MIT Press.
Markman, E. M., & Abelev, M. (2004). Word
learning in dogs? Trends in Cognitive Sciences, 8, 479-481.
Markman, E. M., & Wachtel, G. F. (1988).
Children’s use of mutual exclusivity to
constrain the meaning of words. Cognitive
Psychology, 20, 121–157.
McIlvane, W. J., Kledaras, J. B., Lowry, M.
W., & Stoddard, L. T. (1992). Studies of exclusion in individuals with severe mental
retardation. Research in Developmental Disabilities, 13, 509-532.
Mcllvane. W. J., Munson, L., & Stoddard,
L. T. (1988). Some observations on control
Capítulo XI | Responder por Exclusão
by spoken words in children’s conditional
discrimination and matching by exclusion.
Journal of Experimental Child Psychology,
45, 472-495.
McIlvane, W.J., & Stoddard, L. T. (1981). Acquisition of matching to sample performances in severe retardation: Learning by
exclusion. Journal of Mental Deficiency Research, 25, 33-48.
Menyuk, P. (1969). Sentences children use.
Cambridge, Mass.: MIT Press.
Nelson, K. (2007). Young Minds in Social
Worlds: Experience, Meaning and Memory.
London: Harvard University Press.
Ribeiro, T. A. (2013). Responder por exclusão na aprendizagem de relações simbólicas
envolvendo adjetivos. (Dissertação de Mestrado). Universidade Federal de São Carlos.
Schloegl, C., Bugnyar, T., & Aust, U. (2009).
Exclusion performances in non-human
animals: From pigeons to chimpanzees and
back again. In S. Watanabe, A. P. Blaisdell,
L. Huber, & A. Young (Eds.), Rational animals, irrational humans (pp. 217-234). Tóquio: Keio University Press.
Schloegl, C., Dierks, A., Gajdon, G. K., Huber, L., Kotrschal, K., & Bugnyar, T. (2009).
What you see is what you get? Exclusion
performances in ravens and keas. PLoS
One, 4, e6368.
Schmidt, A., Franco, M. G. O., Lotério, L. S.,
& Gomes, G. F. (2016). Learning name-object relations after a single exclusion trial in
children in 18- to 48-months-old children.
The Psychological Record, 66, 53-63.
Schmidt, A., & Malerbo, A. C. D. B. (no prelo). Aprendizagem de relações nome-textura por meio de dois procedimentos de ensino por exclusão. Acta Comportamentalia.
Souza, M. F., & Schmidt, A. (2014). Responding by exclusion in Wistar rats in a simultaneous visual discrimination task. Journal
of the Experimental Analysis of Behavior,
102, 346-352.
Terrace, H. S. (1963). Discrimination learning with and without errors. Journal of the
Experimental Analysis of Behavior, 6, 1–27.
Tomonaga, M. (1993). Tests for control by
exclusion and negative stimulus relations
of arbitrary matching-to-sample in a ‘‘symmetry-emergent’’ chimpanzee. Journal of
the Experimental Analysis of Behavior, 59,
215–229.
Vincent-Smith, L., Bricker, D. D., & Bricker,
W. A. (1974). Acquisition of receptive vocabulary in the toddlerage child. Child Development, 45, 189-193.
Wilkinson, K. M., de Souza, D. G., & McIlvane, W. J. (2000). Origens da exclusão. Temas em Psicologia, 8, 195-203.
184
Andréia Schmidt
Wilkinson, K. M., & McIlvane, W. J. (1994).
Stimulus organization and learning by exclusion: A preliminary experimental analysis. Experimental Analysis of Human Behavior Bulletin, 12, 21-25.
Wilkinson, K. M., & McIlvane, W. J. (1997).
Blank comparison analysis of emergent
symbolic mapping by young children. Journal of Experimental Child Psychology, 67,
115-130.
Zaine, I., Domeniconi, C., & Costa, A. R.
A. (2014). Exclusion performance in visual
simple discrimination in dogs (Canis familiaris). Psychology & Neuroscience, 7, 199206.
Zaine, I., Domeniconi, C., & de Rose, J. C.
(2016). Exclusion performance and learning
by exclusion in dogs. Journal of the Experimental Analysis of Behavior, 105, 362-374.
185
João Henrique de Almeida, William Ferreira Perez
Paus e pedras podem
machucar, mas palavras...
também! - Teoria das
molduras relacionais
João Henrique de Almeida
Universidade Federal de São Carlos
William Ferreira Perez
Paradigma Centro de Ciências do Comportamento
Dougher, M. J., Hamilton, D. A., Fink, B. C. & Harrington, J. (2007) Transformation of the discriminative and eliciting functions of generalized relational stimuli. Journal of the Experimental
Analysis of Behavior, 88, 179-197.
“Abracadabra! ”
Palavra mágica prototípica usada por mágicos.
186
Capítulo XII | Teoria das Molduras Relacionais
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
É amplamente disseminado na literatura de
fantasia medieval e em jogos que palavras,
frases curtas e textos faziam parte de rituais
mágicos. Nesse contexto, poderosos magos
armazenavam seu poder por escrito em tomos e pergaminhos. Uma vez que os sons
exatos fossem proferidos, coisas incríveis
poderiam acontecer (Gygax & Arneson,
1974). A palavra “Abracadabra” na epígrafe
deste texto deriva de uma frase em Aramaico que significa “Eu crio quando eu falo”
(Lawrence, 1988). Obviamente, não iremos
explorar, neste capítulo, os efeitos das palavras a partir da perspectiva da literatura
fantástica, sequer existem evidências científicas de que as essas podem alterar os
eventos do mundo físico. No entanto, partindo de uma perspectiva analítico-comportamental, baseada em evidências empíricas, falaremos do “poder” das palavras
de funcionar como estímulos e, então, agir
sobre as pessoas. Vamos explorar, neste capítulo, a “magia” que permite que palavras
e frases (símbolos) afetem o comportamento, ou seja, afetem o que as pessoas fazem,
pensam e sentem.
Para compreender esse efeito das palavras,
recorremos a uma explicação operante da
linguagem e cognição humana proposta
pela Teoria das Molduras Relacionais (Relational Frame Theory ou RFT; de Rose &
Rabelo, 2012; Hayes, Barnes-Holmes & Ro-
che 2001; Perez, Nico, Kovac Fidalgo, & Leonardi, 2013; Zettle, Hayes, Barnes-Holmes
& Biglan, 2016). Essa perspectiva analítico-comportamental foi grandemente influenciada pela explicação funcional da linguagem presente no Comportamento Verbal
(Skinner,1957) e pelo estudo de relações
derivadas entre estímulos, iniciado pelas
pesquisas sobre Equivalência de Estímulos
(Sidman & Tailby, 1982; Sidman, 1994, 2000).
Nessa explicação da RFT, um tipo específico de comportamento operante pode alterar o modo como os estímulos adquirem
função a partir de relações arbitrárias derivadas entre estímulos. Elas são chamadas
de arbitrárias, pois não dependem de características físicas dos estímulos relacionados
(são baseadas em convenções); e são chamadas de derivadas pois, a partir de treinos
diretos, inúmeras respostas não ensinadas
diretamente podem ser observadas.
Isso tudo é possível porque, desde muito pequenos, somos expostos a tarefas em
que relacionamos estímulos, e essas relações podem ser de diversos tipos, como:
de similaridade (“esse tênis é parecido com
o meu”), de igualdade (“nossas camisetas
são iguais”), de oposição (“doce é oposto a
salgado”), de comparação (“meu carrinho
é maior que o seu”), entre outras (Tornëke,
2010). Por questões práticas, vamos tomar
o exemplo da comparação. Imagine uma
criança aprendendo a comparar objetos.
Naturalmente, ao ser exposta às contingências da comunidade verbal que modelam os
repertórios linguísticos, a criança se depa187
João Henrique de Almeida, William Ferreira Perez
ra com as palavras “maior” e “menor”. Inicialmente, tais palavras são utilizadas para
controlar respostas baseadas em propriedades físicas dos estímulos. Diante de perguntas e solicitações do tipo “Qual é o maior
brinquedo de todos esses aqui?”, “Qual é a
menor bola que você tem?”, “Pegue a boneca menorzinha!”, “Pegue uma peça maior
do quebra-cabeça”, as crianças aprendem a
comparar objetos sob controle do seu tamanho, volume ou peso.
Uma questão curiosa, no entanto, é que as
dicas contextuais “maior” e “menor” também são frequentemente utilizadas para
ensinar comparações que não se baseiam
nas dimensões físicas dos estímulos, mas
em convenções da comunidade verbal. Por
exemplo, quando for um pouco mais velha, a criança aprenderá que a moeda de 50
centavos tem valor maior, ainda que seja
menor do que a moeda de 25 centavos. Na
escola, nas aulas de matemática, aprenderá
que 0,000000001 é menor do que 1, embora o primeiro número contenha muito mais
algarismos. Assim, a criança aprende a responder adequadamente também a relações
arbitrárias de comparação, ou seja, relações que não têm por base a comparação
de dimensões físicas, mas dependem das
contingências arranjadas para que dados
eventos do mundo sejam tratados comparativamente. Em contextos como esse, dizemos que as respostas relacionais podem
ser arbitrariamente aplicadas a quaisquer
eventos do mundo. Em outras palavras, as
dicas contextuais “maior” e “menor” são
188
aplicadas para estabelecer relações de comparação convencionadas pela comunidade
verbal. Esse tipo de aprendizagem descrita
acima é uma parte do que chamamos de
Treino de Múltiplos Exemplares, e acontece comumente de forma não planejada na
interação da criança e seus pais ou cuidadores.
Além de aprender relações especificamente
ensinadas, depois de inúmeras exposições,
a criança logo aprenderá a responder também de acordo com novas relações que, embora não diretamente explicitadas, derivam
das inicialmente ensinadas. Tomando o
exemplo da comparação, ela aprenderá que
as respostas relacionais também são bidirecionais, ou seja, que existe uma implicação mútua entre os estímulos relacionados:
logo, se um estímulo A é maior que B, B será
necessariamente menor que A. Ela aprenderá, também, a combinar relações (implicação combinatória) de tal modo que, após
aprender que A é maior que B e B maior que
C, poderá responder a novas relações, tais
como: A é maior que C e C é menor que A.
Por fim, aprenderá que estímulos relacionados arbitrariamente podem ter suas funções
transformadas com base no tipo de relação
implicada. Assim, se A é “bom”, logo B e C
podem ser ainda melhores!
O fenômeno da Transformação de Função1 pode ser definido como a propagação
de função de um estímulo para demais os
estímulos relacionados. As funções transformadas podem ser de natureza muito
Capítulo XII | Teoria das Molduras Relacionais
diversa, como funções discriminativas,
reforçadoras, punitivas, eliciadoras, entre
outras. Tal fenômeno já foi exaustivamente comprovado por experimentos, principalmente em relações de similaridade (e.g.,
Bortoloti & de Rose, 2009; de Almeida & de
Rose, 2015; Dougher, Augustson, Markham,
Greenway & Wulfert, 1994; Ferro & Valero,
2008; Perez, Fidalgo, Kovac & Nico, 2015;
Vervoort, Vervliet, Benett & Baeyens, 2014).
O mais importante a ser destacado a respeito desse fenômeno é seu efeito em nosso comportamento: nós respondemos aos
estímulos que adquiriram “indiretamente”
uma determinada função de maneira semelhante a como responderíamos ao estímulo
que “possuía aquela função” originalmente,
como veremos a seguir.
Essa maneira de responder aos estímulos
na ausência de um treino direto modifica
completamente o nosso modo de interagir
com o mundo. Uma vez que nos tornamos
verbais, o significado ou a função de todos
os estímulos ambientais poderá também
depender de relações arbitrárias estabelecidas com diversos outros estímulos, além
da aprendizagem direta. Essa possibilidade
de aprender a partir de relações arbitrárias e
responder a relações derivadas é importantíssima para a explicação de diversos comPara a Teoria das Molduras Relacionais, a Transferência de Funções
é um tipo de Transformação de Função. Os dois termos são utilizados
na literatura da área: Transferência quando diz respeito à propagação
de função considerando relações derivadas de similaridade; Transformação quando diz respeito às demais relações, como, por exemplo,
oposição, comparação, diferença, etc (para um aprofundamento nessa
discussão, ver Dymond & Rehfeldt, 2000) ou ao efeito mais geral de
responder de uma forma não treinada diretamente a estímulos relacionados.
1
portamentos humanos complexos. A seguir,
descreveremos um estudo clássico da Teoria das Molduras Relacionais, de Dougher,
Hamilton, Fink e Harrington (2007), publicado no Journal of Experimental Analysis
of Behavior. Esse estudo investigou como
o estabelecimento de relações arbitrárias de
comparação (e.g., A< B < C) pode modular a
frequência de respostas e a magnitude dos
respondentes eliciados na presença de dados estímulos.
DESCRIÇÃO DOS EXPERIMENTOS
Experimento 1- Objetivo e Método
A pergunta que precisava de resposta era a
seguinte: respostas relacionais de comparação podem transformar (ampliar ou reduzir)
as funções evocativas e eliciadoras de um
estímulo? Por exemplo: imagine que os estímulos A, B e C são figuras abstratas com o
mesmo tamanho; em termos de propriedades físicas, um estímulo não é comparativamente maior do que o outro. No entanto,
suponha que sejam estabelecidas relações
arbitrárias de comparação entre eles, convencionadas pelo experimentador: A é menor que o B, e B é menor que C (A<B<C).
Dito isso, se o participante for ensinado a
emitir uma frequência de respostas estável
diante de B, diante de A observaremos uma
frequência de respostas menor e diante de
C uma frequência maior do que em B? Ou,
ainda, se B for pareado a um estímulo incondicionado aversivo (e.g., choque) e pas189
João Henrique de Almeida, William Ferreira Perez
sar a eliciar uma resposta eletrodermal (característica da reação de medo), será que A
irá eliciar uma resposta eletrodermal menor
do que B? E, mais importante, será que C
irá eliciar uma resposta eletrodermal ainda maior do que o estímulo pareado diretamente com o choque (B)? O objetivo do
primeiro experimento foi responder exatamente a essas questões.
Vinte um participantes universitários (12
para o grupo experimental e 9 para o controle) foram recrutados e receberiam créditos em disciplinas por sua cooperação.
Para garantir que os participantes apresentariam índices eletrodermais mensuráveis
pelo galvanômetro, foi realizado um teste
de “explosão do balão”.2 Considerando os 12
sujeitos do grupo experimental, três deles
não obtiveram o critério exigido no teste e
foram eliminados do estudo.
Consequentemente, nove participantes seguiram para a próxima etapa, de seleção da
intensidade do choque. Essa tarefa serviu
para calibrar a intensidade individual do
choque elétrico. Esse estímulo precisava ser
de intensidade forte e desconfortável, mas
O galvanômetro é um instrumento que serve para medir a diferença
de potencial elétrico entre dois pontos. Não são todos os participantes
expostos à avaliação do índice eletrodermal que mostram um responder suficiente para realização de experimentos. Isso se dá devido a diversas características individuais da pele dos participantes. Dessa forma, é comum nesse tipo de experimento, inicialmente, expor o sujeito
a uma avaliação para certificar que será possível coletar os dados com
aquele participante. Um dos testes realizados, o de explosão do balão
(Levis & Smith,1987) é um dos mais comumente realizados, e consiste
em apenas verificar o efeito no índice eletrodermal diante da explosão
de um balão, que estava sendo enchido pelo participante de olhos vendados. Se a alteração possuir uma magnitude mínima, no caso do experimento aqui descrito de 2 micromhos, ele estaria apto a participar. Do
contrário, o participante seria descartado do experimento.
2
190
não deveria ser doloroso. O procedimento
foi o seguinte: o gerador de choque possuía
10 níveis e, inicialmente, era colocado no
nível 7 para a administração de um choque
breve (50ms). Foi pedido aos participantes
que classificassem esse choque, dando uma
nota de 1-10 (sendo 8 o nível desconfortável, mas não doloroso). Se os participantes
considerassem o choque de qualquer nível
diferente de oito, a intensidade era aumentada ou diminuída e outro choque apresentado. Quando a intensidade fosse considerada como oito, um segundo choque
idêntico era apresentado para ver se essa
avaliação permaneceria estável. Quando
o participante considerasse dois choques
idênticos consecutivos avaliados como oito
a ‘calibragem da intensidade’ esta etapa era
finalizada. Dos nove participantes do grupo
experimental, um deles foi eliminado, por
avaliar todos os choques do gerador com
notas menores que oito. Assim, oito participantes seguiram para a próxima fase.
Sete outros participantes constituíram um
Grupo Controle. Esses realizaram todas as
etapas do experimento, exceto o treino de
múltiplos exemplares.
Treino de Múltiplos Exemplares
Nesse treino, um de três estímulos sem
sentido (A, B ou C) eram apresentados no
topo da tela juntamente de três estímulos
de comparação idênticos, que só variavam
em seu tamanho (e.g., uma bola pequena,
uma média e uma grande), apresentados na
parte inferior. Diante do estímulo A, a esco-
Capítulo XII | Teoria das Molduras Relacionais
lha correta seria o estímulo de comparação
de menor dimensão; diante de B, a escolha
correta seria o estímulo de comparação com
dimensão média; e diante de C a escolha
correta seria o de maior dimensão - como
pode ser visto na Figura 1. Antes de iniciar a
tarefa, o participante foi informado que deveria selecionar um dos estímulos na parte
inferior da tela e receberia feedback sinalizando se sua escolha havia sido correta ou
incorreta. Durante o treino, foram usados
múltiplos conjuntos de estímulos de mesma forma, porém com tamanhos relativos
diferentes .(e.g., triangulo pequeno, médio e
grande; quadrado pequeno, médio e grande
etc.). Depois de aprender a responder corretamente para 12 conjuntos de estímulos
distintos, três novos conjuntos foram apresentados em tentativas de teste, ou seja,
sem feedback para as respostas dos participantes. O objetivo dessa fase era verificar que os estímulos A, B e C continuariam
evocar respostas de escolha do comparação
menor, mediano e maior, respectivamente,
mesmo quando novos estímulos eram apresentados e o feedback era retirado. Caso os
participantes apresentassem uma alta porcentagem de acertos no teste ( > 96%), prosseguiam para outra etapa do estudo.
Figura 1. Figura baseada na Figura 1 de Dougher et. al. (2007), exemplificando um dos conjuntos de estímulos de comparação presentes no
treino de múltiplos exemplares. No topo encontram-se os estímulos
A, B e C que sinalizariam a escolha dos comparações com dimensões,
menor maior e média respectivamente. As posições dos comparações
variavam a cada tentativa.
Treino e teste de transformação
evocativa da resposta de pressão à
barra de espaços do computador
Nesta etapa, os participantes foram instruídos a pressionar a barra de espaço do computador em uma frequência estável na presença do estímulo B (médio). Eles também
foram informados que deveriam pressionar
a barra de espaços durante todo o tempo
em que esse estímulo fosse apresentado na
tela do computador e que não haveria nenhum feedback para essa resposta. Por fim,
foram avisados que, uma vez que a frequência estivesse estável, outros estímulos seriam apresentados na tela do computador;
sua tarefa era pressionar a barra na frequência que achassem apropriada para cada
estímulo apresentado na tela. Após essas
instruções, por modelação, o experimentador pressionava a barra uma vez por segundo durante 30 segundos, com o estímulo B
presente na tela do computador. Seguindo
essa tentativa, o participante foi solicitado
responder da mesma maneira que o experimentador. As tentativas foram repetidas
até que o participante respondesse três vezes seguidas mantendo uma frequência de
respostas constantes (dentro de mais ou
menos 10% das respostas na tentativa anterior). Mantida a estabilidade da taxa de resposta, os participantes foram expostos aos
testes, em que o estímulo B foi apresentado quatro vezes e sucedido pelos estímulos
A, B (novamente) e C. Essa fase tinha por
objetivo verificar se participantes modificaram a taxa de resposta de forma consistente
com o treino relacional realizado anterior191
João Henrique de Almeida, William Ferreira Perez
mente. Será que a taxa de pressão à barra
em A e em C foi, respectivamente, menor e
maior se comparada a taxa apresentada na
presença do estímulo B? Vamos descrever a
última etapa do procedimento e descobriremos os resultados a seguir.
Pareamento e teste transformação
de função eliciadora da resposta
galvânica da pele
Na última etapa, ocorreu o pareamento do
choque elétrico com o estímulo B e o teste de transformação de função eliciadora.
Nessa etapa, os participantes foram instruídos que estímulos seriam apresentados na
tela do computador e eles receberiam choques. Eles não precisariam fazer nada, exceto prestar a atenção nos estímulos apresentados. Após as instruções, o participante
permanecia sentado por cinco minutos e
seu índice eletrodermal era registrado por
esse período como linha de base. O estímulo B deveria adquirir a função de um estímulo aversivo condicionado, graças ao seu
pareamento consistente com um choque
elétrico. Nesse pareamento, o estímulo B foi
exibido por 30 segundos na tela do computador e quando removido, foi apresentado o
choque elétrico. Esse condicionamento foi
realizado por seis vezes.
Essas tentativas de condicionamento tinham intervalo entre tentativas de 90s, para
que os índices de condutância da pele pudessem ser estabilizados. Após o intervalo
da última tentativa de condicionamento do
192
estímulo B, de forma idêntica, foi apresentado no centro da tela o estímulo A; após a
sua apresentação, um choque elétrico com
metade da voltagem de B foi apresentado.
Após novo intervalo de 90s, o estímulo C
foi apresentado, mas sem nenhum choque.
A ordem foi sempre a mesma descrita aqui,
B por seis vezes, seguido de A, B e C. Assim como na pressão à barra, será que os
índices eletrodermais foram modulados de
forma coerente com o treino relacional? Ou
seja, será que a ativação da condutância
elétrica da pele foi maior para C do que para
B, mesmo na ausência de qualquer pareamento direto de C com o choque?
Resultados e Discussão
Todos os oito participantes do grupo experimental aprenderam a tarefa relacional, ou
seja, responderam consistentemente aos
estímulos apresentados inicialmente no
topo da tela (A = escolha o menor; B = escolha o médio; C = escolha o maior). A primeira medida de interesse foi a frequência de
pressão à barra no teste que apresentava os
estímulos A, B e C. Para todos os oito participantes do grupo experimental, a taxa de
resposta diante de A e C refletiu os efeitos
do treino relacional, ou seja, a taxa apresentada em A e em C foi menor e maior do que
em B. Para dois participantes, a diferença
foi pequena, mas ocorreu de forma coerente com o treino realizado. Porém, para
os seis outros participantes, a diferença foi
bem grande, em alguns casos até dobrando
a frequência de respostas ao se comparar A
Capítulo XII | Teoria das Molduras Relacionais
com B e B com C. Um resultado totalmente diferente foi observado nos dados dos
sete participantes do grupo controle. Esses
participantes realizaram todas as etapas do
experimento, exceto o treino de múltiplos
exemplares, ou seja, não aprenderam A < B
< C. Apenas um dos sete apresentou dados
coerentes com o treino relacional, com uma
diferença mínima entre o número de respostas emitidas.
A segunda medida de interesse foi o resultado dos testes de índices eletrodermais
diante de A e C. Os índices foram obtidos
subtraindo o menor índice eletrodermal observado durante os 30 segundos que precederam a apresentação do estímulo do
maior índice durante os 30 segundos de
apresentação do estímulo. Não custa lembrar que os choques elétricos apresentados
com a retirada dos estímulos B e A ocorreram sempre depois desta medida ser efetuada. Os oito participantes do grupo controle
responderam de forma coerente com o treino relacional realizado. Os autores relatam
que, diante da apresentação do estímulo
C, muitos deles ficavam assustados, e um
deles chegou a tentar remover os eletrodos
de choque do seu braço. Além disso, vários
participantes desse grupo relataram que
acreditavam que receberiam um choque
mais forte, após a apresentação do estímulo
C. Esse tipo de resultado não foi observado
para nenhum dos participantes do Grupo
Controle. Para cinco dos sete participantes,
a resposta de maior magnitude foi diante
do estímulo B, diretamente pareado com o
choque. Apenas um participante do grupo
controle mostrou respostas maiores em A
do que em B e para B em comparação a C.
Os resultados tanto da resposta de pressão
à barra como dos índices eletrodermais foram realmente surpreendentes nesse estudo. Podemos destacar apenas duas limitações nesse procedimento: a quantidade de
tentativas nos testes de transformação de
funções e a ordem dos testes. Apenas uma
tentativa foi realizada para cada teste e
sempre na mesma ordem, tanto no teste da
resposta de pressão à barra (após a estabilidade, uma tentativa de teste para cada estímulo, A, B e C), como também na medida
do índice eletrodermal (primeiro, uma para
A e, em seguida, uma para C).
Em relação as pressões à barra, os autores
mencionam que poderiam ter realizado um
número maior de tentativas de teste, contudo isso não ocorreu. Em relação ao índice
eletrodermal, múltiplas apresentações poderiam interferir nos respondentes observados, alterando a condutância da pele dos
participantes; portanto, os autores decidiram por uma única tentativa de teste. Em
relação à ordem dos testes, os experimentadores já estavam usando o limite eticamente permitido para o choque. Não apresentar o choque seguido do estímulo durante o
teste poderia gerar um processo de extinção
respondente. Como teriam que apresentar
um choque, e não poderiam dar um choque
mais forte que o que seguia B (incômodo,
mas não doloroso), as únicas opções seriam
193
João Henrique de Almeida, William Ferreira Perez
apresentar um choque menor para A ou um
choque de intensidade igual a B para C. A
segunda opção poderia afetar as respostas
que seriam apresentadas em seguida diante
do estímulo A. Por essa razão, C foi escolhido para ser testado sempre por último.
Nesse primeiro experimento, os estímulos
A, B e C exerceram o papel de dicas contextuais relacionais (nesse caso, de comparação) sinalizando a seleção do estímulos de
comparação, menores, médios e maiores.
Contudo, o treino relacional foi baseado
em propriedades físicas dos estímulos, já
que os estímulos de comparação tinham
dimensões diferentes. Para verificar se os
mesmos estímulos A, B e C possibilitariam
o estabelecimento de relações arbitrárias
de comparação entre estímulos, o segundo experimento foi realizado empregando
estímulos de comparação com dimensões
idênticas.
arbitrárias de comparação entre círculos
coloridos de mesmo tamanho. Esse treino
tinha por objetivo estabelecer um “ranking
de tamanho” entre quatro círculos coloridos. Para isso, o estímulo A (menor) era
apresentado no topo da tela junto de dois
circulos apresentados na parte inferior.
Como A representava a dica “escolha o
menor”, as respostas corretas seriam as seguintes: o círculo verde seria menor que o
roxo, o roxo menor que o azul e o azul menor que o vermelho (verde < roxo < azul <
vermelho). Uma representação dessas relações pode ser observada na Figura 2. Dessa
forma, se estivessem presentes na tela verde e roxo (sempre na presença do estímulo
A, no topo), a escolha do círculo verde seria
seguida da apresentação da palavra “correto”, enquanto a escolha do roxo seguida da
palavra “incorreto”.
Experimento 2- Objetivo e Método
Treino de Múltiplos Exemplares
No Experimento 2, seis participantes universitários foram expostos a três etapas. Na
primeira delas, foi realizado um treino de
múltiplos exemplares exatamente igual ao
Experimento 1.
Treino relacional com círculos coloridos
Nesta etapa, os estímulos A, B e C foram
então utilizados para estabelecer relações
194
Figura 2. Figura baseada na Figura 4 de Dougher et al (2007), exemplificando tentativas presentes no treino relacional do Experimento 2.
Na parte superior, tentativas de treino. Na parte inferior, tentativas de
teste.
As tentativas foram apresentadas aleatoriamente. O treino foi realizado até que os
participantes respondessem de forma correta a doze tentativas consecutivas. Depois
Capítulo XII | Teoria das Molduras Relacionais
de atingir esse critério de aprendizagem, os
participantes foram expostos a um teste.
Durante esse teste, um dos três estímulos
A, B ou C seria apresentado no topo da tela,
com três dos quatro círculos na parte inferior. Nenhuma consequência foi apresentada nesse teste. Os participantes deveriam
responder escolhendo o círculo relativamente “maior”, “menor” ou “médio”, a partir
do ranking ensinado no treino anterior (verde < roxo < azul < vermelho). O teste apresentava 18 tentativas, e caso o participante
respondesse a todas corretamente, seguiria
para a terceira etapa.
Teste de transformação de função
evocativa da resposta de pressão à
barra
A última etapa do Experimento 2, foi praticamente igual ao treino e teste de pressão a
barra realizado no Experimento 1, com uma
pequena mudança: o estímulo que foi utilizado para o treino de pressão à barra, não
foi o B, e sim o círculo roxo. Além disso, os
círculos verde e azul, foram utilizados no
teste, em vez dos estímulos A e B.
Resultados e Discussão
Os seis participantes foram capazes de realizar o treino de múltiplos exemplares e
também o treino relacional com os círculos
coloridos. Esse tipo de procedimento é um
análogo de como aprendemos a relacionar
eventos do ambiente de modo arbitrário,
baseado em convenções. O treino de múl-
tiplos exemplares ensinou aos participantes as seguintes dicas: “diante de A, escolha
o menor”, “diante de B, escolha o médio”,
“diante de C, escolha o maior”. A partir do
ensino dessas dicas contextuais que passaram a evocar respostas de comparação baseadas em propriedades físicas, foi possível
ensinar relações de comparação não mais
baseadas em dimensões físicas (o tamanho dos estímulos), e sim relações em uma
convenção determinada pela programação
do experimentador. Por isso, dizemos que
a relação entre os círculos (que tinham o
mesmo tamanho) eram relações arbitrárias
de comparação, e que as dicas contextuais
foram arbitrariamente aplicadas à situação
com os círculos para estabelecer o ranking
entre eles. A pergunta, agora um pouco
mais complexa, envolve saber se relações
arbitrárias de comparação “verde < roxo <
azul < vermelho” também determinariam
diferentes taxas de pressão à barra de espaços na presença dos círculos.
No teste de pressão à barra, cinco dos seis
participantes responderam de forma coerente com o treino relacional arbitrário estabelecido entre os círculos, ou seja, frequências menores foram observadas diante do
verde e frequências maiores diante do azul,
se comparadas à frequência observada na
presença do estímulo roxo. Apesar dos resultados consistentes, os autores afirmam
que existe uma chance (muito pequena) de
as funções transformadas nos experimentos 1 e 2 não serem baseadas em relações
derivadas entre os modelos, mas em as195
João Henrique de Almeida, William Ferreira Perez
sociações com as características não arbitrárias dos estímulos de comparação. Para
investigar a ocorrência dessa possibilidade,
novos estímulos foram adicionados investigando relações de comparações entre os
modelos.
Experimento 3 - Objetivo e Método
Treino de Múltiplos Exemplares
O Experimento 3 foi conduzido com sete
participantes e consistiu apenas de duas
fases. A fase inicial foi exatamente igual ao
treino de múltiplos exemplares dos Experimentos 1 e 2.
Teste arbitrário de relações de comparação
Nesta etapa, os participantes foram expostos a tentativas que apresentavam, na parte
de cima da tela do computador, um número; na parte central um símbolo de “menor
que”, “maior que” ou “igual”; e na parte inferior três outros números. Uma representação dessas tentativas pode ser observada
no painel da esquerda da Figura 3. Os participantes foram instruídos que deveriam
“ler” a tela, como se colocassem o número na parte superior à esquerda do sinal e
um dos números na parte inferior à direita do sinal. Além disso, foram informados
que deveriam escolher o número na parte
de baixo que tornasse essa “equação” verdadeira. O critério de encerramento dessa
fase foi que os participantes apresentassem
seis tentativas corretas consecutivamente.
196
Encerrada essa etapa, sem qualquer instrução, novas tentativas foram adicionadas.
Tais tentativas já correspondiam ao teste
dessa segunda fase. Essas tentativas novas,
tinham o mesmo formato da primeira fase
com os números, mas esses números foram
substituídos pelas dicas contextuais do treino de múltiplos exemplares (A, B e C), o que
pode ser observado no segundo painel da
Figura 4. Esse procedimento foi executado
por 18 tentativas.
Figura 3. Figura baseada na Figura 7 de Dougher et al. (2007), exemplificando as tentativas de testes do Experimento 3.
Após essas tentativas, novos estímulos
foram introduzidos, inicialmente como
comparações e, mais tarde, como modelos. Nesse teste, os pesquisadores queriam
verificar se os participantes iriam inferir
esse ranking de estímulos abstratos baseados nas relações aprendidas anteriormente. Exemplos dessas tentativas finais estão
apresentados no terceiro e quarto painéis
da Figura 4. As novas figuras adicionadas iriam acrescentar novos elementos ao
ranking original, aumentando o número de
estímulos relacionados (A-- < A- < A < B <
C < C+ < C++). A cada estímulo novo apresentado nesse teste, apenas uma resposta
poderia ser considerada correta. Esse novo
ranking foi apresentado em cinco tipos de
tentativas diferentes: (1) A<B<C; (2) A- < A <
B; (3) A-- < A- < A; (4) B< C <C +; (5) C< C+ <
C++. Cada tipo de tentativa foi apresentado
seis vezes sem nenhum feedback.
Capítulo XII | Teoria das Molduras Relacionais
Resultados e Discussão
Todos os sete participantes realizaram o
treino de múltiplos exemplares. Eles necessitaram do número mínimo de estímulos para aprenderem a função das três dicas contextuais A, B e C. Na Fase 2 desse
procedimento, dois dos sete participantes
responderam corretamente a todas as tentativas do teste. Outros três participantes
responderam corretamente a todas as tentativas de quatro dos cinco tipos de testes e
apresentaram índices superiores a 80% no
restante. Apenas um participante apresentou resultados menos consistentes nesses
testes, acertando em média 72% das tentativas e com três dos cinco tipos de tentativas
com critérios abaixo de 80%. O resultado robusto e coerente com as tentativas testadas
na etapa final desse procedimento mostra
que os procedimentos de treino relacional
estabeleceram relações derivadas entre os
estímulos presentes no treino. Esse resultado permite, segundo os autores, observar
que, além de transformar as funções como
notado nos experimentos descritos anteriormente, o procedimento realizado no Experimento 3 permitiu o estabelecimento de
uma rede relacional arbitrária entre novos
estímulos. Esses novos estímulos nunca foram pareados ou apresentados juntamente
com os estímulos que possuíam diferenças
em sua dimensão. Todas essas relações adicionais foram estabelecidas arbitrariamente.
DESDOBRAMENTOS
Demonstrações robustas dos efeitos da
aprendizagem de relações arbitrárias entre
estímulos têm proporcionado à Teoria das
Molduras Relacionais, uma explicação funcional de diversos comportamentos humanos complexos (Zettle et al, 2016; Stewart,
2015; Dymond & Roche, 2013; Barnes-Holmes, Barnes-Holmes, McHugh & Hayes,
2004). Essas explicações têm proporcionado a inserção, o estudo e a intervenção da
Análise do Comportamento em diversas
áreas relevantes da Psicologia. Uma dessas áreas é a aplicação clínica. A transformação de funções na perspectiva da RFT
tem proporcionado avanços importantes
em estudos sobre Ansiedade (Luciano et
al, 2013; Luciano et al 2014), Delírios Persecutórios (Stewart, Hughes & Stewart, 2017),
Ideação Suicida (Hussey, Barnes-Holmes
& Booth, 2016), Anedonia Social (Vilardaga, Estévez, Levin & Hayes, 2012), Desamparo Aprendido (Hooper & McHugh, 2013),
entre outros. Além disso, a RFT tem sido
aplicada na explicação funcional da psicopatologia (Dymond, Roche, & Bennett,
2013; Wilson, Hayes, & Zettle, 2001), bem
como no desenvolvimento de propostas de
modelos de intervenções clínicas (Törneke,
2010; Törneke, Luciano, Barnes-Holmes, &
Bond, 2016; Villatte, Villatte, & Hayes, 2016).
Nesse último caso, a RFT tem sido uma ferramenta importante no entendimento dos
efeitos comportamentais de diferentes técnicas utilizadas na ACT (Acceptance and
Commitment Therapy, Hayes, Strosahl,
197
João Henrique de Almeida, William Ferreira Perez
Wilson, 1999), tanto em investigações interpretativas (e.g., Foody, Barnes-Holmes,
Barnes-Holmes, Törneke, Luciano, Stewart,
& McEnteggart, 2014) quanto experimentais
(e.g., Foody, Barnes-Holmes, Barnes-Holmes, Rai, & Luciano, 2015; Foody, Barnes-Holmes, Barnes-Holmes, & Luciano, 2013;
Luciano et al., 2014; Gil-Luciano, Ruiz, Valdivia-Salas, & Suárez-Falcón, 2016).
A RFT também tem sido utilizada para
abordar problemas relacionados ao desenvolvimento. Uma dessas temáticas é a Inteligência, em que métodos baseados em
responder relacional têm sido repetidamente comprovados como efetivos para
melhora do desempenho em testes de QI
(Cassidy, Roche, Colbert, Stewart & Grey,
2016; Cassidy, Roche & Hayes, 2011; O´Toole, Barnes-Holmes, Murphy, O´Connor &
Barnes Holmes, 2009). Outro tema que, até
recentemente, era investigado apenas por
psicólogos cognitivos e recebeu uma interpretação comportamental via RFT, é a Tomada de Perspectiva. Os comportamentos
relacionados à tomada de perspectiva podem ser entendidos resumidamente como a
capacidade de assumir a perspectiva de outro, permitindo inferir suas crenças, emoções e desejos (Carpendale & Lewis, 2006).
Esse repertório é de suma importância para
nossa vida social, e déficits nesses comportamentos têm sido correlacionados com
problemas de relacionamento interpessoal e até mesmo com autismo (e.g., Ranick,
Persicke, Tarbox, Kornack, 2013; Rehfeldt,
Dillen, Ziomek, & Kowalchuk, 2007) , ane198
donia (Villatte, Monestès, McHugh, Freixa i Baqué, & Loas, 2008) e esquizofrenia
(Villatte, Monestès, McHugh, Freixa i Baqué, & Loas, 2010) Diversos outros trabalhos
foram desenvolvidos para avaliar e intervir
na Tomada de Perspectiva sob a ótica da
RFT (e.g., Lovett & Rehfeldt, 2014; McHugh,
Barnes-Holmes, & Barnes-Holmes, 2004;
Rehfeldt, Dillen, Ziomek, & Kowalchuck,
2007).
Outra área muito relevante em que o estudo
desses fenômenos tem contribuído grandemente é a das questões sociais, amplamente
conhecidas por psicólogos cognitivos como
atitudes implícitas, permitindo o estudo de
preconceitos, estigmatização social e preferências. A transformação de funções permite uma explicação comportamental precisa
desses fenômenos sociais e diversos estudos permitiram a investigação e o desenvolvimento de instrumentos para mensuração de sua força (Hughes, Barnes-Holmes
& Vahey, 2012; Barnes-Holmes, Murphy &
Barnes-Holmes, 2010; Barnes-Holmes, Barnes-Holmes, Stewart & Boles, 2010; Mizael,
de Almeida, Silveira & de Rose, 2016).
Esses e muitos outros temas relevantes
têm sido investigados recentemente (e.g.
analogias, regras e instruções, geratividade e desenvolvimento linguagem) a partir
da perspectiva da RFT (ver, Stewart, 2015).
Portanto, podemos entender que essa nova
interpretação do comportamento verbal
tem permitido uma explicação integrada de
vários comportamentos humanos comple-
Capítulo XII | Teoria das Molduras Relacionais
xos, baseada na aprendizagem relacional
derivada. Essa abordagem funcional da linguagem tem permitido a investigação analítico comportamental de vários temas que
por muito tempo foram acessíveis apenas
aos leitores interessados em outras abordagens psicológicas.
CONSIDERAÇÕES FINAIS
O experimento de Dougher e colaboradores
(2007) pode ser considerado um marco importante para o estudo da aprendizagem relacional derivada. Esse trabalho, junto com
inúmeros outros da mesma época (para
uma revisão, ver Dymond, May, Munnelly,
& Hoon, 2010), permitiu que analistas do
comportamento se aventurassem a investigar e explicar fenômenos relacionados à
linguagem e à cognição antes circunscritos
somente a outras abordagens da psicologia.
Isso ocorreu, especialmente, pela compreensão dos processos comportamentais que
permitem a aquisição indireta de funções
de estímulo via participação em redes de
relações arbitrárias. Tal noção possibilitou
que um olhar analítico-comportamental
fosse legítimo também em situações nas
quais uma história de aprendizado direta,
via pareamento ou contingências de reforço, parecia ausente, sendo as causas atribuídas à mecanismos mentais (cognitivos).
Uma estrapolação dos dados obtidos no estudo de Dougher et al. (2007) permite, por
exemplo, compreender como são construídas as fobias, como aprendemos a temer
(ainda mais) eventos com os quais nunca
tivemos uma experiência aversiva direta
e também como eventos aversivos podem
ser categorizados por comparação, tal como
observado nos procedimentos de exposição
realizados em terapia.
Os estudos da transformação de função
ainda não são tão numerosos, e, assim, algumas relações receberam pouca atenção
dos pesquisadores, como é o caso de relações espaciais ou relações hierárquicas derivadas. Novos trabalhos têm surgido com
uma velocidade muito grande, e o entendimento da cognição humana a partir desses
parâmetros comportamentais tem capacitado a Análise do Comportamento com um
instrumental novo e abrangente.
O avanço do estudo da aprendizagem derivada, isto é, de como esse tipo de responder relacional derivado amplia as possibilidades de aprendizagem humanas, tem se
apresentado recentemente como uma linha
de pesquisa muito promissora. Para alguns
pesquisadores, o desenvolvimento dessa
explicação da linguagem e cognição humana pode representar uma maior integração
das vertentes básicas e aplicadas da Análise
do Comportamento, como também maior
inserção e impacto na Psicologia em geral
(Hayes & Bernes, 2004).
Conhecer o “poder” que a linguagem pode
exercer – ampliando enormemente nossa
interação com o ambiente - é essencial para
o entendimento completo das contingên199
João Henrique de Almeida, William Ferreira Perez
cias a que nós seres humanos somos expostos. Pode parecer “magia” algo extremamente não científico. Porém, a proposta da
RFT, apesar de nova, possui evidências robustas e mostra como a ciência pode auxiliar no entendimento deste fenômeno, para
alguns inacessível ou “fantástico”. Como
toda perspectiva recente, sabemos que ainda há muito a ser feito, então, mãos à obra!
PARA SABER MAIS
Perez, de Almeida, & de Rose (2015). Nesse
estudo, os pesquisadores ensinaram redes
relacionais de similaridade e oposição e observaram resultados consistentes de transformação de funções emocionais avaliadas
por instrumentos de avaliação implícita e
explícita.
Perez, Nico, Leonardi, & Kovac (2015).
Nesse estudo, os pesquisadores mostraram
a transferência de função de dica contextual relacional em um procedimento com
diversas variações, demonstrando a flexibilidade do controle contextual.
Gil, Luciano, Ruiz, & Valdivia-Salas (2012).
Esse estudo é uma das proposições iniciais
para o estabelecimento de relações hierárquicas entre estímulos. Além disso, ele investiga os efeitos da transformação de funções em diferentes níveis hierárquicos.
Hughes, Barnes-Holmes, De Houwer, de
Almeida, & Stewart (submetido). Esse con200
junto de cinco experimentos em que são
avaliadas relações de comparação, similaridade e oposição entre diferentes conjuntos
de estímulos (pokémons, produtos fictícios
e prêmios potenciais) Os efeitos de transformação de função foram evidentes para
um conjunto diferente de medidas comportamentais, explícitas e implícitas.
Perez, Nico, Kovac, Fidalgo, & Leonardi,
(2013) e de Rose, & Rabelo (2012). Textos
introdutórios sobre a Teoria das Molduras
Relacionais em língua portuguesa.
REFERÊNCIAS
Barnes-Holmes, Y., McHugh, L., & Barnes-Holmes, D. (2004). Perspective-taking and
Theory of Mind: A relational frame account. The Behavior Analyst Today, 5, 15–25.
Barnes-Holmes, D., Barnes-Holmes, Y.,
Stewart, I. & Boles, S. (2010) A sketch of the
implicit relational assessment procedure
(IRAP) and the elaboration and coherence
(REC) model. The Psychological Record, 60,
527-542
Barnes-Holmes, D., Murph, A., & Barnes-Holmes, Y. (2010) The implicit relational
assessment procedure: exploring the impact of private versus public contexts and
the response latency criterion on pro-white and anti-black stereotyping among Irish
individuals. The Psychological Record, 60,
57-66.
Capítulo XII | Teoria das Molduras Relacionais
Bortoloti, R., & de Rose, J. C. (2009) Assessment of the relatedness of equivalent stimuli through a semntic differential. The
Psychological Record, 59, 563-590.
Cassidy, S., Roche, B., & Hayes, S. C. (2011)
A relational frame training intervention to
raise intelligence quotients: a pilot study.
The Psychological Record, 61, 173-198.
Carpendale, J. I., & Lewis, C. (2006). How
children develop social understanding. Malden: Blackwell Publishing.
de Almeida, J. H. & de Rose, J. C. (2015)
Changing the meaningfulness of abstract
stimuli by the reorganization of equivalence classes: effects of delayed matching. The
Psichological Record, 65, 451-462.
de Rose, J. C. & Rabelo, L. Z. (2012). Teoria
das molduras relacionais e possíveis aplicações à educação. Revista de Deficiência Intelectual, 3, 10-15.
Dougher, M. J., Augustson, E. M., Markham,
M. R., Greenway, D. E., & Wulfert E. (1994)
The transfer of respondent eliciting and extinction functions through stimulus equivalence classes. Journal of the Experimental
Analysis of Behavior, 62, 331-351.
Dougher, M. J., Hamilton, D. A., Fink, B. C.,
& Harrington, J. (2007). Transformation of
the discriminative and eliciting functions
of generalized relational stimuli. Journal of
the Experimental Analysis of Behavior, 88,
179-197.
Dymond, S. & Roche, B. (2013) Advances in
Relational Frame Theory:Research & Application. New Harbringer: Context Press.
Ferro, R., & Valero, L. (2008) Transfer of
function through equivalence relations
using pictures with strong emotional content. European Journal of Behavior Analysis, 9, 13-27.
Gil, E., Luciano, C., Ruiz, F. J., & Valdivia-Salas, V. (2012). A Preliminary Demonstration
of Transformation of Functions through
Hierarchical Relations. International Journal of Psychology and Psychological Therapy, 12, 1, 1-19.
Gygax, G. & Arneson, D. (1974). Dungeons &
Dragons. Lake Geneva: TSR. Inc.
Hayes, S. C. Barnes-Holmes, D., & Roche,
B. (2001). Relational Frame Theory: A Post-Skinnerian account of human language
and cognition. New York: Plenum Press.
Hayes, S. C. & Berens, N. M. (2004). Why
Relational Frame Theory alters the relationship between basic and applied behavioral psychology. International Journal of
Psychology and Psychological Therapy, 4,
341-353.
Hooper, N., & McHugh, L. (2013). Cognitive
Defusion Versus Thought Distraction in the
Mitigation of Learned Helplessness. The
201
João Henrique de Almeida, William Ferreira Perez
Psychological Record, 63, 209–218.
Hughes, S., Barnes-Holmes, D., & Vahey,
N. (2012) Holding on to our fuctional roots
when exploring new intelectual islands: a
Voyage through the implicit cognition research. Journal of Contextual Behavioral
Science, 1, 17-38
Hughes S., Barnes-Holmes, D., De Houwer,
J., de Almeida, J. H. & Stewart, I. (submetido)
On the symbolic generalization of likes and
dislikes. Journal of Experimental Psychology.
Hussey, I. Barnes-Holmes, D. & Booth, R.
(2016) Individuals with current suicidal ideation demonstrate implicit “fearlessness of
death”. Journal of Behavior Therapy and
Experimental Psychiatry, 51, 1-9.
Lawrence, K. (1988). The book of words:
Talking spiritual life, living spiritual talk.
Woodstok: Jewish Lights Publishing.
Luciano, C. Valdivia-Salas, S., Ruiz, F. J.,
Rodríguez-Valverde, M., Barnes-Holmes,
D. Dougher, M. J., Cabello, F., Sánchez, V.,
Barnes-Holmes, Y. & Guitierrez, O. (2013).
Extinction of aversive eliciting functions
as an analog exposure to conditioned fear:
Does it alter avoidance responding? Journal
of Contextual Behavioral Science, 2, 120-134.
Luciano, C. Valdivia-Salas, Ruiz, F. J. Rodríguez-Valverde, M. Barnes-Holmes, D., Dougher, M. J., López-López, J., Barnes-Holmes,
202
Y., Gutierrez-Martínez, O. (2014) Effects of
an acceptance/defusion intervention on
experimentally induced generalized avoidance: A laboratory demonstration. Journal
of the Experimental Analysis of Behavior,
101, 94-111.
Levis, D. J., & Smith, J. E. (1987). Getting individual differences in autonomic conditioning to work for you instead of against you:
Determining the dominant psychological
stress channel on the basis of a biological
stress test. Psychophysiology, 24, 346–352.
Lovett, S., & Rehfeldt, R. A. (2014). An
evaluation of multiple exemplar instruction
to teach perspective-taking skills to adolescents with Asperger Syndrome. Behavioral
Development Bulletin, 19, 22-36.
McHugh, L., Barnes-Holmes, Y., & Barnes-Holmes, D. (2004). Perspective-taking as
relational responding: a developmental profile. The Psychological Record, 54, 110–135.
Mizael, T. M., de Almeida, J. H., Silveira, C.
C. & de Rose, J. C. (2016) Changing racial
bias by transfer of functions in equivalence
classes. The Psichological Record, 66, 451462.
O´Toole, C., Barnes-Holmes, D., Murphy,
C., O´Connor, J., & Barnes-Holmes, Y. (2009)
Relational flexibility and Human Intelligence: extending the remit of Skinner´s verbal
behaviour. International Journal of Psychology and Psychological Therapy, 9, 1-17.
Capítulo XII | Teoria das Molduras Relacionais
Perez, W. F., de Almeida, J. H., & de Rose, J.
C. (2015). Transformation of meaning through relations of sameness and opposition.
The Psychological Record, 65, 679-689.
Perez, W. F., Fidalgo, A. P., Kovac, R. & Nico,
Y. C. (2015) The transfer of Cfunc contextual
control through equivalence relations. Journal of the Experimental Analysis of Behavior, 103, 511-523.
Rehfeldt, R. A., Dillen, J. E., Ziomek, M.
M., & Kowalchuk, R. K. (2007). Assessing
relational learning deficits in perspective-taking in children with high-functioning
Autism Spectrum Disorder. The Psychological Record, 57, 23–47.
Cassidy, S., Roche, B., Colbert, D., Stewart,
I., & Grey, I. M. (2016) A relational frame
skills training intervention to increase general intelligence and scholastic aptitude.
Learning and Individual Differences, 47,
222-235.
Sidman, M. (1994). Equivalence relations
and behavior. A research story. Boston: Authors Cooperative.
Sidman, M. (2000). Equivalence relations
and the reinforcement contingency. Journal
of the Experimental Analysis of Behavior,
74, 127-146.
Sidman, M., & Tailby, W. (1982). Conditional
discrimination vs. matching to sample: an
expansion of the testing paradigm. Journal
of the Experimental Analysis of Behavior,
37, 5-22.
Skinner, B. F. (1978). O comportamento verbal. Traduzido por M.P. Villalobos. São Paulo: Cultrix. (trabalho original publicado em
1957).
Stewart, C., Hughes, S., & Stewart, I. (2017)
A contextual behavioral approach to (persecutory) delusions. Journal of Contextual
Behavioral Science, 5, 235-246.
Stewart, I. (2015) The fruits of a functional
approach for psychological science. Internatinal Journal of Psychology, 51, 15-27.
Törneke, N. (2010). Learning RFT: An introduction to Relational Frame Theory and
Its Clinical Application. Oakland: Context
Press.
Vervoort, E. Vervliet, B., Bennett, M., &
Baeyens. (2014). Generalization of Human
Fear acquisition and extinction within a
Novel Arbitrary Stimulus Category. Plos
One, 9, 1-10.
Vilardaga, R., Estévez, A., Levin, M. E., &
Hayes, S. C. (2012) Deictic relational responding, empathy, and experiential avoidance
as predictors of social anhedonia: further
contributions from relational frame theory.
The Psychological Record, 62, 409-432.
Villatte, M., Villate, J. L., & Hayes, S. C.
(2016) Mastering the clinical conversation:
203
João Henrique de Almeida, William Ferreira Perez
Language as intervention. New York: The
Guilford Press.
Zettle, R. D., Hayes, S. C., Barnes-Holmes,
D. & Biglan, A. (2016) The Wiley Handbook
of Contextual Behavioral Science. John
Wiley & Sons.
204
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
Quando o mundo interage
com o que é dito sobre o
mundo: o comportamento
governado por regras
Carlos Eduardo Costa
Universidade Estadual de Londrina
Carlos Renato Xavier Cançado
Universidade de Brasília
Galizio, M. (1979). Contingency-shaped and rule-governed behavior: Instructional control of
human loss avoidance. Journal of Experimental Analysis of Behavior, 31, 53-70.
“A coisa mais certa de todas as coisas, não vale um caminho sob o sol”
Caetano Veloso
205
Capítulo XIII | Comportamento Governado por Regras
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A evolução do comportamento verbal permitiu outras formas de controle do
comportamento de um indivíduo pelo comportamento de outros indivíduos, sobretudo
quando é impossível ou improvável o contato físico entre eles (Skinner, 1957/1978,
1986). Grande parte do comportamento
humano ocorre sob o controle de regras1,
que são descrições das contingências de reforçamento e punição em vigor em determinado ambiente (Skinner, 1969). Skinner
(e.g., 1969, 1974) distinguiu o comportamento modelado pelas contingências do comportamento governado por regras. O comportamento modelado pelas contingências
é função das modificações que produz no
ambiente, isto é, de suas consequências. O
comportamento governado por regras, no
entanto, ocorre primariamente sob o controle de antecedentes verbais, isto é, das
descrições das contingências de reforçamento e punição em vigor, feitas pelo indivíduo que se comporta, ou por outro indivíduo. Preparar uma refeição, por exemplo,
pode ocorrer primariamente sob controle
das contingências em vigor e da consequência de ter o alimento pronto. No entanto,
o comportamento de indivíduos que não
possuem uma história de aprendizagem relacionada a preparar refeições pode ocorrer
No presente capítulo os termos “regra” e “instrução” serão utilizados
como sinônimos.
1
sob o controle estrito de regras: O indivíduo
pode seguir as instruções descritas em um
livro de receitas ou mesmo o que diz outro
indivíduo sobre preparar a refeição.
Regras em forma de instruções, conselhos, recomendações, sugestões, avisos, e
ordens, são utilizadas para ensinar e prescrever comportamentos nas mais diversas
situações, como cozinhar, operar um equipamento eletrônico, resolver um problema
em determinada área do conhecimento,
comportar-se em determinados contextos
sociais ou dirigir um veículo. Não aprendemos a dirigir um carro simplesmente
sentando atrás do volante, ligando o carro
e acelerando. Primeiramente, somos instruídos a como proceder. Da mesma forma,
aprendemos a cozinhar ou a tocar instrumentos musicais com um forte auxílio do
controle por regras. O controle por regras
pode facilitar a seleção de novos comportamentos porque esses comportamentos
novos podem ocorrer sem que o indivíduo
tenha que passar por uma longa história de
exposição às contingências (Catania, 1999;
Cerutti, 1989; Matos, 2001; Skinner, 1969,
1974). Imagine o quão difícil seria (para você
e para os outros!) aprender a dirigir um carro
sem nenhuma instrução e apenas por exposição direta às contingências! Apesar disso,
quando o comportamento está sob o controle estrito das regras, diz-se que o comportamento é “insensível” às suas consequências (cf. Madden, Chase, & Joyce, 1998).
Isto é, o comportamento pode não se alterar
quando há alterações nas contingências de
206
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
reforçamento e punição (Catania, 1999; Galizio, 1979; Lowe, 1979).
Diversos estudos experimentais sobre o comportamento governado por regras
foram conduzidos após a publicação de análises teóricas feitas por Skinner (1957/1978)
no livro “O Comportamento Verbal” e pelo
autor (1969) no capítulo “Uma análise operante da resolução de problemas” (ver também Skinner, 1974; para revisões da literatura ver Albuquerque & Paracampo, 2010;
e Teixeira Júnior, 2009). Dentre esses estudos, destaca-se uma série de quatro experimentos conduzida por Galizio (1979).
Baseado principalmente em considerações
teóricas feitas por Skinner (1974), Galizio
chegou à seguinte proposição: Se as teorias
comportamentais sobre o porquê as pessoas seguem instruções estiverem corretas,
então “o seguimento de instruções deve
ser influenciado pelo reforço [de seguir instruções], ser sujeito à extinção e deve ficar
sob controle discriminativo” (p. 54). Se isso
ocorresse, poderíamos dizer que seguir regras é comportamento operante.
Os resultados obtidos por Galizio
(1979) lançaram luz sobre algumas variáveis
determinantes do comportamento governado por regras. Além disso, seu procedimento estabeleceu as bases para análises
experimentais do comportamento governado por regras conduzidas desde então (e.g.,
Albuquerque, de Souza, Matos, & Paracampo, 2003; Athayde Neto, Costa, & Banaco,
2015; Baumann, Abreu-Rodrigues, & Souza,
207
2009; Bentall, Lowe, & Beasty, 1985; Calixto,
Ponce, & Costa, 2014; Catania, Matthews, &
Shimoff, 1982; Hayes, Brownstein, Haas, &
Greenway, 1986; Lowe, Beasty, & Bentall,
1983; Matthews, Catania, & Shimoff, 1985;
Okouchi, 1999; Rosenfarb, Newland, Brannon, & Howey, 1992; Shimoff, Catania, &
Matthews, 1981). Vejamos, então, como foram os experimentos conduzidos por Galizio.
DESCRIÇÃO DOS EXPERIMENTOS
Experimento 1 - Objetivo e Método
O objetivo desse experimento foi
analisar o efeito de instruções acuradas
sobre o comportamento. Instruções acuradas descrevem adequadamente as contingências em vigor (i.e., são verdadeiras) e
segui-las garante a obtenção dos reforços
programados. O experimento foi conduzido com seis universitários e o equipamento
consistiu em um painel contendo uma série de lâmpadas e uma alavanca (ver Baum,
2006, p. 169 para uma representação gráfica
do equipamento ). No início das sessões os
participantes eram instruídos que tinham
U$ 2,00 de crédito e deviam evitar a perda
de dinheiro. A resposta sob análise era girar
a alavanca 45o para a direita e essa resposta adiava a perda de dinheiro (i.e., U$ 0,05)
que era sinalizada por uma luz vermelha e
um som. Este é um procedimento de reforçamento negativo descrito como “esquiva”,
em que o comportamento adia ou evita a
Capítulo XIII | Comportamento Governado por Regras
apresentação de determinada consequência (e.g., perdas de pontos ou dinheiro, administração de choque elétrico; Sidman,
1953).
Os participantes foram expostos a
um programa de reforço múltiplo com quatro componentes. Cada componente era
sinalizado por uma de quatro luzes de cor
âmbar e ocorria aleatoriamente uma vez
por sessão. A duração de cada componente
era de 12,5 min.. Acima de cada luz âmbar,
podiam ser colocados rótulos que descreviam as contingências de esquiva em vigor
(i.e., as regras). Em um componente, perdas de dinheiro não ocorriam. Nos outros
três componentes, as perdas de dinheiro
ocorriam a cada 10 s na ausência de respostas. Além disso, nesses três componentes,
as respostas adiavam as perdas de dinheiro por 10 s, em um componente, por 30 s,
em outro, e por 60 s, no outro componente. No início do experimento, os participantes foram instruídos que cada vez que
a luz vermelha acendesse, cinco centavos
seriam subtraídos dos dois dólares que eles
teriam de crédito no início da sessão. Os
participantes foram informados que girar a
alavanca para a direita adiaria a apresentação da luz vermelha e as perdas de dinheiro,
mas não sobre o tempo que cada resposta
adiaria a perda de dinheiro em cada componente do múltiplo.
Em uma condição, os participantes
foram expostos ao programa múltiplo de
reforço na ausência de instruções (Condi-
ção Sem Instrução, SI). Em outra condição,
instruções acuradas sobre as contingências
em vigor em cada componente do múltiplo
foram dadas aos participantes (Condição
com Instrução, I): Rótulos que descreviam
o tempo que cada resposta adiava a perda
de pontos (i.e., “10 s”, “30 s” e “60 s”; o componente sem perdas era indicado pelo rótulo “NO LOSS”) foram adicionados acima de
cada luz âmbar no painel. Após exposição
de cada participante às duas condições, os
rótulos eram retirados e a posição das luzes
âmbar, que indicavam qual componente do
múltiplo estava em vigor, eram alteradas, e
replicações das condições SI e I foram conduzidas. Quatro participantes iniciaram o
experimento pela Condição SI (i.e., três foram expostos à sequência de condições SI-I-SI e outro à sequência SI-I) e dois pela
Condição I (i.e., um participante foi exposto
à sequência de condições I-SI-I-SI e outro
apenas à sequência I-SI).
Resultados e Discussão
Em procedimentos de esquiva, observa-se uma relação inversa entre a taxa
de respostas e a duração do intervalo em
que respostas adiam a apresentação de
consequências (Sidman, 1953). Assim,
quanto maior esse intervalo, menor a taxa
de respostas. Dos quatro participantes que
iniciaram o experimento pela Condição SI,
uma relação inversa entre a taxa de respostas e a duração do intervalo em cada componente do múltiplo foi observada apenas
para um participante. Para os outros três
208
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
participantes, a taxa de respostas foi alta o
suficiente para evitar praticamente todas
as perdas de dinheiro, mas foi indiferenciada entre os componentes do múltiplo. Na
Condição I, independentemente de ter sido
a primeira ou a segunda condição a qual o
participante foi exposto, todos os participantes responderam de acordo com o intervalo descrito nos rótulos e observou-se
uma relação inversa entre a taxa de respostas e o intervalo em que respostas adiavam
a perda de dinheiro em cada componente.
Os resutados desse experimento demonstraram o controle exercido pelas instruções sobre o comportamento humano
mantido sob contingências de esquiva. A
exposição às contingências na ausência de
instruções acuradas gerou um responder
discriminado para apenas um dos participantes. Quando a Condição SI foi replicada, três de cinco participantes responderam
de acordo com os intervalos de adiamento
das perdas de dinheiro em vigor. Portanto, houve um efeito da história de seguir
instruções (Condição I) sobre a exposição
subsequente às mesmas contingências sem
instruções (segunda exposição à Condição
SI). Os resultados para esses três participantes sugerem que a exposição às instruções facilitaram a ocorrência do comportamento quando o ambiente se alterou e as
instruções estavam ausentes. Para dois participantes, no entanto, a exposição à instruções na Condição I não facilitou a ocorrência do comportamento sob o controle de
cada componente do múltiplo durante a
209
replicação da Condição SI.
Experimento 2 - Objetivo e Método
No Experimento 1 as instruções dadas aos participantes foram sempre acuradas. No Experimento 2, Galizio (1979) estudou o efeito de instruções inacuradas sobre
o comportamento. Instruções incacuradas
não descrevem adequadamente as contingências em vigor (i.e., são falsas) e segui-las
não garante a obetenção dos reforços programados. Participaram quatro estudantes
que haviam participado do Experimento
1, e o equipamento foi o mesmo utilizado
naquele experimento. Para esses participantes, o Experimento 1 terminou com a
Condição SI. Por isso, a condição inicial do
Experimento 2 foi a Condição I (como descrita anteriormente) por duas ou três sessões. Os participantes foram então expostos à Condição Sem Contato (SC), na qual
perdas de pontos não ocorriam em nenhum
componente do múltiplo mas os estímulos
discriminativos (luzes âmbar) e as instruções (rótulos acima das luzes) foram mantidos. As instruções eram inacuradas nessa
condição porque não havia perda de dinheiro em nenhum componente do múltiplo (i.e., as respostas não adiavam perdas de
dinheiro). Além disso, os participantes que
seguissem essas instruções não entrariam
em contato com essa mudança nas contingências pois um comportamento eficaz em
um procedimento de esquiva implica que a
consequência programada não ocorra.
Capítulo XIII | Comportamento Governado por Regras
Depois, os participantes foram expostos à Condição Contato (C). Nessa
condição, as luzes e as instruções permaneciam inalterados em relação à condição
SC, mas, em cada componente, perdas de
pontos ocorriam a cada 10 s na ausência de
respostas e as respostas adiavam a perda de
dinheiro por 10 s. Seguir as instruções, que
eram também inacuradas nessa condição
(e.g., uma instrução de que respostas adiavam a perda de dinheiro por 30 s enquanto,
na verdade, adiavam por apenas 10 s), levaria a perdas de dinheiro, isto é, a um contato
com a discrepância entre as instruções as
contingência em cada componente do múltiplo. Posteriormente, a condição SC foi replicada para cada participante.
Resultados e Discussão
Na Condição I, uma relação inversa entre taxa de respostas e o intervalo em
que respostas adiavam perdas foi observada para cada participante, assim como no
Experimento 1. Na Condição SC, as taxas
de respostas dos quatro participantes foram idênticas às da Condição I, indicando
que o comportamento estava sob o controle
das instruções inacuradas e não das contingências (lembre-se que os participantes não
precisavam responder para evitar perdas
de dinheiro, que não ocorriam nessa condição). Esse é um aspecto de controle importante em qualquer análise experimental
do comportamento governado por regras:
entre condições, Galizio (1979) manteve
as instruções e alterou as contingências; a
manutenção do comportamento entre condições indica o controle por regras; a mudança no comportamento indica o controle
pelas novas contingências (alternativamente, pode-se manter as mesmas contingências entre condições, e alterar as instruções
em vigor em cada condição, e.g., Albuquerque, dos Reis, & Paracampo, 2008).
Na Condição C, na qual respostas
adiavam a perda de pontos por 10 s em todos os componentes do múltiplo, os participantes deixaram de seguir as instruções
inacuradas. A taxa de respostas foi equivalente entre os componentes e próxima
àquela do intervalo de 10 s de perda de pontos da Condição SC anterior. Portanto, o
comportamento de cada participante ficou
sob o controle das contingências em vigor
em cada componente e não das instruções
inacuradas. Esses resultados demonstraram que quando seguir uma regra produz
consequências que não condizem com a
descrição presente na regra (e.g., a regra diz
que respostas adiam perdas por 30 s, mas
perdas ocorrem a cada 10 s) é provável que
o comportamento fique sob o controle da
contingência em vigor e a regra seja abandonada.
Durante a replicação da Condição
SC, nenhum participante voltou a seguir
as instruções inacuradas. Isto é, em cada
componente, as taxas de respostas de três
participantes diminuíram para próximo de
zero (o esperado quando não há perdas de
dinheiro), enquanto as taxas de respostas
210
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
de um participante permaneceram altas
e indiferenciadas entre os componentes,
um desempenho semelhante ao observado
para esse participante na Condição C.
Os resultados desse experimento demonstraram que não é suficiente que exista
uma discrepância entre regras e contingências (Condição SC) para que o controle do
comportamento por regras seja alterado e
o comportamento fique sob o controle das
contingências em vigor. É necessário que
o comportamento entre em contato com a
discrepância (como na Condição C) entre o
que a regra descreve e as contingências em
vigor.
O experimento foi conduzido com
dois participantes, e o equipamento foi o
mesmo dos experimentos anteriores, exceto que duas luzes novas (roxa e laranja)
foram adicionadas. Na presença das luzes
laranja e roxa, respectivamente, as instruções eram sempre acuradas e inacuradas
(as luzes laranja e roxa seriam, respectivamente, equivalentes às pessoas A e B do
exemplo anterior). Assim como no Experimento 2, os participantes foram expostos à
Condição SC, à Condição C e novamente à
Condição SC, programadas como naquele
experimento.
Resultados e Discussão
Experimento 3 - Objetivo e Método
O controle de estímulos é uma propriedade do comportamento operante. Isto
é, a probabilidade de um comportamento
ocorrer é influenciada pela presença de determinados estímulos em função da correlação desses estímulos com as consequências do comportamento. Imagine que você
receba instruções de diferentes pessoas, A
e B. Após uma história de seguir instruções
acuradas de A, e instruções inacuradas de
B, a probabilidade de que você siga instruções seria determinada pela pessoa (A ou B)
que dá as instruções? Isto é, a probabilidade
de seguir instruções seria alta na presença
de A e baixa na presença de B? No Experimento 3, o objetivo de Galizio (1979) foi
estudar o controle de estímulos do comportamento de seguir instruções.
211
Durante a primeira exposição à Condição SC, os participantes emitiram taxas
de respostas correspondentes aos rótulos
(i.e., seguiram as instruções) tanto na presença dos estímulos correlacionados às
instruções acuradas (luz laranja) quanto
inacuradas (luz roxa). Esses resultados demonstram que, nessa condição, não houve
controle pelos estímulos correlacionados
às instruções acuradas e inacuradas. Na
Condição C, na presença da luz laranja a
taxa de respostas em cada componente foi
diferenciada como as instruções acuradas
descreviam. Na presença da luz roxa, correlacionada às instruções inacuradas, as taxas de respostas foram altas e semelhantes
em cada componente do múltiplo. Portanto, quando a luz laranja estava em vigor, os
participantes seguiram as instruções (acuradas); quando a luz roxa estava em vigor,
Capítulo XIII | Comportamento Governado por Regras
os participantes não seguiram as instruções
(inacuradas) e o comportamento em cada
componente do múltiplo estava sob o controle das contingências.
Na segunda exposição à Condição SC,
na presença da luz laranja os participantes
responderam de acordo com as instruções.
Na presença da luz roxa, no entanto, os participantes pararam de responder em cada
componente do múltiplo, indicando um
controle do comportamento pelas contingências em vigor (i.e., não havia perdas em
nenhum componente do múltiplo). Portanto, os participantes continuaram a seguir
instruções na presença do estímulo que
havia sido correlacionado com instruções
acuradas mas – e esse é o ponto central –
deixaram de seguir instruções na presença
do estímulo que havia sido correlacionado
com instruções inacuradas. Os resultados
do Experimento 3 demonstraram o controle
de estímulos do comportamento de seguir
instruções. É mais provável que você faça
o que alguém diz quando esse alguém, no
passado, foi uma fonte de instruções acuradas (i.e., foi uma fonte “confiável”) e é mais
provável que você deixe de seguir as instruções de alguém que, no passado, foi uma
fonte de instruções inacuradas. Seguir regras é influenciado por suas consequências
e por estímulos antecedentes na presença
dos quais seguir a regra produziu (ou não) as
consequências descritas na regra.
Experimento 4 - Objetivo e Método
O objetivo do Experimento 4 foi verificar se estímulos correlacionados à instruções acuradas e inacuradas poderiam
funcionar como reforçadores condicionais
para uma resposta de observação (i.e., uma
resposta estabelecida e mantida pela produção desses estímulos; Wyckoff Jr., 1952;
1969). O experimento foi conduzido com
três estudantes e o equipamento foi o mesmo utilizado nos experimentos anteriores.
Assim como nos Experimentos 1 à 3, girar
a alavanca 45o para a direita adiava perdas
de dinheiro. Nesse experimento, girar a alavanca 45o para a esquerda era a resposta de
observação.
Os participantes foram expostos a
um programa múltiplo com quatro componentes assim como no Experimento 1. No
entanto, a luz âmbar correlacionada a cada
componente do múltiplo só acendia após a
emissão de uma resposta de observação. Na
primeira condição, respostas de observação
acendiam as luzes âmbar por 10 , 20 , ou 30
s. Cada uma dessas durações de apresentação das luzes esteve em vigor, para cada
participante, até que a taxa de respostas de
observação fosse estável por duas sessões
consecutivas (o esperado é que houvesse
uma relação inversa entre a taxa de respostas de observação e a duração de apresentação dos estímulos; assim taxas mais altas
de respostas de observação seriam esperadas quando as luzes âmbar ficassem acesas
por 10 s do que quando ficassem acesas por
20 ou 30 s). Na segunda condição, as res212
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
postas de observação deixaram de acender
as luzes âmbar (i.e., as respostas de observação estavam em extinção). Na primeira
parte da terceira condição, as respostas de
observação voltaram a produzir as luzes
âmbar, em cada componente, por 10 s. Na
segunda parte da terceira condição, perdas
de dinheiro passaram a ocorrer a cada 10
s na ausência de respostas de esquiva em
todos os componentes (portanto, as instruções passaram a ser inacuradas e a presença das luzes âmbar dependia da resposta de
observação).
Se os estímulos correlacionados às
instruções (i.e., luzes âmbar) adquirissem
função de reforçadores condicionais, seria
esperado que as respostas de observação
fossem mantidas na primeira condição e
que a taxa dessas respostas diminuísse na
segunda condição. Além disso, na terceira condição, seria esperado que a taxa das
respostas de observação diminuísse quando essas respostas produzissem os estímulos correlacionados à instruções inacuradas
por 10 s.
Resultados e Discussão
Na primeira codição, para cada participante, a taxa de respostas de observação
foi inversamente proporcional à duração de
apresentação das luzes âmbar (i.e., quanto
maior a duração de apresentação das luzes, menor foram as taxas de respostas de
observação). Nessa condição, a taxa de respostas de esquiva foi correspondente com
213
as instruções e contingências programadas (i.e., taxas de respostas de esquiva mais
altas quando a resposta adiava a perda de
dinheiro por 10 s e relativamente mais baixas quando adiava a perda por 30 s e 60 s,
e nenhuma resposta no componente sem
perdas). Na segunda condição (extinção),
as taxas de respostas de observação dos
três participantes ficaram próximas de zero
e a taxa de respostas de esquiva se tornou
menos diferenciada entre os componentes
do múltiplo. Na primeira parte da terceira
condição, a taxa de respostas de observação aumentou para todos os participantes e
as taxas de respostas de esquiva voltaram a
ser diferenciadas entre os componentes do
múltiplo. Na segunda parte dessa condição,
as taxas de respostas de observação dos três
participantes foram novamente próximas
de zero e a taxa de respostas de esquiva foi
alta e indiferenciada entre os componentes.
A relação funcional entre a duração da exibição das luzes âmbar e a taxa
de respostas de observação, assim como a
extinção das respostas de observação, demonstrou que os estímulos correlacionados
à instruções acuradas funcionaram como
reforçadores condicionais para as respostas de observação. Além disso, a redução
na taxa de respostas de observação quando
as instruções se tornaram inacuradas demonstrou que os estímulos correlacionados às instruções eram reforçadores apenas
quando as instruções eram acuradas (i.e.,
quando seguir as instruções evitava a perda
de pontos). Em outras palavras, tendemos
Capítulo XIII | Comportamento Governado por Regras
a pedir informações quando, no passado,
pedi-las levou a reforçamento e tendemos
a não pedi-las quando, no passado, pedir
informações não produziu consequências
diferenciais.
DESDOBRAMENTOS
Os resultados obtidos por Galizio
(1979) têm sido replicados em diversos experimentos. Os resultados do Experimento
1 sugeriram que o comportamento pode ser
mais rapidamente estabelecido com o uso
de instruções acuradas, algo que tem sido
demonstrado também com comportamentos instruídos mantidos por contingências
de reforçamento positivo. Por exemplo, a
diferenciação na taxa de respostas em programas de reforço múltiplo razão fixa (FR)
reforçamento diferencial de baixas taxas
(DRL) é prontamente obtida em alguns estudos somente quando instruções acuradas sobre as contingências são fornecidas
aos participantes (e.g., Hayes, Brownstein,
Haas, et al., 1986; Hayes, Brownstein, Zettle,
Rosenfarb, & Korn, 1986, mas ver Porto, Ramos, & Costa, 2011; e Soares, Costa, Cançado & Cirino, 2013, para exceções). Os resultados de Athayde Neto et al. (2015) também
demonstraram que instruções acuradas favorecem a diferenciação das taxas de respostas em um múltiplo FR DRL, mas que
essa diferenciação pode ser obtida também
com instruções mínimas (i.e., instruções gerais sobre a topografia da resposta – “ganhe
pontos utilizando o mouse”).
Os resultados do Experimento 2 de
Galizio (1979) indicaram que seguir regras é
influenciado por suas consequências. Calixto et al. (2014, Experimento 2) estudaram o
controle do seguimento de regras por suas
consequências com contingências de reforçamento positivo. Participantes foram
expostos a um DRL 5 s com instrução mínima (Grupo IM), acurada (Grupo IA) ou
inacurada (Grupo II). Em uma condição
subsequente, para os participantes em cada
grupo, a contingência mudou de DRL para
extinção, mas as instruções (agora inacuradas) foram mantidas. Sob o DRL, os participantes do Grupo IA emitiram taxas de
respostas mais baixas e obtiveram a maioria dos reforços programados em relação
aos participantes dos outros grupos, corroborando os resultados do Experimento 1
de Galizio. Quando a extinção estava em
vigor, mais participantes dos Grupos IM e
II abandonaram a instrução do que os do
Grupo IA. Assim como nos Experimentos
2 e 3 de Galizio, esses resultados sugerem
que o seguimento de regras é mais provável
após uma história de exposição a instruções acuradas (Grupo IA) e menos provável após exposição a instruções inacuradas
(Grupo II; mas ver Albuquerque et al., 2003,
para resultados diferentes).
No estudo de Galizio (1979) vimos
que quando as instruções são acuradas, os
indivíduos tendem a emitir o comportamento descrito nas instruções. O mesmo
acontece quando as instruções fornecidas
são inacuradas mas não há contato com a
214
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
discrepância entre instruções e contingências. Quando há este contato com a discrepância entre instruções e contingências
(e.g., ao seguir a instrução o indivíduo perde
dinheiro) o seguimento de instrução tende
a ser abandonado. Além disso, Galizio sugeriu que em estudos sobre comportamento
governado por regras nos quais há transição
entre condições em que o comportamento é
mantido por contingências de reforçamento positivo para extinção (uma situação em
que a instrução passa a ser inacurada e há
contato com a discrepância pois os reforçadores deixam de ser produzidos, como
no estudo de Calixto et al., 2014, descrito
anteriormente) pode ocorrer maior persistência do comportamento instruído porque
seriam necessárias muitas sessões para que
o comportamento se enfraquecesse. Isto é,
o contato com a discrepância por perder dinheiro pode não ter o mesmo efeito que o
contato com a discrepância por deixar de
ganhar dinheiro.
na Fase 1, mas extinção estava em vigor em
cada componente do múltiplo. Cinco dos
seis participantes mantiveram altas taxas
de respostas nos dois componentes em ambas as fases sugerindo seguimento da regra
durante todo o experimento, independente
do monitoramento. O fato dos participantes continuarem a responder em altas taxas
na Fase 2 corrobora a afirmação de Galizio
(1979) de que o comportamento pode persistir por bastante tempo quando ocorre
mudança de contingência de reforçamento
positivo para extinção. Além disso, Ramos
et al. sugeriram que pode ter ocorrido um
efeito da história de reforço de seguir regras
(Fase 1) sobre o comportamento em extinção (Fase 2), já que o seguimento da regra na
Fase 1 garantia a obtenção dos pontos disponíveis (monitoramento também não teve
efeito no estudo de N. M. A. Albuquerque,
Paracampo, & Albuquerque, 2004; mas teve
efeito em outros estudos, e.g., Barrett, Deitz,
Gaydos, & Quinn, 1987; Cerutti, 1994).
Ramos, Costa, Benvenuti e Andrade (2015) avaliaram essa questão em um
experimento com seis estudantes que deveriam clicar com o cursor do mouse sobre um botão em uma tela de computador
para ganhar pontos. A instrução era sempre “Pressione o botão rapidamente para
ganhar pontos”. Na Fase 1 estava em vigor
um múltiplo intervalo fixo (FI) 30 s FI 30
s e o experimentador estava presente em
apenas um dos componentes do múltiplo.
Na Fase 2, a instrução e o monitoramento
pelo experimentador foram mantidos como
Por fim, os resultados do Experimento 3 de Galizio (1979) sugerem que, dada
uma história de reforçamento diferencial,
o seguimento de regras pode ser colocado
sob controle de estímulos. Okouchi (1999)
também investigou se instruções poderiam
ser consideradas estímulos discriminativos. Quatro universitários foram expostos
a um programa múltiplo FR DRL e instruídos, na tela do computador, a responderem
lentamente no FR e rapidamente no DRL.
Depois, foram expostos a um múltiplo FI
FI com as mesmas instruções. Durante o
215
Capítulo XIII | Comportamento Governado por Regras
múltiplo FI FI, para três de quatro participantes, as taxas de respostas foram maiores
com a instrução para responder lentamente do que com a instrução para responder
rapidamente. Tal controle por instruções
não foi observado para outros participantes
expostos apenas ao múltiplo FI FI com ou
sem instruções. Os resultados de Okouchi
demonstraram que o efeito de instruções
pode ser alterado por contingências e sugerem que as instruções podem funcionar
como estímulos discriminativos. Em outras
palavras, a instrução “pressione lentamente”, passou a controlar altas taxas de respostas e a instrução “pressione rapidamente”
passou a controlar baixas taxas de repostas
em um múltiplo FI FI devido a história de
contingências que correlacionou o “lentamente” ao FR e o “rapidamente” ao DRL.
Os participantes expostos diretamente ao
múltiplo FI FI responderam em altas taxas
na presença de “pressione rapidamente” e
baixas taxas na presença de “pressione lentamente. O ponto interessante é que Okouchi construiu uma nova relação entre uma
palavra e a história de contingência que dá
“significado” a esta palavra e não se baseou,
como outros estudos, em palavras cujo significado foi construído na história extra experimental do participante.
CONSIDERAÇÕES FINAIS
Tomados em conjunto os quatro experimentos de Galizio (1979) demonstram
que o seguimento de instruções é compor-
tamento operante e como a história comportamental pode determinar o comportamento de seguir instruções. Além disso,
os resultados de Galizio indicam que, em
estudos com humanos em que o interesse
é nos efeitos comportamentais das contingências, atenção ao controle instrucional
deve sempre ser um cuidado. Se instruções
acuradas e detalhadas forem apresentadas
aos participantes, o comportamento pode
se assemelhar àquele selecionado por suas
consequências mas pode estar sob controle
da instrução fornecida. Galizio adverte que
“em casos nos quais o controle de respostas simples pelo programa [de reforço] é de
interesse, instruções mínimas deveriam ser
empregadas” (p. 68).
O fato de que o seguimento de instrução pode ser colocado sob o controle de
estímulos levanta questões interessantes
para a análise de interações sociais. É mais
provável que um indivíduo siga instruções
de fontes (pessoas, instituições) que lhe forneceram instruções acuradas e que deixe
de seguir instruções de fontes que lhe deram instruções inacuradas (Cerutti, 1989;
Galizio, 1979, Experimento 3). Assim, seguir
regras de um professor ou de um especialista em determinada área do conhecimento
pode ser mais provável do que seguir regras
fornecidas por um leigo.
Por fim, os resultados apresentados
por Galizio (1979) sugerem que o controle
do comportamento humano por regras não
deve ser interpretado como uma limitação
216
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
do controle do comportamento humano por
contingências de reforçamento e punição,
ou mesmo como um limite ao princípio de
seleção do comportamento por suas consequências (Skinner, 1981), mas como um
exemplo de uma determinada história de
reforço (por seguir regras) influenciando o
efeito de determinadas contingências sobre
o comportamento. Em geral, os resultados
de Galizio e de outros experimentos sobre o
comportamento governado por regras indicam que o que é dito sobre o mundo interage com o mundo no controle do comportamento de um indivíduo.
Portanto, comportamento governado por regras é comportamento operante.
A tarefa para uma análise experimental é
descrever quais variáveis influenciam o
controle do comportamento por regras e a
interação entre o comportamento governado por regras e o comportamento modelado
por contingências.
PARA SABER MAIS
Catania, Matthews, & Shimoff (1982). Investigaram as diferenças entre o comportamento verbal modelado e o instruído. Os
participantes deveriam aprender a pressionar dois botões de acordo com diferentes
programas de reforçamento por modelagem ou instrução de seus comportamentos
verbais. O interessante nesse estudo é que
a instrução não foi dada ao participante.
Ela foi modelada por meio de pontos dados
217
para a descrição que os próprios participantes faziam sobre seu desempenho. Os resultados sugeriram que o comportamento verbal produz efeitos sobre o comportamento
não-verbal subsequente, principalmente
quando o comportamento verbal é modelado.
Buskist & Miller Jr. (1986). Neste estudo, os
autores procuraram investigar a interação
entre instrução e contingência no desenvolvimento do desempenho de humanos
em FI. Os resultados sugeriram que quando
há contato com a discrepância entre regra e
contingência é mais provável abandonar a
regra do que quando isso não ocorre.
Hayes, Brownstein, Zettle, Rosenfarb, &
Korn, (1986). Procuraram avaliar o efeito
de instruções sobre a taxa de respostas em
um programa de reforço múltiplo FR DRL e
sobre a sensibilidade à mudança nas contingências quando extinção passou a estar
em vigor em cada componente do múltiplo.
Os autores sugeriram que a diferenciação
na taxa de respostas no múltiplo FR DRL
foi obtida somente quando instruções acuradas sobre as contingências foram fornecidas aos participantes. Entretanto, a taxa de
respostas dos participantes que receberam
instruções acuradas sobre como responder
foi mais resistente à extinção.
Torgrud & Holborn (1990). O objetivo foi
observar se existe diferença no seguimento de regras quando os participantes eram
expostos às contingências na ausência de
Capítulo XIII | Comportamento Governado por Regras
regras. Os resultados sugerem que quando
os participantes passaram pela fase de exposição direta às contingências (com instrução mínima), antes da fase em que era
fornecida a instrução, o comportamento da
maioria dos participantes mudou quando
as contingências programadas mudaram.
Baumann, Abreu-Rodrigues, & Souza
(2009). Avaliaram os efeitos de regras e
autorregras sobre a sensibilidade do comportamento à mudança nas contingências.
Participantes em diferentes grupos foram
expostos a diferentes programas de reforçamento ou a apenas um esquema de reforçamento. Alguns participantes foram
expostos a regras e outros foram instruídos
a gerar regras sobre as contingências em
vigor; participantes em um grupo controle
não receberam ou foram instruídos a gerar
regras. A sensibilidade do comportamento à
mudança nas contingências foi maior para
participantes com uma história de exposição à diferentes programas de reforçamento e às regras ou autorregras variadas do
que para participantes com uma história de
exposição à apenas um esquema e a regras
ou autorregras específicas.
REFERÊNCIAS
Albuquerque, L. C., de Souza, D. G., Matos,
M.A., & Paracampo, C. C. P. (2003). Análise
dos efeitos de histórias experimentais sobre
o seguimento subsequente de regras. Acta
Comportamentalia, 11, 87-126.
Albuquerque, L. C., dos Reis, A. A., & Paracampo, C. C. P. (2008). Efeitos de histórias
de reforço, curtas e prolongadas, sobre o seguimento de regras. Acta Comportamentalia, 16, 305-332.
Albuquerque, L. C., & Paracampo, C. C. P.
(2010). Análise do controle por regras. Psicologia USP, 21, 253-273.
Albuquerque, N. M. A., Paracampo, C. C. P.,
& Albuquerque, L. C. (2004). Análise do papel de variáveis sociais e de conseqüências
programadas no seguimento de instruções.
Psicologia: Reflexão e Crítica, 17, 31-42.
Athayde Neto, C. A., Costa, C. E., & Banaco, R. A. (2015). Efeitos da história comportamental e de instruções sobre a aquisição
e a resistência à extinção em um esquema
múltiplo fr drl. Psicologia: Teoria e Pesquisa,
31, 365-374.
Barrett, D. H., Deitz, S. M., Gaydos, G. R., &
Quinn, P. C. (1987). The effects of programmed contingencies and social conditions on
response stereotypy with human subjects.
Psychological Record, 37, 489-505.
Baum, W. M. (2006). Compreender o behaviorismo: Comportamento, cultura e evolução (M. T. A. Silva, M. A. Matos, G. Y. Tomanari, E. Z. Tourinho, & F. Dentello, Trans. 2a
ed.). Porto Alegre, RS: Artmed.
Baumann, A. A., Abreu-Rodrigues, J., &
Souza, A. S. (2009). Rules and self-rules: Ef218
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
fects of variation upon behavioral sensitivity to change. The Psychological Record, 59,
641-670.
Bentall, R. P., Lowe, C. F., & Beasty, A. (1985).
The role of verbal behavior in human learning: Ii. Developmental differences. Journal
of the Experimental Analysis of Behavior,
43, 165-180.
Buskist, W. F., & Miller Jr., H. L. (1986). Interaction between rules and contingencies in
the control of human fixed-interval performance. The Psychological Record, 36, 109116.
Calixto, F. C., Ponce, G. D., & Costa, C. E.
(2014). O efeito de diferentes instruções
sobre o comportamento em drl e a sensibilidade comportamental. Acta Comportamentalia, 22, 201-217.
Catania, A. C. (1999). Aprendizagem: comportamento, linguagem e cognição. (D. G.
Souza Trad.). Porto Alegre: Artmed.
Catania, A. C., Matthews, B. A., & Shimoff,
E. (1982). Instructed versus shaped human
verbal behavior: Interactions with nonverbal responding. Journal of the Experimental
Analysis of Behavior, 38, 233-248.
Cerutti, D. T. (1989). Discrimination theory
of rule-governed behavior. Journal of the
Experimental Analysis of Behavior, 51, 259276.
219
Cerutti, D. T. (1994). Compliance with instructions: Effects of randomness in scheduling and monitoring. The Psychological
Record, 44, 259-269.
Galizio, M. (1979). Contingency-shaped and
rule-governed behavior: Instructional control of human loss avoidance. Journal of the
Experimental Analysis of Behavior, 31, 5370.
Hayes, S. C., Brownstein, A. J., Haas, J. R.,
& Greenway, D. E. (1986). Instructions,
multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.
Hayes, S. C., Brownstein, A. J., Zettle, R. D.,
Rosenfarb, I., & Korn, Z. (1986). Rule-governed behavior and sensitivity to changing
consequences of responding. Journal of the
Experimental Analysis of Behavior, 45, 237256.
Lowe, C. F. (1979). Determinants of human
operant behaviour. In M. D. Zeiler & P. Harzem (Eds.), Reinforcement and the organization of behavior (pp. 159-192). New York:
John, Wiley & Sons.
Lowe, C. F., Beasty, A., & Bentall, R. P. (1983).
The role of verbal behavior in human learning: Infant performance on fixed-interval schedules. Journal of the Experimental
Analysis of Behavior, 39, 157-164.
Capítulo XIII | Comportamento Governado por Regras
Madden, G. J., Chase, P. N., & Joyce, J. H.
(1998). Making sense of sensitivity in the
human operant literature. The Behavior
Analyst, 21, 1-12.
Matos, M. A. (2001). Comportamento governado por regras. Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 51-66.
Matthews, B. A., Catania, A. C., & Shimoff, E. (1985). Effects of uninstructed verbal
behavior on nonverbal responding: Contingency descriptions versus performance
descriptions. Journal of the Experimental
Analysis of Behavior, 43, 155-164.
Okouchi, H. (1999). Instructions as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 72, 205-214.
Porto, T. H., Ramos, M. N., & Costa, C. E.
(2011). História de aquisição do comportamento em um múltiplo FR-DRL: diferenciação e estabilidade das taxas de respostas.
Acta Comportamentalia, 19, 281-306.
Ramos, M. N., Costa, C. E., Benvenuti, M. F.,
& Andrade, C. C. F. (2015). Efeito de regras
inacuradas e monitoramento sobre desempenhos em programas de reforços. Psicologia: Reflexão e Crítica, 28, 813-822.
Rosenfarb, I. S., Newland, M. C., Brannon,
S. E., & Howey, D. S. (1992). Effects of self-generated rules on the development of
schedule-controlled behavior. Journal of
the Experimental Analysis of Behavior, 58,
107-121.
Shimoff, E., Catania, A. C., & Matthews,
B. A. (1981). Uninstructed human responding: Sensitivity of low-rate performance
to schedule contingencies. Journal of the
Experimental Analysis of Behavior, 36, 207220.
Sidman, M. (1953). Two temporal parameters of the maintenance of avoidance by the
white rat. Journal of Comparative and Physiological Psychology, 46, 253-261.
Skinner, B. F. (1969). Contingencies of reinforcement. New York, NY: Appleton-Century-Crofts.
Skinner, B. F. (1974). About behaviorism.
New York, NY: Vintage Books.
Skinner, B. F. (1978). O comportamento verbal. São Paulo, SP: Cultrix/EDUSP.
Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. DOI: 10.1126/
science.7244649
Skinner, B. F. (1986). The evolution of verbal behavior. Journal of the Experimental
Analysis of Behavior, 45, 115-122.
Soares, P. G., Costa, C. E., Cançado, C. R. X.,
& Cirino, S. D. (2013). Controle de estímulos
e história comportamental em humanos.
Psicologia: Reflexão e Crítica, 26, 357-366.
220
Carlos Eduardo Costa, Carlos Renato Xavier Cançado
Teixeira Júnior, R. R. (2009). Variáveis do
comportamento governado por regras: Uma
análise de estudos da área. Acta Comportamentalia, 17, 351-385.
Torgrud, L. J., & Holborn, S. W. (1990). The
effects of verbal performance descriptions
on nonverbal operant responding. Journal
of the Experimental Analysis of Behavior,
54, 273-291.
Wyckoff Jr., L. B., (1952). The role of observing responses in discrimination learning:
Part I. Psychological Review, 59, 431-442.
Wyckoff Jr., L. B. (1969). The role of observing responses in discrimination learning.
In D. P. Hendry (Ed.). Conditioned Reinforcement. Homewood, IL: Dorsey Press.
221
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
A função do mentir em
crianças: o controle operante
na correspondência verbal
Carlos Augusto de Medeiros
Centro Universitário de Brasília
Lucas Ferraz Córdova
Universidade Federal de Mato Grosso do Sul
Ribeiro, A. F. (1989). Correspondence in children’s self-report: tacting and manding aspects.
Journal of the Experimental Analysis of Behavior, 51, 361-367.
“Mentiras sinceras me interessam”
Cazuza e Frejat
222
Capítulo XIV | Correspondência Verbal
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Em 1957, B. F. Skinner publicou o
livro O Comportamento Verbal, no qual
propôs que este tipo de comportamento
poderia também ser explicado por meio
da sua relação com variáveis ambientais.
Mais especificamente, Skinner descreveu o
comportamento verbal como um comportamento operante, isto é, comportamento estabelecido e mantido por processo de
seleção pelas consequências. O que distinguiria o comportamento verbal dos comportamentos não verbais seria a forma de
consequenciação desses comportamentos.
No comportamento verbal, a alteração no
ambiente é proporcionada por um ouvinte, enquanto que no comportamento não
verbal, a modificação no ambiente é direta. O marido pode pegar o controle remoto
da TV e trocar de canal, atuando assim, de
forma direta no ambiente, por exemplo. Ele
também pode, todavia, pedir para que a sua
esposa mude de canal por ele. Neste caso,
a mudança de canal foi proporcionada pela
sua esposa, de modo que a atuação do marido no ambiente foi indireta.
Explicar uma resposta verbal, então, é explicitar suas fontes de controle, é
descrever os eventos ambientais contingentes a sua emissão, ou seja, identificar a
sua função. Isto implica que comportamentos que são cotidianamente designados por
termos como “descrever”, “pedir”, “recitar”,
“persuadir” ou mesmo “mentir” ou “xingar”
seriam comportamentos, logo, seriam função de variáveis ambientais. A existência
de tais comportamentos é dependente de
contingencias de reforçamento socialmente estabelecidas que os tornam mais ou menos prováveis. Por exemplo, falar “cadeira”
diante do objeto cadeira, ou dizer “comi
macarrão” após ter comido macarrão, são
comportamentos que a comunidade verbal coloca sob controle discriminativo das
respectivas condições mencionadas via reforçamento diferencial. Ou seja, caso a resposta “cadeira” seja emitida na presença de
outros móveis, não será reforçada, enquanto que, na presença do móvel cadeira, sim.
Após esse treino, a resposta verbal “cadeira”
será provável na presença de cadeiras e não
de outros móveis.
A relação de controle entre uma resposta verbal ou não verbal emitida por um
falante e o comportamento verbal de relatá-la é chamada de correspondência verbal,
que também denomina um tema de pesquisa em Análise do Comportamento (Beckert,
2005; Lloyd, 2002; Paniagua, 1990). As variáveis ambientais que afetam essa relação de
controle entre o que um falante faz e o que
diz acerca do que faz são investigadas pelas
pesquisas empíricas em correspondência
verbal. Três tipos principais de correspondência verbal são investigados: (a) correspondência dizer-fazer, na qual é avaliado
se o comportamento emitido (fazer) ocorreu
conforme anunciado previamente pelo falante (dizer); (b) correspondência fazer-di223
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
zer, sendo verificado se o relato está sob o
controle discriminativo do comportamento
previamente emitido; e (c) correspondência
dizer-fazer-dizer, na qual a correspondência é investigada em dois momentos, isto é,
se o fazer corresponde ao dizer prévio e se o
relato posterior corresponde ao comportamento previamente emitido.
LIoyd (2002) afirmou que há ocorrência de correspondência quando o falante anuncia que irá fazer algo e o faz ou que
não fará algo e não o faz (correspondência
dizer-fazer). Também ocorre correspondência quando o falante diz que fez algo que
realmente fez ou que não fez algo que, de
fato, não fez (correspondência fazer-dizer).
Portanto, são possíveis quatro tipos correspondência (dizer que fará e fazer; dizer que
não fará e não fazer; fazer e dizer que fez e
não fazer e dizer que não fez) e quatro tipos de não correspondência (dizer que fará
e não fazer; dizer que não fará e fazer; fazer
e dizer que não fez; e não fazer e dizer que
fez). A existência desse tema de investigação em Análise do Comportamento, segundo LIoyd, baseia-se no pressuposto de que
o fazer e o dizer são comportamentos distintos e que, portanto, não estão necessariamente relacionados. Tais comportamentos podem ocorrer em momentos distintos
e sob o controle de variáveis específicas. O
dizer é obrigatoriamente controlado por reforçamento social, ou seja, aquele provido
por outra pessoa, na medida em que se trata de um comportamento verbal (Skinner,
1957). Já o fazer é determinado por suas pró224
prias consequências que podem ser sociais
ou não. Ainda que as consequências de um
fazer específico sejam sociais, não necessariamente são as mesmas do dizer. Caso
um adolescente diga aos pais que respeitará
seus professores, por exemplo, é provável
que seus pais reforcem esse relato. Por outro lado, um comportamento desrespeitoso
em relação aos professores pode ser reforçado pelos risos dos colegas de classe. Ambas consequências são sociais nesse caso,
entretanto, são distintas e podem resultar
na ausência de correspondência dizer-fazer.
Ao enfatizar as relações de contingência para explicar a não ocorrência de
correspondência, a Análise do Comportamento exclui as explicações mentalistas
como “má índole” ou “ausência de caráter”
(Lloyd, 2002). Além disso, ao contrário das
explicações do senso comum, analistas
do comportamento não pressupõem uma
relação de controle a priori do comportamento verbal sobre o comportamento não
verbal. Ainda assim, o controle verbal do
comportamento possui grande relevância aplicada, o que justifica a investigação
das variáveis ambientais que interferem na
correspondência e, principalmente, a tentativa de criar condições que favoreçam
a correspondência entre o dizer e o fazer.
Em uma psicoterapia, por exemplo, é comum os clientes verbalizarem irão emitir
certos comportamentos (e.g., se matricular
numa autoescola para motoristas habilitados como parte do tratamento para voltar
Capítulo XIV | Correspondência Verbal
a dirigir) sem que essa verbalização seja
acompanhada do comportamento correspondente (i.e., se matricular na autoescola
em si). Desse modo, é muito importante investigar variáveis que afetam a correspondência entre dizer e o fazer de modo a aumentar as chances de prever e controlar o
comportamento no contexto aplicado.
Os procedimentos comumente utilizados em pesquisas sobre correspondência verbal envolvem três tipos de condições
experimentais (Beckert, 2005; LIyod, 2002).
Uma linha de base, na qual os reforçadores
não são contingentes a relatos ou comportamentos relatados específicos, nem à correspondência entre eles. As condições de
linha de base são delineadas para verificar
a correspondência verbal decorrente da
história pré-experimental dos participantes
(Ribeiro, 1989).
Com exceção de alguns experimentos como, por exemplo, os de Critchifield e
Perone (1990; 1993), Brino e de Rose (2006),
Cortez, de Rose e Montagnoli (2013), a grande parte dos estudos sobre correspondência
reportam alto índice de correspondência
verbal nas condições de linha de base. Esses resultados corroboram a pressuposição
de Skinner (1957) acerca do extenso treino
da comunidade verbal em propiciar relatos
correspondentes. Entretanto, segundo Medeiros (2013), caso o comportamento relatado tenha histórico de punição, é possível
que a correspondência seja enfraquecida.
Esse foi justamente o resultado reportado
em ambos os estudos de Critchifield e Perone, por Brino e de Rose, e Cortez e cols.,
uma vez que as crianças participantes tinham que relatar erros em tarefas diversas,
e como erros costumam ser punidos, a precisão desses relatos é empobrecida frente à
dos relatos de acertos.
A outra condição experimental comumente utilizada é o reforçamento de relatos (correspondentes ou não) específicos
(Paniagua & Baer, 1982; Ribeiro, 1989). Essa
condição tende a reduzir a correspondência
verbal. Esse tipo de manipulação é muito
importante, uma vez que demonstra que a
correspondência verbal é uma propriedade
do comportamento que é afetada por variáveis ambientais. Na sequência dizer-fazer,
o reforçamento contingente a um dizer prévio específico nem sempre é acompanhando do fazer posterior. No estudo de Paniagua e Baer (1982), eram mostradas fotos de
brinquedos que estariam disponíveis para a
criança brincar. Sempre que esta dizia que
brincaria com um brinquedo previamente preterido por ela em um pré-teste, o seu
relato era reforçado. Entretanto, na situação de brincar em que todos os brinquedos
estavam disponíveis, a criança brincava
com um brinquedo diferente do que havia
anunciado – constituindo uma situação de
ausência de correspondência dizer-fazer.
Na sequência fazer-dizer, são reforçadas
topografias de relato específicas independentemente se estas correspondem ou não
ao comportamento relatado. Com esse procedimento, Pergher (2002), Ribeiro (1989)
225
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
e Sadi (2002) observaram um aumento na
frequência de relatos não correspondentes,
ainda que em apenas a minoria de suas participantes crianças.
Os treinos de correspondência são o
terceiro de tipo de condição experimental e
têm como objetivo estabelecer a correspondência entre o dizer e o fazer. Também é
verificado se a correspondência se mantém
após a retirada da condição de treino de correspondência. Os treinos de correspondência envolvem o reforçamento diferencial no
qual apenas o fazer correspondente ao dizer prévio é reforçado na correspondência
dizer-fazer. Caso ocorra um fazer diferente
do anunciado previamente ou o fazer correspondente não seja emitido, o reforçador
não é apresentado. Esse procedimento se
demonstrou eficaz em estabelecer relatos
correspondentes na direção dizer-fazer nos
estudos de Paniagua e Baer (1982) e Risley e
Hart (1968).
Nos treinos de correspondência fazer-dizer, o reforçador é contingente ao dizer correspondente ao fazer prévio, e não é
apresentado caso o dizer não corresponda
ao fazer (Brino & de Rose, 2006; Paniagua &
Baer, 1982; Ribeiro, 1989). Esse procedimento tem se mostrado eficaz tanto em produzir
correspondência quanto em mantê-la após
o retorno à linha de base.
que buscava-se propiciar a correspondência
entre o que as pessoas diriam que fariam e o
que realmente fariam. Em outras palavras,
criar condições para que as pessoas passem
a fazer o que disseram que fariam.
O estudo de Ribeiro (1989), por outro
lado, não enfatizava o fazer, e sim, o dizer
como objeto de estudo. Nesse estudo, não
era objetivado alterar a probabilidade de
um comportamento específico a ser relatado. Na realidade, a meta do estudo de Ribeiro era investigar o que leva o falante a relatar com precisão ou de forma distorcida um
fazer prévio. Em decorrência disso, Ribeiro,
diferentemente do que havia sido feito em
estudos anteriores, descreveu os comportamentos verbais envolvidos em seu estudo
utilizando as categorias funcionais propostas por Skinner (1957), como tatos1 e mandos2. Essas inovações, a engenhosidade dos
procedimentos e a robustez dos resultados,
como será verificado a seguir, provavelmente fizeram com que essa pesquisa fosse
citada e descrita em diversos estudos em
Análise Experimental do Comportamento,
tendo inaugurado uma nova forma de estudar a correspondência verbal.
Tatos são operantes verbais cujas respostas estão sob o controle discriminativo de estímulos não verbais, sendo estabelecidos e mantidos
por reforçadores generalizados. Os exemplos comuns de tatos são os
relatos, as descrições e as narrativas. Se uma criança brincou com o
carrinho de relata que brincou com o carrinho, está emitindo um tato,
já que o seu relato está sob o controle discriminativo do comportamento de brincar prévio, que é um estímulo não verbal.
1
Os mandos são operantes verbais cujas respostas são controladas por
reforçadores específicos. Pedidos, súplicas e ordens são exemplos de
mandos na linguagem cotidiana. Quando uma criança pede uns trocados para o pai para comprar doces na padaria, está emitindo um mando, uma vez que o que controla a sua resposta verbais é o dinheiro a
ser dado pelo pai.
2
Até a publicação do estudo de Ribeiro (1989), o foco das pesquisas foi sobre a
correspondência dizer-fazer, na medida em
226
Capítulo XIV | Correspondência Verbal
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O estudo de Ribeiro (1989) teve como
objetivo investigar os efeitos do reforçamento do conteúdo das verbalizações de
crianças sobre a acurácia do relatar. Em
outras palavras, o que seria observado se o
reforçamento de relatos específicos acontecesse independentemente da acurácia desse relato. Oito crianças, de ambos os sexos,
com idades entre três e cinco anos, participaram do experimento.
Individualmente, as crianças eram
levadas a uma “sala de brincar”, onde o experimentador podia observá-las por meio
de um espelho unidirecional. Nesta sala,
a criança tinha acesso a brinquedos que
ela podia escolher para brincar. Ela poderia brincar com apenas um brinquedo por
vez. Após o termino do período de brincar,
que durava 12 minutos ou até ela ter brincado com três brinquedos, a criança era
encaminhada para a “sala de relatar”. Nesta
sala, um segundo experimentador, que não
tinha acesso a quais brinquedos a criança
havia brincado na “sala de brincar”, dizia
para a criança que gostaria de saber o que
ela havia feito no período de brincar daquele dia. Ele se sentava à mesa, do lado oposto
da criança, mostrando a foto de cada brinquedo e perguntava se ela havia brincado
com aquele brinquedo.
que consistiam em um período de brincar e
um período de relato. A diferença entre as
condições foi quanto ao período de relato:
(a) Linha de Base (de quatro a seis sessões):
ao fim de cada relato de brincar ou não, a
criança recebia uma ficha que poderia ser
trocada por comestíveis; (b) Reforçamento Individual do Relato de Brincar (seis
sessões): qualquer relato de brincar, independentemente de ter realmente brincado, produzia uma ficha e demonstração de
aprovação pelo experimentador. Por outro
lado, os relatos de que não havia brincado não produzia a apresentação das fichas
nem demonstração de aprovação pelo experimentador; (c) Reforçamento do Relato
de Brincar em Grupo (quatro sessões): essa
condição era semelhante à condição (b),
porém o período de relato era conduzido
em grupos de quatro crianças. Assim, cada
criança tinha acesso ao relato e à forma de
consequenciação dos relatos das outras;
(d) Reforçamento de Correspondência em
Grupo (oito sessões): o reforçador foi contingente ao relato correspondente ao comportamento ocorrido durante o período de
brincar. Cada relato correspondente com o
brincar ou não brincar produzia aprovação
e uma ficha, enquanto que os relatos não
correspondentes não produziam fichas nem
aprovação; (e) Reforçamento Não-Contingente (uma sessão): essa condição foi semelhante à linha de base, com a diferença que
as crianças recebiam seis fichas antes do
período de relatar ao invés de apenas uma.
O experimento teve cinco condições,
todas compostas por sessões experimentais
227
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
Resultados e Discussão
Durante a Linha de Base, todas as
crianças apresentaram alto nível de correspondência (seis das oito crianças apresentaram correspondência total, enquanto uma
delas emitiu um relato não correspondente
de ter brincado e a outra emitiu dois relatos
não correspondentes de não ter brincado).
Na condição de Reforçamento Individual
do Relato de Brincar, foi observada grande
variabilidade entre os participantes de pesquisa. Das oito crianças, seis apresentaram
pelo menos um relato não correspondente.
Quatro crianças não apresentaram correspondência apenas no início da condição,
e as outras duas relataram terem brincado
com todos os brinquedos disponíveis independentemente de terem realmente brincado, maximizando, assim, os reforçadores.
As outras duas crianças não apresentaram
nenhum relato não correspondente ao longo de toda a segunda condição, não se expondo assim à mudança de contingência
em relação à Linha de Base.
Na condição de Reforçamento do
Relato de Brincar em Grupo, que tinha
como objetivo permitir as crianças observarem o relato e consequências dos relatos
das demais, houve um aumento no número
de relatos de brincar independentes da correspondência desse relato. Cinco das oitos
crianças passaram a relatar terem brincado
com todos os brinquedos disponíveis, maximizando os reforçadores. As demais três
crianças emitiram relatos correspondentes ao longo de todo o estudo. Na condição
228
de Reforçamento de Correspondência em
Grupo, todas as crianças passaram a apresentar correspondência tanto para o relato
de brincar quanto para o de não brincar.
Apenas duas participantes precisaram de
três sessões nesta condição para que seus
relatos passassem a ser consistentemente correspondentes. Por fim, na condição
de Reforçamento Não-Contingente houve
100% de correspondência entre todas as
crianças.
Ribeiro (1989) discutiu os dados primeiramente apontando alto grau de correspondência dos participantes no início
do experimento (i.e., Linha de base), justificada, provavelmente, por um histórico
pré-experimental que teria estabelecido
eficientemente um padrão de correspondência. Este seria, segundo Ribeiro (1989),
também o motivo do porquê, na segunda
condição, quatro dos participantes terem
apresentado uma baixa frequência de relatos não correspondentes. Para o autor, é
provável que consequências “naturais ou
automáticas” do relato correspondente se
sobreponham as consequências arranjadas.
Apenas na condição Reforçamento de Relato de Brincar em Grupo foi possível observar um efeito do reforçamento
do relato sob o desempenho de não correspondência. A possibilidade de observar
a relação resposta-consequência em outro
participante, somada à interação verbal
entre as crianças (que descreveram umas
para as outras a contingencia vigente) foi
Capítulo XIV | Correspondência Verbal
fundamental para ampliar o controle do reforçamento sobre o relato de brincar independentemente da correspondência. Essas
variáveis sociais teriam permitido a exposição às contingências de reforçamento para
relatos de brincar não correspondentes,
os quais produziam mais reforçadores que
os relatos correspondentes nas condições
de Reforçamento de Relato de Brincar em
Grupo.
O papel do reforçamento na manutenção da correspondência ou não do relato
fica claro com o retorno, em todos os participantes, ao padrão de correspondência observado durante a condição Linha de Base,
que voltou a ser observado nas condições
de Reforçamento de Correspondência e de
Reforçamento Não Contingente. Nestas
duas fases, a apresentação de reforçadores
passou a ser contingente à correspondência e não ao mero relato de brincar. A partir
da variação da correspondência dos relatos
de brincar de cinco de oito participantes do
estudo em função das condições experimentais às quais foram submetidos, pode-se concluir que a correspondência verbal
é uma propriedade do comportamento função das contingências de reforçamento.
Ribeiro (1989) discute os relatos correspondentes como tatos, na medida em
que as respostas verbais estão sob o controle do comportamento de brincar prévio da
criança (SD não verbal). Por outro lado, os
relatos não correspondentes seriam instâncias de mando, na medida em que estariam
sob o controle das consequências para os
relatos específicos e não sob o controle do
comportamento de brincar prévio da criança. Outro aspecto demonstrado pelo estudo de Ribeiro foi o efeito do reforçamento
sobre as distorções de outros participantes
(i.e., aprendizagem por observação) e das
instruções (i.e., regras) fornecidas pelos
próprios participantes na Condição de Reforçamento de Relato de Brincar em Grupo
sobre a diminuição na acurácia do relato.
Esses resultados apontaram para o efeito
de variáveis sociais antecedentes sobre a
correspondência verbal, além das consequências para os relatos correspondentes ou
não.
DESDOBRAMENTOS
O experimento de Ribeiro (1989) foi
replicado no Brasil em pelo menos cinco
estudos (Dias, 2008; Ferreira, 2009; Ferreira, Neves, Simonassi, Andrade & Dias, 2014;
Pergher, 2002; Sadi, 2002). Sadi (2002), por
exemplo, replicou o estudo de Ribeiro com
alterações procedimentais mínimas, como
por exemplo a adição apenas do registro
de verbalizações espontâneas das crianças.
Já Pergher (2002), adicionou uma condição
na qual a criança observava outra criança
brincando e era solicitada a relatar o comportamento de brincar da colega. Ambos
estudos replicaram os resultados obtidos
por Ribeiro, não importando se o comportamento relatado era o próprio comportamento ou o comportamento de outras
229
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
crianças (Pergher, 2002). Entretanto, os participantes, na condição de Reforçamento da
Correspondência em Grupo, levaram mais
sessões para passar a emitir relatos correspondentes que os participantes do estudo
de Ribeiro.
Os experimentos de Dias (2008) e
Ferreira et al. (2014), trocaram o “fazer” utilizado no experimento de Ribeiro (1989) (i.e.,
o brincar) pelo comportamento de comer.
Participaram destes dois experimentos
crianças obesas e não obesas (Dias) e crianças e adultos também obesos e não obesos
(Ferreira et al.). Em ambos estudos foram
adicionadas fases de grupos heterogêneos
e homogêneos em relação aos participantes
acima (obesos) e abaixo (não obesos) do índice de massa corporal (IMC). Os dois estudos não observaram a variação dos relatos
não correspondentes em função das diferentes condições experimentais. Ou seja,
quando o brincar foi trocado pelo comportamento de comer, os resultados de Ribeiro
não foram replicados, ainda que Dias tenha
observado um aumento na frequência do
comportamento de comer para alguns participantes nas condições de Reforçamento
do Relato Individual e em Grupo de Comer.
Ferreira (2009) também não replicou
os resultados obtidos por Ribeiro (1989) ao
trocar o brincar pela tarefa de realizar operações matemáticas. Além disso, no estudo
de Ferreira, na etapa de relatar, perguntava-se à criança quantas “continhas” ela havia
feito, ao contrário dos estudos de Ribeiro
230
(1989), Dias (2008) e Ferreira et al. (2014) em
que o experimentador apontava para uma
fotografia do brinquedo ou do alimento e
perguntava se a criança havia brincado/comido ou não.
Ferreira (2009) levantou algumas hipóteses acerca das diferenças nos resultados de seu estudo e o de Dias (em relação
ao de Ribeiro (1989). Em primeiro lugar, nos
estudos de Ferreira e de Dias, o fazer da
criança deixava um registro evidente, como
os alimentos que sobraram ou as folhas de
papel com as operações concluídas ou não.
O mesmo não ocorre nos estudos do relato
de brincar, que era filmado sem o conhecimento das crianças. Diante dos registros
dos comportamentos de fazer operações
matemáticas e de comer, haveria a possibilidade de checagem a qualquer momento pelos experimentadores (ainda que esta
nunca tivesse ocorrido), o que poderia ter
diminuído a probabilidade de distorção do
relato.
Ferreira (2009) também comenta que
nenhum dos participantes de seu estudo e
do estudo de Dias (2008) emitiu relatos não
correspondentes de forma sistemática nas
condições de Reforçamento de Relato Individual ou em Grupo. Desse modo, é improvável que as condições de Reforçamento
de Relato em Grupo tenham sido eficazes
em propiciar mais relatos distorcidos como
nos estudos de Ribeiro (1989), Sadi (2002) e
Pergher (2002). Como todas as crianças nos
estudos de Ferreira e Dias apresentaram
Capítulo XIV | Correspondência Verbal
uma alta frequência de relatos correspondentes, as contingencias de reforçamentto
para relatos específicos correspondentes ou
distorcidos não modelaram os relatos não
correspondentes. Desse modo, a frequência
de relatos distorcidos era baixa na condição
de Reforçamento de Relatos em Grupo, dificultando a aprendizagem por observação
de modelos. Também é improvável que as
crianças desses estudos tenham formulado
regras acerca da possibilidade de distorção
do relato como fizeram as crianças do estudo de Ribeiro (1989). Sendo assim, os efeitos de instruções e de modelos reportados
nos estudos de Ribeiro (1989), Sadi (2002) e
Pergher (2002) parecem não ter ocorrido em
Ferreira (2009), Dias (2008) e Ferreira et al.
(2014).
Ribeiro (1989) e Sadi (2002) sugeriram que a idade dos participantes talvez tenha sido uma variável, não controlada, que
teve efeito na correspondência verbal dos
participantes, já que nas condições de Reforçamento de Relato Individual, apenas as
crianças mais velhas começaram a distorcer.
Os autores sugeriram que as crianças mais
velhas, ao contrário das mais novas, provavelmente já passaram por contingências de
reforçamento de relatos não correspondentes ou de punição de relatos correspondentes. Desse modo, seria mais provável que
as contingências de reforçamento para os
relatos de brincar na condição de Reforçamento de Relato Individual, ainda que não
correspondentes, passassem a exercer controle sobre o seu comportamento verbal. Já
as crianças mais novas talvez precisassem
ser instruídas ou terem acesso a modelos se
comportando de acordo com as contingências em vigor para passarem a distorcer os
relatos nas condições de Reforçamento de
Relato em Grupo. Por outro lado, os dados
de Ferreira et al. (2014) com adultos sugerem que essa não é uma variável relevante,
já que os relatos distorcidos de seus participantes adultos replicaram os apresentados pelas crianças, os quais não variaram
de acordo com as condições experimentais.
Talvez as diferenças quanto ao tipo de fazer
dos estudos de Dias (2008), Ferreira (2009) e
Ferreira et al. (2014) em relação aos demais
estudos, conforme discutido acima, possam
ser relevantes para entender a baixa frequência de relatos distorcidos mesmo em participantes adultos.
A correspondência verbal fazer-dizer continuou sendo investigada em diversos outros estudos no Brasil ainda que
com a metodologias distintas da utilizada
por Ribeiro (1989). Entretanto, com exceção dos trabalhos de Critchfield e Perone
(1990; 1993), fora do país, a atenção se voltou novamente para a direção dizer-fazer
(e.g. Baer & Detrich, 1990). Foi observada
uma queda no interesse pelo tema durante
a década de 1990, sendo retomado nos anos
2000 (LIoyd, 2002; López, Valverde & Luciano, 2011). Quanto aos estudos no Brasil, é
possível supor que, ainda que não se tratem
de replicações, estes estudos tenham sido
inspirados pelo trabalho de Ribeiro, pois o
estudo foi sistematicamente citado e descri231
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
to em praticamente todos esses trabalhos. É
possível propor três categorias para agrupar
esses estudos: (a) Estudos observacionais:
Um conjunto de estudos investigou a correspondência verbal sem manipular diretamente o reforçamento de relatos específicos ou de relatos correspondentes. Esses
estudos voltaram a enfatizar o fazer, como
os estudos anteriores ao experimento de
Ribeiro (1989). Outra especificidade desses
estudos foi a realização das pesquisas em
ambientes mais próximos ao natural, como
na realização de exercícios físicos em três
mulheres diagnosticadas com diabetes tipo
2 (Coelho, Wechsler & Amaral, 2008 – dizer-fazer); em consultas pediátricas de díades mães e filhos (Wechsler & Amaral, 2010
– dizer-fazer-dizer); em situações de sala
de aula de professores da rede estadual de
ensino (Leme & Pereira, 2012 – fazer-dizer-fazer; Ricci & Pereira, 2006 – dizer-fazer);
e no contexto organizacional entre gestores
(Ramalho & Pedroso, 2014 – fazer-dizer-fazer);
(b) Relatos acerca do próprio desempenho: Critchfield e Perone (1990; 1993) realizaram dois estudos nos quais os participantes eram solicitados a relatar se haviam
acertado ou não cada tentativa em um procedimento de escolha atrasada de acordo
com modelo, sendo manipuladas as condições de relato. Os estudos de Critchfield
e Perone foram extensamente replicados,
sendo avaliada a correspondência verbal
em função do histórico ou não de fracasso
escolar (Brino & de Rose, 2006; Cortez et al.,
232
2013); presença ou ausência do experimentador durante a sessão experimental (Brino
& de Rose, 2006); punição de relatos específicos em adultos (Sanabio & Abreu-Rodrigues, 2002); dificuldade da tarefa (Cortez
et al., 2013; Domeniconi, de Rose & Perez,
2014); tipo de desempenho relatado (Cortez,
de Rose & Miguel, 2014); e treino de correspondência (Brino & de Rose, 2006; Cortez
et al., 2013; Cortez et al., 2014; Domeniconi et al., 2014). Dentre as variáveis listadas
acima, a frequência de erros no fazer, ainda
que não manipulada diretamente, representou a variável mais relevante na determinação da precisão dos relatos acerca do
desempenho. Os treinos de correspondência se mostraram eficazes em estabelecer e
manter a precisão dos relatos.
No estudo de Brino e de Rose (2006),
por exemplo, as crianças eram solicitadas
a ler em voz alta uma palavra que aparecia
na tela do computador. Na tela do computador, em seguida, apareciam dois quadrados paralelos, um verde e um vermelho. Ao
clicar no quadrado verde a criança relatava
ter acertado a leitura, no quadrado vermelho que havia errado a leitura. Na linha de
base, a criança permanecia sozinha durante a aplicação do experimento e não havia
consequências programadas para os seus
relatos de acerto e erro. Na condição de
treino de correspondência, eram reforçados
os relatos correspondente de erro de leitura.
Também foi realizada uma condição experimental na qual o experimentador permanecia com a criança durante a realização do
Capítulo XIV | Correspondência Verbal
experimento e os relatos de erros e acertos
não tinham consequências programadas.
Os autores observaram que as crianças tendiam a relatar como acertos seus erros de
leitura na linha de base, o que não foi observado quando os relatos correspondentes
eram reforçados ou quando o experimentador permanecia com a criança durante o
experimento. Brino e de Rose concluíram,
com base nesses resultados, que o treino
de correspondência foi eficaz no estabelecimento da correspondência de relatos de
erros e que a presença de adultos pode ter
suprimido a emissão de comportamentos
punidos no passado como, por exemplo, os
relatos não correspondentes;
(c) Relato do valor das cartas em um
jogo de baralho. Diversos estudos sobre correspondência verbal foram realizados em
Brasília com um procedimento diferente
dos utilizados até então. Foi criado um jogo
de cartas inspirado em jogos de blefe (e.g.,
truco ou pôquer), com o objetivo de criar
condições mais próximas às naturais para
favorecer a emissão de relatos distorcidos
sem a necessidade de tokens e de reforçadores de retaguarda (e.g., guloseimas ou
pequenos brinquedos), ainda que estes pudessem ser usados. Nesse jogo, dois participantes jogavam um contra o outro, sendo
as partidas divididas em rodadas. Os jogadores recebiam pilhas de cartas e, a cada
rodada, coletavam uma (e.g., Souza, Guimarães, Antunes & Medeiros, 2014) ou duas
cartas (e.g., Medeiros, Oliveira & Silva, 2013)
de cima de sua pilha e relatavam de forma
correspondente ou não o valor da carta ou
da soma das cartas compradas. Quem relatasse o maior valor, a depender do estudo,
ganhava pontos (e.g., Medeiros, F. H., 2012)
ou descartava a carta (e.g., Medeiros et al.,
2013). Vencia a partida aquele que tivesse
mais pontos ou menos cartas após um número fixo de rodadas.
Após os relatos que podiam ser orais
(e.g., Medeiros et al., 2013), via seleção de
um valor numa janela da tela do computador (e.g., Medeiros, F. H., 2012) ou escritos
simultaneamente em um quadro branco
(e.g., Antunes & Medeiros, 2016; Demoly,
2016), um dado de seis faces real (e.g., Medeiros et al., 2013) ou virtual (e.g., Medeiros,
F. H., 2012; Demoly, 2016) era lançado e, a
depender do valor obtido, os participantes
precisariam mostrar as cartas que compraram para o oponente e para o experimentador. Consequências eram programadas
para relatos correspondentes ou não nos
diversos estudos realizados.
O efeito de diversas variáveis experimentais foi verificado sobre a precisão dos
relatos dos valores das cartas, como a probabilidade de checagem dos relatos, ou seja,
quantos valores do dado determinavam a
checagem (Medeiros et al., 2013); a magnitude das consequências punitivas para relatos distorcidos em termos do número de
cartas adicionais a serem compradas (Brito,
Medeiros, Medeiros, F. H., Antunes & Souza, 2014); a faixa etária dos participantes
(Souza et al., 2014); o modo como o relato
233
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
era solicitado (perguntas fechadas vs. perguntas abertas; Andrade, 2011; Souza et al.,
2014; Demoly, 2016); o tipo de consequência para relatos precisos (ganho de pontos)
e distorcidos (perda de pontos) em situação
computadorizada (Medeiros, F. H., 2012); e
a probabilidade de ganho da partida com a
emissão de relatos precisos (Antunes & Medeiros, 2016).
As variáveis manipuladas afetaram a precisão do relato do valor das cartas, demonstrando o efeito de aspectos do
ambiente sobre o comportamento verbal,
como em Ribeiro (1989). Em resumo, foi observado que, quanto menor a frequência de
checagem, a magnitude das consequência
punitivas para relatos distorcidos e a probabilidade de ganho com relatos precisos,
maior a frequência de relatos distorcidos.
Ao mesmo tempo, o tipo de consequência,
se punitiva para relatos distorcidos ou reforçadora para relatos precisos, não parece
ter efeitos sistemáticos sobre a correspondência verbal. Também foi verificado que a
solicitação do relato via perguntas fechadas
(e.g., você ganha a rodada?), ao invés de perguntas abertas (e.g., qual a sua carta?), produz relatos distorcidos mais frequentes. Por
fim, foi verificado que adultos distorcem
mais que as crianças caso não sejam fornecidas instruções acerca da possibilidade de
distorcer o relato.
234
CONSIDERAÇÕES FINAIS
Dentro da área de pesquisa de correspondência verbal, o estudo de Ribeiro
(1989) tem importância em vários sentidos.
Um primeiro ponto a ser destacado é sua
importância metodológica, como pode ser
observado nos experimentos citados acima (Dias, 2008; Ferreira 2009; Ferreira &
cols., 2014; Pergher 2002; Sadi, 2002). Mas
para além da mudança procedimental, ao
inverter a direção da correspondência tradicionalmente investigada naquela época
(i.e., passar a investigar a correspondência
fazer-dizer ao invés da correspondência
dizer-fazer) Ribeiro altera também o objeto
de estudo da área. Na direção dizer-fazer
investiga-se o controle verbal sobre o comportamento não verbal, ou seja, o foco está
sobre o fazer, onde o dizer se insere como
variável antecedente discriminativa. Com a
mudança de Ribeiro, a resposta verbal passa a ser o foco, e agora, a estimulação discriminativa é identificada como sendo o fazer,
um elemento da contingência controladora
do dizer. Assim, a investigação se volta para
as condições ambientais que determinam a
emissão da resposta verbal.
Essa mudança de foco do fazer para
o dizer, inaugurou, dentro da Análise Experimental do Comportamento, a investigação sistemática do que cotidianamente
é denominado mentir. Como sugere Medeiros (2013), em grande parte das vezes,
a única forma de acesso que temos acerca
do que uma pessoa fez ou ao ambiente que
Capítulo XIV | Correspondência Verbal
está exposta é o seu relato verbal. Desse
modo, caso o relato verbal não seja confiável, teremos muitas dificuldades para predizer e controlar o comportamento que não
se tem acesso direto. A área de investigação da correspondência verbal na direção
fazer-dizer, inaugurada por Ribeiro (1989),
é fundamental para a atuação do psicólogo no contexto aplicado, o qual, diante das
condições ambientais, terá mais condições
de avaliar um relato como fonte confiável
de acesso às informações ou não. Ademais,
terá condições de, ao manipular certos aspectos do ambiente (e.g., frequência de checagem, reforçamento diferencial de relatos
correspondente, solicitação de relatos via
perguntas abertas), afetar a correspondência verbal em contexto aplicado.
Extrapolando a área especifica de
pesquisa da correspondência verbal, o estudo de Ribeiro (1989) se soma, de forma
reconhecidamente robusta, ao banco de
dados que corroboram o caráter operante
do comportamento verbal. Ao demonstrar
a sensibilidade da frequência de respostas
verbais às variáveis antecedentes e consequentes, Ribeiro (1989) descreve o que, na
Análise do Comportamento, é denominado
controle. Assim, Ribeiro permite sustentar
a ideia de que tanto topografia quanto frequência de respostas verbais seriam estabelecidas e mantidas por sua relação com
variáveis ambientais. Em outras palavras, o
comportamento verbal poderia ser explicado a partir da noção de operante (Skinner,
1957).
O presente capítulo buscou permitir
ao seu leitor compreender o experimento
desenvolvido por Ribeiro (1989), tanto as
modificações metodológicas quanto conceituais por ele proposta. Além disso foram discutidos os desdobramentos possibilitados pelo mesmo na produção da área
de correspondência verbal. Como foi visto,
esse desdobramento é multifacetado, o que
marca ainda mais a sua importância para
área do comportamento verbal como um
todo.
PARA SABER MAIS
Antunes & Medeiros (2016). Estudo que investiga o efeito da probabilidade de reforçamento para relatos precisos sobre a correspondência verbal num jogo de cartas em
crianças.
Beckert (2005). Uma revisão de literatura
em correspondência verbal.
Cortez, de Rose, & Miguel (2014). Estudo
que investiga a correspondência do relato
de erros, sendo manipulando o tipo de tarefa relatada
Critchfield & Perone (1990). Estudo no qual
os participantes eram solicitados a relatar
se haviam acertado ou não cada tentativa
em um procedimento de escolha atrasada
de acordo com modelo, sendo manipuladas
as condições de relato.
235
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
REFERÊNCIAS
Andrade, C. M. R. Q. (2011). O efeito de perguntas abertas e fechadas na correspondência verbal. (Monografia de conclusão
de curso). Centro Universitário de Brasília,
Brasília.
Antunes, R. A. B., & Medeiros, C. A. (2016).
Correspondência verbal em um jogo de cartas com crianças. Acta Comportamentalia,
24, 15-28
Baer, R. A. & Detrich, R. (1990). Tacting
and manding in correspondence training:
Effects of child selection of verbalization.
Journal of the Experimental Analysis of
Behavior, 54, 23-30.
Beckert, M. E. (2005). Correspondência Verbal/Não-Verbal: Pesquisa Básica e Aplicações na Clínica. In J. Abreu-Rodrigues, &
M. R. Ribeiro (Orgs), Análise do comportamento: Pesquisa, teoria e aplicação (pp. 229
- 244). Porto Alegre: Artes Médicas.
B. Borges, L. F. G. Aureliano & J. F. Leonardi
(Orgs.). Comportamento em Foco, v. 4 (pp.
173- 188). São Paulo: ABPMC.
Coelho, C. R. & Wechsler, A., & Amaral, V.
L. A. R. (2008). Dizer e fazer: a prática de
exercícios físicos em portadores de diabetes
mellitus tipo 2. Revista Brasileira de Terapia Comportamental e Cognitiva, 10, 29-38.
Cortez, M. D., de Rose, J. C., & Miguel, C.
(2014). The role of correspondence training
on children’s self-report accuracy across
tasks. The Psychological Record, 64, 393402.
Cortez, M. D., de Rose, J. C., & Montagnoli,
T. A. S. (2013). Treino e manutenção de correspondência em autorrelatos de crianças
com e sem história de fracasso escolar. Acta
Comportamentalia, 21, 139–157.
Critchfield, T. S., & Perone, M. (1990). Verbal
self-reports of delayed matching to sample by humans. Journal of the Experimental
Analysis of Behavior, 53, 321–344.
Brino, A. L. F., & de Rose, J. C. (2006). Correspondência entre auto-relatos e desempenhos acadêmicos antecedentes em crianças com história de fracasso escolar. Revista
Brasileira de Análise do Comportamento, 2,
67-77.
Critchfield, T. S., & Perone, M. (1993). Verbal self-reports about matching to sample:
effects of the number of elements in a compound sample stimulus. Journal of the Experimental Analysis of Behavior, 59, 193–214.
Brito, R. L., Medeiros, C. A., Medeiros, F.
H., Antunes, R. A. B. & Souza, L. G. (2014).
Efeitos da magnitude da punição na correspondência verbal em situação lúdica. In N.
Demoly, P. M. (2016). Efeito de perguntas
abertas e fechadas na correspondência
verbal num jogo de cartas. (Monografia de
conclusão de curso). Centro Universitário
236
Capítulo XIV | Correspondência Verbal
de Brasília, Brasília.
Dias, J. S. (2008). Análise de correspondência entre comer e relatar de crianças. (Dissertação de mestrado). Universidade Católica de Goiás, Goiânia.
liminary study. International. Journal of
Psychology and Psychological Therapy, 11,
269-284.
Domeniconi, C, de Rose, J.C., & Perez, W.F.
(2014). Effects of Correspondence Training
on Self-Reports of Errors During a Reading
Task. The Psychological Record, 64, 381-391.
Medeiros, C. A. (2013). Mentiras, Indiretas,
Desculpas e Racionalizações: Manipulações e Imprecisões do Comportamento Verbal. In C. E. Costa, C. R. X. Cançado, D. R.
Zamignani, S. R. S. Arrabal-Gil (Orgs), Comportamento em Foco v. 2 (pp. 157- 170). São
Paulo: ABPMC.
Ferreira, J. V. (2009). Correspondência Fazer-Dizer em crianças na resolução de operações matemáticas. (Monografia de conclusão de curso). Centro Universitário de
Brasília, Brasília.
Medeiros, C.A., Oliveira, J. A., Silva, C. O.
(2013). Correspondência verbal em situação lúdica: efeito da probabilidade de checagem. Revista Fragmentos de Cultura, 23,
563-578.
Ferreira, M., Neves, S. M. M., Simonassi, L.
E., Andrade, M., & Dias, D. O. P. (2014). Análise comparativa da correspondência entre
comer e relatar de crianças e adultos. Fragmentos de Cultura, 24, 61-72.
Medeiros, F. H. (2012). Contingências de
reforçamento positivo e punição negativa
na correspondência verbal. (Monografia de
conclusão de curso). Centro Universitário
de Brasília, Brasília.
Leme, R. C., & Pereira, M. E. M. (2012). Correspondência verbal: a relação entre os
comportamentos verbal e não verbal de
professores. Acta Comportamentalia, 20,
71-85.
Paniagua, F. (1990). A procedural analysis
of correspondence training techniques. The
Behavior Analyst, 13, 107-119.
Lloyd, K. E. (2002). A review of correspondence training: suggestions for a revival.
The Behavior Analyst, 25, 57–73.
López, M. H., Valverde, M. R., & Luciano,
C. (2011). Contextual control and generalization of say-do correspondence: A pre-
Paniagua, F., & Baer, D. (1982) The analysis
of correspondence training as a chain reinforceable at any point. Child Development,
53, 786-798.
Pergher, N. K. (2002). De que forma as coisas
que nós fazemos são contadas por outras
pessoas? Um estudo de correspondência
entre comportamento não-verbal e verbal.
237
Carlos Augusto de Medeiros, Lucas Ferraz Córdova
(Dissertação de mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo.
York: Appleton-Century-Crofts.
Ramalho, N. V. R., & Pedroso, R. (2014).
Correspondência entre o dizer e o fazer do
comportamento do gestor. In C. Vichi, E.
Huziwara, H. Sadi, L. Postalli (Orgs.), Comportamento em Foco, v. 3 (pp. 115-126). São
Paulo: ABPMC.
Souza, R. S., Guimarães, S. S. Antunes, R.
A., & Medeiros, C. A. (2014). Correspondência verbal em um jogo de cartas: Perguntas abertas e perguntas fechadas. In N. B.
Borges, L. F. G. Aureliano & J. F. Leonardi
(Orgs.), Comportamento em Foco, v. 4 (pp.
189-204). São Paulo: ABPMC.
Ribeiro, A. F. (1989). Correspondence in
children’s self-report: tacting and manding
aspects. Journal of the Experimental Analysis of Behavior, 51, 361–367.
Wechsler, A. M., Amaral, V. L. A. R. (2008).
Dizer X Fazer de mães e filhos em exame
médico. Revista Psicologia em Estudo, 15,
55-63.
Ricci, L. S. V. & Pereira, M. E. M. (2006).
Uma análise da relação entre o dizer e o fazer do professor. Psicologia da Educação,
23, 27-55.
Risley, T., & Hart, B. (1968). Developing correspondence between nonverbal and verbal
behavior of preschool children. Journal of
Applied Behavior Analysis, 1, 267–281.
Sadi, H. M. (2002). A correspondência entre
o fazer e o dizer no auto-relato de crianças:
uma replicação de Ribeiro. (Dissertação de
mestrado). Pontifícia Universidade Católica
de São Paulo, São Paulo.
Sanabio, E. T., & Abreu-Rodrigues, J. (2002).
Efeitos de contingências de punição sobre
os desempenhos verbal e não verbal. Psicologia: Teoria e Pesquisa, 18, 161-172.
Skinner, B. F. (1957). Verbal Behavior. New
238
Marcelo Borges Henriques
Do indivíduo ao grupo:
simulações experimentais
de relações sociais com
animais não-humanos
Marcelo Borges Henriques
Universidade Federal de Goiás
Universidade de Brasília
Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental Analysis of
Behavior, 5, 531-533.
“Many social practices essential to the welfare of the species involve the control of
one person by another, and no one can suppress them who has any concern for human achievements”
(Skinner, 1971/1976, p.45)
239
Capítulo XV | Competição e Cooperação
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
O comportamento social foi tratado
por Skinner (1953/2000) como uma forma
de comportamento operante, obedecendo
os mesmos princípios básicos derivados dos
estudos com organismos individuais em interações com um ambiente não-social. Para
Skinner, o adjetivo “social” destaca certos
aspectos da relação condicional responsável pelo estabelecimento e manutenção do
comportamento. No comportamento social,
os eventos ambientais que estabelecem,
mantém e evocam o comportamento são
produzidos por outro indivíduo. Entretanto, as consequências de um comportamento social não precisam ser diretamente fornecidas por outro indivíduo. Há contextos
em que a consequência deve ser coproduzida, mediante a coordenação dos comportamentos de pelo menos dois indivíduos.
Neste último caso, o efeito ambiental correlacionado com a produção de consequências não é gerado pelo comportamento
individual, mas pela coordenação dos comportamentos de dois ou mais indivíduos
(i.e., efeito do comportamento grupal).
A definição de comportamento social de Skinner (1953/2000) é abrangente
e possibilita abordar diferentes tipos de fenômenos sociais, entre eles a competição
e cooperação. Uma interação social é denominada competitiva quando o sistema
reforçador impõe uma limitação ou impe-
dimento de acesso ao reforço para um indivíduo, em função do comportamento de
outro indivíduo dentro do mesmo sistema.
Já na cooperação, o acesso ao reforço é mútuo, desde que a coordenação entre os indivíduos produza o efeito especificado no
sistema (De-Farias, 2005).
É provável que o estudante de Psicologia não esteja familiarizado com as
definições apresentadas acima, e que apresente certo espanto ao saber que a Análise
do Comportamento também trabalha com
fenômenos sociais. É comum o desconhecimento de que, em artigos e livros escritos
por Skinner, o principal tema é o homem
em sociedade. Aproximadamente um terço
do livro Ciência e Comportamento Humano
(Skinner, 1953/2000) – um dos principais livros introdutórios do Behaviorismo Radical
– foi dedicado à análise do comportamento
de indivíduos em grupo (e.g., capítulos 19
à 29). Além disso, Skinner (1938), no início
de seu programa de pesquisas, deixou claro
que “a importância de uma ciência do comportamento deriva-se, em grande parte, da
possibilidade de uma eventual extensão às
questões humanas” (p. 441).
Talvez o espanto inicial se dê pela
forma típica pela qual a Análise do Comportamento é apresentada à comunidade
acadêmica: O famoso laboratório didático.
Por meio de experimentos demonstrativos,
virtuais ou reais, estudantes são ensinados
a observar, descrever e controlar o comportamento de organismos não-humanos
240
Marcelo Borges Henriques
individuais (tipicamente, ratos albinos). Estudantes que tiveram seu primeiro contato
com a área por meio do laboratório didático
devem se perguntar: “Ok, mas como pode
uma teoria que só faz experimentação com
animais não-humanos individuais ser utilizada para explicar relações sociais humanas? Como o trabalho experimental com
animais não-humanos pode ser estendido
ao comportamento humano, incluindo as
relações sociais”? O estudante que se vê
incomodado com estas questões está manifestando uma desconfiança legitima que
merece alguns esclarecimentos.
Há pelo menos duas possibilidades
para explicar por quê o estudante se sente incomodado com a extensão de princípios derivados de pesquisas com animais
não-humanos. Uma delas é a má compreensão sobre a teoria evolutiva, que o leva
a expressar uma concepção de que seres
humanos são animais “superiores” na escala evolutiva. Se fossemos mais complexos,
superiores e especiais, então seria impossível explicar o comportamento humano por
meio de estudos com outros animais, certo?
Contudo, este é um erro comum de interpretação. A continuidade filogenética ou
escala evolutiva não é linear. A continuidade filogenética é representada por árvores,
cada galho representando ramificações de
linhas prováveis de ascendência evolutiva.
Uma característica importante da escala é
a consideração de descontinuidades como
resultado da divergência de linhas evolutivas, e a extinção de muitas formas interme241
diárias de vida. Portanto, por si só, no que
diz respeito a qualquer medida de gradação
de complexidade, a escala não dá nenhuma
indicação do grau de complexidade dos organismos listados. A escala não é em termos
de complexidade, mas de tempo: o momento provável na história do planeta em que
cada espécie surgiu e que semelhanças cada
uma guarda com outras espécies extintas e
vivas (Hodos & Campbell, 1969). Portanto,
o homem não é mais complexo que outros
animais, ele é simplesmente distinto.
A singularidade de cada espécie também não pode ser usada como ataque contra a extensão de princípios. Os princípios
da seleção natural são aplicáveis a qualquer organismo vivo, independentemente
de suas especificidades. O mesmo poderia
ser dito sobre os princípios comportamentais básicos. Uma das premissas centrais na
Análise Comportamento é a ideia de que os
processos comportamentais são adaptações
biológicas selecionadas. O comportamento
é uma das propriedades mais importantes
da vida dos organismos, uma vez que é um
meio de ligação com o seu ambiente. Poderíamos dizer que o comportamento desempenha um papel crítico na evolução dos
organismos vivos e, por isso, os processos
de aprendizagem foram selecionados assim como outras características adaptativas
(Skinner, 1984). Logo, é possível abstrair das
pesquisas com animais não-humanos princípios que operam na seleção de comportamentos de qualquer espécie animal. Isto
não significa que não hajam singularidades.
Capítulo XV | Competição e Cooperação
Entretanto, as singularidades se dão naquilo que cada organismo é capaz de fazer
e dos eventos no mundo que são, e se tornam, relevantes para cada espécie (Sidman,
1960/1976).
O segundo ponto responsável pelo
incomodo é a falta de conhecimento sobre
as táticas de pesquisa em Análise do Comportamento. Os estudantes de Psicologia
têm em comum a noção errada de que os
pesquisadores em Psicologia devem trabalhar com humanos em situações mais próximas às reais. Caso o pesquisador opte por
trabalhar com animais não-humanos, os
experimentos deveriam gerar comportamentos análogos aos dos seres humanos,
pois esta seria a única maneira de se encontrar generalidade. Entretanto, quando o
assunto é a generalidade do dado científico,
a analogia não é um ingrediente necessário
(Sidman, 1960/1976).
Para demostrar a generalidade de
um processo, o cientista buscará a replicação experimental do dado. Uma das principais características das pesquisas em
Análise do Comportamento é a utilização
do próprio comportamento do sujeito experimental como fonte de comparação dos
efeitos das variáveis independentes. Mesmo que o pesquisador observe mudanças
comportamentais em função da introdução
de uma manipulação experimental, ele não
estará seguro até que uma replicação seja
feita. Um primeiro passo, seria reproduzir
a mudança comportamental ocasionada
pela manipulação da variável independente com o mesmo indivíduo. Se a replicação
é bem sucedida com o mesmo indivíduo, e
com outros indivíduo de uma mesma espécie, então o pesquisador poderia analisar a
generalidade do dado manipulando outros
parâmetros da variável independente. Após
sucessivas replicações o cientista poderia
se questionar se a variável independente
produziria o mesmo processo em indivíduos de outras espécies. Cada descoberta de
similaridades processuais é uma instância a
mais de generalidade (Sidman, 1960/1976).
Como o uso de animais não-humanos não compromete a compreensão da
singularidade humana nem é um problema para a generalidade dos dados, eles são
amplamente utilizados não só na Análise
do Comportamento mas também em outras ciências. Animais não-humanos são
utilizados na pesquisa experimental pois o
controle de variáveis independentes pode
ser mais facilmente alcançado, há possibilidade de controle genético e de história
de vida, além da possibilidade de se investigar os efeitos de variáveis que seriam
impossibilitadas por questões éticas em
pesquisas com humanos (Hake, 1982; Lattal, 2001). A pesquisa comportamental com
animais não-humanos desempenha um
papel central em muitas áreas de interesses
humanos, incluindo aprendizagem, psicopatologia e neurofisiologia. Quase todas as
técnicas eficazes em uma ampla variedade
de interesses aplicados tem suas origens na
pesquisa básica com animais não-humanos
242
Marcelo Borges Henriques
(Domjan & Purdy, 1995).
Até então estivemos apresentando os motivos e as vantagens de se utilizar
animais não-humanos em pesquisas comportamentais. Espera-se que, nesse momento, o estudante de Psicologia esteja em
melhores condições de compreender que o
estudo de questões sociais também podem
ser abordados nos mesmos moldes. O pesquisador analista do comportamento poderia se perguntar sobre a possibilidade de
simular contingências sociais tipicamente
humanas em animais não-humanos. Esta
seria uma maneira de investigar variáveis
relevantes para a ocorrência daquilo que é
adjetivado como social. Por exemplo, o pesquisador poderia se perguntar se a linguagem é um aspecto essencial das relações sociais. Porem, se dois animais não-humanos
apresentarem comportamento social tipicamente humano, somente pelo controle de
contingências de reforçamento, então esse
aspecto poderia ser questionado como um
critério necessário e suficiente para explicar o fenômeno social estudado. Portanto,
a ciência estaria mais próxima de compreender as variáveis envolvidas no fenômeno
humano (Herrnstein, 1964).
O exercício de simular contingências
sociais humanas com animais não-humanos chegou a ser realizado por Skinner, que
descreveu um experimento sobre cooperação com pombos no livro Ciência e Comportamento Humano (Skinner, 1953/2000).
Como este e outro experimento estavam
243
sendo constantemente descritos na literatura comportamental, Skinner ponderou
que seria aconselhável um relato mais explícito dos experimentos. Assim, em 1962,
ele publicou, no Journal of the Experimental Analysis of Behavior, o artigo que será
descrito a seguir. Vale ressaltar que esse artigo não foi o primeiro trabalho na literatura
analítico-comportamental sobre comportamentos sociais com animais não-humanos.
Daniel (1942) foi um dos primeiros autores a
argumentar ter obtido comportamento cooperativo em ratos em uma situação experimental. O que torna o artigo de Skinner
singular é a inclusão de um experimento
sobre competição e o tipo de contingência
cooperativa (i.e., o sistema reforçador mútuo). Além do mais, Skinner utilizou pombos ao invés de ratos, o que por si só torna o
experimento interessante em termos de replicação entre espécies e generalidade dos
dados.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
O artigo de Skinner (1962) descreve
dois experimentos demonstrativos, utilizados para ilustrar princípios comportamentais para estudantes da Universidade
de Harvard. Como os experimentos eram
demonstrativos, não há no artigo um relato
claro dos procedimentos, nem apresentação de dados quantitativos. O objetivo dos
experimentos foi demostrar que comportamento social análogo ao de humanos pode
Capítulo XV | Competição e Cooperação
ser obtido com animais não-humanos por
meio do controle de variáveis ambientais.
O Experimento de Competição
O primeiro experimento relatado por
Skinner (1962) procurou simular um jogo
de pingue-pongue com pombos, um contexto competitivo típico do comportamento social em humanos. O equipamento foi
descrito como uma versão “minimamente”
mecanizada de um equipamento já existente. O diferencial do equipamento utilizado
por Skinner era que a bola era movida pelos
próprios sujeitos, e não por um dispositivo
motor. O equipamento consistia basicamente em uma mesa com altura conveniente aos animais e com uma leve inclinação
partindo do centro para ambos os lados.
Dois pombos podiam ser posicionados um
frente ao outro, prevenindo que os pombos
pudessem voar ou se deslocar de suas posições sobre o equipamento. Uma bola de
pingue-pongue podia ser posicionada no
centro da mesa de tal forma que quando
solta, poderia rolar para qualquer um dos
lados. Alguns centímetros antes do final da
mesa, em ambos os lados, havia uma calha
onde a bola poderia cair. Ao cair na calha,
um interruptor ali localizado acionava o
comedouro do lado oposto, fornecendo alimento para o pombo ali posicionado.
Os passos para se obter a relação
competitiva entre os pombos foram sucintamente descritos no artigo. Os pombos
eram privados de alimento para controle de
peso corporal. O primeiro passo foi condicionar os pombos, separadamente, a bicar
uma bola de pingue-pongue padrão, fixada
à borda da mesa. O passo seguinte foi alternar a posição da bola ao longo da borda
da mesa e, posteriormente, a bola era deixada livre para rolar. No momento em que
a bola era deixada livre, o comportamento
dos pombos somente era reforçado se a bola
rolasse para um ponto predeterminado, ligeiramente distante da borda. Depois de o
pombo conseguir jogar a bola para além do
centro da mesa, o esquema de liberação do
reforçamento era modificado para ter certa
intermitência (i.e., nem todas as respostas
eram reforçadas). Somente após a manutenção do repertório de jogar a bola para a
calha, localizada no lado oposto da mesa,
foi que os pombos foram expostos ao sistema competitivo.
A nova condição experimental implicava em colocar ambos pombos um de
frente ao outro e deixar a bola rolar em direção a qualquer um dos animais, o qual poderia bicar a bola em direção ao lado oposto. A obtenção dos reforços (i.e., alimento)
fazia analogia à obtenção de pontos no jogo
de pingue-pongue. Na contingência competitiva o comportamento de um indivíduo
era reforçado em detrimento do outro, ou
seja, a “vitória” de um implicava a “derrota” do outro. Uma vez que a razão de reforços produzidos por cada pombo poderia ser
extremamente desproporcional, o comportamento do pombo mal sucedido poderia
entrar em extinção. Sendo assim, as parti244
Marcelo Borges Henriques
das eram mantidas por meio do controle de
peso dos animais, aumentando a privação
do pombo frequentemente derrotado ou diminuindo a privação do pombo frequentemente bem sucedido.
Resultados e Discussão
A descrição de Skinner (1962) é anedótica e relata o que o público em geral poderia observar da situação. Uma vez estabelecida a história de interação com o ambiente
experimental e colocados um de frente ao
outro, em lados opostos, cada pombo bicava efetivamente a bola de pingue-pongue,
jogando-a para o lado oposto. Os pombos
bicavam a bola de um lado para o outro até
que ela eventualmente rolasse para dentro
da calha no lado oposto. Skinner relata que
os animais rebatiam a bola em sequências
de cinco a seis rebatidas. Entretanto, o autor não observou evidências de variações
(e.g., em termos de velocidade ou direção)
nas bicadas dos pombos de modo a produzir a derrota do adversário.
O Experimento de Cooperação
O segundo experimento descrito por
Skinner (1962) foi uma simulação do fenômeno cooperativo. O equipamento consistia em duas câmaras experimentais unidas lado a lado, separadas por uma divisão
transparente. Em cada compartimento encontrava-se uma fileira vertical de três discos de resposta vermelhos, e abaixo de cada
arranjo de discos o comedouro que dava
245
acesso ao alimento. Dois pombos privados
de alimento foram treinados separadamente a bicar os discos. Somente um dos três
discos funcionava por vez de uma maneira
semialeatória. Após o estabelecimento da
resposta de bicar os discos, os pombos foram colocados juntos no equipamento com
uma nova contingência em vigor. A contingência cooperativa não só exigia que os
pombos “encontrassem” qual dos três discos estava em funcionamento, mas também que as respostas de ambos os pombos
ocorressem com uma diferença de meio segundo (0,5 s) uma da outra em discos correspondentes. A relação condicional programada na contingência cooperativa era a
seguinte: se bicadas ≤ 0,5 s uma da outra,
em discos correspondentes, então comida
para ambos; se bicadas > 0,5 s uma da outra
ou em discos diferentes, então comida não
era produzida. Procedimentos de privação
foram aplicados a ambos pombos (e.g., um
dos pombos poderia ser submetido a um nível de privação maior do que o outro), de
modo a alterar a frequência e alternância de
bicadas entre eles.
Resultados e Discussão
Skinner (1962) descreve que após
uma prolongada exposição à contingência
cooperativa, os pombos passavam a bicar
discos correspondentes quase que simultaneamente. Skinner também observou uma
divisão de trabalho entre os dois pombos.
Um dos pombos explorava os discos sendo
sempre o primeiro a bicar, e o outro pombo
Capítulo XV | Competição e Cooperação
seguia as respostas do primeiro bicando o
disco correspondente. A divisão de trabalho
foi invertida manipulando o nível de privação. O pombo mais privado aumentava a
frequência de exploração dos discos de forma que o antigo “líder” passava a seguir os
discos bicados pelo pombo agora mais privado. Segundo o relato de Skinner, a coordenação dos pombos se tornou tão perfeita
que dava a impressão de se estar observando um espelho. Em sua interpretação, o
primeiro pombo a bicar um disco fornecia
estímulos discriminativos para o segundo
pombo bicar no disco correspondente.
Por último, Skinner (1962) descreve
que a dupla de pombos desenvolvia um repertório de imitação generalizado em função do controle de privação, que gerava a
alternância da liderança. A alternância da
liderança estabelecia um contexto em que o
comportamento de ambos fosse controlado
pelo comportamento um do outro. Skinner
menciona que quando bebedouros eram
disponibilizados para cada pombo na câmara experimental, eles passavam a beber
água simultaneamente. Se os sujeitos experimentais fossem colocados do lado oposto aos discos, virados para o fundo transparente das câmaras, ambos começavam a
fazer movimentos exploratórios como uma
imagem no espelho.
DESDOBRAMENTOS
O experimento de Skinner (1962) que
teve maior influência em pesquisas subsequentes foi o experimento sobre cooperação. O procedimento e os resultados obtidos
por Skinner estabeleceram o contexto para
perguntas sobre os princípios básicos envolvidos em comportamentos sociais, tais
como a cooperação e aprendizagem social,
por exemplo. Como no estudo de Skinner
(1962) o comportamento do pombo “líder”
não foi manipulado assim como é comum
em um estudo sobre controle de estímulos,
não é claro em que medida o comportamento do pombo denominado de “seguidor” estava sob controle do comportamento
do pombo “líder”. Há a possibilidade de que
outros fatores no ambiente experimental
tenham exercido controle sobre o comportamento dos pombos. Tanto na imitação
quanto na cooperação é imprescindível que
ao menos um dos indivíduos emita respostas sob controle discriminativo dos comportamentos do outro indivíduo.
Para pesquisadores como Danson
e Creed (1970), Hake, Donaldson e Hyten
(1983), Husted e Mckenna (1966), Wiest
(1969) e Nakashika (2004), o aspecto central da análise de interações sociais, como a
relatada por Skinner (1962) no experimento
de cooperação, é o controle discriminativo.
O objetivo desses autores foi verificar se
animais não-humanos poderiam ser condicionados a emitir uma resposta sob controle do comportamento de outro indivíduo da
246
Marcelo Borges Henriques
mesma espécie (um estímulo social). Todos
os autores encontraram evidências de que
diferentes animais podem discriminar estímulos sociais de coespecíficos, sejam eles a
presença vs. a ausência de outro indivíduo
(e.g., Husted & Mckenna, 1966, com ratos),
a diferença na taxa de repostas emitida por
outro indivíduo (e.g., Danson & Creed, 1970,
com macacos-esquilo) ou a localização da
resposta do outro indivíduo (e.g., Nakashika, 2004, com pombos).
É verdade que os estudos de Danson
e Creed (1970), Hake, et.al. (1983), Husted e
Mckenna (1966), Wiest (1969) e Nakashika
(2004) apresentam uma diferença crucial
em relação ao experimento de cooperação de Skinner (1962). A contingência social criada pelos autores nestes estudos era
uma contingência individual. Os pesquisadores pré-definiam os papéis desempenhados por cada sujeito no experimento. O
comportamento de um sujeito servia como
fonte de estímulos, e o comportamento do
outro servia como variável dependente do
treino de controle de estímulos. O animal
cujo comportamento servia como um estímulo discriminativo estava exposto à sua
própria contingência. Já o comportamento
do sujeito experimental era reforçado diferencialmente para responder a determinadas características do comportamento do
sujeito-estímulo (e.g., em Danson & Creed,
1970, a taxa alta de respostas do sujeito-estímulo sendo o estímulo discriminativo e a
taxa baixa sendo o estímulo delta, i.e., na
presença da qual reforços não eram produ247
zidos). No estudo de cooperação de Skinner,
o reforço era contingente à produção de um
efeito ambiental que só podia ser produzido
com o comportamento conjunto dos indivíduos.
Entretanto, os estudos citados acima (e.g., Danson & Creed, 1970; Husted &
Mckenna, 1966) são úteis para discutir o
resultado do estudo sobre cooperação de
Skinner (1962): esses estudos discutem a
dificuldade de se gerar evidências de controle discriminativo por estímulos sociais.
Quando o estímulo não é o comportamento de outro indivíduo, há a possibilidade de
se controlar diferentes dimensões do estímulo, de forma que ele seja padronizado de
apresentação à apresentação (e.g., intensidade do comprimento de onda luminosa,
o intervalo de tempo entre apresentações
dos estímulos, entre outras). Quando o estímulo é o comportamento de outro indivíduo, inúmeras propriedades podem ser
diferentes de ocorrência a ocorrência, além
da dificuldade se isolar o evento de outros
estímulos não sociais presentes no experimento (e.g., a localização das respostas é
um estímulo não social que pode exercer
controle sobre o comportamento do outro
indivíduo pelo emparelhamento entre local e disponibilidade de alimento), dificultando interpretações. Hake, et al. (1983), por
exemplo, argumentaram que os resultados
dos estudos sobre comportamento social,
de maneira geral,
Capítulo XV | Competição e Cooperação
(...) sugerem que as futuras pesquisas
dução de consequências?.
sobre interações sociais, tais como
cooperação e competição deveriam
proporcionar o treino e/ou testes de
controle por parte do comportamento apropriado do outro sujeito ao invés de assumir que tal controle existe,
como tem sido frequentemente o caso”
(p. 22).
Sem uma evidência para além do relato de aquisição de coordenação entre os
animais não-humanos, é possível questionar em que medida um sujeito está efetivamente respondendo ao comportamento do
outro. Esta pergunta é essencial para que
possamos aceitar o estudo com animais
não-humanos como um modelo experimental de relações sociais humanas. Se os
pombos do experimento de cooperação de
Skinner (1962) tivessem adquirido uma alta
taxa de respostas alternadas, em função do
treino individual anterior, eles poderiam,
ao acaso, atender ao critério de reforçamento mútuo. A manipulação da privação
que gerava alternância na liderança poderia
ser somente um caso de mudança na frequência de exploração dos discos pelo pombo
anteriormente no papel de seguidor. Neste
caso, não haveria relação social ou cooperativa entre os pombos. Portanto, uma pergunta que poderia ser derivada do estudo
de Skinner é: A ocorrência da resposta cooperativa foi casual ou ambos indivíduos
estão efetivamente respondendo ao comportamento um do outro de modo a gerar o
efeito ambiental correlacionado com a pro-
Em um estudo mais recente, Tan e
Hackenberg (2016) demostraram preocupação com a possibilidade da explicação
alternativa para o comportamento cooperativo. Os autores estudaram pares de ratos
utilizando caixas experimentais paralelas,
divididas por uma parede de acrílico transparente, e em cada compartimento havia
somente uma barra. A contingência cooperativa era semelhante à de Skinner (1962),
pois reforços somente poderiam ser produzidos se a pressão à barra de ambos os ratos
fosse separada por 0,5 s. Cada par foi exposto a três condições em um delineamento do
tipo ABACA (i.e. “A” sendo a condição de reforçamento mútuo ou contingência cooperativa, “B” um esquema acoplado de tempo
variável, em que os reforços independiam
das respostas, e “C” um esquema acoplado
de intervalo variável, em que os reforços
dependiam das respostas, mas neste caso,
sem a contingência cooperativa). As condições “B” e “C” do estudo serviram como condições de controle, pois serviam como fonte
de comparação do repertório adquirido na
contingência cooperativa. Se a frequência
de cooperação entre os ratos fosse casual,
então a frequência de cooperação deveria
se manter relativamente inalterada mesmo
diante de outra contingência. Os esquemas
acoplados permitem controlar a taxa de reforços do esquema, tendo com base a taxa
de reforços obtidos em um outro esquema.
Este procedimento permite ao pesquisador
verificar se um padrão de comportamento é
248
Marcelo Borges Henriques
função da distribuição de reforços no tempo ou da relação condicional entre o comportamento e a produção de consequências
(ver Catania, 1999, p. 183). No procedimento
de Tan e Hackenberg (2016), a resposta de
um dos ratos abria um intervalo de tempo
que era registrado até que o segundo rato
pressionasse sua barra. Esse registro gerou
duas unidades de medida: a proporção de
intervalos menores do que 0,5 s entre as
respostas de ambos os ratos, e o número
de alternâncias entre as respostas, independentemente do critério de 0,5 s (i.e., nas
condições “B” e “C”, a ocorrência do reforço
interrompia o registro, independentemente
do segundo indivíduo ter emitido uma resposta).
O dado obtido foi favorável à contingência cooperativa. Quando a contingência
provia reforçamento para a coordenação
entre as respostas dos ratos, a frequência
de respostas grupais era significativamente
maior do que nas outras condições, mesmo
a distribuição de reforços sendo controlada
pelo acoplamento em vigor nas condições B
e C. Quanto ao número médio de respostas
de alternância, observou-se que a alternação de respostas foi maior na condição cooperativa, mas diminuiu consideravelmente nas condições dos esquemas acoplados
(i.e., o número de respostas individuais aumentou). Os resultados indicam que a contingência cooperativa promovia o entrelaçamento entre as respostas dos animais,
ou seja, um rato pressionava a barra sob
controle da resposta do outro rato. O dado
249
enfraquece a explicação alternativa de simultaneidade ao acaso. Mesmo assim, é
possível enfatizar a importância de garantir
que o efeito no ambiente seja efetivamente
fruto de controle social mútuo. Embora os
resultados do estudo de Tan e Hackenberg
demonstrem que a contingência cooperativa foi responsável pelo estabelecimento da
resposta grupal, não se pode deixar de destacar que o número de respostas coordenadas fora do critério foi muito maior, mesmo os pesquisadores tendo considerado o
desempenho em estado estável. Portanto, o
cuidado em demostrar que ambos animais
não-humanos estão efetivamente respondendo um ao comportamento do outro permanece.
CONSIDERAÇÕES FINAIS
Pesquisas que simulam interações
sociais humanas com animais não-humanos, como a apresentada neste capítulo,
testam o alcance dos conceitos básicos na
explicação de fenômenos sociais e expandem nossa compreensão dos processos que
seriam relevantes no comportamento humano. É uma maneira de explorar os limites dos processos comportamentais ou de
encontrar fenômenos que, em tese, só poderiam ser observados em humanos.
Ao longo do capítulo procuramos
exemplificar por meio da apresentação de
um artigo clássico (Skinner, 1962), e sua influência em pesquisas sobre cooperação na
Capítulo XV | Competição e Cooperação
Análise do Comportamento, que é possível
desenvolver pesquisas analítico-comportamentais de fenômenos sociais com animais não-humanos. Pôde-se discutir que
o uso de animais não-humanos em pesquisas analítico comportamentais torna-se
uma ótima oportunidade de se determinar
a extensão na qual os princípios comportamentais básicos podem se constituir em
explicações válidas sobre o comportamento social observado em humanos. Ademais,
os trabalhos citados no texto são um bom
exemplo de que a replicação sistemática e a
utilização de diferentes espécies de animais
não-humanos é o caminho para se ampliar
a generalidade dos princípios comportamentais básicos aplicados ao estudo de fenômenos sociais.
O artigo de Skinner (1962) é importante para a Análise do Comportamento
não só por fomentar a pesquisa experimental sobre comportamentos sociais, mas pela
relação condicional inovadora criada no estudo. A contingência cooperativa elaborada
por Skinner possibilita um olhar diferente
para a contingência de reforçamento. Enquanto esta última diz respeito ao comportamento de organismos individuais, a contingência cooperativa provê reforços para
o comportamento conjunto de organismos.
Neste sentido, a unidade de análise não é
mais o comportamento individual, mas o
comportamento grupal. Estudos experimentais sobre seleção de comportamentos
grupais podem contribuir para o melhor entendimento de alguns aspectos da seleção
de determinadas práticas culturais. O modelo inovador de programação de relações
condicionais no nível grupal vem sendo
testado em novas áreas, como no estudo de
metacontingências (e.g., Henriques, Navarini, Souza & Todorov, 2015, Todorov & Vasconcelos, 2015, Toledo, et al., 2015, Velasco,
Benvenuti & Tomanari, 2012).
Embora a demonstração de controle
por estímulos sociais seja, em alguma medida, um desafio para os pesquisadores da
área (Hake, et al., 1983), o processo de seleção por consequências continua valendo
na explicação do comportamento social. O
que há de especial em interações sociais é a
dificuldade de padronização no controle de
estímulos. Estímulos sociais são mais difíceis de se manipular do que os não sociais,
pois suas dimensões podem não ser tão
consistentes de uma apresentação à outra
e são comumente “contaminados” por estímulos não sociais (e.g., o som produzido
pela operação do equipamento; Danson &
Creed, 1970; Hake, et al., 1983).
Entretanto, a dificuldade da tarefa do
pesquisador não denota que sejam necessários constructos psicológicos hipotéticos
para se explicar o comportamento social
humano. Pesquisas com animais não-humanos caminham na direção do abandono de constructos hipotéticos por uma explicação baseada na descrição de relações
condicionais entre o comportamento de
indivíduos e grupos e variáveis ambientais
relevantes (Herrnstein, 1964).
250
Marcelo Borges Henriques
PARA SABER MAIS
Epstein (1981). Este artigo divulga parte das
pesquisas realizadas no projeto Columban
Simulations. O projeto consistiu em simular, com pombos, comportamentos exclusivamente humanos como a “comunicação
simbólica”, “insight”, “autoconsciência”, e
o “uso espontâneo de memorandos” para
determinar os princípios comportamentais
responsáveis pela ocorrência de tais fenômenos. O autor discute a implicação dos
dados para a Psicologia e como o uso de simulações com animais não-humanos pode
contribuir para uma melhor compreensão
do comportamento humano.
Schmitt (1998). Este capítulo apresenta
uma contextualização conceitual dos termos “cooperação” e “competição” como um
dos principais fenômenos sociais estudados
pela Análise do Comportamento. Ademais,
discute os principais procedimentos utilizados com humanos, as variáveis independente e dependente e compila os principais
resultados de pesquisas.
Schmitt & Marwell (1968). Os autores utilizaram uma tarefa experimental similar à
de Skinner (1962) com humanos. O objetivo
foi verificar se a estrutura do procedimento utilizado com animais não-humanos e
humanos poderia oferecer uma explicação
alternativa (e.g., a casualidade na coordenação das respostas) ao aumento da frequência da resposta cooperativa. Cada um
dos seis pares de participantes foram sub251
metidos a dois procedimentos: Um procedimento típico, em que cada oportunidade de
resposta cooperativa era separada por um
timeout; e um procedimento modificado
em que os participantes deveriam responder, necessariamente, ao estímulo (i.e., um
luz) produzido pelo parceiro para que uma
resposta cooperativa fosse registrada. Por
meio dos dados foi possível concluir que a
resposta grupal (cooperativa) é dependente
da presença de estímulos sociais (i.e., eventos no ambiente experimental gerados pelo
comportamento de outro indivíduo). Outra conclusão a que se pôde chegar é a necessidade de realçar o estímulo social (em
vez de utilizar o deslocamento motor como
estímulo, utilizar produtos físicos do comportamento, como uma luz que se acende
quando uma resposta é emitida por qualquer um dos indivíduos) em experimentos
derivados da contingência cooperativa de
Skinner.
Łopuch & Popik (2011). O estudo é interessante por ser uma pesquisa externa à
Análise do Comportamento. Apesar de utilizar um referencial teórico mais próximo à
etologia, os autores utilizam procedimentos operantes semelhantes ao de Skinner
(1962). Os pesquisadores avaliaram o efeito
de condições de restrição de contato físico,
visual e auditivo sobre a resposta cooperativa. Com base nos dados obtidos foi possível concluir que as respostas cooperativas
foram mais frequentes quanto maior a possibilidade de contato social, e que a vocalização dos animais pode ter sido um fator
Capítulo XV | Competição e Cooperação
facilitador das respostas cooperativas.
REFERÊNCIAS
Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto
Alegre, RS: Artmed.
Daniel, W. J. (1942). Cooperative problem
solving in rats. Journal of Comparative Psychology, 34, 361-368.
Danson, C., & Creed, T. (1970). Rate of response as a visual social stimulus. Journal of
the Experimental Analysis of Behavior, 13,
233-242.
De-Farias, A. K. C. R. (2005). Comportamento social: Cooperação, competição e trabalho individual. In J. Abreu-Rodrigues & M.
R.Ribeiro. Análise do Comportamento: Pesquisa, teoria e aplicação (pp. 265-281). Porto
Alegre: Artmed.
Behavior Analyst, 5, 21.
Hake, D. F., Donaldson, T., & Hyten, C.
(1983). Analysis of discriminative control by
social behavioral stimuli. Journal of the Experimental Analysis of Behavior, 39, 7- 24.
Henriques, M. B., Navarini, V., Souza, M.
C. G. & Todorov, J. C. (2015). Inter- aggregate-product-time distribution as a function
of differential reinforcement of temporally
spaced aggregate products. Painel apresentado na Reunião Anual da Society for the
Quantitative Analyses of Behavior, San
Antonio, Texas.
Herrnstein, R. J. (1964). Will. Proceedings of
the American Philosophical Society, 455458.
Hodos, W., & Campbell, C. B. (1969). Scala
naturae: Why there is no theory in comparative psychology. Psychological Review, 76,
337.
Domjan, M., & Purdy, J. E. (1995). Animal
research in psychology: More than meets
the eye of the general psychology student.
American Psychologist, 50, 496–503.
Husted, J. R., & McKenna, F. S. (1966). The
use of rats as discriminative stimuli. Journal
of the Experimental Analysis of Behavior, 9,
677-679.
Epstein, R. (1981). On pigeons and people: A
preliminary look at the Columban Simulation Project. The Behavior Analyst, 4, 43.
Lattal, K. A. (2001). The human side of animal behavior. The Behavior Analyst, 24,
147-161.
Hake, D. F. (1982). The basic-applied continuum and the possible evolution of human
operant social and verbal research. The
Łopuch, S., & Popik, P. (2011). Cooperative
behavior of laboratory rats (Rattus norvegicus) in an instrumental task. Journal of
252
Marcelo Borges Henriques
Comparative Psychology, 125, 250-253.
Nakashika, N. (2004). Pigeon’s behavior as a
discriminative stimulus. International Journal of Comparative Psychology, 17. 369-377.
Schmitt, D. R., & Marwell, G. (1968). Stimulus control in the experimental study
of cooperation. Journal of the Experimental
Analysis of Behavior, 11, 571-574.
Schmitt, D. R. (1998). Social behavior. In K.
A. Lattal & M. Perone (Eds.). Handbook of
research methods in human operant behavior (pp. 471-505). US: Springer.
Sidman, M. (1976). Táticas da pesquisa científica: Avaliação dos dados experimentais
na psicologia. São Paulo: Brasiliense. (Original publicado em 1960)
Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York:
Appleton-Century-Crofts.
Skinner, B. F. (2000). Ciência e comportamento humano. São Paulo: Martin Fontes
(Original publicado em 1953).
Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental
Analysis of Behavior, 5, 531-533.
Skinner, B. F. (1976). Beyond freedom and
dignity. Harmondsworth: Penguin Books.
(Original publicado em 1971).
253
Skinner, B. F. (1984). The evolution of behavior. Journal of the Experimental Analysis of
Behavior, 41, 217-221.
Tan, L., & Hackenberg, T. D. (2016). Functional analysis of mutual behavior in laboratory rats. Journal of Comparative Psychology, 130, 13–23.
Todorov, J. C., & Vasconcelos, I. (2015). Experimental analysis of the behavior of persons
in groups: Selection of an aggregate product
in a metacontingency. Behavior and Social
Issues, 24, 111-125.
Toledo, T. F. N., Benvenuti, M. F. L., Sampaio, A. A. S., Marques, N. S., Cabral, P.
A. A., Araújo, L. A. de S., … Moreira, L. R.
(2015). Free Culturant : A software for the
experimental study of behavioral and cultural selection. Psychology & Neuroscience,
8, 366–384.
Velasco, S. M., Benvenuti, M. F., & Tomanari, G. Y. (2012). Metacontingencies, experimentation and nonhumans: Searching for
conceptual and methodological advances.
Revista Latinoamericana de Psicología, 44,
25-34.
Wiest, W. M. (1969). Socially mediated stimulus control in pigeons. Psychological Reports, 25, 139-148.
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
Metacontingências:
investigação experimental
da seleção cultural
Fábio Henrique Baia
Alina Barboza Cabral Bianco
Isabella Guimarães Lemes
Poliana Ferreira da Silva
Universidade de Rio Verde
Vichi, C., Andery, M. A. P. A., Glenn, S. S. (2009). A metacontingency experiment: The effects of
contingent consequences on patterns of interlocking contingencies of reinforcement. Behavior
and Social Issues, 18, 41-57.
“É o efeito sobre o grupo e não as consequências reforçadoras para seus membros, o
responsável pela evolução da cultura”
(Skinner, 1981, p. 215)
254
Capítulo XVI | Cultura
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
consequências. Tal modelo especifica três
níveis de seleção comportamental: filogenia, ontogenia e cultura.
A Análise do Comportamento é uma
ciência que tem o comportamento dos organismos como seu objeto de estudo (Baum,
2006). Para um analista do comportamento,
o comportamento não carece de elementos
externos a sua definição para ser compreendido (e.g., Skinner, 1974). A definição de
comportamento envolve a relação entre
ambiente e organismo (Pierce & Cheney,
2008; Skinner, 1953). Portanto, a explicação
do comportamento não envolve outros elementos que não sejam eventos ambientais
e eventos do organismo. Por exemplo, vejamos o caso de alguém afirmar que o comportamento é causado por “pensamento”
ou “sentimento”. Neste caso, “pensamento”
ou “sentimento” seriam externos ao comportamento. E assim, para essas pessoas os
pensamentos deveriam ser compreendidos
fora da definição de comportamento. Para
analistas do comportamento pensamentos
são um tipo de comportamento – chamados eventos privados – que devem ser explicados dentro da definição relacional entre ambiente e organismo (Tourinho, 2009),
e não como algo que causa essa relação. No
Behaviorismo Radical, o termo “radical” faz
referência à “raiz”, isto é, o comportamento
é investigado como um objeto de estudo legítimo (Chiesa, 2006) e não como um acessório explicativo para outros fenômenos –
como desejos e sentimentos. Skinner (1981)
propôs o modelo explicativo de seleção por
A filogenia envolve a história da espécie (Mayr, 2009). Nesse nível de seleção,
comportamentos que permitiram a sobrevivência da espécie foram selecionados e
passaram a compor o repertório dos organismos (Melo, Dittrich, Moreira, & Martone, 2013). Vejamos o caso do reflexo de sucção. Imagine a situação hipotética de dois
grupos de recém-nascidos em um período
passado longínquo. Um grupo nasceu – graças à mutação – com a capacidade de sugar
dada a apresentação de algo em sua boca,
como o seio da mãe. O outro grupo nasceu
sem essa capacidade. Quais bebês tem mais
chance de sobreviver? Certamente aqueles
do grupo com a capacidade de sugar, já que
não terão que aprender esse comportamento. Esses, portanto, serão capazes de mamar
segundos após o parto. Esses bebês terão
mais chance de chegar a fase adulta, se reproduzir e transmitir a seus descendentes
essa capacidade. Já os outros bebês dificilmente conseguiram mamar e morrerão antes mesmo de se chegarem à vida adulta.
A ontogenia diz respeito à história de
vida de um organismo. Neste caso, estímulos que antes não eram capazes de eliciar
respostas podem adquirir essa capacidade
se contingenciados a estímulos que eliciam
respostas. No exemplo do choro, o médico
por si só é incapaz de eliciar o choro em recém-nascidos. Mas se repetidamente o mé255
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
dico der tapas no bumbum do bebê, após
algumas tentativas, a mera presença do
médico poderá disparar a resposta de choro na criança. Note que bebês não nascem
com a capacidade de chorar dada a mera
presença do médico, mas em sua vida, se a
situação acima ocorrer, então o recém-nascido aprenderá a chorar dada a presença do
médico.
Outra possibilidade de aprendizagem de comportamentos durante a história
de vida se dá pela relação contingente entre
respostas e suas consequências. O bebê, ao
chorar, é colocado no seio da mãe, com isso
passa a ter acesso ao leite materno. Essa relação estabelecerá que a resposta de chorar
tem como consequência o alimento (Tourinho, 2009). Portanto, no futuro, em situações nas quais o bebê estiver privado de
alimento, ele provavelmente emitirá a resposta de chorar que no passado foi reforçada com a apresentação de alimento.
O terceiro nível de seleção descrito
por Skinner (1981) é a cultura. Por cultura,
entende-se a manutenção do ambiente social de um grupo (Andery, 2011). Nesse sentido, comportamentos são selecionados por
atenderem critérios sociais de reforçamento
e punição estabelecidos por um dado grupo
de indivíduos. Por critérios sociais nos referimos a situações nas quais o comportamento de um organismo é reforçado ou punido por consequências que são mediadas
por outros indivíduos.
256
No caso do choro, uma pessoa pode
aprender durante sua história de vida a chorar se esta resposta produzir como consequência retirada da demanda de trabalho. Porém, em um grupo de pesquisas, ao chorar
após a demanda do orientador, os demais
membros do grupo podem punir o comportamento da colega reclamando da mesma.
Assim, o grupo estabelece que tal resposta é
passível de punição. Ou seja, o ambiente social criado pelos membros do grupo de pesquisa estabelece condições para supressão
de comportamentos. Este exemplo ilustra a
tradição de analistas do comportamento interessados no terceiro nível de seleção, que
investigam de que modo o comportamento individual é determinado pelo ambiente social (e.g., Baum, Richerson, Efferson,
& Paciotti, 2004; Cohen, 1962; Schmitt &
Marwell, 1968; Schmitt, 1998; Tan & Hackenberg, 2012, 2016). Nesses casos, aspectos
da cultura são entendidos como variáveis
independentes e os comportamentos são
investigados como variáveis dependentes
(Andery, 2011).
Porém, a cultura também pode ser
entendida como variável dependente. Nesse caso, o interesse de analistas do comportamento é compreender como práticas culturais são mantidas. Práticas culturais são
comportamentos socialmente aprendidos
que são similares e que são transmitidos
entre diferentes gerações de membros de
um grupo de indivíduos (Glenn, 2004; Sampaio & Andery, 2010). Por exemplo, analistas do comportamento tentam explicar por
Capítulo XVI | Cultura
quê uma pratica cultural como parar o carro
diante da faixa de pedestres se inicia (Sénéchal-Machado & Todorov, 2008), ou ainda
politicas públicas, como programas de controle de reprodução de animais abandonados e que habitavam as ruas da cidade de
São Carlos (Bortoloti & D’Agostino, 2007) .
Esse tipo de análise tem como objeto o que
Skinner (1981) especificou na epígrafe desse capítulo: a evolução da cultura. Quando
estudamos a evolução da cultura, entendemos que as consequências que selecionam
práticas culturais agem sobre o grupo e não
como consequências individuais do comportamento de cada membro do grupo. Mas
o grupo não é um organismo que se comporta. Quem se comporta são os indivíduos
membros do grupo. Assim, teoricamente,
um grupo não pode ser sensível às consequências. Então como pode uma consequência agir sobre o grupo?
tingência: estímulo discriminativo (SD), resposta (R) e estimulo reforçador (SR). Note
que são apresentadas duas possibilidades
de entrelaçamentos, mas existem muitas
outras possibilidades. Escolhemos estas
pois representam duas situações distintas
no que se refere a produção de reforços.
Na primeira, apresentada no quadro da esquerda, a coordenação de respostas produz
diferentes reforçadores para cada organismo. Este é o caso dos pombos cooperativos
descritos por Skinner (1962). Naquele estudo, quando os pombos coordenavam suas
respostas bicando cada qual em um disco
diferente, porém ao mesmo tempo, reforços
eram liberados para cada organismo.
Primeiramente, é preciso ter clareza de que o objeto de estudo da Análise
Comportamental da Cultura (ACC) ainda é
o comportamento e quem se comporta são
os organismos individuais. Porém, esse objeto de estudo não é o comportamento de
um único individuo, mas o comportamento
de vários indivíduos (que geralmente, mas
não necessariamente, recorre entre gerações). Nesse caso, as contingências estão
entrelaçadas, isto é, as contingências comportamentais individuais estão conectadas
umas às outras (Skinner, 1953). Como pode
ser visto na Figura 1, o comportamento de
cada indivíduo é descrito pela tríplice con-
Figura 1. Diagrama de contingências comportamentais entrelaçadas.
No quadro da esquerda os indivíduos precisam coordenar suas respostas para produzir reforços para cada organismo. No quadro da direita, a
coordenação de respostas produz um reforço comum que é partilhado
pelos organismos.
O quadro da direita da Figura 1 apresenta a situação na qual dois organismos
coordenam suas respostas e produzem uma
consequência comum para ambos. O exemplo descrito por Sampaio e Andery (2010) é
uma situação em que vários organismos
precisam coordenar suas respostas para remover uma pedra de uma tonelada. Note
que somente um dos organismos atuando
sozinho não poderia remover a pedra. A remoção da pedra só é possível pela coorde257
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
nação das respostas de vários organismos.
Além disso, a consequência – pedra removida – é partilhada por todos os organismos
envolvidos.
Em ambos os casos apresentados na
Figura 1, é o comportamento de organismos
individuais que é sensível às consequências
(Todorov, 2012). Mas no estabelecimento e
manutenção de uma cultura, a produção
das consequências depende do “conjunto”,
do entrelaçamento, dos comportamentos
dos indivíduos.
Portanto, não se afirma que o “grupo”
é sensível às consequências. A passagem
de Skinner (1981) que serve como epígrafe
desse capítulo ressalta que a recorrência da
prática dependerá dos efeitos sobre o grupo
como um todo. Por exemplo, a adoção de
uma nova prática de pesca dependerá das
consequências para o grupo: mesmo que
um dos membros do grupo tenha menos lucro individualmente, se o grupo como um
todo lucrar mais, é provável que a nova prática se torne mais frequente do que a antiga.
Culturante
Figura 2. Diagrama de uma metacontingência. Os comportamentos
operantes estão envolvidos em contingências entrelaçadas. Em conjunto, os comportamentos geram um produto agregado (PA). Como o
PA atende o critério ambiental uma consequência cultural (CC) é liberada.
258
Glenn (1986, 1988, 1991, 2004) descreveu um tipo de programação de contingências chamada metacontingência para
descrever a seleção de práticas culturais.
Como pode ser visto na Figura 2, o conceito
descreve uma relação de dependência entre culturantes e consequências culturais
(Glenn et al., 2016). Culturantes se referem
à contingências comportamentais entrelaçadas (CCEs) e seus produtos agregados
(Hunter, 2012). Desse modo, assim como o
operante é entendido como uma classe de
respostas que é controlada por uma mesma
consequência, o culturante seria uma classe
de CCEs mais PA que estão sob controle das
mesmas consequências culturais. O produto agregado (PA) é um efeito ambiental que
só pode ser produzido pelo comportamento
de diversos indivíduos que estão envolvidos
em CCEs (Vichi & Tourinho, 2011). Em uma
programação de metacontingência, caso o
PA atenda um critério, consequências culturais (CC) são produzidas. Essas consequências culturais alteram a probabilidade futura de recorrência dos culturantes.
O caso da pesca ilustra esta situação
(Costa, Nogueira e Vasconcelos, 2012). Imagine um grupo de pescadores que se reúne
para pescar em alto mar. Este grupo de pescadores utiliza a técnica da tarrafa. Tarrafas
são redes artesanais redondas que contém
pesos em suas bordas. Os pescadores jogam
as tarrafas no mar e puxam de volta. Os
pescados ficam presos nessas tarrafas. Neste caso, o barco de pesca possui um capitão
que navega a embarcação, pescadores, lim-
Capítulo XVI | Cultura
padores de peixe e pessoas que armazenam
os peixes em recipientes refrigerados. Cada
indivíduo envolvido na pescaria tem seu
comportamento controlado por uma consequência, mas esses comportamentos individuais estão envolvidos em CCEs. Veja,
o capitão tem seu comportamento reforçado por atingir o local de pesca. O local de
pesca funciona como SD para o comportamento dos pescadores de jogarem as tarrafas e a puxarem de volta. A consequência
para o comportamento dos pescadores são
os pescados. Os pescados são, por sua vez,
SD para o comportamento dos limpadores
de peixes, que tem seus comportamentos
reforçados por pescados limpos. Por fim,
pescados limpos são SD para o comportamento dos armazenadores de alocarem os
pescados em recipientes refrigerados.
Além das consequências individuais,
as CCEs geram o PA: quantidade de peixes
pescados e limpos, digamos, 1 tonelada.
Com essa quantidade, os pescadores podem
vender os pescados e assim produzirem mil
reais (CC). Essa quantidade de dinheiro irá
selecionar (i.e., tornar mais frequente) o
comportamento dos pescadores de se reunirem e utilizar tarrafas.
Assim como nos níveis filogenético
e ontogenético, é possível observarmos variação no nível cultural. Por exemplo, além
da tarrafa, os pescadores podem fazer uso
de redes de arrastro. Neste caso, as redes
são lançadas ao fundo do mar e o barco é
colocado em movimento. Com isso, os pei-
xes ficam presos nas redes de arrastro e
são retirados do mar. Novamente, o comportamento de cada organismo envolvido
produz sua consequência reforçadora individual. Porém, o PA gerado é maior do que
aquele produzido pela técnica de tarrafas.
Digamos que a técnica de redes de arrastro
gere 3 toneladas de peixe. Logo, a CC será
três mil reais. Neste caso, a prática cultural selecionada será a de utilizar a técnica
de redes de arrastro. O problema é que esta
técnica produz certos efeitos ambientais
deletérios. Redes de arrastro coletam não
apenas os peixes de tamanho adulto, mas
também peixes que ainda não atingiram a
idade adulta. Outro problema é que peixes
que não são alvo de pesca acabam sendo
pescados e morrem no processo. Com isso,
a quantidade de peixes diminui a em médio
e longo prazo e essa técnica de pesca é considerada predatória e danosa. Mas como
produz CC de maior magnitude em curto
prazo, provavelmente esta técnica é que
será seleciona.
Note que quando se programam metacontingências, os comportamentos individuais podem ser selecionados por seus
reforçadores. Porém, esses comportamentos podem ser alterados sem que se modifiquem as contingencias operantes individuais. É nesse sentido que se afirma que há um
terceiro nível de seleção (cf. Skinner, 1981):
Diferentes arranjos do tipo [CCEs + PA] →
CC podem produzir mudanças no comportamento dos organismos envolvidos sem
que se haja mudanças em cada contingên259
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
cia operante individual envolvida no entrelaçamento.
Apesar da proposição do conceito de
metacontingência ter ocorrido em meados
da década de 1980 (Glenn, 1986), apenas em
2004 o primeiro trabalho experimental foi
realizado. O experimento conduzido por
Christian Vichi fez parte de sua dissertação
de mestrado e foi publicado incialmente
como capítulo de livro (Vichi, 2005) e, mais
tarde, como artigo, no Behavior and Social
Issues (Vichi, Glenn, & Andery, 2009). Além
de ter sido o primeiro trabalho experimental
sobre metacontingência, o estudo tornou-se clássico por descrever um de delineamento experimental e um procedimento
para investigação de práticas culturais em
laboratório.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Vichi et al. (2009) investigaram se a
apresentação contingente de consequências culturais (ganhos) a determinado produto agregado (modo de distribuição dos
ganhos obtidos, se igual ou desigual) poderia influenciar interações entre indivíduos
em pequenos grupos. A engenhosidade dos
autores foi programar consequências para a
decisão do grupo de como distribuir os ganhos, o que só poderia ser produzido pelas
interações de todos os membros do grupo e não pelo comportamento individual
de cada participante. Assim, mudanças no
260
comportamento individual não poderiam
ser explicadas como efeito de consequências para o comportamento de indivíduos,
isto é, por reforçamento. Lembre-se, no reforçamento, uma classe de respostas de um
individuo tem sua probabilidade de ocorrência aumentada por um evento ambiental contingente. Na programação de Vichi
et al., as respostas de todos os indivíduos
seriam alteradas ao se exigir um tipo específico de interações entre todos os membros
do grupo para que as consequências fossem
liberadas. Desse modo, foi produzida em laboratório a situação sugerida por Skinner
(1981) na epígrafe desse capítulo.
Os participantes do estudo de Vichi
et al. (2009) foram oito universitários de
ambos os sexos, distribuídos em dois grupos
com quatro participantes cada. O delineamento utilizado foi intrassujeitos. Os participantes em cada grupo foram expostos a
diferentes ordens de condições. O Grupo 1
foi exposto à ordem A-B-A-B e o Grupo 2 à
ordem B-A-B. A programação de diferentes
ordens de condições verificar se há algum
efeito que é função da ordem de exposição
às condições (ver Sidman, 1960). A mudança de condições envolvia atingir o critério
de estabilidade exigido. Tal critério foi estipulado como 10 distribuições consecutivas
de acordo com as exigências programadas
para a condição.
A tarefa utilizada foi baseada no
trabalho de Wiggins (1969). Uma matriz
composta por oito colunas e oito linhas foi
Capítulo XVI | Cultura
impressa e fixada em uma parede da sala
experimental. A junção entre colunas e linhas formavam células (ao todo, 64 células).
Metade das células foram preenchidas com
símbolos de adição (+) e as demais com símbolo de subtração (–). Cada sessão foi composta por 30 ciclos. Um ciclo era composto por apostas, nas quais cada participante
entregava fichas para compor a aposta do
grupo, o anuncio de uma das linhas pelos
participantes, o anuncio de uma das colunas pelo pesquisador, e o anuncio de ganhos e distribuição de ganhos. Assim, no
começo de cada ciclo, cada participante entregava uma quantidade de fichas a seu critério para compor a aposta do grupo. Após
todos os participantes terem entregado sua
quantidade de fichas para a aposta, o experimentador solicitava que fosse realizada
escolha consensual dos participantes por
uma linha da matriz. Tendo sido declarado acordo consensual por uma das linhas,
o pesquisador declarava a escolha de uma
das colunas. Caso a junção entre linha e
coluna fosse um símbolo de adição, os participantes recebiam o dobro do total (i.e.,
a soma das apostas individuais) apostado.
Se a junção entre linha e coluna fosse um
símbolo de subtração, os participantes recebiam metade do valor total apostado. Por
fim, os participantes distribuíam os ganhos
da aposta entre todos os membros do grupo.
A escolha do pesquisador por uma
coluna não era aleatória. O pesquisador escolhia uma coluna que resultasse em adição
ou subtração a depender da maneira como
os ganhos eram distribuídos entre os participantes no final da tentativa anterior. Na
condição A, caso os participantes distribuíssem seus ganhos igualmente (i.e., a mesma quantidade para cada membro) na tentativa anterior, o pesquisador escolhia uma
coluna que necessariamente resultaria em
adição (i.e., produzindo como ganho para o
grupo o dobro do valor apostado na tentativa). Distribuições desiguais de ganhos na
tentativa anterior (i.e., cada participante recebia diferentes quantidades de fichas) levavam o pesquisador a selecionar um símbolo
de subtração (i.e., produzindo como ganho
para o grupo metade do valor apostado na
tentativa). Na condição B, as programações
foram invertidas: caso os participantes distribuíssem seus ganhos desigualmente (i.e.,
diferentes quantidades para cada membro)
na tentativa anterior, o pesquisador escolhia uma coluna que necessariamente resultaria em adição (i.e., produzindo como
ganho para o grupo o dobro do valor apostado na tentativa). Distribuições iguais de
ganhos na tentativa anterior (i.e., cada participante recebia a mesma quantidades de
fichas) levavam o pesquisador a selecionar
um símbolo de subtração (i.e., produzindo
como ganho para o grupo metade do valor
apostado na tentativa).
A exposição sucessiva do mesmo
grupo à diferentes condições possibilitou
investigar se o modo como os participantes
distribuíam seus ganhos poderia ser alterado por mudanças nas metacontingências
sem que houvesse mudanças nas contin261
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
gências operantes. Por um lado, se os resultados indicassem que a distribuição de
ganhos não foi alterada a despeito das diferentes metacontingências (i.e., as condições
A e B descritas anteriormente), isso significaria que as consequências para o grupo
não eram capazes de selecionar diferentes
práticas (i.e., a distribuição de ganhos entre
participantes ao final de cada tentativa). Por
outro lado, caso a distribuição de ganhos
se alterasse dadas as alterações nas metacontingências, seria demonstrado que as
consequências providas pelo pesquisador
estavam selecionado as práticas sem que
houvesse interferência nas contingências
operantes.
O procedimento de Vichi et al. (2009)
estabeleceu que o culturante fosse composto pelas respostas verbais dos participantes
(CCEs) que geravam a escolha consensual
por uma linha (PA) que, se atendesse o critério da condição, produzia o dobro ou metade do valor apostado (CC).
Resultados e Discussão
De modo geral, os dois grupos distribuíram seus ganhos de acordo com a
metacontingência programada em cada
condição. Porém, na condição B, na qual a
metacontingência exigia distribuição desigual, os pesquisadores precisaram intervir
já que os participantes incialmente tendiam
a não realizar distribuições desiguais. Tal
estratégia não foi prevista quando o experimento foi delineado. Porém, os dados ob262
tidos demandaram a realização de uma intervenção: o pesquisador informava que era
necessário reter parte dos ganhos para “o
banco” (i.e., quem pagava as apostas). Esse
“confisco” foi uma estratégia desenvolvida
pelos pesquisadores durante o experimento
para produzir contato com a metacontingência em vigor na condição B.
Em algumas situações experimentais
é necessário realizar intervenções de modo
que o comportamento do organismo ocorra
e entre em contato com as contingências em
vigor. Reflita, se o comportamento nunca
ocorrer, como as consequências poderiam
seleciona-lo? Assim, forçamos a ocorrência
do comportamento para garantir que, ao
menos uma vez, o comportamento entre em
contato com as contingências. Vejamos o
caso de estudos onde o participante precisa
realizar escolhas. Nesse experimento hipotético, o participante pode ganhar um real
por escolher o cartão azul ou três reais por
escolher o cartão vermelho. Se no começo
do experimento o pesquisador não forçar o
participante a realizar ao menos uma escolha em cada opção, como podemos afirmar
que a escolha estava sob controle de uma
variável como a magnitude (quantidade) de
reforços (i.e., um real vs. três reais)?
É possível que os participantes do
estudo de Vichi et al. (2009) tenham tendido a realizar distribuições igualitárias para
evitar conflitos entre os membros do grupo
sobre quem ganharia mais. Afinal os participantes eram colegas de turma na mesma
Capítulo XVI | Cultura
universidade. Nesse caso, a história pré-experimental dos participantes (isto é, aprendizagem anteriores ao experimento) pode
ter atuado na determinação do comportamento durante o experimento. Quando o
pesquisador forçou a distribuição desigual
por meio da intervenção, os participantes
entravam em contato com o fato de que essa
distribuição gerava maiores ganhos. Assim,
os efeitos da história pré-experimental dos
participantes podem ser minimizados em
função de arranjos experimentais adicionais. Vichi et al. (2009) precisaram intervir
23 vezes na condição B para o Grupo 1 e 30
vezes para o Grupo 2, na mesma condição.
A intervenção também aconteceu na condição A (distribuição igualitária) para o Grupo 1, mas apenas duas vezes.
Em geral, uma vez que os participantes entravam em contato com a metacontingência, poucas interferências do pesquisador foram necessárias. Você se lembra do
cuidado metodológico de expor cada grupo
a diferentes ordens de condições? Pois bem,
os experimentadores também observaram
que a história de exposição influenciou os
resultados. Em ambos os grupos, na segunda exposição à condição B, se comparada
a primeira, precisou de menos tentativas
para que a distribuição se tornasse estável
(ocorresse por 10 tentativas consecutivas).
Esses resultados indicam que a prática de distribuir os ganhos, se igual ou desigual, dependeu das consequências programadas para o grupo e não para cada
participante individualmente. Portanto, as
metacontingências foram responsáveis por
alterar as interações entre os membros do
grupo .
DESDOBRAMENTOS
Após o estudo de Vichi et al. (2009)
diversos estudos sobre a seleção cultural foram conduzidos. Martone (2008), por exemplo, conduziu uma replicação sistemática
do experimento de Vichi et al. num estudo
com quatro experimentos. O objetivo foi investigar se as práticas de distribuição igualitária e desigual seriam mantidas após a
substituição de participantes em cada grupo. Ou seja, no estudo de Martone investigou-se não apenas a seleção de culturantes,
mas também a transmissão de comportamento entre gerações. Uma das principais
diferenças entre os trabalhos de Vichi et al.
e Martone é que no segundo a matriz foi
apresentada em um programa de computador. A cada nova tentativa os símbolos de
adição e subtração eram apresentados em
diferentes células. Além disso, havia outras
diferenças entre os estudos, como o número de participantes por grupo e o modo
como o pesquisador intervinha para propiciar o contato com a metacontingência. Os
resultados de Martone sugerem indícios de
seleção das práticas culturais mas, segundo
o autor, não de forma contínua. Isto porquê,
para alguns grupos de participantes, não foi
observado um padrão de distribuição de
acordo com a metacontingência em vigor.
263
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
Os culturantes por vezes atendiam as exigências ambientais mas não se mantinham
estáveis. Esse resultado é diferente do observado por Vichi et al.
Por outro lado, os resultados de Martone (2008) indicam que a substituição de
participantes não afetou o padrão de distribuição dos grupos. Mesmo após a troca
de participantes, os grupos tendiam a continuar a apresentar o padrão de distribuição
desenvolvido pelas gerações anteriores.
Uma das principais contribuições do
estudo de Vichi et al. (2009) foi apresentar
um procedimento para a análise experimental de metacontingências. Diversos outros estudos utilizaram o “jogo da matriz”
descrito em seu artigo (e.g., Borba & Glenn,
2014; Borba et al., 2014; Cavalcanti, Leite,
& Tourinho, 2014; Franceschini, Samelo,
Xavier & Hunziker, 2012; Pavanelli, Leite,
& Tourinho, 2014; Soares, Cabral, Leite, &
Tourinho, 2012). Novas questões de pesquisa e procedimentos foram desenvolvidos.
Pereira (2008), por exemplo, tentou isolar
experimentalmente os efeitos da programação de contingências individuais e metacontingências na seleção de comportamentos envolvidos em entrelaçamentos como
aqueles no experimento de Vichi et al. Para
tanto, Pereira (que trabalhou no mesmo laboratório da PUC-SP no qual Vichi havia
realizado seu estudo) desenvolveu o “jogo
dos números”, no qual é possível programar
diferentes consequências individuais e culturais (atualmente diversos procedimentos
264
apresentam este cuidado, incluindo o jogo
da matriz). Diversos estudos foram realizados utilizando esse procedimento (e.g., Baia,
Azevedo, Segantini, Macedo, & Vasconcelos, 2015; Bullerjhann, 2009; Caldas, 2009;
Saconatto & Andery, 2013; Vieira, 2010).
De modo geral, os estudos encontraram
que culturantes são selecionados por consequências culturais. Isto é, os organismos
tendem a coordenar suas ações de modo a
gerar um produto agregado que atenda as
exigências ambientais para liberação de
consequências culturais.
A investigação experimental da seleção por metacontingências é um campo
de pesquisa recente. Por este motivo, diferentes procedimentos existem atualmente
(e.g., Costa et al., 2012; Hunter, 2012; Neves,
Woels, & Glenn, 2012; Ortu, Becker, Woelz,
& Glenn, 2012; Sampaio et al., 2013). Em
geral, os procedimentos envolvem tentativas discretas – situação na qual o responder é restringido a períodos de observação
seja removendo o acesso dos participantes
ao equipamento ou à possibilidade de responder (Perone, 1991). Nos experimentos
que usam o jogo da matriz, os participantes precisam aguardar o pesquisador autorizar o novo ciclo de apostas. Já no procedimento do jogo dos números, após todos
participantes terem inserido seus números,
o computador libera as consequências e realiza um intervalo (em geral é de 0,8 s) antes do início de uma nova possibilidade de
os participantes inserirem os números. Um
ponto importante em relação a esses pro-
Capítulo XVI | Cultura
cedimentos que usam tentativas discretas é
que a sessão termina comumente em função do número de tentativas. Assim, os participantes deve sempre responder, não sendo possível que respostas não ocorram. Esse
aspecto do procedimento dificulta a análise
de efeitos da suspensão das consequências
culturais (Baia et al., 2015). Tal dificuldade
pode ser minimizada ao se utilizar procedimentos similares ao operante livre.
Há ao menos dois procedimentos
que foram desenvolvidos utilizando método similar ao operante livre: O jogo do xadrez (Vasconcelos & Todorov, 2015) e o culturante livre (Toledo et al., 2015). Nesse tipo
de procedimento os organismos são livres
para responder – podem ou não emitir os
comportamentos alvo de análise sem restrições ao acesso dos participantes ao equipamento ou à possibilidade de responder
(Perone, 1991). O uso desses procedimentos
permite verificar, por exemplo, o que ocorre
com culturantes em situações nas quais as
consequências são programadas de modo
intermitente, ou ainda em situações em que
não há relação de dependência entre culturantes e consequências culturais. Outra
vantagem de estudos cujo o procedimento
é similar ao operante livre é que os efeitos
da suspensão das relações condicionais entre culturantes e consequências culturais
(como extinção) podem produzir resultados
mais confiáveis, já que os participantes podem não se engajar na emissão de comportamentos sem alterar a exposição ao procedimento (como ocorre em procedimentos
de tentativas discretas).
A condução de experimentos sobre
metacontingências é de suma importância
para a perspectiva analítico-comportamental da seleção cultural. Há críticas sobre a
necessidade do conceito de metacontingências (e.g., Gusso & Kubo, 2007). Contudo, sendo a Análise do Comportamento
uma ciência indutiva, a validade dos conceitos depende da sua demonstração empírica (Harzem & Miles, 1978).
CONSIDERAÇÕES FINAIS
O estudo de Vichi et al. (2009) inaugurou o campo de investigações experimentais sobre metacontingências. Além
disso, os resultados do estudo sugerem que
é possível alterar comportamentos de pessoas em pequenos grupos sem que as alterações sejam nas contingências operantes.
Essa é uma importante demonstração de
seleção cultural. Esse tipo de explicação do
comportamento é alinhada aos princípios
da seleção por consequências (Skinner,
1981).
Um grupo não se comporta, não é
sensível à consequências, mas seus membros se comportam e são sensíveis a mudanças ambientais. O conceito de metacontingência não afirma que é possível uma
seleção do comportamento de grupos, mas
que é possível alterar comportamentos que
estejam envolvidos em CCEs ao programar
265
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
diferentes consequências culturais (i.e.,
programando-se diferentes relações condicionais entre os diferentes culturantes e
as consequências culturais). É apenas neste
sentido que diz-se que o grupo esteve sob
controle das exigências comportamentais.
O mesmo acontece quando alguém diz “o
rapaz ficou sob controle dos reforços sociais”. É importante ressaltar que, em ambos
os casos, quem está sob controle das consequências são os comportamentos, seja dos
membros do grupo ou do indivíduo.
Quando falamos em programar metacontingências estamos mais interessados
em alterar os comportamentos envolvidos
em CCEs sem intervir nas contingências
operantes que mantém cada comportamento individual. Imagine a quantidade
de recursos envolvidos para alterar contingências operantes numa situação na qual as
CCEs envolvem o comportamento de milhares de pessoas. Portanto, se for possível
alterar o comportamento desses indivíduos
ao se estabelecer metacontingências, sem
que seja necessário manipular cada contingência operante, então o conceito de metacontingências pode se mostrar útil. Isso
porque, neste caso, a intervenção se daria
no nível cultural e não no operante. Vejamos um exemplo.
Em uma situação de escassez de
água – como a vivida na cidade de São
Paulo em 2014 e 2015 – pode ser mais eficiente ocupar-se de programações que gerem o PA, quantidade de água consumida,
266
do que estabelecer contingências operantes
para o comportamento de cada usuário do
sistema de abastecimento. Nesse contexto,
o conceito de metacontingência pode ser
promissor para aplicações. Até o momento, o que temos são análises interpretativas
(e.g., Bortoloti & D’Agostino, 2007; Perossi &
Carrara, 2012; Sénéchal-Machado & Todorov, 2008). Esperamos que no futuro o conceito seja útil para análise de problemas da
sociedade, além da elaboração de intervenções comportamentais no nível cultural.
Por exemplo, o consumo e gestão da água é
um problema que talvez possa ser abordado no nível supra-organismo (i.e., cultural).
Seria algo muito bom se o conhecimento
experimental básico sobre seleção cultural
pudesse ajudar a resolver problemas sociais
que demandam a intervenção simultânea
no comportamento de muitos indivíduos.
PARA SABER MAIS
Martone & Todorov (2007). Artigo que
apresenta o desenvolvimento do conceito
de metacontingência desde sua proposição
por Glenn (1986).
Sampaio & Andery (2010). Apresentação
de conceitos e possibilidades de análise de
fenômenos sociais na Análise do Comportamento.
Saconatto & Andery (2013). Programação
de metacontingências com contingências
aversivas. Nessa pesquisa as consequências
Capítulo XVI | Cultura
culturais foram caracterizadas por evitar a
perda de bônus para todo o grupo.
Gusso & Kubo (2007). Neste artigo os autores questionam a necessidade do conceito
de metacontingência. Um importante contraponto a ser considerado.
Revista Latinoamericana de Psicologia 44
(1), (2012). Um número especial sobre o conceito de metacontingência e seleção cultural.
REFERÊNCIAS
Andery, M. A. P. A. (2011). Comportamento
e cultura na perspectiva da análise do comportamento. Perspectivas em Análise do
Comportamento, 2, 203–217.
Baia, F. H., Azevedo, F. F., Segantini, S. M.,
Macedo, R. P., & Vasconcelos, L. A. (2015).
Efeitos de diferentes magnitudes de consequências individuais e culturais sobre
culturantes. Acta Comportamentalia, 23,
257–272.
Baum, W. M. (2006). Compreender o behaviorismo: comportamento, cultura e evolução. Porto Alegre: Artmed.
Baum, W. M., Richerson, P. J., Efferson, C.
M., & Paciotti, B. M. (2004). Cultural evolution in laboratory microsocieties including
traditions of rule giving and rule following.
Evolution and Human Behavior, 25, 305–
326.
Borba, A., & Glenn, S. S. (2014). Establishing
the macrobehavior of ethical self-control in
an arrangement of macrocontingencies in
two microculturures. Behavior and Social
Issues, 86, 68–86.
Borba, A., Silva, B. R. da, Cabral, P. A. dos A.,
Souza, L. B. de, Leite, F. L., & Tourinho, E. Z.
(2014). Effects of exposure to macrocontingecies isolation and social situations in the
production of ethical self-control. Behavior
and Social Issues, 19, 5–19.
Bortoloti, R., & D’Agostino, R. G. (2007).
Ações pelo controle reprodutivo e posse
responsável de animais domésticos interpretados à luz do conceito de metacontingência. Revista Brasileira de Análise Do
Comportamento, 3, 17–28.
Bullerjhann, P. B. (2009). Análogos experimentais de fenômenos sociais: o efeito das
consequências culturais. (Dissertação de
Mestrado). Pontifícia Universidade Católica
de São Paulo. São Paulo.
Caldas, R. A. (2009). Análogos experimentais de seleção de extinção de metacontingências. (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São
Paulo.
Cavalcanti, D. E., Leite, F. L., & Tourinho, E.
Z. (2014). Seleção de práticas culturais complexas : Avaliação experimental de um aná267
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
logo do procedimento de aproximação sucessiva. Psicologisa e Saber Social, 3, 2–21.
Chiesa, M. (2006). Behaviorismo Radical: A
filosofia e a ciência. Brasilia: Editora Celeiro.
Cohen, D. J. (1962). Justin and his peers: an
experimental analysis of a child’s social
world. Child Development, 33, 697–717.
Costa, D., Nogueira, C. de P. V., & Vasconcelos, L. A. (2012). Effects of communication
and cultural consequences on choices combinations in INPDG with four participants.
Revista Latinoamericana de Psicologia, 44,
121–131.
Franceschini, A. C. T., Samelo, M. J., Xavier,
R. N., & Hunzinker, M. H. L. (2012). Effects
of consequences on patterns of interlocked
contingencies: A replication of a metacontingency experiment. Revista Lainoamericana de Psicologia, 44, 87–95.
Glenn, S. S. (1986). Metacontingencies in
Walden Two. Behavior Analysis and Social
Action, 5, 2–8.
Glenn, S. S. (1988). Contingencies and metacontingencies: Toward a synthesis of behavior analysis and cultural materialism. The
Behavior Analyst, 11, 161–179.
Glenn, S. S. (1991). Process and content in
behavioral and cultural phenomena. Behavior and Social Issues, 1, 1– 4.
268
Glenn, S. S. (2004). Individual behavior,
culture, and social change. The Behavior
Analyst, 2, 133–151.
Glenn, S. S., Malott, M. E., Andery, M. A.
P. A., Benvenuti, M., Houmanfar, R., Sandaker, I., … Vasconcelos, L. A. (2016). Toward
consistent terminology in a behaviorist
approach to cultural analysis. Behavior and
Social Issues, 25, 11–27.
Gusso, H. L., & Kubo, O. M. (2007). O conceito de cultura: Afinal, a “jovem” metacontingência é necessária? Revista Brasileira
de Terapia Comportamental e Cognitiva,
139-144.
Harzem, P., & Miles, T. R. (1978). Conceptual issues in operant psychology. Chichester:
John Wiley & Sons.
Hunter, C. S. (2012). Analyzing behavioral
and cultural selection contingencies. Revista Latinoamericana de Psicologia, 44,
43–54.
Martone, R. C. (2008). Efeito de consequências externas e de mundanças na constituição do grupo sobre a distribuição dos
ganhos em uma metacontingência experimental. (Tese de Doutorado). Universidade
de Brasília, Brasília.
Martone, R. C., & Todorov, J. C. (2007). O
desenvolvimento do conceito de metacontingência. Revista Brasileira de Análise do
Comportamento, 3, 181–190.
Capítulo XVI | Cultura
Mayr, E. (2009). O que é evolução. Rio de Janeiro: Editora Rocco.
Melo, C. M., Dittrich, A., Moreira, M. B., &
Martone, R. C. (2013). O modelo de seleção
por consequências: o nível filogenético. In
M. B. Moreira (Ed.), Comportamento e práticas culturais (pp. 24–34). Brasilia: Walden4.
Neves, A. B. V. S., Woels, T. A. R., & Glenn, S.
S. (2012). Effect of resource scarcity on dyadic fitness in a simulation of two-hunter
nomoclones. Revista Latinoamericana de
Psicologia, 44, 159–167.
Ortu, D., Becker, A. M., Woelz, T. A. R., &
Glenn, S. S. (2012). An iterated four-player
Prisoner’s Dilemma Game with an external
selecting agent : A metacontingency experiment. Revista Latinoamericana de Psicologia, 44, 111–120.
Pavanelli, S., Leite, F. L., & Tourinho, E. Z.
(2014). A “ modelagem ” de contingências
comportamentais. Acta Comportamentalia, 22, 425–440.
Pereira, J. M. C. (2008). Investigação experimental de metacontingências : separação
do produto agregado e da consequência individual. (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo,
São Paulo.
Perone, M. (1991). Experimental design in
the analysis of free-operant behavior. In I.
H. Iversen & K. A. Lattal (Eds.), Experimental analysis of Behavior - Part 1. (pp. 135–
171). Amsterdam: Elsevier Inc.
Perossi, G. R., & Carrara, K. (2012). Por que
funcionam limitadamente campanhas e
programas de conservação de água ? Uma
análise comportamental. Interação em Psicologia, 16, 199–210.
Pierce, W. D., & Cheney, C. D. (2008). Behavior analysis and learning. New York: Psychology Press.
Saconatto, A. T., & Andery, M. A. P. A. (2013).
Seleção por metacontingências : Um análogo experimental de reforçamento negativo.
Interação em Psicologia, 17, 1–10.
Sampaio, A. A. S., & Andery, M. A. P. A.
(2010). Comportamento Social, produção
agregada e prática cultural: Uma análise
comportamental de fenômenos sociais. Psicologia: Teoria e Pesquisa, 26, 183–192.
Sampaio, A. A. S., Araújo, L. A., Gonçalo, M.
E., Ferraz, J. C., Alves Filho, A. P., Brito, I. S.,
Barros, N. M., & Calado, J. I. F. (2013). Exploring the role of verbal behavior in a new
experimental task for the study of metacontingencies. Behavior and Social Issues,
22, 87–101.
Schmitt, D. R. (1998). Social behavior. In K.
A. Lattal & M. Perone (Eds.), Handbook of
research methods in human operant behavior (pp. 471–508). New York: Plenum Press.
269
Fábio Henrique Baia, Alina B. C. Bianco, Isabella Guimarães Lemes, Poliana Ferreira da Silva
Schmitt, D. R., & Marwell, G. (1968). Stimulus control in the experimental study
of cooperation. Journal of the Experimental
Analysis of Behavior, 5, 571–574.
Sénéchal-Machado, V. L., & Todorov, J. C.
(2008). A travessia na faixa de pedestre em
Brasília (DF/Brasil): Exemplo de uma intervenção cultural. Revista Brasileira de Análise do Comportamento, 4, 191–204.
Sidman, M. (1960). Tactics of scientific research: Evaluating experimental data in psychology. New York: Basic Books Inc.
Skinner, B. F. (1953). Science and Human
Behavior. New York: Macmillan.
Skinner, B. F. (1962). Two “synthetic social relations”. Journal of the Experimental
Analysis of Behavior, 5, 531–3.
Skinner, B. F. (1974). About behaviorism.
New York: Bantam Books.
Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504.
Soares, P. F. R., Cabral, P. A. A., Leite, F. L.,
& Tourinho, E. Z. (2012). Efeitos de consequências culturais sobre a seleção e manutenção de duas práticas culturais alternadas.
Revista Brasileira de Análise do Comportamento, 8, 37–46.
Tan, L., & Hackenberg, T. (2012). Social foraging in rats: Group and individual choice in
270
dynamic environments. Mexican Journal of
Behavior Analysis, 38, 87–105.
Tan, L., & Hackenberg, T. D. (2016). Functional analysis of mutual behavior in laboratory rats. Journal of Comparative Psychology, 130, 13–23.
Todorov, J. C. (2012). Metacontingências e a
análise comportamental de práticas culturais. Clínica & Cultura, 1, 36–45.
Toledo, T. F. N., Benvenuti, M. F. L., Sampaio, A. A. S., Marques, N. S., Cabral, P.
A. A., Araújo, L. A. de S., … Moreira, L. R.
(2015). Free Culturant : A software for the
experimental study of behavioral and cultural selection. Psychology & Neuroscience,
8, 366–384.
Tourinho, E. Z. (2009). Subjetividade e relações comportamentais. São Paulo: Paradigma.
Vasconcelos, I. G., & Todorov, J. C. (2015).
Experimental analysis of the behavior of
persons in groups: Selection of an aggregate product in a metacontingency. Behavior
and Social Issues, 24, 111–125.
Vichi, C. (2005). Igualdade e Desigualdade:
Manipulando um análogo experimental
de prática cultural em laboratório. In J. C.
Todorov, R. C. Martone, & M. B. Moreira
(Eds.), Metacontingências: comportamento,
cultura e sociedade (pp. 81–100). Santo André: ESETEC Editores Associados.
Capítulo XVI | Cultura
Vichi, C., Glenn, S. S., & Andery, M. A. P.
A. (2009). A metacontingency experiment:
The effects of contingent consequences on
patterns of interlocking contingencies of
reinforcement. Behavior and Social Issues,
18, 41–57.
Vichi, C., & Tourinho, E. Z. (2011). Consequências culturais x consequências comportamentais na literatura experimental de
pequenos grupos. Acta Comportamentalia,
20, 201–215.
Vieira, M. C. (2010). Condições antecedentes participam de metacontingências? (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo.
271
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
“Pare com isso menino!”:
análise funcional de
problemas de comportamento
André A. B. Varella
Universidade Católica Dom Bosco
Maria Carolina Correa Martone
Universidade Federal de São Carlos; Fundação Panda
Carolina Coury Silveira
Universidade Federal de São Carlos
Iwata, B. A., Dorsey, M. F., Slifer, K. J., Bauman, K. E., & Richman, G. S. (1982). Toward a functional analysis of self-injury. Analysis and Intervention in Developmental Disabilities, 2, 3-20.
“A alma não tem segredo que o comportamento não revele”
Lao Tsé
272
Capítulo XVII | Análise Funcional
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A Análise do Comportamento Aplicada (ou ABA, do inglês Applied Behavior
Analysis) se caracteriza como uma ciência
dedicada à aplicação da Análise Experimental do Comportamento na solução de
problemas socialmente relevantes (Baer,
Wolf, & Risley, 1968). Enquanto uma ciência
aplicada, a ABA historicamente se ocupou
com diversos problemas humanos, dentre
eles o estudo e desenvolvimento de intervenções para reduzir ou eliminar problemas
severos de comportamento, tais como comportamentos agressivos, de automutilação,
ingestão de objetos não comestíveis, entre
outros. Indivíduos com autismo, deficiência intelectual, transtornos psiquiátricos e
até mesmo pessoas com desenvolvimento
típico apresentavam comportamentos que
poderiam colocar em risco a sua saúde e de
outras pessoas, o que demandava, portanto,
intervenções rápidas e eficazes.
A partir do final da década de 1950,
começaram a ser publicados estudos sobre intervenções em problemas de comportamento, de diversas topografias. Esses
primeiros estudos procuraram intervir em
comportamentos como escalar móveis e locais perigosos (Risley, 1968), ferir a própria
cabeça e braços com batidas (Lovaas, Freitag, Gold, & Kassorla, 1965), desferir tapas
no próprio rosto e introduzir os dedos na
cavidade ocular (Corte, Wolf, & Locke, 1971),
entre outras topografias potencialmente
perigosas. Entretanto, nesse período, a ABA
ainda não havia desenvolvido recursos
tecnológicos para compreender a função
desses problemas de comportamento, ou
seja, quais consequências mantinham esses
comportamentos ocorrendo em certos contextos. Naturalmente, as intervenções nesse período não eram baseadas na função
do comportamento e eram implementadas
a partir do conhecimento sobre comportamento operante produzido até aquele período pela Análise Experimental do Comportamento.
Estes estudos iniciais foram importantes por terem demonstrado que esses
comportamentos eram operantes; ou seja,
poderiam ser explicados pelos princípios da
Análise do Comportamento e seriam sensíveis à manipulação de estímulos antecedentes e de suas consequências. Por exemplo, Wolf, Risley e Mees (1964) relataram
sucesso na redução da frequência de birras
de uma criança com autismo. As birras incluíam topografias de respostas como estapear o rosto, arrancar fios de cabelo, bater
a cabeça e arranhar o rosto. Os autores obtiveram uma medida da linha de base das
topografias identificadas e implementaram uma contingência de timeout (time out
from positive reinforcement, ou suspensão
discriminada de contingências de reforço;
Ferster, 1958). Quando a criança emitia o
comportamento, ela era imediatamente removida do ambiente em que estava e colocada dentro de uma sala, sozinha, até o
273
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
comportamento cessar. O procedimento de
timeout poderia funcionar como uma contingência de punição: a emissão da resposta
resultava na inserção do indivíduo em uma
sala pequena, o que restringia drasticamente suas possibilidades de se engajar em alguma atividade reforçadora.
A eficácia das técnicas de modificação do comportamento na redução de
problemas comportamentais foi sendo
demonstrada cumulativamente nos anos
1960 e 1970. Os procedimentos envolviam
desde o uso de contingências aversivas
(Kohlenberg, 1970; Pendergrass, 1972) até
intervenções baseadas em reforçamento
de comportamentos alternativos e socialmente adequados (Bailey, Wolf, & Philips,
1970; Bostow & Bailey, 1969). Todavia, as
intervenções ainda não consideravam a
função que os comportamentos-problema
apresentavam, uma vez que não existiam
procedimentos desenvolvidos para identificar quais consequências mantinham esses
comportamentos. Quando o comportamento-alvo era identificado, as intervenções
eram conduzidas na tentativa de modificá-lo; na maioria das vezes por meio de contingências aversivas, ou por reforçadores
artificiais (e.g., economia de fichas) para estabelecer comportamentos alternativos e/
ou incompatíveis. Em outras palavras, pouco se sabia sobre os reforçadores que mantinham os comportamentos-problema, quais
estímulos os controlavam e qual história de
reforçamento estabeleceu tal aprendizagem
(Mace, 1994).
274
O desconhecimento sobre as variáveis relacionadas aos problemas de comportamento tinha importantes implicações
para as intervenções comportamentais. Por
não considerar a função, muitas delas não
eram bem-sucedidas ou não se mantinham
após a retirada da intervenção, o que prolongava o tempo em que o indivíduo era
exposto a situações que o levavam a emitir
tais comportamentos. Nesse contexto, Carr
(1977) publicou um importante trabalho
de revisão dos estudos sobre intervenções
em comportamentos autolesivos e levantou hipóteses que poderiam explicá-los.
Os comportamentos autolesivos seriam (a)
comportamentos operantes mantidos por
reforçamento positivo em forma de reforço
social, (b) operantes mantidos por reforçamento negativo em forma de interrupção
de estimulação aversiva, ou (c) operantes
que produziam autoestimulação. Ainda,
outras duas hipóteses extraídas dos estudos revisados supunham que os comportamentos autolesivos (d) eram causados por
alterações fisiológicas ou (e) eram produto
de processos psicodinâmicos relacionados
ao ego ou redução de culpa.
O estudo de Carr (1977) propôs que
comportamentos de autolesão poderiam
ser controlados por múltiplas variáveis e,
inclusive, sugeriu o desenvolvimento de
modelos animais experimentais para, futuramente, permitir a validação de procedimentos de avaliação das hipóteses levantadas. Em 1982, Iwatta, Dorsey, Slifer, Bauman
e Richman publicaram o que veio a ser um
Capítulo XVII | Análise Funcional
dos estudos mais influentes na ABA, com
importantes implicações para a pesquisa
e aplicação. O artigo, intitulado “Em direção a uma análise funcional da autolesão”
(“Toward a functional analysis of self-injury”), foi originalmente publicado em 1982
na revista Analysis and Intervention in Developmental Disabilities e republicado em
1994 em uma edição especial no Journal of
Applied Behavior Analysis (JABA).
O estudo de Iwata et al. (1982/1994)
ofereceu uma contribuição substancial à
ABA ao propor uma importante metodologia para identificar variáveis controladoras
dos comportamentos autolesivos. Com base
nos resultados dessa metodologia, denominada Análise Funcional Experimental, era
possível identificar as consequências que
mantinham esses comportamentos. Portanto, intervenções poderiam ser planejadas a
partir das variáveis que os mantinham. Se
antes elas eram realizadas de forma arbitrária (no sentido de que ignoravam a função
do comportamento), agora se tornava possível planejar e executar intervenções que
poderiam produzir mudanças na relação do
comportamento com o ambiente, aumentando consideravelmente sua eficácia.
DESCRIÇÃO DO EXPERIMENTO
Objetivos e Método
O estudo de Iwatta, et al. (1982/1994)
descreveu um protocolo de avaliação em
que o comportamento dos participantes era
observado de forma repetida e sistemática,
em uma série de condições bem definidas.
O estudo foi conduzido com nove participantes com atraso no desenvolvimento e
com taxas de respostas autolesivas, que
variavam entre moderadas a altas. As topografias mais frequentes observadas foram
(a) bater a cabeça em algum objeto; (b) bater
na própria cabeça; (c) morder-se; (d) puxar
orelhas; (e) apertar os olhos; e (f) puxar cabelos.
O estudo ocorreu em uma sala do
hospital pediátrico ligado à Universidade
de medicina Johns Hopkins. As observações foram realizadas em uma sala contígua, contendo um espelho unidirecional. De
forma a avaliar os efeitos do ambiente sobre
os comportamentos estudados, foi permitido que os participantes engajassem em
comportamentos autolesivos; entretanto,
os pesquisadores seguiam protocolos para
garantir a segurança dos participantes. Por
exemplo, havia acompanhamento médico
constante e as sessões eram interrompidas
frente a qualquer risco maior de dano físico
(emissão de comportamentos autolesivos
que pudessem machucar os participantes
de forma mais grave). As observações mostraram que os participantes engajavam em
pelos menos duas ou mais formas de comportamentos autolesivos. A ocorrência dos
comportamentos foi registrada em intervalos de 10s. A variável dependente era o
percentual de intervalos em que respostas
autolesivas foram registradas.
275
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
Os participantes eram expostos a
quatro condições, por oito sessões diárias
(duas para cada condição). Um delineamento de tratamentos alternados (Barlow &
Hayes, 1979) foi empregado para organizar a
apresentação das quatro condições, em ordem não sistemática e que variava ao longo dos dias. Cada condição tinha a duração
de 15 min. O procedimento permanecia em
vigor até que fosse observada: (a) a estabilidade dos comportamentos autolesivos, (b)
instabilidade nos níveis das respostas autolesivas por cinco dias seguidos em todas
as condições, ou (c) que 12 dias de sessões
tivessem decorrido. Cada condição tinha
como objetivo avaliar o efeito de uma variável específica. As variáveis foram manipuladas de forma sistemática pela alternância das diferentes condições. Frequências
elevadas de respostas autolesivas em uma
determinada condição indicariam que a
variável em questão estaria funcionalmente relacionada ao comportamento-alvo. As
quatro condições serão descritas a seguir.
Condição Desaprovação Social: Nessa condição, o experimentador e o participante entravam em uma sala com brinquedos espalhados pelo chão. O participante
tinha livre acesso aos materiais e recebia
uma instrução para brincar, enquanto o experimentador ficava em um canto da sala
fingindo ler uma revista. Quando o comportamento autolesivo ocorria, o experimentador fornecia atenção ao participante,
demonstrando preocupação ou desaprovação (e. g., “não faça assim, você vai se ma276
chucar”), com um breve e suave contato físico (e. g., tocando o ombro do participante).
Quaisquer outras respostas emitidas pelo
participante eram ignoradas. Esta condição, portanto, criava uma situação na qual
os participantes não tinham a atenção do
experimentador. Ela foi proposta considerando que desaprovação social e contato
físico, contingentes a emissão de comportamentos autolesivos são situações comuns
em ambientes naturais. Assim, elas poderiam inadvertidamente manter tais comportamentos por reforçamento positivo.
Condição Demanda Acadêmica: O
objetivo dessa condição era avaliar se as
respostas autolesivas apresentavam função de fuga de demandas. Nessa condição,
algumas atividades escolares foram disponibilizadas para os participantes. A escolha
das atividades baseava-se em informações
fornecidas pelas escolas, sendo selecionadas aquelas que os participantes raramente
completavam. O experimentador solicitava
a realização de alguma atividade e aguardava uma resposta por 5 segundos. As instruções atendidas pelo participante eram seguidas de elogios. Se respostas autolesivas
ocorressem, a atividade era interrompida e
o experimentador virava-se de costas por
30s. Embora, a consequência programada
nessa condição pudesse se assemelhar a
um procedimento de extinção, ela procurava avaliar se as respostas autolesivas foram
mantidas por reforçamento negativo (isto é,
fuga e esquiva das demandas acadêmicas,
Carr, 1977; Carr, Newsom, & Binkoff, 1976;
Capítulo XVII | Análise Funcional
Jones, Simmons, & Frankel, 1974; Measel
& Alfieri, 1976). Frequências maiores nessa
condição em comparação às outras poderiam indicar que as respostas autolesivas
apresentavam função de fuga de demandas.
Condição Brincadeira Não-estruturada: Nessa condição, o experimentador
ficava próximo ao participante e permitia
que ele se movimentasse livremente pela
sala, engajando em brincadeiras sociais ou
solitárias. O experimentador ainda fornecia
elogios e breve contato físico contingente a qualquer comportamento socialmente
apropriado a cada 30 segundos. Essa etapa
teve por objetivo “enriquecer” o ambiente dos participantes, de modo a diminuir
a probabilidade de ocorrência de comportamentos autolesivos, funcionando como
condição controle. Nessa condição não foram apresentadas demandas, havia livre
acesso aos brinquedos, o experimentador
fornecia atenção social constantemente e
demonstrações de preocupação ou desaprovação não foram fornecidas se respostas
autolesivas ocorressem (extinção).
Condição Sozinho: Nesta condição, o
participante foi colocado na sala de avaliação sozinho, sem acesso a interação social,
brinquedos e materiais que pudessem servir
como fonte reforçamento. O propósito dessa condição era simular um ambiente “empobrecido”, com poucos estímulos sociais e
físicos. Assim, tal contexto poderia estabelecer a ocasião para que comportamentos
autoestimulatórios ocorressem, tornando
possível avaliar se as respostas autolesivas
eram mantidas por reforçamento automático, ou seja, pela própria consequência
sensorial produzida pela resposta. A observação de altas taxas de respostas autolesivas nessa condição sugeriria, portanto, um
comportamento mantido por reforçamento
automático.
Resultados e Discussão
Para cada participante foi calculada
uma média geral da porcentagem dos intervalos no período total de 15 minutos em
que ocorreram comportamentos autolesivos, além de médias dos participantes para
as condições experimentais, separadamente. Assim, os dados permitiram uma análise
do responder geral entre os participantes,
assim como comparações entre condições
por participantes diferentes. Foram identificadas variações tanto na taxa de respostas entre os participantes (com médias de
4,5% a 91,3% de intervalos com ocorrências
de respostas autolesivas) quanto nas quatro condições experimentais, o que sugeriu
influência das variáveis manipuladas nas
condições. Para seis dos nove participantes, altas taxas de respostas autolesivas foram consistentemente associadas com uma
condição experimental específica.
Com base nesses resultados, os autores identificaram cinco padrões de respostas
gerais para os participantes deste estudo. O
primeiro padrão consistia em uma baixa
apresentação de respostas autolesivas du277
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
rante a condição Brincadeira não-estruturada. Todos os oito participantes expostos a
esta condição (o participante 1 foi excluído)
exibiram porcentagens iguais ou abaixo de
sua média geral. O segundo padrão, observado nas respostas de quatro participantes,
foi uma maior ocorrência durante a condição Sozinho, indicando a autoestimulação
como uma variável relevante. O terceiro
padrão foi obtido com dois participantes e
consistiu na baixa frequência de respostas
em todas as condições experimentais, exceto a condição Demanda. O quarto padrão,
identificado no participante 5, consistiu na
apresentação de uma taxa mais alta de respostas autolesivas durante a condição de
Desaprovação Social. O quinto e último padrão, observado em dois participantes, foi
classificado como “indiferenciado” e consistiu em taxas de respostas similares entre as condições ou altas taxas em duas ou
mais condições experimentais. Como previsto por Carr (1977), os padrões identificados evidenciaram que respostas autolesivas
poderiam ser mantidas por diferentes reforçadores (diferentes funções).
Os resultados do experimento foram
importantes por demonstrarem a possibilidade de identificar variações nas taxas de
respostas autolesivas ao se manipular sistematicamente algumas variáveis ambientais (e.g., retirada de demandas, atenção
social). Se diferentes reforçadores poderiam
manter respostas autolesivas, intervenções
comportamentais deveriam considerar essas variáveis. Por exemplo, os autores suge278
rem que para um indivíduo que cutuca seu
olho em função de produzir estimulação
visual (reforçamento automático), o uso de
massagem ocular de maneira contingente
à ausência de respostas autolesivas poderia ser uma intervenção eficaz (Favell et al.,
1982), visto que tal intervenção produziria
a consequência reforçadora sem que o indivíduo engajasse em respostas autolesivas.
Entretanto, se tais respostas autolesivas
fossem mantidas por fuga de demandas (reforçamento negativo), a massagem ocular
seria ineficaz. Nesse caso, intervenções que
incluíssem períodos sem nenhuma demanda poderiam ser mais eficazes.
Pode-se dizer que um dos achados
mais relevantes deste experimento foi que
a variabilidade na taxa de respostas autolesivas em um mesmo sujeito não é um processo aleatório. A utilização de condições
experimentais bem definidas, análogas ao
contexto natural e em um delineamento de
sujeito único (que permitiu verificar efeitos
da manipulação de variáveis sobre o comportamento-alvo de cada participante) foi
fundamental para este achado. Foi possível,
portanto, identificar variáveis relacionadas ao estabelecimento e/ou manutenção
de comportamentos autolesivos a partir da
comparação das taxas de respostas de uma
mesma pessoa, entre diferentes condições.
Deste modo, o presente estudo ofereceu
uma metodologia eficaz para investigar
múltiplos efeitos do ambiente na ocorrência de autolesivos.
Capítulo XVII | Análise Funcional
Duas limitações foram apontadas
pelos autores no estudo de Iwata et al.,
1982/1994. A primeira é que a metodologia
pode não ter isolado completamente todas
as variáveis que poderiam influenciar as
respostas autolesivas. Por exemplo, para
um comportamento em que atenção social
funciona como reforçador, taxas altas de
respostas autolesivas na condição Sozinho
poderiam indicar não necessariamente ser
função de reforço automático (autoestimulação), mas sim o primeiro estágio de uma
curva de extinção, visto que nessa condição o reforçamento social era suspenso.
Isto porque, uma resposta operante pode
ocorrer em altas taxas durante os estágios
iniciais de um procedimento de extinção,
antes que seja vista uma diminuição significativa de sua ocorrência, e ser assim
caracterizada a extinção da resposta. A segunda limitação se refere à possibilidade de
a análise realizada ter sido incompleta. Por
exemplo, respostas autolesivas que ocorressem majoritariamente na condição Demanda levantariam a hipótese de reforçamento negativo (fuga de demandas). Porém,
alterações no comportamento a partir de alterações nas contingências (e.g., suspender
o reforço do comportamento de fuga) acrescentaria maiores evidências da função de
reforçamento negativo.
Apesar dessas limitações, os resultados sugeriram grande utilidade da metodologia, tendo em vista a possibilidade de
identificar empiricamente variáveis que
afetam respostas autolesivas antes de se
implementar alguma condição de tratamento (Iwata et al., 1982/1994). Além disso,
a exposição dos participantes por curto período de tempo não foi maior que o período típico de situações usuais em que esses
indivíduos engajavam em respostas autolesivas e, mesmo assim, o procedimento de
avaliação forneceu dados para uma amplitude de variáveis que afetam estas respostas. Estes dois aspectos dão suporte à incorporação dessa metodologia em pesquisas
que investiguem o tratamento de respostas
autolesivas.
DESDOBRAMENTOS
As evidências empíricas de que respostas autolesivas poderiam ocorrer em
função de diferentes fontes de reforçamento
tem implicações diretas para o planejamento do tratamento de problemas de comportamento. Por exemplo, suponhamos uma
pessoa que apresenta respostas autolesivas
na escola, mantidas por fuga de demanda
(reforçamento negativo, por ex., por escapar
de atividades escolares). Alguém com pouco ou nenhum conhecimento de Análise do
Comportamento poderia propor que o professor colocasse a pessoa “de castigo” todas
as vezes que ela emitisse o comportamento,
na expectativa de que essa consequência
reduzisse o comportamento de frequência
(ou seja, funcionasse como punição). Entretanto, como o reforçador do comportamento é exatamente escapar de determinadas
tarefas escolares, a intervenção teria efeito
279
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
contrário: ao emitir o comportamento autolesivo, o castigo removeria a tarefa escolar
(ou a atrasaria), funcionando como reforço.
A intervenção, portanto, deveria considerar
que o comportamento autolesivo é mantido por reforçamento negativo relacionado
a tarefas escolares. A partir dessa informação, pode-se planejar intervenções como
mudanças nas atividades em que o comportamento ocorre com maior frequência
(tornando-as mais reforçadoras), ensinar a
pessoa a pedir por breves pausas ao longo
do período de realização das atividades,
aumentar gradativamente a frequência de
comportamentos de cooperação, entre outras possibilidades (para uma discussão sobre intervenções em comportamentos autolesivos, cf. Varella, 2016).
O estudo de Iwata et al. (1982/1994)
também se estendeu para outras topografias. A metodologia também se mostrou
útil na identificação de variáveis ambientais relacionadas a agressões físicas (Northup et al., 1991), escapar repentinamente
de cuidadores sem autorização (elopement,
Piazza, Hanley, Bowman, Ruyter, Lindauer,
& Saiontz, 1997), comportamentos destrutivos e opositores (Fisher, Ninness, Piazza,
& Owen-Schryver, 1996), entre outros. De
acordo com Beavers, Iwata e Lerman (2013),
mais de 2.000 artigos foram publicados
após o estudo de 1982, o que demonstra seu
grande impacto na Análise do Comportamento.
280
CONSIDERAÇÕES FINAIS
A metodologia da Análise Funcional Experimental desenvolvida por Iwata
et al. (1982/1994) consistiu em um importante avanço em relação às intervenções
baseadas nas estratégias de Modificação
do Comportamento (Hanley, 2012). A partir de seus resultados, é possível aumentar
as chances de sucesso da intervenção ao
se tomar decisões mais fundamentadas a
seu respeito, evitando escolhas de procedimentos apenas com base em palpites ou
resultados obtidos com outras pessoas no
passado. Ainda, segundo Hanley, conduzir
uma análise funcional envolve questões
importantes como considerar as particularidades do comportamento e da história de
reforçamento de cada pessoa. A realização
de uma análise funcional evita a implementação de contingências arbitrárias sem
antes se fazer a pergunta mais importante:
por que o comportamento-alvo ocorre? E a
ABA, enquanto uma ciência aplicada e em
constante desenvolvimento, dispõe hoje
de metodologias empiricamente validadas
para responder a essa pergunta.
PARA SABER MAIS
Hanley, Iwata, & McCord (2003). Apresenta uma excelente revisão de literatura sobre
os estudos envolvendo análise funcional
do comportamento até o ano 2000. Discute importantes implicações para o planejamento e condução das condições análogas.
Capítulo XVII | Análise Funcional
Beavers, Iwata, & Lerman (2013). Apresenta uma atualização da revisão de literatura acima, englobando 158 novos estudos,
publicados entre 2001 até 2012.
Hanley (2012). Discute questões de ordem
práticas relacionadas à realização de avaliações funcionais do comportamento. Apresenta outras metodologias além da Análise
Funcional Experimental (avaliações indiretas e descritivas) e discutindo suas vantagens e desvantagens.
Iwata & Dozier (2008). Apresenta informações sobre a metodologia de análise funcional em linguagem simples e clara, fornecendo dicas e alguns detalhes importantes
para o seu planejamento.
Varella (no prelo). Discute algumas possibilidades de intervenções em comportamentos autolesivos a partir de estratégias
de avaliação funcional do comportamento.
REFERÊNCIAS
Barlow, D. H., & Hayes, S. C. (1979). Alternate treatment design: one strategy for comparing the effects of two treatments in a
single subject. Journal of Applied Behavior
Analysis, 12, 199-210.
Beavers, G. A., Iwata, B. A., & Lerman, D. C.
(2013). Thirty years of research on the functional analysis of problem behavior. Journal
of Applied Behavior Analysis, 46, 1-21.
Bostow, D. E., & Bailey, J. S. (1969). Modification of severe disruptive and aggressive
behavior using brief timeout and reinforcement procedures. Journal of Applied Behavior Analysis, 2, 31-37.
Carr, E. G. (1977). The motivation of self-injurious behavior: A review of some hypotheses. Psychological Bulletin, 84, 800-816.
Carr, E. G., Newsom, C. D., & Binkoff, J. A.
(1976). Stimulus control of self-destructive
behavior in a psychotic child. Journal of
Abnormal Child Psychology, 4, 139-152.
Baer, D. M., Wolf, M. M., & Risley, T. R.
(1968). Some current dimensions of Applied
Behavior Analysis. Journal of Applied Behavior Analysis, 1, 91-97.
Corte, H. E., Wolf, M. M., & Locke, B. J. (1971).
A comparison of procedures for eliminating
self-injurious behavior of retarded adolescents. Journal of Applied Behavior Analysis,
4, 201-213.
Bailey, J. S., Wolf., M. M., & Philips, E. L.
(1970). Home-based reinforcement and
the modification of pre-delinquents’ classroom behavior. Journal of Applied Behavior
Analysis, 3, 223-233.
Favell, J. E., McGimsey, J. F., & Schell, R. M.
(1982). Treatment of self-injury by providing
alternative sensory activities. Analysis and
Intervention in Developmental Disabilities,
2, 83- 104.
281
André A. B. Varella, Maria Carolina Correa Martone, Carolina Coury Silveira
Ferster, C. B. (1958). Control of behavior in
chimpanzees and pigeons by time out from
positive reinforcement. Psychological Monographs: General and Applied, 72, 1-38.
Fisher, W. W., Ninness, H. A., Piazza, C. C.,
& Owen-Schryver, J. S. (1996). On the reinforcing effects of the content of verbal attention. Journal of Applied Behavior Analysis, 29, 235-238.
Hanley, G. P. (2012). Functional assessment
of problem behavior: dispelling myths,
overcoming implementation obstacles, and
developing new lore. Behavior Analysis in
Practice, 5, 54-72.
Hanley, G. P., Iwata, B. A., & McCord, B.
E. (2003). Functional analysis of problem
behavior: a review. Journal of Applied Behavior Analysis, 36, 147-185.
Iwata, B. A., & Dozier, C. L. (2008). Clinical
application of Functional Analysis Methodology. Behavior Analysis in Practice, 1, 3-9.
Iwata, B. A., Dorsey, M. F., Slifer, K. J., Bauman, K. E., & Richman, G. S. (1994). Toward
a functional analysis of self-injury. Journal
of Applied Behavior Analysis, 27, 197-209.
(Reimpresso de Analysis and Intervention
in Developmental Disabilities, 2, 3-20, 1982).
Jones, F. H., Simmons, J. Q., & Frankel, F.
(1974). An extinction procedure for eliminating self-destructive behavior in a 9-year-old autistic girl. Journal of Autism and
282
Childhood Schizophrenia, 4, 214-250.
Kohlenberg, R. J. (1970). The punishment of
persistent vomiting: a case study. Journal of
Applied Behavior Analysis, 4, 241-245.
Lovaas, 0. I., Freitag, G., Gold, V. J., & Kassorla, I. C. (1965). Experimental studies in
childhood schizophrenia: Analysis of self-destructive behavior. Journal of Experimental Child Psychology, 2, 67-84.
Mace, F. C. (1994). The significance and future of functional analysis methodologies.
Journal of Applied Behavior Analysis, 27,
385-392.
Measel, C. J., & Alfieri, P. A. (1976). Treatment of self-injurious behavior by a combination of reinforcement for incompatible behavior and overcorrection. American
Journal of Mental Deficiency, 81, 147-153.
Northup, J., Wacker, D., Sasso, G., Steege, M.,
Cigrand, K., Cook, J., & DeRaad, A. (1991). A
brief functional analysis of aggressive and
alternative behavior in outclinic settings.
Journal of Applied Behavior Analysis, 24,
509-522.
Pendergrass, V. E. (1972). Time out from positive reinforcement following persistent,
high-rate behavior in retardates. Journal of
Applied Behavior Analysis, 5, 85-91.
Piazza, C. C., Hanley, G. P., Bowman, L. G.,
Ruyter, J. M., Lindauer, S. E., & Saiontz,
Capítulo XVII | Análise Funcional
D. M. (1997). Functional analysis and treatment of elopement. Journal of Applied
Behavior Analysis, 30, 653-672.
Risley, T. R. (1968). The effects and side effects of punishing the autistic behaviors of
a deviant child. Journal of Applied Behavior
Analysis, 1, 21-34.
Varella, A. A. B. (no prelo). Intervenções em
comportamentos de autoagressão e autoestimulação em pessoas com Transtorno do
Espectro Autista. In R. Gorayeb, M. C. O. S.
Miyazaki, & M. Teodoro (Orgs), Programa
de atualização em psicologia clínica e da
saúde (PROPSICO). Porto Alegre: Artmed
Panamericana.
Wolf, M. M., Risley, T., & Mees, H. (1964).
Application of operant conditioning procedures to the behaviour problems of an autistic child. Behavior Research and Therapy, 1, 305-312.
283
Hernando Borges Neves Filho
Recombinação de repertórios:
criatividade e a integração de
aprendizagens isoladas
Hernando Borges Neves Filho
Pontifícia Universidade Católica de Goiás
Epstein, R., Kirshnit, C. E., Lanza, R. P. & Rubin, L. C. (1984). “Insight” in the pigeon: Antecedents
and determinants of an intelligent performance. Nature, 308, 61-62.
“Uma tarde, contrariando meus hábitos, tomei café preto e não consegui dormir.
Multidões de ideias surgiram; senti-as colidindo até que pares se interligaram, formando uma combinação estável, por assim dizer”
(Poincaré, 1913, p. 387)
284
Capítulo XVIII | Criatividade
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
A criatividade tem sido uma fonte
inesgotável de especulações filosóficas e
científicas. Seu escrutínio empírico tem sido
um trabalho constante na Psicologia desde
o início do século XX, e a Análise do Comportamento vem dando uma contribuição
importante ao estudo deste tema a partir da
análise de processos comportamentais relacionados com a origem de comportamentos
novos.
No início do século XX, uma das discussões mais acaloradas no meio científico
tratava do que separava animais humanos
de não humanos, e que tipo de diferenças
eram essas (Mas, 2015). Toda essa discussão
era suplantada pela efusiva eclosão da teoria da evolução de Darwin, que começava
a ganhar adeptos eminentes na Psicologia
(Boakes, 1984). Nesse contexto, um trabalho pioneiro e lembrado com frequência em
livros texto é o de Wolfgang Köhler (1948)
com chimpanzés (Pan troglodytes). Köhler
expôs chimpanzés a diferentes tarefas de
resolução de problemas e, em alguns casos,
descreveu uma solução súbita da tarefa em
questão como um “insight”. Este “insight”
foi descrito por Köhler como uma topografia de resolução de problema súbita, que
ocorria em um lampejo, de forma fluída e
direcionada a uma meta (a solução do problema). Um exemplo deste desempenho
se deu em uma situação problema na qual
uma banana estava fora do alcance, suspensa por uma corda, e caixotes estavam
disponíveis no ambiente. Diversos animais
tinham acesso a essa situação simultaneamente. Diversos chimpanzés pularam e esticaram seus braços em direção a banana,
sem alcança-la. Até que, subitamente um
destes sujeitos, chamado Sultão, se aproxima de uma caixa e a carrega em direção a
banana, coloca-a abaixo da posição da banana, sobe na caixa e agarra a banana diante do olhar atento da plateia (de chimpanzés
e humanos). Rapidamente foram traçadas
analogias antropomorfizadas que tratavam
o desempenho de Sultão como similar ao
“a-há!” que humanos em uma cultura ocidental costumam emitir ao resolver subitamente um problema (Jung-Beeman et al.,
2004). Na época em que Köhler lançou seu
livro, seus dados empíricos e suas manipulações experimentais contrastaram com a
forma anedótica com a qual a inteligência
animal era usualmente tratada em livros
clássicos de Psicologia Comparada (Boakes,
1986; Delage & Carvalho Neto, 2010), e consequentemente seu método de teste sistemático de resolução de problema animal
chamou a atenção de outros pesquisadores1.
Köhler foi um pioneiro do estudo empírico da cognição animal, mas
não foi o único. Pelo menos três de seus contemporâneos foram também pioneiros em suas metodologias empíricas: E. L. Thorndike, L.
Hobhouse e R. Yerkes. Köhler (1948, p. 22) contrasta sua metodologia
e seus dados aos dados obtidos por Thorndike com gatos em caixas
problema. Köhler alinha e encontra pontos de confluência com às propostas de Hobhouse e Yerkes. Esta polarização gerou um longo debate
sobre dois supostos tipos de resolução de problemas distintas: uma resolução tentativa e erro (como a obtida por Thorndike) ou uma resolução súbita por Insight (Delage & Carvalho Neto, 2006). A Universidade
de Würzburg disponibiliza online em seu website algumas filmagens
originais dos experimentos de Köhler (1948) com chimpanzés.
1
285
Hernando Borges Neves Filho
Ao longo dos anos, e com a vasta
repercussão dos trabalhos de Köhler, uma
série de estudos sobre a resolução de problemas foi realizada com chimpanzés e outros animais em diferentes situações (Neves
Filho, 2015). O debate acerca do “insight”
chegou até mesmo a chamar a atenção de
Pavlov e seus colegas, que adquiriram um
casal de chimpanzés com o objetivo de replicar os achados de Köhler (para uma descrição detalhada da série de estudos de
resolução de problemas em chimpanzés, realizados nos laboratórios de Pavlov, conferir
Razran, 1961; Ladygina-Kots & Dembovskii,
1969; Windholz, 1984; Windholz & Lamal,
1985; Reznikova, 2007). A maioria dos estudos focava a capacidade de animais de diferentes espécies resolverem tarefas em uma
primeira apresentação, de forma criativa.
Uma menor parcela de estudos, não menos
relevante, teve como objetivo explorar qual
o efeito da aprendizagem sobre o desempenho súbito de resolução de problemas
(Maier, 1931; 1937; Birch, 1945). Foi apenas
uma questão de tempo até que pesquisadores de viés analítico comportamental dessem suas contribuições sobre este tópico.
Project3 (Epstein, 1981). Foram abordados
fenômenos comportamentais como o auto
reconhecimento e a formação de self (Epstein, Lanza & Skinner, 1981), uso de memorandos (Epstein & Skinner, 1981), comunicação (Epstein, Lanza & Skinner, 1980), e até
mesmo o comportamento de mentir (Lanza,
Starr & Skinner, 1982). Dentre estes estudos,
um que ganhou reconhecido destaque foi o
que se propôs a identificar quais as variáveis históricas responsáveis pelo “insight”
(Epstein, Kirshnit, Lanza & Rubin, 1984).
Publicado no tradicional periódico Nature,
este estudo trouxe à comunidade científica um novo processo comportamental demonstrado empiricamente, a recombinação
de repertórios (ou interconexão de repertórios), e elencou com clareza qual o papel da
aprendizagem na resolução súbita de um
problema, e alguns dos processos comporEm geral, o termo “comportamento complexo” é pouco claro e cria
uma distinção pouco útil (comportamento simples e comportamento
complexo). Entretanto, os autores utilizam este termo na série de artigos do Columban Simulation Project para chamar a atenção de Psicólogos Cognitivos (Epstein, 1996). Em uma visão analítico comportamental, a dicotomia comportamento complexo vs. simples é eliminada,
na medida em que se parte do pressuposto de que o que distingue diferentes comportamentos são suas variáveis de controle antecedente e
consequente, e que em geral, chama-se de “complexo” comportamentos dos quais pouco se sabe sobre suas variáveis de controle (Donahoe
& Palmer, 2004, p. 3).
2
O Columban Simulation Project foi uma resposta a febre cognitiva
que tomou conta da psicologia experimental estadunidense na época. Neste momento das ciências cognitivas, estava em voga a metáfora do computador, que tinha como pressuposto básico o uso de um
computador para simular e estudar fenômenos mentais (Cisek, 1999;
Teixeira, 2008). O Columban Simulation Project visava dar uma alternativa biologicamente mais sensata e parcimoniosa: simular e estudar
fenômenos tidos como mentais em organismos vivos, no caso, pombos
(Epstein, 1981). O Columban Simulation Project hoje é apenas uma nota
de rodapé em livros de história, mas seu pressuposto básico de estudar
processos ditos mentais em organismos e não em máquinas, tem voltado a ter destaque nas ciências cognitivas, na medida em que a metáfora
do computador perdeu força (Lopes, Lopes & Teixeira, 2004), e as abordagens evolutivas do comportamento vem novamente ganhando vigor
(Chemero, 2009; Horik, Clayton & Emery, 2012). Um documentário de
1982 sobre o projeto, com a apresentação de B. F. Skinner, está disponível na íntegra no site de R. Epstein: http://drrobertepstein.com/index.
php/videos
3
Na década de 1980, B. F. Skinner e
alguns colaboradores publicaram uma série de experimentos cujo objetivo foi estudar fenômenos complexos2, ordinariamente
chamados de cognitivos, em um tradicional espécime do laboratório de Análise do
Comportamento: o pombo (Columba livia).
Esses estudos faziam parte do que ficou
conhecido como o Columban Simulation
286
Capítulo XVIII | Criatividade
tamentais básicos envolvidos no desempenho criativo.
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Epstein et al. (1984) adaptaram uma
das situações problemas do pioneiro trabalho de Köhler (1948) aos pombos. A tarefa
consistiu em empurrar uma caixa em direção a uma banana de plástico afixada no
teto da câmara experimental, subir na caixa, e bicar a banana. A banana foi escolhida
sarcasticamente para mostrar que pombos,
dado o treino adequado, poderiam exibir o
mesmo desempenho que os chimpanzés de
Köhler. A essa situação problema, deu-se
o nome de teste de deslocamento de caixa
(Cook & Fowler, 2014). Os autores manipularam explicitamente o treino que estes
pombos receberam antes de serem expostos a situação de teste.
Onze pombos participaram do experimento, e diferentes números de sujeitos
receberam diferentes histórias experimentais antes de serem expostos a situação problema. Quatro sujeitos receberam o treino
independente (não encadeado) de dois repertórios pré-requisito: (a) treino de empurrar direcionado (na qual uma caixa deveria
ser empurrada em direção a um alvo verde),
e; (b) subir na caixa e bicar um alvo (uma
banana de plástico afixada no teto da câmara experimental). Todas as respostas foram consequenciadas com acesso a alimen-
to, e os animais foram mantidos em regime
de privação alimentar durante o período
do experimento. Foram também realizadas
sessões de extinção de voar em direção ao
alvo. Nestas sessões o alvo ficava disponível, fora do alcance e sem a caixa, e nenhuma resposta era consequenciada.
O treino da habilidade de empurrar
direcionado consistia na modelagem de
respostas de empurrar a caixa em direção a
um alvo verde, que ficava afixado em uma
das paredes da câmara, em posições alternadas a cada tentativa, na altura do piso.
Também foram realizadas sessões de extinção de empurrar na ausência do alvo verde.
O alvo do teste final (a banana de plástico)
não esteve presente em nenhuma das sessões desta etapa.
Durante o treino da habilidade de subir e bicar o alvo, a caixa permanecia fixa
no piso da câmara, logo abaixo da posição
onde o alvo estava afixado no teto. Tentativas de empurrar e caixa e bicar a mesma
não foram consequenciadas. A posição da
caixa e da banana foi aleatorizada a cada
apresentação. Durante o treino, nenhum
critério de aprendizagem foi utilizado, e
os autores apenas afirmam que o teste foi
realizado após os sujeitos emitirem respostas de empurrar direcionado e subir e bicar
confiavelmente na presença de cada estímulo (empurrar na situação caixa e alvo,
subir na situação caixa e banana). Posteriormente, Epstein (1996) afirma que a não
utilização de critérios de aprendizagem foi
287
Hernando Borges Neves Filho
intencional, para assegurar que nenhuma
das duas respostas treinadas adquirisse um
forte controle discriminativo durante o treino.
Além dos quatro pombos que receberam o treino completo dos dois repertórios
pré-requisito, dois outros sujeitos aprenderam somente a bicar o alvo, mas não a subir
na caixa. Outros dois sujeitos aprenderam a
subir na caixa e bicar o alvo, mas não a empurrar a caixa. Um terceiro par de sujeitos
aprendeu a subir na caixa e bicar o alvo e
a empurrar a caixa, mas de forma não direcionada (sem o alvo verde), e um último
sujeito passou pelo treino completo (subir
na caixa e bicar a banana, e empurrar direcionado), mas não recebeu as sessões de
extinção de respostas de voar. Cada uma
destas histórias de treino produziu um desempenho particular na situação de teste.
Resultados e Discussão
Os resultados dos quatro sujeitos
que receberam o treino completo foram
similares e consistentes entre si. No início
do teste, os animais exibiram um padrão
de respostas que os autores categorizaram
como um estado de “confusão”. Este padrão
consistia em o sujeito ficar parado, entre a
caixa e o alvo, emitindo respostas de olhar
alternadamente para a caixa e para a alvo.
Após a “confusão”, os sujeitos passaram a
ir em direção à banana e tentar alcança-la (nunca pulando ou voando), sem êxito.
Após isso, novamente os sujeitos emitiram
288
os mesmos padrões de “confusão” do início
do teste. Após estes momentos de “confusão” os sujeitos se aproximaram da caixa, e
prontamente começaram a empurrá-la em
direção à banana. Todos os sujeitos deste
grupo guiavam seus empurrões em direção
à banana olhando para a mesma a cada empurrão, corrigindo a rota de deslocamento
da caixa se necessário. Todos os sujeitos
pararam de empurrar a caixa quando ela
estava abaixo da banana, ou próximo dela,
e em seguida subiram na caixa e bicaram a
banana, resolvendo o problema.
Dos sujeitos que não receberam um
treino completo dos dois repertórios pré-requisito, os que não haviam sido treinados
a subir na caixa, não resolveram a tarefa, e
passaram a maior parte da sessão tentando alcançar a banana esticando-se em direção a ela. No teste dos sujeitos que não
aprenderam a empurrar a caixa, nenhuma
resposta de empurrar foi registrada durante
as sessões, logo, a tarefa não foi resolvida.
Os sujeitos que não tiveram um treino de
empurrar direcionado passaram a maior
parte do tempo das sessões empurrando a
caixa, em diversas direções, tendo inclusive
passado pelo local onde estava pendurado
o alvo. Um destes sujeitos resolveu a tarefa eventualmente, após 14 minutos, o outro
apenas empurrou a caixa durante toda a
sessão. O último sujeito, que recebeu o treino de subir a caixa e bicar o alvo e empurrar
direcionado, mas não passou pelas sessões
de extinção de voar em direção a banana,
apresentou várias respostas em direção à
Capítulo XVIII | Criatividade
banana, como pular e voar, por diversos
minutos, até que, após essa etapa inicial,
começou a empurrar a caixa em direção à
banana, subiu na caixa e bicou a banana.
Os resultados deste estudo identificaram o papel da história de treino, como
uma variável decisiva na resolução súbita
de uma tarefa, já que os animais sem algum dos pré-requisitos comportamentais
não resolveram o problema, ou o resolveram acidentalmente, ao passo que os animais que receberam o treino completo dos
repertórios pré-requisitos, solucionaram a
tarefa com topografia similar à clássica topografia de “insight”. Köhler foi um pioneiro
ao mostrar que chimpanzés exibiam comportamentos originais e criativos em situações problemas criadas em um ambiente
controlado. Epstein et al. (1984) mostraram
a origem e uma forma de se construir estes
comportamentos originais a partir de uma
história de treino controlada.
Epstein et al. (1984) também forneceram uma análise ponto a ponto da solução do problema. No início da resolução, o
estado de “confusão” do sujeito é efeito do
controle de duas respostas pelo contexto do
problema. O alvo, a banana pendurada no
teto, controla respostas de bicar, e a caixa
controla respostas tanto de subir como de
empurrar. A “confusão” é resultado da nova
configuração dos estímulos, no caso, banana e caixa presentes, com a caixa afastada
da banana. Alguns dos sujeitos começam a
sessão subindo na caixa, como a caixa não
está abaixo da banana, a resposta de subir
não produz o reforço, portanto entra em
extinção. Na extinção, o empurrar ocorre
por ressurgência (Epstein & Skinner, 1980),
e é controlado pela posição da banana, que
adquire controle sobre o empurrar a partir
de um processo que os autores chamam de
generalização funcional. A generalização
funcional seria distinta da generalização
tradicional, já que neste caso, não há semelhança física entre os estímulos, apenas
um compartilhamento de função. Ao passo
que o animal empurra a caixa na direção da
banana, o ambiente vai sendo progressivamente modificado, até que a caixa fique em
baixo (ou próxima) da banana. Este novo
estímulo (caixa em baixo da banana), produzido pelo sujeito, controla a segunda resposta, o subir, que é, na palavra dos autores,
encadeada automaticamente ao empurrar,
e produz a solução da tarefa. O animal para
de empurrar a caixa assim que ela está próxima da banana pois ao produzir o estímulo
“caixa em baixo da banana”, o subir se torna
mais provável. O conjunto destes processos
resultava no que os autores chamaram de
recombinação de repertórios.
A recombinação de repertórios é o
processo comportamental pelo qual repertórios aprendidos independentemente um
dos outros (ou seja, não encadeados) podem
ser recombinados em uma forma ou sequência nova, dada um controle discriminativo (situação problema) adequada. A recombinação de repertórios passou a ser então
uma nova maneira que a AC desenvolveu
289
Hernando Borges Neves Filho
para lidar com a criatividade, ou a origem
de comportamentos novos, ao lado de outros processos básicos como a generalização
de estímulos, a indução, a variabilidade, a
modelagem e o encadeamento de respostas. Além disso, a recombinação de repertórios, quando estudada em procedimentos
de resolução de problemas, é também um
modo de descrever os processos comportamentais envolvidos na solução súbita de
um problema, tradicionalmente conhecido
na literatura de Psicologia como um “insight”, desde que Köhler (1948) popularizou
o termo a partir de seus experimentos com
chimpanzés.
DESDOBRAMENTOS
Todos os trabalhos do Columban Simulation Project produziram muitas controvérsias. Franz de Waal, um eminente
primatologista, chegou a comentar que o
trabalho de auto reconhecimento em pombos (Epstein, Lanza & Skinner, 1981) é uma
das “maiores bizarrices da ciência comportamental” (de Waal, 2001, p. 60)4. Diversas
críticas foram também direcionadas ao traO principal ponto da crítica formulada por de Waal (2001) se pauta no
fato de que primatas que apresentam o comportamento de auto reconhecimento em espelhos precisam de pouco ou nenhum treino explícito para que isso ocorra, ao passo que os pombos de Epstein, Lanza e
Skinner (1981) precisaram de um treino direto de repertórios pré-requisito. A crítica passa ao largo do ponto principal do trabalho de Epstein,
Lanza e Skinner (1981), que é construir em laboratório os pré-requisitos
ontogenéticos para que esse desempenho seja observado, independente da espécie. O autor da crítica (de Waal, 2001) também aponta que
replicações do estudo de Epstein, Lanza e Skinner (1981) não obtiveram o mesmo resultado. Considerações acerca dessas replicações podem ser encontradas no recente estudo de Uchino e Watanabe (2014)
que replicaram adequadamente o trabalho original de Epstein, Lanza
e Skinner (1981).
4
290
balho de “insight” (Epstein et al. 1984), em
geral acusando que o mesmo se tratava de
um simples encadeamento de respostas (Ellen & Pate, 1986). Esta crítica não procede,
já que a rigor não se trata de um treino de
encadeamento, dada a natureza independente dos treinos das habilidades pré-requisito (um treino encadeado asseguraria
que a consequência de uma resposta seria
também discriminativo de outra). Outra crítica (Ettlinger, 1984) aponta que não houve
manipulação de variáveis paramétricas de
treino (como treinos de repertórios em contextos distintos), o que sugere que o dado
obtido possa ser um artefato metodológico
(i.e. a resolução não passa de algo que pombos fazem por não haver outras coisas a não
ser uma caixa e uma banana na situação de
teste). A crítica de Ettlinger (1984) não se
sustenta, graças aos dados com os pombos
de Epstein et al. (1984) que não resolveram a
tarefa com um treino incompleto dos repertórios pré-requisito, portanto, apesar dos
autores não terem testado variáveis adicionais, o efeito do treino é claro. Sem o treino,
não há resolução.
Apesar destas críticas, maiores foram os impactos positivos do trabalho sobre a comunidade científica, tanto que
Shettleworth (2012, pg. 217), especialista em
cognição animal, coloca o trabalho de Epstein et al. (1984) como uma das maiores descobertas das ciências comportamentais do
século XX, ao lado do pioneiro trabalho de
Köhler (1948).
Capítulo XVIII | Criatividade
Desta forma, diversos trabalhos adicionais sobre a recombinação de repertórios foram publicados ao longo dos anos
que se seguiram a publicação do trabalho
original de Epstein et al. (1984). Com pombos, em variações do teste de deslocamento de caixa, Cook e Fowler (2014) e Neves
Filho (2015) replicaram os achados originais
de Epstein et al. (1984) envolvendo a recombinação de dois repertórios. Epstein (1985) e
Luciano (1991) demonstraram a recombinação de três repertórios, a partir do desmembramento do treino de subir e bicar em dois
repertórios independentes, e Epstein (1987)
demonstrou a recombinação de quatro repertórios, adicionando uma porta que, se
aberta, dava acesso a caixa.
A recombinação de repertórios também foi observada em diferentes tarefas,
para além do teste de deslocamento de caixa, e com diferentes espécies como: macacos-prego (Delage & Galvão, 2010; Neves
Filho, 2010; Delage, 2011; Neves Filho, Carvalho Neto, Barros, & Costa, 2014), ratos albinos (Delage, 2006; Tobias, 2006; Ferreira,
2008, Leonardi, 2012; Neves Filho, Stella,
Dicezare & Garcia-Mijares, 2015), corvos
da Nova Caledônia (Taylor, Elliffe, Hunt &
Gray, 2010; Neves Filho, 2015) e humanos
(Sturz, Bodily & Katz, 2009).
CONSIDERAÇÕES FINAIS
A recombinação de repertórios é um
processo comportamental relacionado a re-
solução de problema e criatividade (Neves
Filho & Carvalho Neto, 2013). A publicação
do artigo de Epstein et al. (1984) trouxe uma
nova linha de pesquisa para a Análise do
Comportamento, e a recombinação de repertórios tem o potencial de ser um modelo animal para o estudo de comportamentos novos (Kubina, Morrison & Lee, 2011;
Leonardy, Andery & Rossger, 2011; Murari
& Henklain, 2013). Assim como procedimentos comportamentais bem estabelecidos, como os esquemas de reforçamento,
são amplamente utilizados em pesquisas
de neurociências e farmacologia (McKim,
2007), a recombinação de repertórios, como
um modelo animal de criatividade, tem o
potencial de servir aos mesmos propósitos.
Na medida em que um procedimento produz a recombinação de repertórios, novas
variáveis podem ser introduzidas, como o
efeito de drogas. Será que um animal que
aprenda uma das habilidades pré-requisito
de um problema sob o efeito de álcool apresenta uma topografia de solução igual a um
animal sóbrio? E se o animal estiver sob
efeito da droga somente no teste? Estas são
perguntas empíricas ainda em aberto.
Algumas variáveis de treino já mapeadas indicam que se as habilidades pré-requisito são treinadas com reforços diferentes (água ou comida), a recombinação de
repertórios não ocorre em pombos na tarefa de deslocamento de caixa (Neves Filho,
2015). Com macacos-prego, em uma tarefa
de dois repertórios (encaixar ferramentas e
alcançar alimento usando uma ferramen291
Hernando Borges Neves Filho
ta) a recombinação ocorre se os repertórios
forem treinados e testados em um mesmo
ambiente (Neves Filho, 2010), porém não
ocorre da mesma maneira se ao menos um
dos repertórios é treinado em um local diferente do local onde a recombinação é testada (Neves Filho, Carvalho Neto, Barros,
& Costa, 2014), o mesmo efeito de contexto
distinto de treino e teste não é observado
em corvos da Nova Caledônia de vida livre5 (Neves Filho, 2015). Uma série de outras variáveis ainda precisa ser analisada, e
processos como a generalização funcional e
o encadeamento automático precisam ser
mais bem estudados e definidos (Luciano,
1991). De qualquer forma, todos estes dados
sobre os efeitos de variáveis de treino sobre a recombinação de repertórios apontam
que, de fato, para cada situação problema e
espécie estudada, um conjunto de variáveis
de treino podem ter efeitos distintos sobre
a topografia de solução do problema. Diferentes tipos de treino produzem diferentes
soluções, ou as inviabilizam. Desta forma,
é possível, em tese, mapear que variáveis
de treino produzem uma melhor recombinação, em uma tarefa específica, de modo
a criar uma “tecnologia de insight”, ou uma
“tecnologia da criatividade”, pautada em
um método de aprendizagem que facilite
Vida livre aqui indica que os animais que participaram do estudo não
estavam em um laboratório. Neste estudo (Neves Filho, 2015), corvos
da Nova Caledônia (Corvus moneduloides) foram capturados em seu
ambiente natural e foram alojados em um aviário, no qual a coleta de
dados ocorreu. Ao final da coleta, os animais foram liberados no mesmo local onde ocorreu a captura. Para mais informações sobre estudos
de cognição animal em animais de vida livre, em especial corvos da
Nova Caledônia, conferir Taylor, Elliffe, Hunt e Gray (2010). E para uma
sugestão de algumas vantagens do estudo de animais de vida livre para
a Análise do Comportamento, conferir Pritchard et al. (2016).
5
292
recombinações em diferentes tarefas. Este
amadurecimento da área e do que se sabe
sobre a recombinação de repertórios produz
o contexto ideal para começarmos a aplicação do que sabemos, e observar, treinar e
facilitar a recombinação em ambientes fora
do laboratório, como escolas, ambientes de
educação à distância, empresas e organizações. Este é o desafio do momento.
PARA SABER MAIS
Epstein (1996). Coletânea de artigos de Robert Epstein sobre a recombinação de repertórios e criatividade. No livro constam
todos os experimentos do Columban Simulation Project nos quais Epstein esteve envolvido. O livro apresenta diversos comentários sobre o tema e a proposta do autor de
uma “teoria generativa do comportamento”,
baseada na recombinação de repertórios.
Leonardy, Rossger, & Andery (2011). Artigo
discutindo a importância da recombinação
de repertórios para a Análise do Comportamento a partir de uma revisão de diversas
dissertações de mestrado que utilizaram ratos como sujeitos.
Neves Filho & Carvalho Neto (2013). Uma
introdução à recombinação de repertórios
e alguns exemplos interpretativos de onde
podemos encontra-la em diversos produtos
artísticos humanos.
Murari & Henklain (2013). Artigo discutin-
Capítulo XVIII | Criatividade
do como a Análise do Comportamento lida
com a criatividade, apresentando diversos
processos básicos, incluindo a recombinação de repertórios.
REFERÊNCIAS
Birch, H. G. (1945). The relation of previous
experience to insightful problem-solving.
Journal of Comparative Psychology, 38,
367-383.
Boakes, R. (1984). From Darwin to behaviourism: psychology and the minds of animals. UK: Cambridge University Press.
Cisek, P. (1999). Beyond the computer metaphor: Behaviour as interaction. Journal of
Consciousness Studies, 6, 125-42.
Chemero, A. (2009). Radical embodied cognitive science. Cambridge: The MIT Press.
Cook, R., & Fowler, C. (2014). ‘‘Insight’’ in pigeons: Absence of means–end processing
in displacement tests. Animal Cognition, 17,
207-220.
de Waal, F. (2001). The Ape and the sushi
master. New York: Basic Books.
Delage, P. E. G. A. (2006). Investigações sobre o papel da generalização funcional em
uma situação de resolução de problemas
(“insight”) em Rattus norvegicus. (Dissertação de Mestrado). Universidade Federal do
Pará, Belém, Pará.
Delage, P. E. G. A. (2011). Transferência de
aprendizagem no uso de ferramentas por
Macacos-Prego (Cebus cf apella). (Tese de
Doutorado). Universidade Federal do Pará,
Belém, Pará.
Delage, P. E. G. A., & Carvalho Neto, M. B.
(2006). Comportamento criativo & análise
do comportamento II: Insight. Em H. J. Guilhardi, N. C. Aguirre. (Orgs.). Sobre Comportamento e Cognição: Expondo a Variabilidade Volume 18. Santo André: ESETec
Editores Associados.
Delage, P. E. G. A., & Carvalho Neto, M. B.
(2010). Um modo alternativo de construir
um operante: A aprendizagem recombinativa. Psicologia em Pesquisa, 4, 50-56.
Delage, P. E. G. A., & Galvão, O. F. (2010).
Generalidade da aprendizagem em situações de uso de ferramentas por um macaco-prego, Cebus Apella. Psicologia: Teoria e
Pesquisa, 26, 687-694.
Donahoe, J. W. & Palmer, D. C. (2004). Learning and complex behavior. Richmond:
Ledgetop Publishing.
Ellen, P. & Pate, J. L. (1986). Is Insight merely
a response chaining? A reply to Epstein. The
Psychological Record, 36, 155-160.
Epstein, R. (1981). On pigeons and people: A
preliminary look at the Columban Simula293
Hernando Borges Neves Filho
tion Project. The Behavior Analyst, 4, 43-55.
Epstein, R. (1985). The spontaneous interconnection of three repertoires of behavior
in a pigeon (Columba livia). Psychological
Record, 35, 131-141.
Epstein, R. (1987). The spontaneous interconnection of four repertoires of behavior
in a pigeon (Columba livia). Journal of Comparative Psychology, 101, 197-201.
Epstein, R. (1996). Cognition, creativity and
behavior: Selected essays. New York: Praeger.
Epstein, R., Lanza, R. P., & Skinner, B. F.
(1980). Symbolic communication between two pigeons (Columba livia domestica).
Science, 207, 543-545.
Epstein, R., & Skinner, B. F. (1980). Resurgence of responding after the cessation of
response-independent reinforcement. Proceedings of the National Academy of Sciences USA, 77, 6251-6245.
Epstein, R., & Skinner, B. F. (1981). The
spontaneous use of memoranda by pigeons.
Behaviour Analysis Letters, 1, 241-246.
Epstein, R., Lanza, R., & Skinner, B. F. (1981).
“Self-awareness” in the pigeon. Science, 212,
695.
Epstein, R., Kirshnit, C. E., Lanza, R. P., &
Rubin, L. C. (1984). “Insight” in the pigeon:
294
Antecedents and determinants of an intelligent performance. Nature, 308, 61-62.
Ettlinger, G. (1984). Humans, apes and
monkeys: The changing neuropsychological viewpoint. Neuropsychologia, 22, 685696.
Ferreira, J. S. F. (2008). Comportamentos
novos originados a partir da interconexão
de repertórios previamente treinados: uma
replicação de Epstein, Kirshnit, Lanza e Rubin, 1984. (Dissertação de Mestrado). Pontifícia Universidade Católica, São Paulo.
Jung-Beeman, M., Bowden, E M., Haberman, J., Frymiare, J. L., Arambel-Liu, S.; Greenblatt, R., Reber, P. J., & Kounios, J. (2004).
Neural activity when people solve verbal
problems with insight. PLoS Biology, 2, e97.
Horik, J. O., Clayton, N. S., & Emery, N. J.
(2012). Convergent evolution of cognition
in corvids, apes and other animals. In T.
K. Shackelford & J. Vonk (Eds.), The Oxford handbook of comparative evolutionary
psychology. New York: Oxford University
Press.
Köhler, W. (1948). The mentality of the apes
(2nd ed.). New York: New Haven. Originalmente publicado em 1917.
Kubina, R. M., Morrison, R. S., & Lee, D. L.
(2011). Behavior analytic contributions to
the study of creativity. The Journal of Creative Behavior, 40, 223-242.
Capítulo XVIII | Criatividade
Ladygina-Kots, N. N., & Dembovskii, Y. N.
(1969). The psychology of primates. In M.
Cole & I. Maltzman (Eds.). A Handbook of
Contemporary Soviet Psychology. London:
Basic Books.
Lanza, R. P., Starr, J., & Skinner, B. F. (1982).
“Lying” in the pigeon. Journal of The Experimental Analysis of Behavior, 38, 201-203.
Leonardi, J. L., Andery, M. A. P. A., & Rossger, N. C. (2011). O estudo do insight pela
análise do comportamento. Perspectivas em
Análise do Comportamento, 2, 166-178.
Leonardi, J. L. (2012). “Insight”: um estudo
experimental com ratos. (Dissertação de
Mestrado). Pontifícia Universidade Católica, São Paulo.
Lopes, E. J., Lopes, R., & Teixeira, J. F. (2004).
A psicologia cognitiva experimental cinquenta anos depois: a crise no paradigma
do processamento de informação. Paidéia,
14, 17-26.
Luciano, C. (1991). Problem solving behavior: An experimental example. Psicothema, 3, 297-317.
Maier, N. R. F. (1931). Reasoning and learning. Psychological Review, 38, 332-346.
Maier, N. R. F. (1937). Reasoning in rats and
human beings. Psychological Review, 44,
365-378.
Mas, M. (2015). El desarrollo de la psicologia
comparada: de Darwin a Köhler. Boletín Informativo de la Sociedad Española de Historia de la Psicología, 54, 2-9.
McKim, W. A. (2007). Drugs and behaviour:
An introduction to behavioral pharmacology. New Jersey: Pearson Education.
Murari, S. C., & Henklain, M. H. O. (2013).
Criatividade em debate: algumas contribuições da análise do comportamento. Temas
em Psicologia, 21, 17-29.
Neves Filho, H. B., & Carvalho Neto, M. B.
(2013). A criatividade nas artes: a recombinação de repertórios comportamentais
como processo básico. Boletim Contexto,
38, 133-145.
Neves Filho, H. B., Carvalho Neto, M. B.,
Barros, R. S., & Costa, J. R. (2014). Insight
em macacos-prego (Sapajus spp.) com diferentes contextos de treino das habilidades
pré-requisitos. Interação em Psicologia, 18,
333-350.
Neves Filho, H. B., Stella, L. R., Dicezare,
R., & Garcia-Mijares, M. (2015). Insight in
the white rat: The spontaneous recombination of two repertoires. European Journal of
Behavior Analysis, 16, 1-14.
Neves Filho, H. B. (2010). Efeito de diferentes histórias de treino sobre a ocorrência
de “Insight” em macaco-prego (Cebus spp.).
(Dissertação de Mestrado). Universidade
295
Hernando Borges Neves Filho
Federal do Pará, Belém, Pará.
Neves Filho, H. B. (2015). Efeito de variáveis de treino e teste sobre a recombinação
de repertórios em pombos (Columba livia),
ratos (Rattus norvegicus) e corvos da Nova
Caledônia (Corvus moneduloides). (Tese de
Doutorado). Universidade de São Paulo,
São Paulo.
Poincaré, H. (1913). The foundations of
science: Science and hypothesis, the value of
science, science and method. New York: The
Science Press.
Pritchard, D. J., Hurly, A., Tello-Ramos, M.
C., & Healy, S. D. (2016). Why study cognition in the wild (and how to test it)? Journal
of the Experimental Analysis of Behavior,
105, 41-55.
Razran, G. (1961). Raphael’s “idealess” behavior. Journal of Comparative and Physiological Psychology, 54, 366-367.
Reznikova, Z. (2007). Animal intelligence:
From individual to social cognition. UK:
Cambridge University Press.
Shettleworth, S. J. (2012). Do animals have
insight, and what is insight anyway? Canadian Journal of Experimental Psychology,
66, 217-266.
Sturz, B. R., Bodily, K. D., & Katz J. S. (2009).
Dissociation of past and present experience
in problem solving using a virtual environ296
ment. CyberPsychology & Behavior, 15, 1519.
Taylor, A. H., Elliffe, D., Hunt, G., & Gray R.
D (2010). Complex cognition and behavioural innovation in new caledonian crows.
Proceedings of the Royal Society B, 277,
2637-2643.
Teixeira, J. F. (2008). Mente, cérebro e cognição 3ª edição. Brasil: Vozes.
Tobias, G. K. S. (2006). É possível gerar “Insight” através do ensino dos pré-requisitos
por contingências de reforçamento positivo em Rattus norvegicus? (Dissertação de
Mestrado). Universidade Federal do Pará,
Belém, Pará.
Uchino, E., & Watanabe, S. (2014). Self-recognition in pigeons revisited. Journal of
the Experimental Analysis of Behavior, 102,
327-334.
Windholz, G. (1984). Pavlov vs. Köhler: Pavlov’s little-known primate research. Pavlovian Journal of Biological Science, 19, 23-31.
Wildholz, G., & Lamal, P. A. (1985). Köhler’s
insight revisited. Teaching of Psychology, 12,
165-167.
Cristiano Valério dos Santos
Controlar para
conhecer
Cristiano Valério dos Santos
Universidad de Guadalajara,
Centro de Estudios e Investigación en Comportamiento
Rescorla, R. A. (1968). Probability of shock in the presence and absence of CS in fear conditioning. Journal of Comparative and Physiological Psychology, 66, 1-5.
“A simplificação do laboratório revela a relevância de fatores
que poderíamos de outro modo deixar passar.”
(Skinner, 1953/2003, p. 23).
297
Capítulo XIX | Condicionamento Pavloviano
INTRODUÇÃO À ÁREA DE PESQUISA E CONTEXTUALIZAÇÃO
DO EXPERIMENTO
Alguns anos atrás, houve uma promoção de uma franquia de café na minha
cidade. Por cada copo de café que você tomasse, os atendentes carimbavam um papel
e, se você juntasse um número específico
de carimbos, era possível ganhar prêmios.
Como eu já gostava do café que eles faziam
e me interessava conseguir um prêmio em
particular, passei a tomar café duas ou três
vezes ao dia nesse estabelecimento em vez
de duas ou três vezes na semana (um testemunho de que esquemas de reforçamento
funcionam ou de que necessito encontrar
outro passatempo). Alguns dias depois que
eu comecei meu novo regime “cafeínico”,
senti que certas coisas não andavam bem
no meu corpo. Pesquisei na internet algumas causas relacionadas ao que eu estava
sentindo e descobri como possível causa a
intoxicação por cafeína (deixarei com vocês
a escolha de investigar o que é se quiserem).
Acreditando que essa poderia ser a causa
mais provável, resolvi mudar meu consumo
do café comum para descafeinado e os sintomas desapareceram em poucos dias.
Normalmente, apresento comportamentos que poderiam ser classificados
como hipocondríacos, como acreditar que
qualquer coisa no meu corpo é sintoma de
algo muito mais grave e pensei: Poderia ser
só coincidência que os sintomas tenham
desaparecido? Afinal, é possível que os sin-
tomas de uma doença mais grave tenham
um curso de tempo predeterminado (não sei
se é verdade, mas fazia sentido para mim na
época). Então, como poderia ter mais certeza do meu próprio diagnóstico? Voltando a
tomar café comum! Dito e feito, os sintomas
voltaram. Pouco depois voltei a tomar café
descafeinado por um tempo, até desintoxicar-me completamente, e os sintomas voltaram a desaparecer. Este tipo de situação
na qual uma variável é introduzida e posteriormente retirada se conhece comumente
como delineamento de reversão.
Esse é só um exemplo anedótico de
uma inferência causal, algo que todas as
pessoas fazem constantemente. Por exemplo, quando alguém nos trata mal, podemos
supor que essa pessoa “é assim com todo
mundo” ou que “tem passado por alguma experiência desagradável nos últimos
tempos”. O tipo de suposição que fazemos
pode ter a ver com o grau de intimidade
que temos com a pessoa: Se a conhecemos
bem, talvez saibamos que ela não é assim
normalmente e supomos que algo fora do
comum aconteceu; se não a conhecemos
bem, é possível que suponhamos, talvez erroneamente, que este é seu “temperamento
normal”. A pergunta que nos interessa – e
que todos deveríamos fazer antes de acabar
com a reputação de alguém por algo que
pode ser um evento isolado – é como podemos ter certeza de nossas suposições.
No exemplo do meu problema com o
café, o pequeno “experimento” que realizei
298
Cristiano Valério dos Santos
comigo mesmo me deu mais confiança de
que os sintomas que eu apresentava se deviam à natureza das bebidas que eu estava
consumindo. Contudo, essas bebidas são
produtos compostos por vários elementos
e a causa dos meus sintomas pode ter sido
a cafeína ou qualquer outro componente
presente na bebida. Para saber com mais
certeza ainda qual era o componente responsável, não bastaria que eu deixasse de
tomar café; eu teria que continuar tomando as bebidas que geralmente consumia,
com todos os seus componentes menos o
elemento que eu achava que estava relacionado ao que me estava acontecendo, neste
caso a cafeína. Por isso, tive a ideia de consumir a mesma bebida, porém sem cafeína.
Como os sintomas desapareceram e a única
variável alterada tinha sido a cafeína, posso dizer com boa precisão que a cafeína foi
responsável pelos sintomas.
Esse tipo de situações nas quais
mantemos constantes todos os elementos
que não nos interessam num determinado
momento e que poderiam invalidar a minha
inferência causal se conhece como controle
experimental e é a âncora de qualquer ciência. No entanto, às vezes não é tão simples
saber o que temos que controlar, principalmente quando o objeto de estudo é novo e
as variáveis das quais o fenômeno é função
são pouco conhecidas. O estudo sistemático do comportamento dos organismos é
relativamente recente em comparação com
outros objetos de estudo e, portanto, ainda
é mais suscetível de padecer do problema
299
da ignorância sobre quais variáveis devem
ser controladas. A revisão feita por Rescorla
(1967) sobre os protocolos de controle experimental em estudos de condicionamento
respondente reflete bem essa questão.
O condicionamento respondente,
também conhecido como condicionamento clássico ou pavloviano, refere-se a uma
mudança comportamental que é resultado
da relação sistemática entre dois estímulos
(ver M. Lattal, 2013, para uma revisão ampla
sobre o tema). Um desses estímulos evoca
uma resposta no organismo com uma alta
probabilidade, geralmente sem que o organismo tenha uma experiência prévia com
ele, e é denominado estímulo incondicionado (US). O outro estímulo inicialmente
evoca outras respostas no organismo, porém, como resultado da relação com o estímulo incondicionado, passa a evocar respostas diferentes que não evocava antes.
Por exemplo, se uma pessoa ingerir uma
comida que esteja contaminada com bactérias nocivas ao organismo, a presença
dessas bactérias evocará uma série de respostas fisiológicas com uma probabilidade
muito alta, tais como febre, náuseas, vômito
e diarreia. Como essas respostas fisiológicas ocorreram como resultado da ingestão
de uma comida específica (i.e., não ocorreram como resultado da ingestão de outro
tipo de comida), é provável que ocorra uma
mudança comportamental como resultado
dessa relação: a pessoa provavelmente sentirá náusea ao ver esse alimento específico
e evitará consumi-lo, mesmo que não es-
Capítulo XIX | Condicionamento Pavloviano
teja contaminado. Esse é, a propósito, um
dos principais procedimentos usados para
estudar condicionamento respondente no
laboratório, conhecido como aversão a sabores (Garcia, Kimeldorf, & Koelling, 1955).
Considera-se que o condicionamento respondente, portanto, é resultado da relação entre os dois estímulos. O problema
neste tipo de procedimento é que a apresentação dos estímulos pode por si só produzir efeitos no comportamento que não
necessariamente são resultado da relação
entre eles, que é a condição necessária para
se falar de condicionamento respondente.
Na situação com a comida, por exemplo, é
possível que o alimento por si mesmo possa causar náusea na pessoa sem que esteja
contaminado (eu tenho esse problema com
o aipo). Para ter certeza de que as mudanças
no comportamento se devem à relação entre os estímulos e não à mera apresentação
dos estímulos, pesquisadores e pesquisadoras desse fenômeno desenvolveram alguns
protocolos experimentais de controle que
permitem descartar os efeitos que não são
resultados da manipulação de interesse.
Rescorla (1967) faz uma revisão de seis desses protocolos de controle.
mento do organismo. O segundo é apresentação de um estímulo condicionado novo,
que não se apresenta antes das tentativas
do teste para avaliar se houve condicionamento de fato, com o objetivo de estimar o
efeito incondicionado do estímulo. O terceiro é a apresentação apenas do estímulo
incondicionado o mesmo número de vezes
que se apresenta ao grupo experimental,
para avaliar possíveis efeitos de sensibilização ou habituação ao estímulo incondicionado (sensibilização e habituação se
referem ao aumento ou diminuição, respectivamente, da probabilidade ou magnitude
de uma resposta como resultado da mera
apresentação repetida de um estímulo). O
quarto é o procedimento explicitamente
desemparelhado. Nesse procedimento, o
estímulo incondicionado nunca é apresentado de maneira temporalmente próxima ao
estímulo condicionado. O quinto é o emparelhamento reverso, no qual se apresenta o
estímulo incondicionado antes do estímulo
condicionado. Finalmente, o sexto é o condicionamento discriminado, no qual um estímulo condicionado é apresentado de maneira contígua ao estímulo incondicionado,
enquanto que outro estímulo é apresentado
explicitamente desemparelhado.
O primeiro deles é apresentação apenas do estímulo condicionado a um grupo
diferente de sujeitos o mesmo número de
vezes que se apresenta ao grupo experimental. Este protocolo de controle foi criado
para avaliar os efeitos de familiaridade com
o estímulo condicionado sobre o comporta-
Rescorla (1967) defendeu que um critério lógico para avaliar um procedimento
de controle adequado é se o procedimento
retém o maior número possível de características similares ao procedimento experimental, somente eliminando algum aspecto
importante. No caso do condicionamento,
300
Cristiano Valério dos Santos
tanto respondente como operante, a variável que supomos ser responsável pelas mudanças comportamentais é a relação que se
estabelece entre os estímulos ou entre uma
resposta e uma consequência, respectivamente. Considerando esse critério, todos
os seis protocolos de controle padecem de
problemas e, segundo Rescorla, todos esses problemas têm uma origem comum: A
crença de que a variável mais importante
no condicionamento respondente é a contiguidade temporal entre os estímulos.
O primeiro protocolo, apresentação
do estímulo condicionado sozinho, tem o
problema de que os sujeitos do grupo controle não são expostos à mesma quantidade
de apresentações do estímulo incondicionado, além de que as apresentações repetidas do estímulo condicionado sem o estímulo incondicionado podem não gerar o
mesmo nível de habituação que quando se
apresenta junto com o estímulo incondicionado. O segundo protocolo, apresentação de
um novo estímulo condicionado, além dos
problemas anteriores, também não controla
o fato de os sujeitos do grupo experimental já terem a experiência com o estímulo
condicionado. O terceiro protocolo, apresentação do estímulo incondicionado sozinho, tem o problema de que os sujeitos do
grupo controle não são expostos à mesma
quantidade de apresentações do estímulo
condicionado. O quarto, o quinto e o sexto
protocolos têm um problema similar: Esses
três protocolos, apesar de removerem a relação positiva entre o estímulo condiciona301
do e o incondicionado, ao mesmo tempo introduzem uma relação negativa entre eles,
isto é, sempre que o estímulo condicionado
estiver presente, o estímulo incondicionado
nunca o seguirá.
Para contornar esses problemas,
Rescorla (1967) propôs outro tipo de protocolo de controle, que ele chamou de verdadeiramente aleatório. Nesse caso, os dois
estímulos são programados de maneira
completamente aleatória e independente,
de tal forma que o grupo controle é exposto
à mesma quantidade de apresentações de
ambos estímulos que o grupo experimental
e, inclusive, alguns emparelhamentos acidentais entre estímulos podem ocorrer. A
única diferença é a ausência de uma contingência temporal regular entre eles. A maior
vantagem desse procedimento, segundo o
autor, é que os seis protocolos descritos anteriormente, de alguma forma, foram criados para excluir fatores específicos, como a
sensibilização ao estímulo incondicionado
ou a familiaridade com o estímulo condicionado; o procedimento verdadeiramente
aleatório permite excluir todos os fatores
que não estão relacionados ao condicionamento respondente, sem ter a necessidade
de especificar a priori quais seriam esses
fatores.
Subjacente à ideia do procedimento
de controle verdadeiramente aleatório encontra-se a noção de contingência, que é
definida como uma relação de dependência
entre eventos. A ocorrência de um evento
Capítulo XIX | Condicionamento Pavloviano
A é contingente, ou depende da ocorrência
de outro evento, B, se a probabilidade do
primeiro condicional à presença do segundo [p(A/B)] é diferente da probabilidade do
primeiro condicional à ausência do segundo [p(A/~B)]. Um aspecto importante dessa
definição é que a relação de contingência se
expressa num continuum que inclui desde
relações negativas, quando p(A/B) é menor
que p(A/~B), até relações positivas, quando
p(A/B) é maior que p(A/~B). Isso abre espaço para o estudo de relações entre estímulos
tanto excitatórias (i.e., quando a ocorrência do estímulo aumenta a probabilidade
de ocorrência da resposta) como inibitórias (i.e., quando a ocorrência do estímulo
diminui a probabilidade de ocorrência da
resposta), além de situações nas quais não
há contingência entre eventos [i.e., p(A/B)
= p(A/~B)]. Para ilustrar a importância dessas relações, será descrito um estudo de
Rescorla (1968), que foi o primeiro a realizar
manipulações paramétricas dessas probabilidades, e abriu as portas para o estudo de
relações de contingência negativa, como no
experimento posterior de Rescorla (1969).
DESCRIÇÃO DO EXPERIMENTO
Objetivo e Método
Até a publicação do trabalho de Rescorla (1968), existia a noção de que a contiguidade temporal entre os estímulos, definida como a ocorrência dos estímulos em
proximidade temporal um com o outro, era
a variável necessária e suficiente para que
houvesse condicionamento respondente. O
estudo de Rescorla de 1968 foi constituído
de dois experimentos e o primeiro deles tinha como objetivo isolar os efeitos da contiguidade temporal dos efeitos da contingência entre os estímulos. Para alcançar esse
objetivo, 24 ratos Sprague-Dawley foram
expostos a um procedimento de supressão condicionada (Estes & Skinner, 1941)
em caixas operantes tradicionais, com uma
barra de resposta, um comedouro, uma luz
para iluminação geral, um alto-falante pelo
qual o experimentador poderia apresentar
um tom e um gerador de choques elétricos
que poderia eletrificar o piso da caixa. Nesse procedimento, os ratos foram treinados
inicialmente a pressionar uma barra e recebiam pelotas de comida de acordo com
um esquema de reforçamento intervalo variável (VI) 2 min. Depois de cinco dias de
treino, as barras foram removidas da caixa
e cinco sessões de condicionamento respondente foram realizadas. Para um grupo
de ratos, denominado R-1 (n=8), 12 tons de
dois minutos de duração (CS) foram apresentados mais ou menos a cada oito min e
outros 12 choques elétricos de 0,5 s de duração e 0,9 mA de intensidade (US) foram
apresentados aleatoriamente e de maneira
independente dos tons [p(choque/tom) =
p(choque/ ~tom)]. Um segundo grupo, denominado G, passou por um procedimento
similar, exceto que todos os choques que
ocorreriam na ausência dos tons foram eliminados. Assim, os ratos do grupo G receberam a mesma quantidade de choques na
presença do tom que os ratos do grupo R-1,
302
Cristiano Valério dos Santos
mas nenhum choque na ausência do tom,
o que caracterizou diferentes probabilidades de choque na presença e na ausência
do tom e, portanto, uma relação de contingência positiva [p(choque/tom) > p(choque/ ~tom)]. Contudo, os ratos do grupo G
receberam menos choques do que os ratos
do grupo R-1 e, para controlar essa diferença, um terceiro grupo, denominado R-2, foi
exposto à mesma quantidade de choques
que o grupo G, mas apresentados de maneira aleatória e independente do tom. Depois da fase de condicionamento, os ratos
foram expostos a 10 sessões semelhantes às
sessões de treino, com a exceção que houve
quatro apresentações do tom sobrepostas
ao esquema de reforçamento VI 2 min, sem
a apresentação de choques depois de cada
tom.
taxa de respostas durante o estímulo condicionado em comparação com a taxa de
respostas em um período equivalente antes do estímulo; quanto maior a supressão,
mais forte o efeito do condicionamento. No
primeiro experimento, observou-se supressão no grupo G, o qual havia sido exposto
a diferentes probabilidades de choque em
presença ou ausência do estímulo, e não
houve supressão para os outros dois grupos, expostos ao procedimento verdadeiramente aleatório, independentemente da
quantidade total de choques recebidos. No
segundo experimento, esse resultado foi replicado: Quanto menor a probabilidade de
choque na ausência do tom, mais forte era a
supressão. Por outro lado, quando a probabilidade de choque na presença ou ausência do tom era igual, não houve supressão.
No segundo experimento, Rescorla realizou um estudo paramétrico com
10 grupos de ratos. Cada grupo foi exposto a um par de probabilidades distinto, por
exemplo 0,4-0,4, 0,4-0,2, 0,2-0,0, entre outros. O primeiro valor se referia à probabilidade de choque durante o estímulo condicionado (tom) e o segundo valor se referia
à probabilidade de choque na ausência do
estímulo condicionado. Os demais detalhes
do procedimento foram como no primeiro
experimento.
Esses resultados apoiaram fortemente a ideia de que a contingência entre
os estímulos é a variável principal na determinação do condicionamento respondente
e não a ocorrência dos dois estímulos em
contiguidade temporal.
Resultados e Discussão
A medida principal usada no estudo foi a razão de supressão, que se refere à
303
DESDOBRAMENTOS
A proposta de Rescorla (1967), que
inicialmente começou como uma discussão
acerca dos tipos de protocolos de controle
existentes em pesquisas sobre condicionamento respondente, e a sugestão de um
protocolo mais adequado, serviu de base
para que se questionasse uma ideia muito
Capítulo XIX | Condicionamento Pavloviano
arraigada em psicologia experimental até
essa época: a noção de que a contiguidade temporal entre os eventos era suficiente para que se produzissem mudanças no
comportamento dos organismos.
Atualmente, essa discussão continua
em vigor em diferentes áreas da Análise do
Comportamento, no que se conhece como a
discussão entre a postura molar e a postura
molecular (Baum, 2002; Dinsmoor, 2001). A
ideia de que o comportamento dos organismos é influenciado por contingências entre
estímulos se alinha com uma postura molar
de comportamento, a qual defende que tanto o comportamento como as variáveis que
o afetam são fenômenos que se estendem
no tempo, em contraposição com a postura
molecular, que centra suas explicações em
relações de contiguidade espaço-temporal. É claro que nem a postura molar ignora
efeitos de variáveis locais contíguas à ocorrência de respostas específicas, como demonstrado na análise que fizeram Davison
e Baum (2000) do comportamento de escolha, nem a postura molecular ignora o efeito
de variáveis claramente estendidas no tempo, como a probabilidade ou a contingência.
No entanto, mesmo que reconheçam o efeito dessas variáveis, os defensores de uma
postura molecular buscarão explicar como
os organismos são afetados por essas variáveis estendidas no tempo apelando a processos contíguos à ocorrência de respostas
discretas temporalmente definidas, como
o caso das teorias bifatoriais propostas
para explicar o comportamento de esquiva
(Dinsmoor, 2001). Por outro lado, defensores de uma postura molar buscarão encaixar o efeito variáveis localmente definidas
em padrões comportamentais mais amplos,
como por exemplo a análise de Rachlin
(2000) sobre o autocontrole. Essas questões
têm gerado debates acirrados sobre a natureza mesma dos fenômenos psicológicos e
sobre a melhor maneira de estudá-los.
Um segundo desdobramento importante é que a noção de contingência como
diferença de probabilidades (Rescorla, 1967,
1968) abriu as portas para o estudo de outros fenômenos até então pouco discutidos,
como é o caso da inibição condicionada. A
inibição condicionada se refere aos efeitos
inibitórios de um estímulo que foi previamente apresentado com o estímulo incondicionado em uma contingência negativa,
ou seja, a probabilidade do estímulo incondicionado dada a ausência do estímulo condicionado é maior que a probabilidade do
estímulo incondicionado dada a presença
do estímulo condicionado. Por exemplo, se
os choques ocorrem mais frequentemente
na ausência de um tom que em sua presença, haveria uma contingência negativa entre o tom e o choque. Posteriormente, quando se apresenta esse estímulo junto com
outro estímulo que já havia adquirido propriedades excitatórias, observa-se uma diminuição da probabilidade da resposta ante
o estímulo que era excitatório (Rescorla,
1969). Antes da proposta de Rescorla (1967,
1968), o fenômeno de inibição em condicionamento respondente não tinha um lugar
304
Cristiano Valério dos Santos
certo, devido em grande parte à ideia de
que o condicionamento respondente era resultado somente da contiguidade temporal
entre os estímulos. Se isso fosse correto, então apresentar o estímulo incondicionado
na ausência do estímulo condicionado não
deveria resultar em nenhum tipo de efeito
e, portanto, não fazia sentido perguntar o
que aconteceria nesse caso.
Outro desdobramento interessante
é que, embora o procedimento verdadeiramente aleatório tenha sido proposto como
uma condição de controle para a aprendizagem, com a suposição de que não se aprenderia nada ao estar exposto a apresentações
independentes de dois estímulos, estudos
posteriores mostraram que essa suposição
é falsa. Poucos anos depois dos trabalhos de
Rescorla, foram encontradas evidências de
que a exposição à ausência de contingência
entre dois estímulos dificulta a aprendizagem posterior quando se estabelece uma
relação de contingência entre os mesmos
estímulos, e esse efeito parece não ser resultado somente da apresentação isolada
de qualquer dos dois estímulos por si sós
(Baker, 1976; Baker & Mackintosh, 1979).
Este fenômeno hoje se conhece como irrelevância aprendida.
CONSIDERAÇÕES FINAIS
Em um texto de 1988, Rescorla argumentou que o condicionamento respondente havia mudado muito nos 20 anos
305
anteriores à publicação desse artigo, mas a
forma como o tema era apresentado nos livros de Psicologia não havia acompanhado
a evolução da área. Esse problema deveu-se,
em parte, a que acreditamos já saber tudo
o que é possível saber sobre o fenômeno.
Afinal, é só um estímulo que se relaciona a
outro e adquire nova função. No entanto, a
natureza simples do condicionamento respondente é enganosa e ainda é necessário
responder muitas perguntas.
A primeira delas tem a ver com as
condições que produzem o condicionamento respondente. A análise feita por Rescorla
e seus experimentos posteriores junto com
outros fenômenos como o bloqueio (Kamin, 1968), o sombreamento (Mackintosh,
1974), a inibição latente (Lubow, 1973) e a
inibição condicionada (Rescorla, 1969), entre outros, revelam que o condicionamento
respondente pode ocorrer ou não dependendo de muitos outros fatores que não só
a contiguidade temporal entre os estímulos.
A segunda pergunta tem a ver com o que
é aprendido. Por exemplo, estudos sobre
condicionamento de segunda ordem, nos
quais um estímulo neutro se relaciona a um
estímulo condicionado, têm sugerido que,
com estímulos compostos, o comportamento do organismo é controlado por relações
hierárquicas entre os estímulos, e não pela
soma dos efeitos dos elementos que compõe um estímulo agindo em paralelo (Rescorla, 1980). Além disso, há evidências que
sugerem que, quando um estímulo sinaliza
uma relação entre outros dois estímulos (o
Capítulo XIX | Condicionamento Pavloviano
que se conhece como “occasion-setting”),
os estímulos podem ter funções tanto excitatórias como inibitórias ao mesmo tempo
com diferentes elementos da relação (Rescorla, 1980). Esses dados têm sido usados
como evidência que apoia a ideia de que os
estímulos, em lugar de eliciar uma resposta, como tradicionalmente se pensava, modulam sua ocorrência. Todos esses dados
mencionados, em conjunto, sugerem que o
fenômeno de condicionamento respondente é muito mais complexo do que se imaginava.
Além disso, é amplamente reconhecido o papel que o condicionamento respondente tem tanto no desenvolvimento
como no tratamento de muitos problemas
psicológicos, como transtornos de ansiedade ou disfunções sexuais (Bellack, Hersen,
& Kazdin, 1990). Menos conhecido, mas
igualmente importante, é o papel do condicionamento respondente em fenômenos
fisiológicos como a imunologia. Desde já
algumas décadas, sabe-se que a resposta
imunológica é afetada pela apresentação de
estímulos previamente emparelhados com
substâncias imunossupressoras ou facilitadoras (ver Ader, Cohen, & Felten, 1995 para
uma revisão da literatura) e esse fato já foi
usado como coadjuvante no tratamento de
doenças autoimunes como o lúpus (Olness
& Ader, 1992). Igualmente, há propostas
plausíveis de desenvolvimento de tolerância à drogas que se baseiam nos princípios
do condicionamento respondente (Poulos,
Hinson, & Siegel, 1981).
O condicionamento respondente também pode estar relacionado a fenômenos psicológicos que normalmente não
pensaríamos estar relacionados. Numa
revisão da literatura sobre juízos de causalidade, Allan (1993) argumentou que a
maneira como julgamos se dois eventos
estão relacionados ou não, se um influencia o outro, ou a efetividade de uma variável sobre outra, pode ser entendida como
uma relação entre estímulos semelhante ao
condicionamento respondente. Inclusive as
variáveis que fazem que um estímulo condicionado adquira mais fortemente a capacidade de evocar a resposta condicionada parecem ser as mesmas que fazem com
que julguemos como mais forte a relação de
causalidade entre dois eventos (ver Allan,
1993 para uma revisão dos experimentos
realizados sobre o tema).
Especificamente relacionada a noção
de contingência, uma prática muito comum
no contexto clínico ou educativo é o que se
conhece como reforçamento diferencial de
outras respostas (DRO), que se define como
a entrega do reforçador após períodos específicos de tempo durante os quais uma resposta específica não ocorreu. Essa prática é
um exemplo claro de contingência negativa
entre uma resposta específica e um reforçador putativo e ilustra o poder dessas contingências que até então haviam sido pouco
estudadas.
Por fim, embora os efeitos comportamentais de eventos independentes da res306
Cristiano Valério dos Santos
posta já tivessem sido analisados em pesquisas sobre condicionamento operante,
como no caso do trabalho de Skinner (1948)
sobre superstição em pombos, seu uso
como estratégia de controle experimental
não era tão difundido, salvo honrosas exceções, como Skinner (1938) e Herrnstein e
Hineline (1966). Contudo, para poder falar
de condicionamento operante, também é
necessário ter certeza de que as mudanças
no comportamento são produto da relação
de contingência entre a resposta e a consequência. Um exemplo desse tipo de procedimento é o estudo de Stein, Xue e Belluzi
(1993), no qual os autores queriam estudar
o condicionamento operante in vitro reforçando as respostas das células piramidais com microinjeções de dopamina. Para
que a demonstração pudesse ter êxito, era
necessário demonstrar que o aumento na
taxa de respostas das células era resultado
da contingência entre responder e receber
dopamina e não devido a um aumento indiscriminado do responder pela presença
de mais dopamina no sistema. Portanto, foi
realizada uma condição de controle na qual
as microinjeções de dopamina ocorriam de
maneira aleatória, sem relação com a resposta dos neurônios. Comparando os dados
dessa condição de controle com a condição
na qual as microinjeções de dopamina ocorriam de maneira contingente às respostas,
os autores puderam concluir que os efeitos
reforçadores dos agentes dopaminérgicos
podem ser verificados in vitro.
307
PARA SABER MAIS
Rescorla (1969). Um dos primeiros estudos
no qual as relações de contingência negativa entre estímulos foram avaliadas sistematicamente.
Rescorla & Wagner (1972). Neste texto, os
autores apresentam o modelo de Rescorla-Wagner para explicar os fenômenos do
condicionamento respondente. Neste modelo, os autores introduzem o conceito de
discrepância e defendem que o condicionamento respondente é resultado desse fenômeno. Esse conceito tem sido muito útil
para diferentes modelos e teorias em diferentes áreas.
Miller, Barnet, & Grahame (1995). Uma revisão dos pressupostos básicos, sucessos e
fracassos do modelo de Rescorla-Wagner.
Ader & Cohen (1975). Este experimento
foi o primeiro a testar sistematicamente os
efeitos do condicionamento respondente
nas respostas imunológicas.
Rescorla (1980). Neste livro, Rescorla descreve uma série de experimentos sobre
condicionamento de ordem superior. Com
essa preparação experimental, foi possível
responder a muitas perguntas sobre o que
é aprendido no caso do condicionamento
respondente.
Capítulo XIX | Condicionamento Pavloviano
REFERÊNCIAS
Ader, R., & Cohen, N. (1975). Behaviorally
conditioned immunosuppression. Psychosomatic Medicine, 37, 333-340.
Davison, M., & Baum, W. M. (2000). Choice
in a variable environment: Every reinforcer
counts. Journal of the Experimental Analysis of Behavior, 74, 1-24.
Ader, R., Cohen, N., & Felten, D. (1995). Psychoneuroimmunology: Interactions between the nervous system and the immune
system. The Lancet, 345, 99-103.
Dinsmoor, J. A. (2001). Stimuli inevitably
generated by behavior that avoids electric
shock are inherently reinforcing. Journal of
the Experimental Analysis of Behavior, 75,
311-333.
Allan, L. G. (1993). Human contingency judgments: Rule based or associative? Psychological Bulletin, 11, 435-448.
Estes, W. K., & Skinner, B. F. (1941). Some
quantitative properties of anxiety. Journal
of Experimental Psychology, 29, 390-400.
Baker, A. G. (1976). Learned irrelevance and
learned helplessness: Rats learn that stimuli, reinforcers, and responses are uncorrelated. Journal of Experimental Psychology:
Animal Behavior Processes, 2, 130-141.
Garcia, J., Kimeldorf, D. J., & Koelling, R. A.
(1955). Conditioned aversion to saccharin
resulting from exposure to gamma radiation. Science, 122, 157-158.
Baker, A. G., & Mackintosh, N. J. (1979). Preexposure to the CS alone, US alone, or CS
and US uncorrelated: Latent inhibition, blocking by context or learned irrelevance? Learning and Motivation, 10, 278-294.
Baum, W. M. (2002). From molecular to
molar: A paradigm shift in behavior analysis. Journal of the Experimental Analysis of
Behavior, 78, 95-116.
Bellack, A. S., Hersen, M., & Kazdin, A. E.
(Eds.). (1990). International handbook of
behavior modification and therapy. New
York: Plenum Press.
Herrnstein, R. J., & Hineline, P. N. (1966).
Negative reinforcement as shock-frequency reduction. Journal of the Experimental
Analysis of Behavior, 9, 421-430.
Lubow, R. E. (1973). Latent inhibition. Psychological Bulletin, 79, 398-407.
Mackintosh, N. J. (1974). The psychology of
animal learning. Oxford: Academic Press.
Miller, R. R., Barnet, R. C., & Grahame, N. J.
(1995). Assessment of the Rescorla-Wagner
model. Psychological Bulletin, 117, 363-386.
Poulos, C. X., Hinson, R. E., & Siegel, S.
(1981). The role of Pavlovian processes in
308
Cristiano Valério dos Santos
drug tolerance and dependence: Implications for treatment. Addictive Behaviors, 6,
205-211.
Rachlin, H. (2000). The science of self-control. Cambridge: Harvard University Press.
Rescorla, R. A. (1967). Pavlovian conditioning and its proper control procedures. Psychological Review, 74, 71-80.
Rescorla, R. A. (1968). Probability of shock
in the presence and absence of CS in fear
conditioning. Journal of Comparative and
Physiological Psychology, 66, 1-5.
Rescorla, R. A. (1969). Pavlovian conditioned inhibition. Psychological Bulletin, 72,
77-94.
Rescorla, R. A. (1980). Pavlovian second-order conditioning: Studies in associative learning. Hillsdale, NJ: Erlbaum
Rescorla, R. A., & Wagner, A. R. (1972). A
theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement
and nonreinforcement. In A. H. Black & W.
F. Prokasy (Eds.), Classical conditioning II:
Current Research and Theory (pp. 64-99).
New York: Appleton-Century Crofts.
Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York:
Appleton Century Crofts.
Skinner, B. F. (1948). Superstition in the pi309
geon. Journal of Experimental Psychology,
38, 168-172.
Skinner, B. F. (2003). Ciência e Comportamento Humano. São Paulo: Martins Fontes
(Originalmente publicado em 1953).
Stein, L., Xue, B. G., & Belluzzi, J. D. (1993).
A cellular analogue of operant conditioning. Journal of the Experimental Analysis
of Behavior, 60, 41-53.
Kennon A. Lattal
The check is in the mail:
examining how delayed
reinforcement affects
performance
Kennon A. Lattal
West Virginia University
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e Silva, M. I. (1964). Exteroceptive control of response
under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162.
“… a delay of reinforcement is not a static parameter in the effect of reinforcement
on behavior”
(C. B. Ferster, 1953)
310
Capítulo XX | Delay of Reinforcement
INTRODUCTION TO THE RESEARCH AREA AND CONTEXT OF
THE EXPERIMENT
Delay of reinforcement, even in
1964, was a long-standing problem of interest in the psychology of learning (e.g., Kimble, 1961; Renner, 1964). Thorndike (1911) set
the stage for future inquiry when he noted
that “responses accompanied or closely followed by satisfaction to the animal” (p. 244)
would be strengthened. It was left to others to explore the limits and implications
of “closely” for the response-reinforcer relation. The general theme was explored by
all of the major learning theorists who followed Thorndike. Guthrie (1935) emphasized the overriding importance of temporal contiguity between events in learning,
but no reinforcement theorist was he! Hull
(1943) discussed the problem of delay of reinforcement at length in his book Principles
of Behavior, with a particular emphasis on
the mechanisms responsible for maintaining behavior challenged by delays of reinforcement (see also Spence, 1947). Delay of
reinforcement also appears as a research
problem in Skinner’s (1938) book The Behavior of Organisms. In contrast to Hull’s
attempt to infer theoretical mechanisms
underpinning the delay of reinforcement
gradient, Skinner’s analysis was, predictably, more empirical.
Experiments concerned with imposing a temporal delay between the response
that produces the reinforcer and the deliv-
ery of that reinforcer are described in two
places in The Behavior of Organisms. The
delays investigated by Skinner (1938) were
unsignaled, that is, there was no stimulus
change that accompanied the delay interval. In the first experiment (described on pp.
73-74), a response released “a timing pendulum which operates the magazine at the
end of the desired interval”. Skinner (Figure 6, p. 73) showed the acquisition data for
eight rats using delays of 1-4 s with different pairs of rats, which, with one exception,
he noted were comparable to acquisition
with immediate reinforcement. It is unclear
whether these delays reset if subsequent responses occurred during the delay interval,
but it seems that they did not, that is, the
delays were nonresetting (cf. Lattal & Gleeson, 1990). He stated that “[a] new interval
must be begun [when a second response
occurs] or the second response will be reinforced too quickly, but this means that the
first response must go unreinforced” (p. 73).
His subsequent comments suggested that
he did not solve this problem in this first
experiment.
A little later in the book he described
two other experiments involving delay of
reinforcement. He began by repeating the
drawback to the aforementioned procedure:
“[n]o provision is made against the possible coincidence of a second response with
a delayed reinforcement” (Skinner, 1938, p.
138), thereby making it likely that the obtained delay would be less than the nominal or programmed delay. He also noted a
311
Kennon A. Lattal
second difficulty, having to do with the rats
holding the lever down. The delay started
with a lever depression, but sometimes the
lever continued to be held down during the
delay and was released at the end of the interval, leading Skinner to question whether
this would result in immediate or delayed
reinforcement. The apparatus used in this
experiment was the same as that used in
the experiment described above; however,
he noted one change: “[t]he device has this
important property: if a second response is
made during the delay interval, the timing
begins again, so that a full interval must
again elapse before reinforcement occurs”
(p. 139). Thus, instead of a nonresetting
delay, in this experiment delays were resetting, that is, the delay interval restarted
with each response after the one that initiated the delay. Using this resetting delay
procedure, rats “were conditioned in the
usual way” (p. 140; presumably by this Skinner meant with immediate reinforcement)
to respond, ultimately on a fixed-interval
(FI) 5-min schedule. After this training,
delays of 2, 4, 6, or 8 s were in effect with
different rats for three sessions. Rates of
responding were reduced when the delays
were in effect, with the two shorter delays
reducing responding less than the two longer ones. In a final delay of reinforcement
experiment, Skinner examined the effects
of various changes in the training and implementation of the delays.
The next major development in the
experimental analysis of delay of reinforce312
ment was the research of Ferster (1953).
Most learning theorists, including Skinner,
focused on the detrimental effects of delaying reinforcement on learning and performance. Ferster turned the question around
and asked how one might sustain behavior
despite the presence of a delay between
the reinforcer and the response that produced it. He conducted a series of experiments with pigeons in which he first maintained key-peck responding (pecking at
small plastic disc with the beak) with variable-interval (VI) reinforcement schedules.
Against this baseline, in his first and second
experiments delays signaled by blackouts
of the chamber occurred between the reinforcer and the response that produced it.
The blackouts were used “to prevent S from
responding” (p. 219), taking advantage of
the fact that pigeons typically don’t peck response keys when the chamber and the key
are dark. Of course, darkening the chamber was an immediate consequence of the
response, making the blackout a stimulus
ultimately correlated with reinforcer delivery. As a result, delay of reinforcement was
confounded with the potential conditioned
reinforcing function of the blackout. This
confound questions this experiment, and
all experiments involving signaled delays
of reinforcement, as a test of a “pure” delay of reinforcement on responding. In his
first experiment, Ferster observed that 60-s
delays caused a “small decline” in response
rates, but under a 120-s delay, responses
rates fell to about half of what they were
when immediate reinforcement was used.
Capítulo XX | Delay of Reinforcement
In his second experiment, Ferster next tried
to sustain high response rates by introducing the delays gradually, increasing their
duration from 1 to 60 s over a 90-hr training period. He reported that “[t]he three Ss
that did maintain normal rates of response
under 60-sec. delays were continued under
the same procedure for several hundred experimental hours each. They exhibited no
tendency to slow down” (p. 222). Responding of the fourth pigeon was not sustained,
according to Ferster, because the delays
“were increased too rapidly.” (p. 222). He
presented no quantitative data in his report of the experiments, but relied instead
on verbal descriptions of what happened,
supported by only a few sample cumulative
records of the pigeons’ performance.
These two lines of research (Skinner,
1938; and Ferster, 1953) provide the segue to
the subject of this chapter: the experiment
by Azzi, Fix, Rocha e Silva and Keller (1964).
An important part of the story behind the
experiment by Azzi et al. is Fred Keller’s
love affair with Brazil, which began with
his arrival as a Fulbright Teaching Fellow
at the University of São Paulo early in 1961.
He was assigned as his research assistant
Rodolpho Azzi, shown with Keller and two
other Brazilian psychologists in Figure 1. Of
Azzi, Keller (2008) observed:
administration. He helped me answer
queries, write reports, and evaluate
my pupils’ progress. He prepared me
for important meetings, posted me on
new developments, and protected me
from annoyances of any kind.” (p. 248)
Figure 1. Photograph of (left to right) Rodolpho Azzi, Fred Keller, Maria
Amélia Matos, Carolina Martuscelli Bori, and Andrés Aguirre with apparatus, December, 1961.
Soon after Keller started teaching, he
received a shipment of research equipment
that he had ordered from the Grason-Stadler
Company in Waltham, Massachusetts. He
remembered that the apparatus
“… carried no instructions with it, so
we had to determine its uses by trial
and error. Rodolfo [sic][Azzi] and I,
together with Mario Guidi, a student
“He quickly became my counselor and
in our course, worked for days before
guide, he acquainted me with every-
we finally discovered how to automate
thing I should know about my pupils,
a long-term study of the effects of dif-
members of the faculty, and officers of
ferent delays of reinforcement on the
313
Kennon A. Lattal
lever-pressing response of three white
rats (named Alpha, Beta, and Gamma by Rodolfo [sic]). The results were
published later in the Journal of the
Experimental Analysis of Behavior”
(Keller, 2008, p. 250).
One can only speculate about why
delay of reinforcement was the topic of the
first research paper published in Journal of
the Experimental Analysis of Behavior with
a Brazilian first author (Azzi). Let’s go back
to Skinner’s second-reported experiment
on delay of reinforcement in The Behavior
of Organisms. Recall that he used a resetting
delay procedure such that each response
after the one initiating the delay restarted
the delay interval. He used a similar procedure to reduce high rate responding [“no
response was ever reinforced if it had been
preceded within fifteen seconds by another response” (p. 306)], thus giving birth to
the differential-reinforcement-of-low-rate
(DRL) schedule of reinforcement. Wilson
and Keller (1953) thereafter studied the effects of DRL schedules on lever pressing
of rats across a range of “delay” (i.e., DRL
schedule) values. The Wilson and Keller experiment grew out of an earlier demonstration of what was basically a differential-reinforcement-of-other-behavior
(DRO)
schedule, in which the onset of an SD period occurred only if there were no response
in the immediately preceding S-delta period
for a specified time period (cf. Skinner, 1938,
p. 161). A resetting delay of reinforcement
contingency is essentially a DRL schedule
314
without the required response at the end of
the interval, and a DRO schedule is essentially a resetting delay procedure, but without the delay requirement of a response to
initiate each DRO interval (the reinforcers
occur so long as the target response is absent, and if a target response does occur it
resets the DRO interval). Mix all of these
ideas together, add in the fact that Ferster
(one of Keller’s doctoral students at Columbia) had previously studied the effects of
signaled delays of reinforcement and, voila, the procedures used by Azzi et al. (1964)
emerge. We cannot know precisely how the
idea for the experiment developed, but it
certainly, and unsurprisingly, can be closely tied to some of the earlier work of Keller
and his students at Columbia.
DESCRIPTION OF THE EXPERIMENT
Goals and Method
Azzi et al. (1964) set out to do two
things: (a) investigate operant responding
under conditions where the interval between a reinforcer and the response that
produced it was varied and (b) compare
conditions where the delay was either accompanied by a stimulus change (a signal)
or occurred without any change during
the delay interval (unsignaled). Thus, the
experiment was basically a comparison of
two different conditions - unsignaled and
signaled delays of reinforcement – that had
been observed in two separate experiments
Capítulo XX | Delay of Reinforcement
conducted by, respectively, Skinner (1938)
and Ferster (1953).
To this end, three rats first were
trained to lever press under a fixed-ratio
(FR) 1 schedule, where the reinforcer was
access to water. It seems reasonable to assume that at this time neither the food pellets used with rats in many experiments by
Skinner and others, nor the means for delivering these pellets – i.e., a pellet dispenser – were available in Brazil. Water was easy
to obtain and Keller had brought with him
what he called a “Brenner dipper”1 for delivering water reinforcers. After the initial
training, “within a dimly lighted response
chamber, each [rat] was exposed successively to reinforcement delays of 1, 3, 5, 7.5,
10, 15, and 20 s[econds], in that order, with a
total of 150 reinforcers at each delay” (Azzi
et al., 1964, p. 159). The schedule of reinforcement thus was, technically speaking, a
tandem FR 1 DRO t-s schedule, where t corresponded to one of the delay values given
above. A tandem (the Latin word for “one
right after the other”) schedule is identical
to a chained schedule in that two or more
components schedules must be completed
in a fixed sequence for reinforcement; however, in the chained schedule each component is associated with a different stimulus
but in the tandem schedule the stimuli associated with each component are identical.
In Azzi et al.’s (1964) procedure, each delay
restarted if a response occurred during the
Brenner was the name of the instrument maker at Columbia University who fabricated these water delivery devices.
1
delay interval (a resetting delay), and there
was no stimulus change during the delay
period. There followed several manipulations of delay durations for two of the rats.
The third rat apparently was exposed only
to a DRL 20-s schedule with immediate reinforcement. In the second, as in the first,
part of the experiment, the schedule in effect technically was a tandem FR 1 DRO t-s
schedule, where t was 20 s for ten days, followed by six days with t = 30 s. For half of
each session, “each animal worked within
a dimly lighted chamber” (p. 160). For the
other half, however, “darkness was in effect
during each delay interval … each time a response was made to the lever, the light in
the chamber went off” (p. 160, italics original) and did not come back on until a reinforcer had been delivered. Lever presses
in the dark chamber extended the darkness
until the delay duration lapsed and a reinforcer occurred. Thus, in the second part of
the experiment, a delay interval correlated
with the presence and absence of a stimulus change were compared.
Results and Discussion
There were two main findings. Responding maintained under a tandem FR 1
DRO t- s schedule was a negatively decelerating function of delay duration. That is,
rate of responding dropped precipitously as
the delay was increased from 1 to 10 s, but
it asymptoted at that point, not dropping
further when delays were 15 or 20 s long.
This relation is referred to as a delay of rein315
Kennon A. Lattal
forcement gradient, and it is characteristic
of the relation between response measures
and delay duration across a wide range of
delay of reinforcement and reinforcement
schedule parameters (cf. Lattal, 2010). Darkening the chamber during the delay “produced an appreciable effect, regularizing
and increasing the response rate [relative to
that observed in the unsignaled delay condition] in all but a few instances” (Azzi et al.,
1964, p. 160).
The discussion addressed the role
of mediating behavior in sustaining responding during the delay, an observation
made earlier by Ferster (1953). In what subsequently became a standard analysis, the
role of the signal was interpreted to function as a conditioned reinforcer, maintaining responses that produce it. This still is
a popular interpretation of the role of the
signal in signaled delay of reinforcement
procedures. This interpretation, however,
has more recently been questioned by interpreting the role of the signal to be one of
either bridging or marking the delay (e.g.,
Williams, 1991), rather than strengthening
the behavior that precedes it.
IMPACT
Both outcomes of the experiment
qualify Azzi et al.’s (1964) as a seminal experiment in the study of delay of reinforcement. The delay of reinforcement gradients
reported by Azzi et al. (1964) have been rep316
licated when a number of different schedules of reinforcement have been used to
maintain responding (Elcoro & Lattal, 2011,
FI; Jarmolowicz & Lattal, 2013, FR; Richards, 1981, DRL and VI; Sizemore & Lattal,
1978, VI) and across a wider range of delay
values (Pierce, Hanford, & Zimmerman,
1972; Richards, 1981; Sizemore & Lattal,
1978). Azzi et al. also anticipated several
subsequent comparisons of signaled and
unsignaled delay of reinforcement, with
more or less the same results: Signaled delays maintain more robust responding than
do unsignaled ones (Richards, 1981). A particularly appealing feature of Azzi et al. is
that the comparisons of signaled and unsignaled delays of reinforcement occurred
within individual subjects. They are the first
to simultaneously (within session) compare
the effects of signaled and unsignaled delays of reinforcement (cf. Lattal, 1984; Lattal & Ziegler, 1982; Richards, 1981). Long
after Azzi et al., Reilly and Lattal (2004)
developed a method for generating delay
of reinforcement gradients within individual subjects during a single session. They
maintained responding on a VI schedule
and, at the beginning of each session, introduced a short delay before a reinforcer was
delivered. Each subsequent reinforcer was
delivered after a progressively increasingly
longer delay.
Azzi et al.’s (1964) experiment was
conducted in the Columbia University tradition of systematic parametric analysis
of the controlling variables of behavior. In
Capítulo XX | Delay of Reinforcement
this instance, delay durations were varied
across successive conditions. Because there
was no return to baseline between the successive delay value increases, subsequent
delays were imposed on varying rates of
responding across manipulations, with unknown effects on the delay of reinforcement
gradient. These delay of reinforcement gradients, however, are quite similar in shape
to those obtained with rats’ lever pressing or
pigeons’ keypecking maintained under other reinforcement schedules (Elcoro & Lattal, 2011; Pierce, et al., 1972; Richards, 1981;
Sizemore & Lattal, 1978), suggesting that the
baseline response rates may play less of a
role in the form of the gradient than the delay value itself.
One potential confounding variable
in the experiment was that of reinforcement
rate. Like so many other early experiments
involving reinforcement delays, reinforcement rate under each delay value was not
reported by Azzi et al. (1964). It is almost
certainly the case that reinforcement rates
differed as the delays were increased in the
first part of the experiment and in the presence and absence of a signal in the second
part. Subsequent research, however, has
shown that reinforcement rate differences
generally do not account for the differences
in response rates brought about when delay
durations are changed (Lattal, 1982; Richards, 1981; Sizemore & Lattal, 1978).
Lattal and Gleeson (1990) used a procedure similar to that of both Skinner (1938)
and Azzi et al. (1964) to investigate the acquisition of responding by naïve rats and
pigeons under unsignaled resetting and
nonresetting delays to reinforcement when
the operant response was not shaped or
otherwise trained, but left to develop without any such intervention by the investigators. Robust responding developed under
these conditions, attesting to the power of
delayed reinforcement in developing and
sustaining operant behavior. This is another way of saying that immediate reinforcement is not necessary for learning to occur.
That said, however, immediate reinforcement results in much more robust responding. It is an open question as to whether
response acquisition is “faster” with immediate versus delayed reinforcement of responses.
FINAL CONSIDERATIONS
Delay of reinforcement is one of the
major parameters of reinforcement that affects its efficacy in developing and maintaining behavior (Kimble, 1961). For this reason, its role both alone and in combination
with other reinforcement parameters, such
as reinforcer magnitude, has been investigated extensively. One outcome of such
interactive analyses is delay discounting,
in which systematically increasing delays
of reinforcement for a larger magnitude or
more probable reinforcer are pitted against
a fixed, smaller magnitude or less probable reinforcer to determine, among other
317
Kennon A. Lattal
things, the indifference point where either
alternative is equally likely to be chosen
(see Green, Myerson, & Vanderveldt, 2014,
for a contemporary summary of these findings). Studies of delay discounting offer insights into how different combinations of
reinforcement parameters might be scaled.
Similarly, delay of reinforcement (sometimes also called “gratification” in nonbehavior-analytic experiments on the phenomenon) plays an important role in the
development of self-control or self-management strategies. Indeed, the foundation
of this area of research and application is
the experimental analysis of delay of reinforcement.
Yet another area where delay of reinforcement research has been important is
in the study of conditioned reinforcement.
A major theory of such reinforcement is the
delay reduction theory, which suggests that
stimuli function as reinforcers to the extent
that they indicate a reduction in the time of
access to (primary) reinforcement (Fantino,
1977).
The lessons of delay of reinforcement have not been lost in applied behavior
analysis, where the importance of reinforcer
immediacy following appropriate behavior
continues, with good reason, to be emphasized. Although immediate reinforcement
may be optimal in both treatment and generally in managing human behavior, much
of human behavior is maintained even
though its reinforcers are delayed from
318
the responses that produce them. Basic research on delay of reinforcement suggests a
number of conditions under which delays
will (e.g., longer or unsignaled delays) or will
not (e.g., shorter or signaled delays) reduce
responding, but there has been little applied
research to expand on these findings as they
might relate to treatment programs (but cf.
Stromer, McComas, & Rehfeldt, 2000).
One particularly important unresolved issue in the analysis of delayed reinforcement with humans in either research
or applied settings is that of the mediation
of behavior during delays by verbal behavior. Both Ferster (1953) and Azzi et al. (1964)
suggested that behavior is sustained during
delays of reinforcement to the extent that
certain stereotyped behavior patterns
emerge during the delay that result in a
chain of behavior developing such that the
response that initiates the delay is followed
by some regular behavior pattern (not required, but maintained by adventitious reinforcement) that ends contiguously with
reinforcement. Such superstitious chains
thus ensure a “connection” between the initiating operant response and the reinforcer
at the end of the delay. Verbal behavior of
humans, it has been suggested, also could
mediate delays. Something a person does
now may not have an effect for an hour, a
day, or even longer, yet the two events remain linked and the person continues to
engage in the behavior reinforced after the
delay. Perhaps it is related to things that either the person tells himself or others tell
Capítulo XX | Delay of Reinforcement
him during the intervening delay interval.
Or perhaps not. Some contemporary critics of such contiguity-based interpretations
of delay of reinforcement have suggested
that temporal proximity between response
and reinforcer plays a relatively minor role
in the acquisition and maintenance of responding relative to the fact that there is an
overall correlation between response rate
and the reinforcer that accrue, either immediately or after delays (see Baum, 1973).
The Lattal and Gleeson (1990) experiment
described above illustrates that learning
can occur when there is only a correlation
between responding and reinforcement,
but not response-reinforcer contiguity. This
latter point raises the broader, unanswered
question of whether reinforcers occurring
after a delay are more usefully characterized as delayed from specific responses or
correlated with groups of responses organized as response rates or time allocated to
responses of particular topographies. Lastly, but certainly not least, from
an historical perspective the experiment
is important because it is the first of many
subsequent research reports by Brazilian
behavior analysts to be published in the
Journal of the Experimental Analysis of Behavior.
perspectives on the use and implications of
delay of reinforcement for the understanding of the reinforcement process.
Lattal (2010). Reviewed basic research on
delay of reinforcement conducted in the
behavior-analytic tradition from Skinner to
the time of his review.
Renner (1964). Is an important early review of delay of reinforcement with a broad
learning-theory perspective on the topic.
Stromer, McComas, & Rehfeldt (2000).
Considered some of the applied implications of research on delay of reinforcement.
Tarpy & Sawabini (1974). Critiqued research on delay of reinforcement conducted from the time of Renner’s review until
their own.
REFERENCES
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha
e Silva, M. I. (1964). Exteroceptive control
of response under delayed reinforcement.
Journal of the Experimental Analysis of
Behavior, 7, 159-162.
TO LEARN MORE
Baum, W. M. (1973). The correlation-based
law of effect. Journal of the Experimental
Analysis of Behavior, 20, 137-153.
Commons, Mazur, Nevin, & Rachlin (1987).
Is an edited volume offering a number of
Commons, M. L., Mazur, J., Nevin, J. A., &
Rachlin, H. (Eds.) (1987). Quantitative stu319
Kennon A. Lattal
dies of operant behavior: The effect of delay
and of intervening events on reinforcement
value. New York: Erlbaum.
Keller, F. S. (2008). At my own pace: The autobiography of Fred S. Keller. Cornwall on
Hudson: Sloan Publishing.
Elcoro, M., & Lattal, K. A. (2011). Effects of
unsignaled delays of reinforcement on fixed-interval schedule performance. Behavioural Processes, 88, 47-52.
Kimble, G. A. (1961). Hilgard and Marquis’ Conditioning and Learning. New York:
Appleton Century Crofts.
Fantino (1977). Conditioned reinforcement,
choice, and information. In W. K. Honig &
J.E.R. Staddon (Eds.), Handbook of operant
behavior (pp. 326-339). New York: Prentice
Hall.
Ferster, C. B. (1953). Sustained behavior under delayed reinforcement. Journal of Experimental Psychology, 45, 218-224.
Green, L., Myerson, J., & Vanderveldt, A.
(2014). Delay and probability discounting.
In F. K. McSweeney & E. S. Murphy
(Eds.), The Wiley Blackwell handbook of
operant and classical conditioning. Oxford:
John Wiley & Sons.
Guthrie, E. R. (1935). The psychology of learning. New York: Harper.
Hull, C. L. (1943). Principles of Behavior.
New York: Appleton-Century Crofts.
Jarmolowicz, D. P., & Lattal, K. A. (2013). Delay of reinforcement and fixed-ratio performance. Journal of the Experimental Analysis of Behavior, 100, 370-395.
Lattal, K. A. (1984). Signal functions in delayed reinforcement. Journal of the Experimental Analysis of Behavior, 42, 239-253.
Lattal, K.A. (2010). Delayed reinforcement
of operant behavior. Journal of the Experimental Analysis of Behavior, 93, 129-139.
Lattal, K. A., & Gleeson, S. (1990). Response acquisition with delayed reinforcement.
Journal of Experimental Psychology: Animal
Behavior Processes, 16, 27-39.
Lattal, K. A., & Ziegler, D. R. (1982). Briefly
delayed reinforcement: An interresponse
time analysis. Journal of the Experimental
Analysis of Behavior, 37, 407-416.
Pierce, C. H., Hanford, P. V., & Zimmerman,
J. (1972). Effects of different delay of reinforcement procedures on variable-interval responding. Journal of the Experimental Analysis of Behavior, 18, 141-146.
Renner, K. E. (1964). Delay of reinforcement:
A historical review. Psychological Review,
61, 341-361.
Reilly, M.P., & Lattal, K.A. (2004). Progressi-
320
Capítulo XX | Delay of Reinforcement
ve delays to reinforcement. Journal of the Experimental Analysis of Behavior, 82, 2135.
Richards, R. W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis
of Behavior, 35, 145-152.
versus conditioned reinforcement. Animal Learning and Behavior, 19, 264-269.
Wilson, M. P., & Keller, F. S. (1953). On the
selective reinforcement of spaced responses. Journal of Comparative and Physiological Psychology, 46, 190-193.
Sizemore, O. J., & Lattal, K. A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30, 169-175.
Skinner, B. F. (1938). The behavior or organisms: An experimental analysis. New York: Appleton Century Crofts.
Spence, K. W. (1947). The role of secondary
reinforcement in delayed reward learning. Psychological Review, 54, 1-8.
Stromer, R, McComas, J. J., & Rehfeldt, R. A.
(2000). Designing interventions that include delayed reinforcement: Implications of recent laboratory research. Journal
of Applied Behavior Analysis, 33, 359-371.
Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: A selective review of the
past decade. Psychological Bulletin, 81,
984-987.
Thorndike, E. L. (1911). Animal intelligence.
New York: MacMillan.
Williams, B. A. (1991). Marking and bridging
321
Hiroto Okouchi
How do you feel?
Hiroto Okouchi
Osaka Kyoiku University, Japan
Lubinski, D., & Thompson, T. (1987). An animal model of the interpersonal communication of
interoceptive (private) states. Journal of the Experimental Analysis of Behavior, 48, 1-15.
“We need not suppose that events which take place within an organism’s skin have
special properties for that reason”
(Skinner, 1953, p.257).
322
Capítulo XXI | Private Events
INTRODUCTION TO THE RESEARCH AREA AND CONTEXT OF
THE EXPERIMENT
A lot of people, not only psychologists but also laymen, are interested in understanding the “mind.” Behavior analysts
have a unique view of it. One example is
that based on radical behaviorism (Skinner,
1945).
A hypothetical entity that usually has
been called “mind” is related with one of the
behavior-analytic concepts, private events.
Private events generally have been defined
structurally as events that occur within the
skin of a person (Catania, 1992, p.388) and
functionally as events that are directly accessible to only one person (Skinner, 1953,
p.257). Feelings, such as “depressed” and
“excited”, are private events not only structurally but also functionally, because they
occur within the skin of a person and are
directly accessible only to him or her. Such
feelings, in general, are regarded as “elements of mind” (The Oxford English Dictionary, 2004, pp.1047-1048).
As the opposite of private events,
events that occur outside the skin of a person and/or events that are directly accessible to more than the individual person may
be called public events. Rat’s lever-pressing
and the delivery of a food pellet during operant-conditioning experiments are typical
examples of public events. The experimental analysis of behavior has accumulated
an extensive body of knowledge on lawful
relations among such public events (Ferster
& Skinner, 1957; Honig, 1966; Honig & Staddon, 1977; Iversen & Lattal, 1991; Madden,
2013).
Behavior analysts assume that private events follow the behavioral principles
discovered by the experimental analysis
of public events. According to this viewpoint, for example, even describing one’s
own feelings is a result of contingencies of
reinforcement. Skinner (1945) argued that
verbal responses under the control of private stimuli are established and maintained
mostly by the contingencies of reinforcement arranged by other people. Suppose
that a “depressed” person (a speaker) says,
“I am depressed.” If someone (a listener)
listened to and understood the complaint
(i.e., if the listener belonged to the same
verbal community that the speaker did
and could react appropriately to what the
speaker said), and if the listener knew that
the speaker had experienced an event that
usually elicits depressed feelings (e.g., loss
of a significant other), the listener may say,
“I know exactly how you feel.” Behaviorally, the depressed feeling, the complaint “I
am depressed,” and the words of comfort “I
know exactly how you feel,” respectively,
are a discriminative stimulus, a response,
and a reinforcer to the speaker’s verbal behavior. As a verbal response (e.g., “red”) to
a public stimulus (e.g., a red card) can be established by reinforcement given by others
(e.g., “Right, that is the color of the card.”),
323
Hiroto Okouchi
behavior analysts presume that describing
one’s own feelings (e.g., being depressed),
also is learned (e.g., Skinner, 1953, pp.257282).
Skinner (1945) also argued that a person’s report of a private stimulus occurs not
by direct reinforcement but through generalization. A person may describe his or her
novel feeling as “depressed” if he or she has
learned that the word “depressed” is used
when something (e.g., a lever) was pushed
down (generalization from public events to
private ones, Skinner, 1957, pp.132-133) or it
is used when he or she has experienced a
feeling that is similar to the novel one (i.e.,
generalization from known private events
to unknown ones).
In contrast to plenty of conceptual analyses (e.g., Leigland, 2014; Schlinger,
2011; Tourinho, 2006), experimental analyses of private events have received relatively little attention. The experiment by
Lubinski and Thompson (1987) is one of the
rare cases in which an experimental analysis of private events has been conducted.
internal milieu.
Subjects were five experimentally naïve female White Carneau pigeons
distributed into two groups, referred to as
“manders” (two pigeons) and “tacters” (three
pigeons).
Two contiguous experimental chambers, separated by a transparent Plexiglas
divider which allowed the pigeons to see
one another, were used (see Figures 1 and 2).
The manders were trained in the left chamber, the tacters in the right. Before being
placed in their chambers simultaneously,
each pigeon was trained individually.
The tacters, which were food and water deprived during the experiment, were
trained in a two-component chain in which
DESCRIPTION OF THE EXPERIMENT
Goals and Method
The goal of Lubinski and Thompson’s
(1987) experiment was to assess whether
nonhuman animals could learn to interact
communicatively, based on events in their
324
Figure 1. Adjoining work panels of the chambers for the two groups
of pigeons. Work panels were separated by a Plexiglas divider. The
manders were trained in the left chamber; the tacters were trained in
the right chamber (reproduced from Lubinski & Thompson, 1987, with
permission of John Wiley and Sons).
Capítulo XXI | Private Events
Figure 2. A two-pigeon communicative exchange based on the drug state (internal state) of one of the pigeons. From left to right, the five frames (A-E)
show the successive components of the procedure. The pigeons on the left and the right in each frame were the mander and the tacter, respectively
(reproduced from Lubinski & Thompson, 1987, with permission of John Wiley and Sons).
the first component involved an arbitrary
matching-to-sample task (the procedure
of this training will be summarized later).
After this training, the established chain
was as follows: (a) The tacter was injected a
depressant (pentobarbital), a stimulant (cocaine) or isotonic saline solution; (b) three
response keys, each labeled with a letter “D”,
“N”, or “Σ” were illuminated (Figure 1); (c)
the tacter’s key pecks matching the injected substance (the “D” key for pentobarbital, the “Σ” key for cocaine, and the “N” key
for saline) were followed by presentation
of a flashing blue light above the response
keys; (d) responses on a key above a food
dispenser (food key) and on a key above a
water dispenser (water key) were reinforced
with food and water, respectively.
The matching-to-sample task the
tacters experienced is known as a drug discrimination procedure: Reinforce one type
of activity following drug administration
and reinforce some other activity following
administration of either no drug or some
other drug (Branch, 1991). With no differential exteroceptive stimuli correlated with
any activity, choices that produced reinforcers more frequently than chance levels and
could be attributed to interoceptive stimuli
arising from the administrated substance
(e.g., the drug or the saline solution). Thus,
the tacters in the Lubinski and Thompson’s
(1987) experiment were trained to “report
325
Hiroto Okouchi
their feelings” by the matching-to-sample
task. Approximately seven months were
required for the tacters to respond reliably
(i.e., at least 80% of correct responses) in
this task.
water deprived and 4 hr food deprived). By
alternating these two conditions in an A-BA-B fashion, the tacters chose food and water indifferentially when the blue light was
flashing.
A second goal of the Lubinski and
Thompson’s (1987) experiment was to assess whether the pigeons’ responses to their
internal (private) events could function as a
tact, which was examined on the final part
of the experiment (described later). A tact, a
unit of verbal behavior, is “a verbal operant
in which a response of given form is evoked
(or at least strengthened) by a particular
object or event or property of an object or
event” (Skinner, 1957, pp.81-82). Quoting
several other authors (e.g., MacCorquodale,
1969; Skinner, 1957, pp.81-82), Lubinski and Thompson stated that tacts are not
maintained by particular reinforcers, nor
do they covary with the individual’s state
of deprivation or aversive stimulation, but
are maintained by generalized conditioned
reinforcers (e.g., saying “Right” when someone correctly names the color of a red card
by saying “Red”). In order to reach this second goal, therefore, Lubinski and Thompson attempted to establish the flashing blue
light as a generalized conditioned reinforcer that could maintain the behavior of the
tacters. The tacters were deprived of food
more strictly than they were deprived of
water on one day (i.e., 28 hr food deprived
and 4 hr water deprived), and they were deprived of water more strictly than they were
deprived of food on another day (i.e., 28 hr
A mand, a more primitive unit of verbal behavior, is “a verbal operant in which
the response is reinforced by a characteristic consequence and is therefore under the
functional control of relevant conditions of
deprivation or aversive stimulation” (Skinner, 1957, pp.35-36). Saying “Candy” is an
example of a mand when reinforced by access to candy, and the response “Candy”
will be more likely to occur after a period
of candy/food deprivation (Skinner, 1957,
p.35). The manders, which were maintained
at 85% of their free-feeding weights by food
deprivation, were trained in a three-component chain in which the third component
involved an arbitrary matching-to-sample
task. The established chain for the mander
was as follows: (a) A key with English letters
arranged to form words “How Do You Feel?”
was illuminated (Figure 1); (b) the mander’s
pecking the “How Do You Feel?” key was
followed by the illumination of another key
labeled “Thank You”; (c) when the mander
pecked the “Thank You” key, a letter “D”,
“N”, or “Σ” was projected onto a sample key;
(d) pecking the sample key and then pecking the comparison key containing the correct matching response (a key labeled “P” to
the letter “D”, a key labeled “C” to the letter
“Σ”, and a key labeled “S” to the letter “N”)
produced food.
326
Capítulo XXI | Private Events
After both manders and tacters independently acquired the necessary accuracy
(i.e., at least 80% of correct responses) on
their chain performance, individual tacters
and manders were placed in their chambers
simultaneously. As Figure 2 illustrates,
the behavioral interaction required of each
mander-tacter pair was as follows; (a) The
mander’s “How Do You Feel?” was illuminated and the mander pecked it; (b) all of
the tacter’s comparison keys (i.e., the “D”,
“N”, and “Σ” keys) were illuminated and the
tacter pecked the comparison key correlated
with the injected substance (or the tacter’s
own “feelings”); (c) the “Thank You” key in
the mander’s chamber was illuminated and
the mander pecked it; (d) the letter (“D”, “N”,
or “Σ”; i.e., the drug “name” or the tacter’s
report of its feelings) previously pecked by
the tacter appeared on the mander’s sample key and the blue light started to flash in
the tacter’s chamber; the mander pecked
the sample key and then pecked the correct comparison key; the tacter pecked the
food key or the water key, producing either
food or water; (e) the mander received food.
If the tacter pecked a comparison key uncorrelated with the injected substance (an
incorrect response), the houselights were
dimmed for 4 s and the initial link of the
chain (a) was reinstated. Thus, the sample
stimulus presented to the mander was always correct. Both manders worked with
each of the tacters. Pigeons were tested
under this interaction for 40 experimental
sessions.
It should be noted that the Lubinski
and Thompson’s (1987) experiment had two
additional phases (Phases 2 and 3). In Phase
2, the tacters were injected novel drugs,
chlordiazepoxide and d-amphetamine,
which share pharmacological properties
with pentobarbital and cocaine, respectively, as a generalization test. In Phase 3,
the authors examined whether the tacters’
responses to their private events actually
functioned as tacts. The tacters’ performances were tested when the tacters were
placed in their experimental chamber after
receiving 24 hr free access to both food and
water (the tacters were satiated with food
and water), and when their correct responses flashed the blue light only, but did not
produce water or food anymore (the tacters’
correct responses produced only a conditioned reinforcer).
Results and Discussion
Results of Phase 1
Because only a single substance
(pentobarbital, cocaine, or saline) was injected prior to each session, the correct
choice for the tacter was the same across
all trials within a session. Thus, the performance of the tacters on the first trial of a
session was important in this experiment.
Both the mander and the tacter responded
correctly (e.g., the tacter injected the pentobarbital pecked the “D” key and the mander
pecked the “P” key) on the first trial in 70100% of the sessions, whereas the percentage of a correct discrimination happening
327
Hiroto Okouchi
by chance was approximately 11% (i.e., the
product of the two individual performances
happening by chance, i.e., .33 x .33). These
results suggest that the pigeons learned to
interact communicatively based on events
in their internal milieu.
Results of Phases 2 and 3
The performances observed in Phase
1 persisted in Phase 2, suggesting that the
tacters’ responses to their private events
arising from training drugs (pentobarbital
and cocaine) generalized to those of similar
private events arising from untrained drugs
(chlordiazepoxide and d-amphetamine).
The performances observed in Phases 1 and
2 persisted in Phase 3, suggesting that the
tacters’ accurate responses to their private
events were not maintained by particular
reinforcers (food or water), nor did they covary with the tacters’ states of deprivation,
but were maintained by a generalized conditioned reinforcer (the flashing blue light).
The discussion of Lubinski and
Thompson (1987) may be summarized as
follows: (a) The tacters’ behavior involved
tacting private events; (b) the tacters
learned to tact private events under a continuous reinforcement schedule with 100%
accuracy, that is, by a contingency in which
every correct response produced a reinforcer and any incorrect response produced no
reinforcer; in contrast, humans are considered to learn to tact private events by an
intermittent reinforcement schedule with
weak accuracy (Skinner, 1945); (c) the gen328
eralization obtained in Phase 2 qualifies
as an example of extended tacts and exemplifies with nonhumans Skinner’s description of how humans come to report on
novel feelings; (d) Lubunski and Thompson’s results demonstrate that covert behavior (e.g., thoughts, feelings, and images),
which has been one of the candidates for
nonhuman-animal experimental models
(Epstein, 1984) but has resisted empirical
analysis, is amenable to objective analysis;
(e) the performances studied by Lubinski
and Thompson may not constitute an example of “linguistic activity” as the term is
usually understood, but share features with
those activities seen in very young children or individuals diagnosed with developmental disabilities; (f) Savage-Rumbaugh
(1984) claimed that behavior controlled by
the contingencies imposed by electronic
circuity rather than by another individual
could not be characterized as “communication.” However, human dyadic exchanges
of responses often are mediated by external
events such as telephone connections and
computer bulletin boards, and we are still
content to refer to such exchanges as “verbal.”
IMPACT
The experiment by Lubinski and
Thompson (1987) has received great attention (e.g., Catania, 1992, pp.219-220). In
1993, the journal Behavioral and Brain Sciences devoted space to a debate on it, with
Capítulo XXI | Private Events
commentaries by 27 behavioral and nonbehavioral scholars (see Lubinski & Thompson, 1993).
The Lubinski and Thompson’s (1987)
experiment, however, has not been replicated directly or systematically. Probably,
this may be due to practical reasons. The
experimental apparatus used by Lubinski and Thompson was very different from
standardized operant chambers. Psychoactive drugs are not accessible to all researchers. In addition, this kind of experiments
takes a long time. As described in the present chapter’s Goals and Method section, in
fact, Lubinski and Thompson spent seven
months to teach the tacters the drug discrimination.
Two studies may be regarded as successors to Lubinski and Thompson (1987).
One was conducted by DeGrandpre, Bickel, and Higgins (1992). They also used the
drug discrimination procedure as Lubinski
and Thompson did, and examined whether
equivalence relations can emerge between
interoceptive stimuli (activated by drugs)
and exteroceptive stimuli. Adult humans
were trained drug discriminations with
triazolam (reducing self-reports of anxiety) and placebo (lactose-filled capsules) as
sample stimuli and visual stimuli as comparison stimuli. When the triazolam (A1)
was administered, choosing a visual stimulus B1 was correct and visual stimuli B2 and
A0 incorrect; or choosing a visual stimulus
C1 was correct and visual stimuli C2 and
C0 incorrect. Similarly, when placebo (A2)
was the sample, correct comparisons were
B2 and C2. Following the establishment
of A1B1, A1C1, A2B2, and A2C2 conditional relations by such a drug discrimination
training, untrained B1C1 and B2C2 relations
emerged. These results demonstrate that
private events can emerge as members of
an equivalence class as public ones do (Sidman & Tailby, 1982), and, as Lubinski and
Thompson showed, provide evidence that
behavioral principles operating on public
events operate on private ones, too (Skinner, 1953, pp.257-258).
An experiment conducted by Okouchi (2006) is another case relevant to the
topic. As in the Lubinski and Thompson’s
experiment, in Okouchi’ s experiment responses to private stimuli of one individual resulted in sample stimuli for another
individual. Different from the Lubinski
and Thompson’s experiment, however, private stimuli were not interoceptive stimuli
but exteroceptive, visual, stimuli that only
one individual of a pair of undergraduates
could see. According to the functional definition of private events as events that are
directly accessible to only one person (Skinner, 1953, p.257), events that occur outside
the skin of a person can be private (Rachlin,
2003, called this type of private events as
Privacy B and distinguished it from Privacy
A, which are events that occur under a person’s skin).
Employing the functional definition
329
Hiroto Okouchi
of private events, Okouchi (2006) examined one of Skinner’s (1945) interpretations
of how verbal responses under the control
of private stimuli are established: the report of a private stimulus (e.g., pain) may
be established by reinforcement from other
people who infer the private stimulus from
collateral public responses (e.g., hand to
jaw, facial expressions, groans) to the stimulus. Eight of 16 participants, referred to
as instructors, first learned BC conditional
discriminations with the B stimuli as the
samples and the C stimuli as the correct
comparisons. Then, the other eight participants, referred to as learners, were exposed
to modified matching-to-sample trials in
which the responses of the learners were
reinforced or punished not by the responses of the experimenter but by those of the
instructors. AC conditional discriminations
were to be established for the learners, in
which the sample stimuli As were presented simultaneously with the B stimuli so that
the instructors could see the Bs but not the
As. According to the functional definition
of private events, the A stimuli were private for the instructors. Thus, the sample
stimuli As and the sample-correlated stimuli Bs corresponded, respectively, to private
stimuli and their collateral overt responses
in Skinner’s interpretation. Okouchi examined whether the learners’ reports (Cs) of
their own stimuli (As) would be established
by differential reinforcement from other
people (the instructors) who could access
only the collateral stimuli (Bs) and the reports (Cs).
330
In Okouchi’s (2006) experiment, two
of eight pairs showed the expected performances that the learners mastered the AC
conditional discriminations from the instructors who had no access to the A stimuli.
Subsequently, Sonoda and Okouchi (2012)
replicated the results of Okouchi using a revised procedure. They used abstract stimuli and a computer, for example, whereas
Okouchi used geometric stimuli, nonsense
syllables, and color stimuli and controlled
the experiment manually. Sonoda and Okouchi obtained the expected performances
from all of 26 pairs of undergraduates.
FINAL CONSIDERATIONS
Perhaps, simulating the behavior of
reporting private events by nonhuman animals may be one of the most significant accomplishments of Lubinski and Thompson
(1987). Epstein (1981, 1984) insisted that animal simulations, or experimental models,
synthesizing so-called “complex” human
behavior with nonhuman animals, could
lend insight into what kinds of variables
constitute some of these “complex” behaviors in humans. Epstein (1984) listed four
classes of behaviors that had resisted analyses and, therefore, had been regarded as
“complex”: (a) covert behaviors (“thoughts,”
“feelings,” and “images”); (b) typically human behaviors (language, behavior that
comes under the rubric of “self,” and problem-solving behavior); (c) behaviors controlled by temporally remote stimuli (“mem-
Capítulo XXI | Private Events
ory”); and (d) novel behaviors (“creativity,”
and “productive thinking”). Except for the
class of covert behaviors, some behaviors
in each class were simulated and studied
experimentally (e.g., Epstein, 1981; Epstein,
Lanza, & Skinner, 1980; Epstein & Skinner,
1981). The work by Lubinski and Thompson
may be regarded as a success of an animal
simulation of covert behaviors or private
events (“feelings”).
As the title of their article implies,
two practices illustrating a model of how
to examine private events also may be
significant accomplishments by Lubinski
and Thompson (1987). First, they showed
that drug discrimination procedures can
be used in experiments on private events.
One of the difficulties in the experimentation on private events is the manipulation
of the private events. Presentation and
nonpresentation of a “feeling”, for example, is not easy, whereas those of a colored
light have been commonly implemented in
behavioral experiments. The use of psychoactive drugs would be one of the few
methods for manipulating feelings relatively reliably (but see Branch, 1991, for a discussion of difficulties in using drugs as discriminative stimuli). Second, Lubinski and
Thompson conducted an experiment on
private events in the context of interindividual interactions. This practice is useful
because, according to the functional definition of private events (Skinner, 1953, p.257),
whether an event is private or not depends
on whether it is accessible to other persons
or not.
TO LEARN MORE
DeGrandpre, Bickel, & Higgins (1992).
This article reports an experiment in which
human private events were manipulated by
psychoactive drugs.
Kohlenberg, & Tsai (1991). This book describes how private events, such as emotions, memories, cognitions, and beliefs,
are conceptualized and managed in a behavior-analytic psychotherapy.
Okouchi (2006). This article discusses how
events outside a participant’s skin and not
accessible to another participant but to an
experimenter may contribute to experimental analyses of private events and reports an experiment that examined one of
Skinner’s (1945) interpretations of the way
in which humans learn to report private
events.
Rachlin (2003). This book chapter describes
how teleological behaviorism views private
events. Teleological behaviorism excludes
internal events (events under an organism’s
skin) from the analysis of behavior and
looks for controlling variables of behavior
widely into the organism’s temporally extended environment.
Skinner (1945). This is a classic on private
events. You MUST read it if you would
331
Hiroto Okouchi
study private events based on a behavioral
point of view.
the analysis of behavior. Behaviorism, 12,
41-59.
Sonoda & Okouchi (2012). This article reports experiments that replicated the results of Okouchi (2006), using a revised
procedure. In Experiment 2, the learners
learned to tact “private events” by reinforcement not with 100%, but with 83.3%
accuracy, illustrating a laboratory analogue
to daily life, in which humans are considered to learn to tact private events by a reinforcement schedule with weak accuracy
(Skinner, 1945).
Epstein, R., Lanza, R. P., & Skinner, B. F.
(1980). Symbolic communication between
two pigeons (Columba livia domestica). Science, 207, 543-545.
REFERENCES
Honig, W. K. (Ed.). (1966). Operant behavior: Areas of research and application. New
York: Appleton-Century-Crofts.
Branch, M. N. (1991). Behavioral pharmacology. In I. H. Iversen & K. A. Lattal (Eds.),
Experimental analysis of behavior (Part 2,
pp.21-77). Amsterdam: Elsevier.
Catania, A. C. (1992). Learning (3rd ed.).
Englewood Cliffs, NJ: Prentice-Hall.
DeGrandpre, R. J., Bickel, W. K., & Higgins,
S. T. (1992). Emergent equivalence relations between interoceptive (drug) and exteroceptive (visual) stimuli. Journal of the
Experimental Analysis of Behavior, 58, 9-18.
Epstein, R. (1981). On pigeons and people:
A preliminary look at the columban simulation project. The Behavior Analyst, 4, 43-55.
Epstein, R. (1984). Simulation research in
332
Epstein, R., & Skinner, B. F. (1981). The
spontaneous use of memoranda by pigeons.
Behavior Analysis Letters, 1, 241-246.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.
Honig, W. K., & Staddon, J. E. R. (Eds.).
(1977). Handbook of operant behavior. Englewood Cliffs, Prentice-Hall.
Iversen, I. H., & Lattal, K. L. (Eds.). (1991).
Experimental analysis of behavior (Part 1).
Amsterdam: Elsevier.
Kohlenberg, R. J., & Tsai, M. (1991). Functional analytic psychotherapy: Creating
intense and curative therapeutic relationships. New York: Plenum Press.
Leigland, S. (2014). Contingency horizon:
On private events and the analysis of behavior. The Behavior Analyst, 37, 13-24.
Capítulo XXI | Private Events
Lubinski, D., & Thompson, T. (1987). An
animal model of the interpersonal communication of interoceptive (private) states.
Journal of the Experimental Analysis of Behavior, 48, 1-15.
Sidman, M., & Tailby, W. (1982). Conditional discrimination vs. matching to sample:
An expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22.
Lubinski, D., & Thompson, T. (1993). Species and individual differences in communication based on private states. Behavioral and Brain Sciences, 16, 627-680.
Skinner, B. F. (1945). The operational analysis of psychological terms. Psychological
Review, 52, 270-277.
MacCorquodale, K. (1969). B. F. Skinner’s
verbal behavior: A retrospective appreciation. Journal of the Experimental Analysis
of Behavior, 12, 831-841.
Skinner, B. F. (1953). Science and human
behavior. New York: Macmillan.
Skinner, B. F. (1957). Verbal behavior. New
York: Appleton-Century-Crofts.
Madden, G. J. (Ed.). (2013). APA handbook
of behavior analysis (Vol.1). Washington,
DC: American Psychological Association.
Sonoda, A., & Okouchi, H. (2012). A revised
procedure for analyzing private events. The
Psychological Record, 62, 645-661.
Okouchi, H. (2006). An experimental analysis of another privacy. The Psychological
Record, 56, 245-257.
The Oxford English Dictionary (2nd. ed.).
(2004). Oxford: Clarendon Press.
Rachlin, H. (2003). Privacy. In K. A. Lattal,
& P. N. Chase (Eds.), Behavior theory and
philosophy (pp.187-201). New York: Kluwer
Academic/Plenum Publishers.
Tourinho, E. Z. (2006). Private stimuli, covert responses, and private events: Conceptual remarks. The Behavior Analyst, 29,
13-31.
Savage-Rumbaugh, E. S. (1984). Verbal behavior at a procedural level in the chimpanzee. Journal of the Experimental Analysis of
Behavior, 41, 223-250.
Schlinger, H. D. (2011). Introduction: Private events in a natural science of behavior.
The Behavior Analyst, 34, 181-184.
333
Download