Análise do Comportamento - Pesquisa , Teoria e Aplicação

ANÁLISE DO COMPORTAMENTO
S616
Análise do comportamento [recurso eletrônico] : pesquisa, teoria e aplicação /
Josele Abreu-Rodrigues, Michela Rodrigues Ribeiro (organizadoras). –
Dados eletrônicos. – Porto Alegre : Artmed, 2007.
Editado também como livro impresso em 2005.
ISBN 978-85-363-1102-9
1. Psicologia – Comportamento. I. Abreu-Rodrigues, Josele. II. Ribeiro,
Michela Rodrigues.
CDU 159.9.019.4
Catalogação na publicação: Juliana Lagôas Coelho – CRB 10/1798
ANÁLISE DO COMPORTAMENTO
Pesquisa, Teoria e Aplicação
Josele Abreu-Rodrigues
Michela Rodrigues Ribeiro
Organizadoras
Versão impressa
desta obra: 2005
2007
© Artmed Editora S.A., 2005
Capa
Gustavo Macri
Preparação do original
Rubia Minozzo
Leitura final
Maria Lúcia Barbará
Supervisão editorial
Mônica Ballejo Canto
Projeto e editoração
Armazém Digital Editoração Eletrônica – Roberto Vieira
Reservados todos os direitos de publicação, em língua portuguesa, à
ARTMED® EDITORA S.A.
Av. Jerônimo de Ornelas, 670 - Santana
90040-340 Porto Alegre RS
Fone (51) 3027-7000 Fax (51) 3027-7070
É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer
formas ou por quaisquer meios (eletrônico, mecânico, gravação, fotocópia, distribuição na
Web e outros), sem permissão expressa da Editora.
SÃO PAULO
Av. Angélica, 1091 - Higienópolis
01227-100 São Paulo SP
Fone (11) 3665-1100 Fax (11) 3667-1333
SAC 0800 703-3444
IMPRESSO NO BRASIL
PRINTED IN BRAZIL
AUTORES
Josele Abreu-Rodrigues (org.)
Universidade de Brasília
Michela Rodrigues Ribeiro (org.)
Universidade Católica de Goiás
Universidade de Brasília
Instituto de Aplicação e Pesquisa Comportamental
Alessandra de Moura Brandão
Universidade de Brasília
Alessandra Rocha de Albuquerque
Universidade Católica de Brasília
Ana Karina Curado Rangel de-Farias
Universidade Católica de Goiás
Instituto de Aplicação e Pesquisa Comportamental
Carlos Eduardo Cameschi
Universidade de Brasília
Cristiano Valério dos Santos
Universidade de São Paulo
Elenice S. Hanna
Universidade de Brasília
Elisa Tavares Sanabio-Heck
Universidade Católica de Goiás
Instituto de Aplicação e Pesquisa Comportamental
Geison Isidro-Marinho
Centro Universitário de Brasília
Instituto São Paulo de Terapia e Análise do Comportamento
Gordon R. Foxall
Cardiff University
vi
AUTORES
João Claudio Todorov
Universidade Católica de Goiás
Universidade de Brasília
Jorge M. Oliveira-Castro
Universidade de Brasília
Karina de Guimarães Souto e Motta
Instituto São Paulo de Terapia e Análise do Comportamento
Kennon A. Lattal
West Virginia University
Laércia Abreu Vasconcelos
Universidade de Brasília
Lincoln da Silva Gimenes
Universidade de Brasília
Marcelo Emílio Beckert
Instituto de Educação Superior de Brasília
Instituto Brasiliense de Análise do Comportamento
Marcelo Frota Benvenuti
Pontifícia Universidade Católica de São Paulo
Rachel Nunes da Cunha
Universidade de Brasília
Raquel Maria de Melo
Universidade de Brasília
Raquel Moreira Aló
West Virginia University
Centro Universitário de Brasília
Sonia Beatriz Meyer
Universidade de São Paulo
Yvanna Aires Gadelha
Centro Universitário de Brasília
DEDICATÓRIA
Ao querido amigo Marcelo Beckert, que, com sua curiosidade,
nos mostrou como é interessante aprender, com sua
alegria, nos mostrou como é possível sorrir mesmo
nos momentos críticos e, com sua vivacidade, nos mostrou
como a vida é curta e deve ser aproveitada.
Marcelo, você está presente em nossa vívida história...
SUMÁRIO
Apresentação .................................................................................................................... 11
1.
Ciência, tecnologia e análise do comportamento ....................................................... 15
Kennon A. Lattal
2.
Operações estabelecedoras: um conceito de motivação ............................................ 27
Rachel Nunes da Cunha
Geison Isidro-Marinho
3.
História de reforçamento ............................................................................................. 45
Raquel Moreira Aló
4.
Momento comportamental ........................................................................................... 63
Cristiano Valério dos Santos
5.
Desamparo aprendido .................................................................................................. 81
Elisa Tavares Sanabio-Heck
Karina de Guimarães Souto e Motta
6.
Comportamento adjuntivo: da pesquisa à aplicação ................................................. 99
Lincoln da Silva Gimenes
Alessandra de Moura Brandão
Marcelo Frota Benvenuti
7.
Contingências aversivas e comportamento emocional ........................................... 113
Carlos Eduardo Cameschi
Josele Abreu-Rodrigues
8.
Generalização de estímulos: aspectos
conceituais, metodológicos e de intervenção .......................................................... 139
Yvanna Aires Gadelha
Laércia Abreu Vasconcelos
10
SUMÁRIO
9.
Quantificação de escolhas e preferência .................................................................. 159
João Claudio Todorov
Elenice S. Hanna
10.
Autocontrole: um caso especial de comportamento de escolha ............................ 175
Elenice S. Hanna
Michela Rodrigues Ribeiro
11.
Variabilidade comportamental .................................................................................. 189
Josele Abreu-Rodrigues
12.
Regras e auto-regras no laboratório e na clínica ..................................................... 211
Sonia Beatriz Meyer
13.
Correspondência verbal/não-verbal:
pesquisa básica e aplicações na clínica .................................................................... 229
Marcelo Emílio Beckert
14.
Equivalência de estímulos: conceito,
implicações e possibilidades de aplicação ............................................................... 245
Alessandra Rocha de Albuquerque
Raquel Maria de Melo
15.
Comportamento social: cooperação,
competição e trabalho individual ............................................................................. 265
Ana Karina Curado Rangel de-Farias
16.
Análise do comportamento do consumidor ............................................................. 283
Jorge M. Oliveira-Castro
Gordon R. Foxall
APRESENTAÇÃO
A Análise do Comportamento é uma ciência do comportamento fundamentada na filosofia do Behaviorismo Radical e que tem como
objeto de estudo a interação do indivíduo com
o ambiente. Skinner repetidas vezes afirmou
que o comportamento humano é um campo
de estudo delicado. Delicado no sentido de que
há controvérsia sobre qual seria a melhor forma
de estudá-lo. Delicado também no sentido de
que é multiplamente determinado e que, portanto, consiste em um evento bastante complexo. Esta obra ilustra ambos os aspectos ao
oferecer uma alternativa teórico-conceitual
para o estudo do comportamento humano e
ao especificar diversas estratégias metodológicas utilizadas na identificação de suas variáveis de controle.
Este livro consiste em uma coletânea de
textos que apresentam um conhecimento atualizado e empiricamente fundamentado sobre
processos comportamentais complexos, bem
como as possíveis aplicações desse conhecimento na resolução de problemas práticos. No Capítulo 1, Kennon A. Lattal apresenta uma análise das relações entre ciência básica, ciência
aplicada e tecnologia, o que dá suporte para
todas as discussões apresentadas nos capítulos posteriores. Para o autor, as pesquisas básica e aplicada em análise do comportamento
contribuem para o desenvolvimento de tecnologias que, por sua vez, ao serem implementadas e desenvolvidas, fornecem subsídios para
futuras pesquisas. Assim sendo, haveria uma
interdependência entre ciência básica e aplicada e tecnologia, tendo em vista que o cresci-
mento de um campo depende das conquistas
efetuadas no outro campo. Apesar de ser comum a realização de estudos em que a transversalidade de informações entre ciência e tecnologia é descartada, os capítulos deste livro
pretendem seguir um caminho contrário e
apresentam algumas possíveis inter-relações
desses três campos.
No Capítulo 2, Rachel Nunes da Cunha e
Geison Isidro-Marinho apresentam a abordagem analítico-comportamental do conceito de
motivação. A ênfase dos autores recai sobre o
conceito de operação estabelecedora (OE) que,
na atualidade, consiste em um instrumento
conceitual e metodológico para o estudo da
motivação em situação experimental e aplicada. Após apresentar uma análise histórica desses conceitos, os autores definem e exemplificam as OEs incondicionadas e condicionadas
e apontam as dificuldades metodológicas de
se demonstrar empiricamente a diferença entre OE e estímulo discriminativo. São também
descritas pesquisas aplicadas, as quais sugerem
que o conceito de OE é fundamental para a análise funcional do comportamento e, conseqüentemente, para o planejamento de intervenções
efetivas. Ao final do capítulo, os autores discorrem sobre as relações entre OEs e estados emocionais, com ênfase no contexto clínico.
O Capítulo 3 aborda os efeitos da história de reforçamento sobre a sensibilidade
comportamental a mudanças nas contingências. Inicialmente, Raquel Aló apresenta as diferentes definições do termo história de reforçamento e, em seguida, indica que os efeitos
12
ABREU-RODRIGUES, RIBEIRO & COLS.
da história dependem de variáveis tais como o
tipo de esquema de reforçamento presente
antes da mudança, da similaridade entre os
estímulos discriminativos antes e após a mudança, das operações estabelecedoras em vigor, etc. Também são apontadas algumas pesquisas aplicadas que ilustram os efeitos da história sobre o comportamento de estudar e sobre comportamentos agressivos. A autora discute possíveis aplicações dos resultados da
pesquisa empírica, enfatizando a relevância das
variáveis históricas para o diagnóstico e a intervenção no ambiente clínico. Por fim, a autora analisa os pontos em comum entre os estudos de história de reforçamento e de outras
áreas, como aqueles sobre resistência a mudanças, desamparo aprendido e comportamento governado por regras, incentivando a
integração dos resultados desses estudos.
No Capítulo 4, Cristiano Valério dos Santos discute diversas questões metodológicas presentes nos estudos sobre resistência a mudanças, tanto no que se refere aos procedimentos
experimentais utilizados quanto à mensuração
da resistência. É apresentada uma distinção entre taxa de respostas e resistência à mudança,
as quais seriam determinadas por diferentes
processos comportamentais, bem como uma
definição do modelo de momento comportamental. Após descrever pesquisas básicas sobre
os determinantes (p. ex.: magnitude, atraso,
taxa e tipo de reforço) da resistência, o autor
estabelece um paralelo entre resistência à mudança e escolha/preferência, controle instrucional e história de reforçamento. Ao final, o autor
exemplifica a utilização dos conceitos de momento comportamental e resistência à mudança na solução de problemas aplicados tais como
seguimento de instruções, resolução de problemas de matemática, desempenho em jogos esportivos e autocontrole.
O Capítulo 5, de Elisa Tavares Sanabio-Heck
e Karina de Guimarães Souto e Motta, aborda o
fenômeno comportamental conhecido como desamparo aprendido, o qual resulta da exposição
a situações de incontrolabilidade, bem como as
estratégias metodológicas utilizadas na prevenção e na reversão desse fenômeno. As autoras
também fazem uma análise crítica do status causal comumente atribuído ao conceito de expec-
tativa pelos pesquisadores dessa área de investigação. Para tanto, analisam estudos de desamparo caracterizados pela presença ou pela ausência de correspondência entre comportamento verbal e não-verbal, apresentando uma interpretação
analítico-comportamental das relações verbais
presentes nesses estudos. Finalmente, são discutidas algumas estratégias terapêuticas (p. ex.:
treino de auto-observação, treino de repertórios
não-verbais e modelagem de relatos discriminados) relevantes para a reversão dos efeitos da
história de incontrolabilidade.
No Capítulo 6, Lincoln da Silva Gimenes,
Alessandra de Moura Brandão e Marcelo Frota
Benvenuti apresentam a definição de comportamento adjuntivo ou, alternativamente, comportamento induzido por contingências de
reforçamento, descrevem alguns tipos desse
comportamento e exemplificam a generalidade do fenômeno. Esses autores sugerem que o
modelo de comportamento adjuntivo pode ser
útil para o entendimento de diversos distúrbios comportamentais, tais como drogadição,
obesidade, bulimia, anorexia e síndrome do
cólon irritável, entre outros. Além disso, é também ilustrada a possibilidade de controle de
estímulos sobre o comportamento adjuntivo.
O Capítulo 7, de Carlos Eduardo Cameschi e Josele Abreu-Rodrigues, avalia a pesquisa
básica sobre contingências aversivas e seus
principais efeitos sobre o comportamento de
organismos humanos e não-humanos. Ao analisar a punição e o reforçamento negativo, além
de apresentar algumas variáveis determinantes
das propriedades aversivas dos eventos
ambientais, os autores enfatizam as controvérsias existentes sobre a efetividade da punição,
as dificuldades metodológicas encontradas no
estudo da resposta de fuga, o procedimento
de esquiva de Sidman e o debate entre os adeptos de interpretações molares e moleculares do
processo de esquiva. Além disso, os autores
discutem a abordagem analítico-comportamental do comportamento emocional. Por último, há uma discussão sobre o uso de controle
aversivo em procedimentos terapêuticos diversos, tais como na Terapia Analítica Funcional
e na Terapia da Aceitação e do Compromisso.
No Capítulo 8, Yvanna Aires Gadelha e
Laércia Abreu Vasconcelos apresentam uma
ANÁLISE DO COMPORTAMENTO
análise teórico-conceitual e metodológica do
processo de generalização. Para tanto, as autoras estabelecem diferenças entre pseudogeneralização e generalização verdadeira, generalização e generalidade, classes funcionais e classes de equivalência, generalização de estímulos
e de respostas. Este capítulo contém, ainda, uma
descrição de estratégias metodológicas para a
promoção de generalização (p.ex., mediação da
generalização, treinamento direto da generalização) e uma discussão do fenômeno da generalização no contexto clínico. Nessa discussão,
as autoras destacam os conceitos de integridade do tratamento e satisfação do consumidor.
Na seqüência são apresentados dois capítulos referentes à análise do comportamento
de escolha. No Capítulo 9, João Claudio Todorov
e Elenice S. Hanna apresentam os estudos de
quantificação de escolhas e preferência, indicando modelos matemáticos desenvolvidos
para descrever o comportamento de escolha,
em especial o modelo conhecido como lei da
igualação. Os autores também apontam variáveis que influenciam a igualação entre distribuição de respostas e de reforços, tais como o atraso do reforço para respostas de mudança, a história dos sujeitos experimentais e os tipos de
esquemas de reforçamento envolvidos na situação de escolha. Esse capítulo também apresenta
a controvérsia sobre o princípio da relatividade, discute a generalidade da lei da igualação
para o comportamento de escolha de humanos e discorre sobre possíveis aplicações da
relação de igualação para o comportamento de
indivíduos autistas, atletas e estudantes.
No Capítulo 10, Elenice S. Hanna e
Michela Rodrigues Ribeiro avaliam um tipo especial de situação de escolha – a situação de
autocontrole. Esse capítulo discute o conceito
de autocontrole e impulsividade a partir do
paradigma de autocontrole proposto por
Rachlin. Dentre as variáveis determinantes do
autocontrole, as autoras destacam os parâmetros do reforço (atraso, probabilidade, freqüência e magnitude), atividades desenvolvidas
durante o atraso do reforço, a história de
reforçamento, os estímulos discriminativos presentes na situação e o custo da resposta. Também é discutido o papel do procedimento de
esvanecimento para fortalecer o comportamen-
13
to de autocontrole em contextos aplicados (p.
ex., indivíduos com atraso de desenvolvimento, crianças hiperativas, adictos em nicotina,
mulheres com vaginismo). Ao final, as autoras
discorrem sobre o papel do comprometimento
em situações aplicadas de autocontrole.
No Capítulo 11, Josele Abreu-Rodrigues
discute o fenômeno da variabilidade comportamental. Ao apresentar as contribuições
da pesquisa básica e aplicada para a compreensão desse fenômeno, a autora analisa separadamente a variabilidade como um subproduto de variáveis ambientais (p. ex., intermitência do reforço, retirada do reforço) e
como um produto direto de contingências de
variação. Na discussão do controle operante
da variabilidade, a autora discorre sobre tópicos tais como controle de estímulos, resistência à mudança, escolha entre repetição e variação, história de reforçamento e controle
verbal. Neste capítulo, a autora também discute a relevância dos estudos sobre variabilidade para a compreensão do comportamento
criativo e de questões relacionadas à liberdade de escolha.
O livro ainda contém uma análise do comportamento verbal sob três diferentes ângulos.
Sonia Beatriz Meyer, no Capítulo 12, discute a
utilização de regras e auto-regras no laboratório e na clínica analítico-comportamental. Ao
descrever os principais resultados da pesquisa
básica sobre o tema, a autora aponta diversas
variáveis que afetam a sensibilidade do comportamento verbalmente controlado a mudanças nas contingências, tais como o grau de contato com a nova contingência, o conteúdo da
regra, o nível de variabilidade comportamental,
a história de reforçamento e o grau de
discriminabilidade das contingências em vigor.
O capítulo apresenta, em seguida, uma discussão sobre o controle verbal no contexto clínico, na qual a autora avalia a efetividade do
uso de regras/instruções e de modelagem na
promoção de mudanças comportamentais. Há
também uma discussão sobre duas variáveis
que influenciam o uso de estratégias diretivas:
a abordagem teórica do terapeuta e a história
de vida do cliente. Por fim, a autora analisa a
relação entre controle verbal e resistência e
adesão ao tratamento.
14
ABREU-RODRIGUES, RIBEIRO & COLS.
Marcelo Emílio Beckert, no Capítulo 13,
apresenta uma descrição e a análise da correspondência entre comportamento verbal e comportamento não-verbal. O autor discute aspectos teóricos e metodológicos derivados da pesquisa sobre correspondência, enfatizando a diversidade metodológica existente na área, a
efetividade dos diversos tipos de treino da correspondência (p. ex., fazer-dizer, dizer-fazer,
dizer-fazer-dizer) e as variáveis que afetam a
aquisição, a generalização e a manutenção da
correspondência. O capítulo também apresenta algumas implicações dos resultados da pesquisa básica para contextos aplicados, com ênfase no contexto clínico. Aqui, o autor discorre
sobre a relevância do treino da correspondência para a aquisição dos comportamentos de
autoconhecimento e de autocontrole.
Alessandra Rocha de Albuquerque e Raquel Maria de Melo, no Capítulo 14, discutem
a aprendizagem por equivalência de estímulos. As autoras inicialmente apresentam uma
diferenciação entre equivalência e generalização e uma caracterização do procedimento
comumente utilizado para avaliar equivalência. Ao descrever os resultados da pesquisa
básica sobre o tema, as autoras discutem se a
nomeação oral dos estímulos é necessária para
a emergência de equivalência e sobre a possibilidade de transferência de função entre os
membros de uma classe de equivalência. Por
fim, as autoras discorrem sobre a aplicabilidade
do paradigma de equivalência para o treino de
leitura, escrita, habilidades matemáticas e comportamentos clinicamente relevantes (p. ex.,
consumo de drogas, autoconceito negativo).
Finalizando, os dois últimos capítulos
abordam temas sociais. No Capitulo 15, Ana
Karina Curado Rangel de-Farias avalia a
pertinência de uma análise experimental do
comportamento social, enfatizando as estratégias metodológicas utilizadas nas investigações
dos comportamentos de cooperação, competição e trabalho individual. A autora destaca,
dentre as variáveis de controle desses comportamentos, a magnitude dos reforços, a história
de reforçamento, o custo da resposta, o conteúdo das instruções e a iniqüidade de reforços entre os participantes da situação social. É
também discutida a relevância dos estudos so-
bre comportamento social para diversas situações aplicadas, tais como produtividade no trabalho, desempenho acadêmico, participação
em cooperativas de trabalho e manutenção de
recursos naturais.
No Capítulo 16, Jorge M. Oliveira-Castro
e Gordon Foxall apontam a relevância da
abordagem analítico-comportamental para o
estudo do comportamento do consumidor. São
apresentados resultados de pesquisas sobre tópicos relacionados ao comportamento do consumidor, como, por exemplo, economia
comportamental, escolha e preferência, sistemas de economia de fichas e marketing social.
O capítulo também contém uma caracterização
dos padrões de escolha do consumidor, bem
como uma discussão sobre questões como o cenário de consumo, a história de aprendizagem
do consumidor e as conseqüências do consumo. Os autores mostram, ainda, uma proposta
de categorização do comportamento do consumidor. Por fim, os autores descrevem o uso de
procedimentos respondentes e operantes para
investigar o comportamento do consumidor.
É com muito entusiasmo que apresentamos este livro, que poderá ser de grande utilidade a alunos de graduação e pós-graduação,
tendo em vista que os temas de que trata constituem parte de disciplinas obrigatórias na formação desses alunos. Os profissionais que adotam a abordagem analítico-comportamental,
bem como aqueles de áreas afins, que buscam
um conhecimento atualizado e fundamentado
na pesquisa básica e aplicada sobre processos
comportamentais diversos, também se beneficiarão com a leitura deste livro. Além disso,
esta obra poderá amenizar as dificuldades dos
professores da área em oferecer bibliografia
atualizada na língua portuguesa, dificuldade
esta que nos têm levado a adotar, nos cursos
de graduação, traduções já defasadas ou textos em outros idiomas, o que freqüentemente
traz prejuízos ao processo ensino-aprendizagem. Por fim, queremos agradecer a todos os
colaboradores pelo esforço em apresentar trabalhos fortemente embasados na literatura científica e em apontar possíveis aplicações dos
resultados da pesquisa a contextos diversos.
As organizadoras
ANÁLISE DO COMPORTAMENTO
CIÊNCIA, TECNOLOGIA E
ANÁLISE DO COMPORTAMENTO
15
1
KENNON A. LATTAL
Os capítulos que compõem este livro oferecem substância para as relações entre os elementos descritos no título deste primeiro capítulo. Os autores descrevem muitos desenvolvimentos na análise experimental de processos básicos de aprendizagem, e muitos deles
também discutem as implicações de uma compreensão desses processos básicos para a resolução de problemas do comportamento humano. A interação entre ciência e tecnologia é
central para o bem-estar da ciência do comportamento e da tecnologia que envolve intervenções comportamentais planejadas para
melhorar problemas de comportamento. Este
capítulo examina as origens, os pressupostos e
a natureza da interação entre ciência e
tecnologia como um prelúdio para as discussões de tais relações, as quais são desenvolvidas
para áreas específicas e substantivas da análise do comportamento nos capítulos seguintes.
CIÊNCIA BÁSICA, CIÊNCIA APLICADA
E TECNOLOGIA
Uma definição satisfatória e mutuamente acordada de ciência pode ser tão difícil de
se alcançar quanto a de uma série de conceitos
em psicologia, mas é necessária uma definição
como um ponto de partida. A famosa definição de E. G. Boring de inteligência como “aquilo que os testes de inteligência testam” pode ser
refraseada para definir ciência como “aquilo que
os cientistas fazem”. A partir disso, Skinner
(1953) elaborou a definição de que aquilo que
os cientistas fazem envolve um “conjunto de atitudes” caracterizado por “uma disposição para
aceitar fatos mesmo quando eles são opostos a
desejos” (p. 12). O comportamento de um cientista envolve “uma busca por ordem, por uniformidade, por relações ordenadas entre os
eventos na natureza” e, além disso, demonstra
“mais e mais relações entre eventos ... mais e
mais precisamente” (p.13).
Para essa discussão será também útil distinguir a ciência básica da aplicada. Tal distinção pode ser feita comportamentalmente em
termos das variáveis que controlam o comportamento do cientista. Na ciência básica o comportamento do cientista, amplamente definido,
é controlado pela aquisição de novos conhecimentos e pelo desenvolvimento de teorias. O
comportamento do cientista aplicado é similarmente controlado pela aquisição de novos
conhecimentos, mas novos conhecimentos à
medida que estes se relacionam com o impacto do conhecimento sobre problemas práticos
(sociais para alguns, como Baer, Wolf, e Risley,
1968), isto é, faz as coisas funcionarem. Como
disse Baer (1991), “algumas disciplinas não se
dedicam a fazer alguma coisa funcionar, mas
sim a notar regularidade, ordem e predições,
enquanto outras dedicam-se a fazer as coisas
funcionarem” (p.429). A adição de controle ao
repertório do cientista aplicado, por meio do
desenvolvimento teórico, obscurece a distinção entre ciência básica e aplicada, mas as variáveis que controlam os dois empreendimentos, aquelas relacionadas com a aquisição de
conhecimento versus aquelas relacionadas com
16
ABREU-RODRIGUES, RIBEIRO & COLS.
a aquisição de conhecimento controlada por
seu impacto em assuntos práticos, ainda distinguem as duas.
A tecnologia não é controlada por nenhuma dessas variáveis, mas por seu impacto sobre problemas práticos. O comportamento do
tecnicista é aquele de adaptação e de aplicação do que é conhecido a partir das ciências
básica e aplicada para resolver problemas práticos da vida cotidiana, sejam eles construir
uma ponte melhor, ajudar um adulto que atravessa uma crise pessoal ou melhorar a qualidade de vida de um adolescente gravemente
retardado. Assim como a distinção entre ciência básica e aplicada também o é, a distinção
entre ciência aplicada e tecnologia é, algumas
vezes, obscura (cf. Hawkins e Anderson, 2002;
Johnston, 1996).
ANÁLISE DO COMPORTAMENTO COMO
UMA CIÊNCIA E UMA TECNOLOGIA
A ciência da análise do comportamento
começou com o trabalho de Skinner na década de 1930 (Skinner, 1956) sobre processos
básicos de aprendizagem. Os métodos de
Skinner encontraram seu espaço na aplicação,
talvez primeiramente na análise experimental
dos efeitos de drogas sobre o comportamento
(Skinner e Heron, 1937) e depois no desenvolvimento de bombas teleguiadas por pombos para o governo dos Estados Unidos
(Skinner, 1960), mas mais importante, por
meio do que mais tarde tornou-se a análise
comportamental aplicada (ver Ullman e
Krasner, 1965, p. 1-63, para uma revisão histórica). Talvez as mais amplas questões nesses
desenvolvimentos em análise do comportamento tenham sido aquelas referentes a como a
ciência básica, a ciência aplicada e a tecnologia
podem e relacionam-se entre si. Essas questões
têm resultado em um número de revisões úteis
dessas relações. Alguns têm discutido a caracterização da análise comportamental aplicada
como uma ciência e uma tecnologia (Hayes,
1978; Epling e Pierce, 1986; Johnston, 1996;
Smith, 1992), outros têm considerado a lacuna entre a análise comportamental básica e a
aplicada e sugerido maneiras de eliminá-la
(Baron e Perone, 1982; Hake, 1982; Epling e
Pierce, 1986), e outros ainda têm defendido a
necessidade de considerar as três não em termos de hierarquia, mas em termos de suas contribuições independentes para a disciplina
(Epling e Pierce, 1986; Hayes, 1978).
A ciência da análise do comportamento é
controlada por variáveis de pelo menos três
fontes: pesquisa empírica passada, teoria e
observações correntes do comportamento. Com
a pesquisa empírica passada e a teoria, o controle é amplamente verbal, visto que estímulos tanto escritos quanto orais estabelecem ocasiões para novas pesquisas. Observações do
comportamento podem ser realizadas tanto no
laboratório quanto em cenários “aplicados”,
tais como clínico e educacional. Essas observações também incluem o bem conhecido princípio de “serendipidade” (Bachrach, 1960;
Skinner, 1956), por meio do qual observações
sistemáticas futuras do comportamento são
controladas por observações que desviam do
esperado, isto é, por contingências mais locais
e imediatas em contraste com as contingências de mais longo termo envolvidas no controle da pesquisa pela teoria ou pela experimentação prévia.
Um dos objetivos da análise do comportamento como uma ciência é desenvolver princípios comportamentais gerais que podem ser
aplicados igualmente a humanos e a não-humanos, tanto em laboratório quanto em ambientes
naturais. Hake (1982) propôs que a pesquisa
básica sobre comportamento social e verbal
com humanos poderia servir como uma ponte
entre pesquisa básica com animais não-humanos e a aplicação dos princípios a problemas
de comportamento humano, por exemplo, em
situações clínicas e educacionais. A importância da pesquisa básica nesses dois tópicos em
relação à aplicação é inquestionável porque
essas características definem partes importantes do ambiente natural dos humanos. O que é
questionável é se elas são uma conexão necessária entre pesquisa básica de laboratório com
animais e trabalho aplicado com humanos.
Hake definiu essa ponte como a extensão dos
princípios comportamentais para novas popu-
ANÁLISE DO COMPORTAMENTO
lações e novos padrões de comportamento, e,
nesse sentido, a pesquisa operante básica sobre comportamento social e verbal em humanos pode ser considerada uma ponte. Essa observação não sugere, entretanto, que a pesquisa operante com humanos seja necessária antes da aplicação dos princípios comportamentais a problemas do cotidiano. A história
da análise comportamental aplicada mostra
que o desenvolvimento do trabalho aplicado
não se deu por tal processo de três fases: da
pesquisa operante básica com animais para a
pesquisa operante com humanos e para a aplicação. A análise comportamental aplicada desenvolveu-se, pelo menos inicialmente, em
função do sucesso da extensão direta dos princípios comportamentais desenvolvidos com
animais não-humanos, em função da falta de
significativa produção de pesquisa operante básica com humanos. Uma vez que tanto o comportamento social quanto o verbal não são encontrados no laboratório animal, tal pesquisa
com humanos parece útil se o interesse é na
melhora de problemas comportamentais que
envolvem esses dois processos. As mesmas fontes de controle na ciência básica operam na
ciência aplicada da análise do comportamento. Embora esta possa estar fundamentada na
ciência básica, ela se desenvolve independentemente da ciência básica, uma vez que os problemas estudados por ela são controlados por
diferentes características do ambiente.
A análise do comportamento funciona
como uma tecnologia de duas maneiras diferentes: aplicando princípios estabelecidos por
meio das pesquisas básica e aplicada para o
melhoramento de problemas de significância
social (Baer et al., 1968) e como uma fonte de
métodos para tornar “observação e mensuração válidas e confiáveis” (Baer, 1991, cf.
Cardwell, 1994, p. 492). É a ênfase na solução
de problemas práticos que tem creditado à
análise do comportamento, dirigida a humanos, sua reputação positiva. Melhoras na validade e na confiabilidade das observações por
meio do desenvolvimento de tecnologias
observacionais têm, entretanto, contribuído
significativamente para fornecer evidências de
que a análise do comportamento, de fato, fun-
17
ciona. Além disso, a aplicação de métodos analítico-comportamentais em áreas diversificadas,
como cognição animal e farmacologia comportamental, tem contribuído imensamente para
o sucesso dessas disciplinas, pelo avanço da
ciência básica associada a cada uma delas.
PRAGMATISMO E PRÁTICA
A análise de comportamento é definida
como uma disciplina pragmática (Moxley,
2001; Baum, 1994), o que significa dizer que
tanto a ciência como a tecnologia da análise
do comportamento têm como critério de verdade de um conceito a utilidade daquele conceito. Na distinção entre pragmática e prática,
Morris (1970) observou que Peirce, quem primeiro descreveu pragmatismo, “preferiu o termo ‘pragmatismo’ ... [porque] pragmatismo
não estava preocupado com ‘o prático’, nem
mesmo com todos os tipos de ‘prática’, mas com
a maneira como o conhecimento humano ... é
relacionado a ação ou conduta humana” (p. 910). A distinção entre pragmatismo e prática é
importante para discussões das relações entre
ciência básica, ciência aplicada e tecnologia
porque os dois termos, às vezes, são equiparados, com a implicação resultante de que a meta
final da análise do comportamento está em contribuir para a solução de problemas práticos.
Por exemplo, Baer e colaboradores (1968) notaram que “behaviorismo e pragmatismo
freqüentemente parecem caminhar lado a lado.
A pesquisa aplicada é eminentemente pragmática; ela pergunta como conseguir com que um
indivíduo faça algo de maneira eficaz” (p. 93).
O segundo termo é, então, examinado em relação “ao valor de aplicação” e às metas que
são “socialmente importantes” (p. 93). Metas
socialmente importantes certamente podem ser
tanto pragmáticas como práticas, porém nem
todas as metas pragmáticas são práticas. Do
ponto de vista da filosofia pragmática, qualquer solução, mesmo aquelas que podem não
satisfazer outros critérios, tais como a aceitabilidade social (sem mencionar a relevância),
pode ser pragmática na medida em que satisfaça as metas estabelecidas. A pesquisa básica
18
ABREU-RODRIGUES, RIBEIRO & COLS.
em análise do comportamento é pragmática
sem carregar, com esse rótulo, a necessidade
de ser prática.
O que significa uma disciplina pragmática? O pragmatismo veio para a psicologia, e
então para a análise do comportamento, pelos
primeiros trabalhos de James e Dewey que, juntos com Peirce, são considerados os fundadores da escola pragmática da filosofia. James e
Dewey rejeitaram a abordagem estruturalista
e seu substrato filosófico racionalista, que definiu o início da psicologia como uma disciplina separada da filosofia e da fisiologia. Para
esses três fundadores (Morris, 1970, p. 10):
A ação humana é um tópico de preocupação
central. Esta preocupação, porém, não é com
o “movimento” ou a “atividade” como tal, nem
com os efeitos de idéias sobre a vida humana,
nem com uma teoria completa da natureza
humana; é principalmente focalizada (embora não exclusivamente) em um aspecto do
comportamento humano: ação inteligente,
que seria o comportamento propositivo ou
dirigido a metas, influenciado por reflexão.
Se o alvo é um assunto teórico ou prático,
o critério pragmático de verdade de utilidade é
definido em termos das metas que são determinadas conforme for mencionado na citação anterior. Essa operacionalização de utilidade parece, a princípio, estar em conflito com uma ciência do comportamento; o próprio Skinner
(1974, p. 55), entretanto, sugeriu que a análise
do comportamento é “o próprio campo do propósito e da intenção”. Lattal e Laipple (no prelo) descreveram vários modos em que o critério
de verdade de utilidade é incorporado em uma
visão behaviorista de mundo. Pode ser, por
exemplo, considerada uma instância de correspondência entre dizer e fazer (Ribeiro, 1989)
com o estabelecimento da meta e a realização
da meta correspondendo a dizer e a fazer.
tos antecedentes incluem desenvolvimentos em
ciência básica, em ciência aplicada e em
tecnologia, e eventos conseqüentes envolvem
a “utilidade” ao longo das linhas do critério
pragmático de verdade de realização de metas
esboçado na seção anterior. A interação entre
esses eventos antecedentes e conseqüentes
constitui um progresso científico e tecnológico.
Moxley (1989) e Neef e Peterson (no prelo) descreveram um modelo interativo, apresentado na Figura 1.1, para enquadrar as relações entre ciência básica, ciência aplicada e
tecnologia. As atividades no lado esquerdo da
matriz constituem a fonte de informações, isto
é, a condição antecedente, e aquela no topo
da matriz constituiu o receptor ou o beneficiário das informações. Desse modo, cada atividade influencia as outras. Os próximos três
itens consideram as implicações de tal configuração para a ciência e para a tecnologia da
análise do comportamento.
A ciência da análise do comportamento
A independência da ciência básica
e da aplicada
As interações mais comuns e influentes
na ciência da análise do comportamento envolvem ciência básica para ciência básica e ciência aplicada para ciência aplicada. A análise
do comportamento foi caracterizada como uma
RELAÇÕES ENTRE CIÊNCIA BÁSICA,
CIÊNCIA APLICADA E TECNOLOGIA
Tanto a ciência como a tecnologia da análise do comportamento são controladas por
eventos antecedentes e conseqüentes. Os even-
FIGURA 1.1 Uma matriz descrevendo as interações
entre ciência básica, ciência aplicada e tecnologia.
ANÁLISE DO COMPORTAMENTO
ciência histórica, visto que práticas atuais e descobertas são construídas a partir de observações e de experimentações prévias. Este livro
ilustra como o conhecimento atual sobre processos e fenômenos comportamentais é o resultado do acúmulo de experimentação, em
que novos experimentos são fundamentados
em experimentos anteriores. As fontes mais
fortes de controle sobre práticas científicas atuais em ciência básica e em ciência aplicada são
os experimentos que as precederam em, na
maioria das vezes, uma área similar ou relacionada. Pode ser só um leve exagero dizer que
muitos, se não a maioria, dos cientistas básicos lêem principalmente o que outros cientistas básicos escrevem. Quer dizer, eles lêem
pouco sobre ciência aplicada ou áreas tecnológicas de sua disciplina. O mesmo pode ser dito
de cientistas aplicados com respeito à literatura aplicada. Essa afirmativa é sustentada por
estudos que mostram que as taxas de citações
transversais em artigos de análise do comportamento que aparecem no Journal of the Experimental Analysis of Behavior e no Journal of
Applied Behavior Analysis são, realmente, bastante pequenas (Poling, Alling e Fuqua, 1994).
Uma implicação dessa infreqüente taxa
de citações transversais é que as ciências básicas e as aplicadas da análise de comportamento estão operando de maneira relativamente
independentes entre si. Esse achado não é insalubre nem particularmente surpreendente.
A independência entre análise do comportamento básica e aplicada, em termos de programas de trabalho de pesquisas e de assuntos
conceituais que comandam a atenção, é um
sinal saudável de crescimento na disciplina
como um todo. Embora a análise do comportamento aplicada derive seus princípios e sua
visão de mundo da ciência básica baseada em
investigações com humanos e com não-humanos dentro da análise experimental do comportamento, a análise do comportamento aplicada não pode ser estritamente limitada pela
ciência básica em termos tanto dos problemas
que investiga quanto dos métodos que desenvolve para estudá-los. Ela se fundamenta em
alguns dos assuntos e problemas teóricos derivados da análise do comportamento básica,
entretanto muitos problemas encontrados na
19
aplicação de princípios do comportamento também devem ser tratados. É improvável que a
ciência básica trate esses problemas, colocando, assim, o ônus de investigá-los na análise
do comportamento aplicada. A análise do comportamento aplicada não é também limitada
pelos métodos da ciência básica. A importância dos planejamentos de reversão na ciência
básica é uma parte de quase toda investigação
de um processo básico de aprendizagem. O
procedimento de linha de base múltipla foi desenvolvido porque as demandas na condução
de pesquisa em situações naturais algumas
vezes impedem a reversão para a condição de
linha de base. Embora aquele planejamento
seja um “cavalo de força” da análise do comportamento aplicada, isto raramente, se alguma vez, foi usado em situações de pesquisa
básica.
Relações interdependentes entre
a ciência básica e a aplicada
Como já foi sugerido, a análise do comportamento básica se desenvolveu antes da ciência aplicada e, nesse sentido, a última é uma
descendente linear da primeira. Desse modo,
as ciências básica e aplicada da análise do comportamento compartilham uma linhagem comum que inclui uma visão comum de mundo,
uma visão comum das variáveis que determinam o comportamento e os métodos sobrepostos (mas métodos freqüentemente não-idênticos porque os ambientes naturais em que a ciência aplicada muitas vezes ocorre colocam
especial demanda sobre os métodos, demandas essas não colocadas sobre pesquisas em
situações de laboratório, como notado anteriormente). De forma geral, as ciências básica e
aplicada influenciam fortemente uma a outra.
Mais especificamente, é muito freqüente
o caso em que a pesquisa básica provê o ímpeto para a pesquisa aplicada, e muitos têm discutido que isso deveria ser mais freqüente.
Mace (1994), por exemplo, clamou pelo desenvolvimento de pesquisa básica em várias
áreas que ele sugeriu como particularmente
relevantes para a análise do comportamento
aplicada: distribuição de respostas, resistência
20
ABREU-RODRIGUES, RIBEIRO & COLS.
à mudança, contracontrole, formação e diferenciação/discriminação de classes de estímulos e de respostas, análise de comportamento
de taxa baixa e comportamento governado por
regra.
Ocasionalmente, a relação inversa também ocorre. Dois exemplos ilustram o movimento de pesquisa aplicada para pesquisa básica. Às vezes, a pesquisa aplicada influencia a
pesquisa básica quando uma pesquisa sobre um
problema aplicado revela uma anomalia ou um
resultado inesperado que não é intuitivo a partir do que é conhecido na ciência básica. Como
um exemplo simples, em meu próprio laboratório, há vários estudos aplicados que demonstram que usando dois tipos diferentes de recompensas para a mesma tarefa, brinquedos e
M&M (pastilhas de chocolate), por exemplo,
ocorre um melhor desempenho do que quando
utilizado um ou outro tipo de recompensa individualmente. Não é óbvio por que isso deveria acontecer, e agora estamos estudando o
problema, usando ratos como sujeitos e pelotas
de comida e leite condensado como reforçadores. Outras vezes, modelos de laboratório,
com humanos ou não-humanos, são construídos a partir da ciência básica para estudar fenômenos de interesse para a ciência aplicada
sob condições mais controladas, mas mais importante em termos da discussão presente,
permitir que o fenômeno aplicado seja mais
sistematicamente relacionado aos processos
comportamentais básicos. Lattal (2001) tem
discutido a natureza da extensão dos princípios de um lado para outro entre a ciência
básica e a aplicada dentro da análise do comportamento.
As pesquisas básica e aplicada parecem
mutuamente importantes uma para a outra
como uma fonte de novas idéias e soluções de
problemas práticos, mas a dificuldade está em
encontrar formas para pesquisadores básicos e
aplicados deixarem o que estão fazendo e estudar em alguma outra coisa, presumivelmente por causa das contingências que operam para
manter suas atividades presentes. O problema
é o controle do comportamento, neste caso,
do comportamento científico. Skinner (1956)
observou que, quando alguém descobre algo
interessante algumas vezes é uma boa estraté-
gia deixar o que se está fazendo e estudar a
nova descoberta. Se tomado muito literalmente, a ciência nunca progrediria porque novas
descobertas definem a atividade. Menos literalmente, Skinner estava sugerindo que seguir
os dados de maneira indutiva pode ter resultados recompensadores. Uma maneira de facilitar a exposição do cientista para outro tipo de
problema é pedir a ele para relacionar sua própria pesquisa com outras coisas. Como um bom
exemplo de como isso poderia ser feito, recentemente o Journal of Applied Behavior Analysis
tomou a iniciativa criativa de convidar pesquisadores básicos e aplicados para colaborarem
no desenvolvimento de uma revisão de uma
área de análise do comportamento básica com
um olhar nas aplicações de tais pesquisas
(Lattal e Neef, 1996). Desse modo, cientistas
com diferentes focos examinam problemas relacionados a sua própria pesquisa, mas em uma
outra arena.
Ciência e tecnologia
Foram sugeridos dois modelos gerais de
interações entre as ciências, tanto a básica
como a aplicada, e a tecnologia. O mais convencional modelo de progresso da ciência para
a aplicação é um modelo linear. Com esse modelo, desenvolvimentos em ciência básica são
refinados e tornados relevantes por cientistas
aplicados, que, por sua vez, entregam seus produtos para indivíduos qualificados e bem-treinados para empregá-los como uma tecnologia.
É o caso do modelo de progressão da física e
da química para a engenharia e, então, para a
construção ou produção. O segundo modelo é
parte do que foi descrito previamente como um
modelo interativo em que ciência e tecnologia
influenciam-se mutuamente. Ainda existe o movimento da ciência básica e da aplicada para a
aplicação, mas os movimentos reversos também
são reconhecidos (cf. Cardwell, 1994).
O modelo linear tem sido apresentado
como uma justificativa para a pesquisa básica,
como a fundação da tecnologia moderna. Como
tal, às vezes é visto como o modo ideal para
maximizar ganhos a partir do conhecimento
científico. Segundo esse modelo, a ciência bá-
ANÁLISE DO COMPORTAMENTO
sica tem fornecido a base necessária para a aplicação tecnológica de tal forma que se torna
simplesmente uma questão de adaptar o princípio científico para algum problema prático.
Embora isso freqüentemente seja verdade, não
é sempre o caso, e contra-exemplos trazem à
discussão a generalidade do modelo.
Em sua análise de revoluções científicas,
Kuhn (1971) notou que a ciência é perita em
esconder conflitos, especialmente conflitos teóricos. Sua posição é que a ciência normal eventualmente permite falhas no paradigma sob o
qual ela é conduzida. As falhas são escondidas
ou ignoradas até que um paradigma novo e
melhorado apareça. Então, a história do problema é reescrita de tal maneira que as inconsistências anteriores são encobertas, e a ciência é apresentada como um acúmulo gradual e
fluente de conhecimento. Essas mesmas idéias
podem ser aplicadas à relação entre ciência e
tecnologia. Moxley (1989) ofereceu o exemplo de como o uso de laranjas e limões se desenvolveu em um tratamento para o escorbuto.
A descoberta científica dos mecanismos
freqüentemente é retratada como a razão para
a prática (Skinner, 1987), o que se constitui
em um exemplo clássico do modelo linear.
Comer frutas como um tratamento para aquele flagelo do serviço naval, o escorbuto, porém, era parte da medicina popular pelo menos por 400 anos antes de ser descoberto que
o escorbuto era o resultado de uma falta de
vitamina C na dieta. Moxley sugeriu que a
tecnologia de comer frutas para prevenir o
escorbuto não foi causalmente ligada à descoberta dos mecanismos no final dos anos 1700.
Ele notou que (1989, p. 49):
A história da cura para o escorbuto não é a
história do atraso lento entre uma descoberta
científica inicial e sua aplicação prática. Ao
invés disso, é a história de quanto tempo pode
levar antes que alguma adventícia aplicação
prática bem-sucedida possa ser cientificamente explicada.
O modelo interativo oferece uma visão
relacionada, mas mais completa, da relação
entre a ciência e a tecnologia, levando em conta
os círculos de retroalimentação entre a tecnologia e as ciências a partir das quais elas se de-
21
senvolvem. Mesmo dentro de um modelo interativo, a tecnologia é mais freqüentemente
influenciada pela ciência aplicada porque as
aplicações são mais diretas desta para a outra.
Em muitos casos, entretanto, a aplicação
tecnológica é suficientemente direta, de forma que pesquisa aplicada adicional não é necessária, ou pode ser adiada até que a aplicação
direta da pesquisa básica seja tentada.
Qual a contribuição da
ciência para a tecnologia?
A ciência contribuiu mais freqüentemente
com as matérias-primas das quais a tecnologia
é construída, e esta parte da relação segue o
modelo linear de ciência para tecnologia, previamente discutido. As tecnologias da análise
do comportamento, por exemplo, foram inicialmente construídas sobre os fundamentos
conceituais e experimentais do trabalho de
Skinner, como já notado. O modelo linear não
dá conta, porém, de todas as instâncias de
tecnologia porque algumas tecnologias desenvolvem-se em resposta direta às contingências
naturais locais sem que, necessariamente, exista uma ciência básica como pré-requisito. A
roda, a escrita e o desenvolvimento do ferro
podem ser exemplos de tais respostas diretas.
Thomas Edison, o “mago do Parque Menlo”
como era chamado, era um dos inventores mais
prolíferos e bem-sucedidos entre aqueles reivindicados pelos Estados Unidos, mas ele
não tinha nada a ver com a compreensão científica de mecanismos. Seu único interesse era
inventar “coisas úteis”. É claro, pode ser argumentado que as matérias-primas das quais ele
construiu suas invenções eram, de fato, um
produto das ciências do seu tempo. Além disso, o trabalho de Edison, e de outros inventores, poderia ter prosseguido de maneira mais
eficaz se tivesse a ciência básica provido uma
fundação mais formal. Nikola Tesla, o principal competidor de Edison e de igual inventividade, nascido na Croácia, disse sobre Edison
(White, 2002, p. 132):
Se ele tivesse de achar uma agulha em um
palheiro, ele procederia com a diligência da
22
ABREU-RODRIGUES, RIBEIRO & COLS.
abelha para examinar palha após palha até
encontrar o objeto de sua procura. Eu fui uma
testemunha penosa de tais ações, sabendo que
um pouco de teoria e de cálculo teria economizado 90% de seu trabalho.
Aqueles que aplicam a tecnologia provavelmente têm uma interação direta, relativamente pequena, tanto com a ciência básica
como com a aplicada, mas suas informações
sobre os desenvolvimentos nessas áreas e as
implicações de tais desenvolvimentos para a
prática podem vir daqueles envolvidos tanto
em uma como em outra ciência. Tais informações são destiladas para algo facilmente aplicado e apresentadas em foros tais como seminários, documentação escrita e apresentações
em conferências.
Existe um problema potencial de circularidade no fato de que a tecnologia retroalimenta a ciência básica da qual ela deriva. A
circularidade é quebrada em parte porque a
tecnologia importada de volta para a ciência
é baseada em outras facetas da ciência em
questão, ou porque a tecnologia pode ser importada de outra disciplina (isto é, tecnologia
computacional no caso da ciência da análise
do comportamento). O importante papel da
tecnologia em desenvolvimento científico parece ser contrário a um modelo estritamente
linear de desenvolvimento científico para aplicação porque ele não permite que a tecnologia
retroalimente a ciência e, assim, altere o curso da ciência.
A tecnologia pode sustentar-se sozinha?
Qual a contribuição da tecnologia
para a ciência?
A ciência também fornece à tecnologia
muitos problemas práticos que ela, a ciência,
precisa que sejam resolvidos para os avanços
adicionais e, diretamente ao ponto desta subseção, a tecnologia retroalimenta a ciência com
muitas das ferramentas que esta precisa desenvolver e que, de outra maneira, não seria possível. O fornecimento dessas ferramentas tem um impacto que vai além do propósito
original de seu desenvolvimento. Embora ferramentas sejam criadas em resposta a certas
demandas específicas do ambiente, uma vez
que uma ferramenta torna-se disponível pode
ser disponibilizada para muitos outros usos.
Um desses usos é a expansão da ciência básica
até mesmo em outras direções daquela permitida pela ferramenta original. Avanços tecnológicos, tal como um novo modo de medir uma
resposta difícil ou um novo teste estatístico,
desenvolvido para um determinado propósito,
podem ter uma larga aplicação para outros
problemas da ciência básica e da aplicada.
Desse modo, por exemplo, o desenvolvimento
de uma tecnologia para a análise funcional de
comportamentos-problema de crianças com
atraso de desenvolvimento tem provado ser valioso para um amplo espectro de problemas e
de ambientes.
O bloco restante da matriz na Figura 1.1
é aquele em que tecnologia é tanto a fonte
quanto o recipiente, gerando a pergunta no título desta subseção. Somente de modo limitado pode a tecnologia sustentar-se. Algumas
vezes, ela fornece soluções locais, circunscritas a problemas que surgem em situações específicas; mas existem pelo menos três problemas com tecnologia alimentando tecnologia,
talvez especialmente em psicologia. O primeiro é que na ausência de qualquer avaliação e
modificação resultante dessa avaliação, tais intervenções psicológicas tecnologicamente
dirigidas tornam-se nada mais do que psicologia popular, um tipo de alquimia psicológica
em que cada praticante procura seu próprio
caminho de acordo com suas próprias regras,
nenhum dos quais necessariamente concordando com as regras dos outros. Como os limões,
no caso dos marinheiros britânicos, tais intervenções podem funcionar, mas sua aplicação
pode ser limitada e ineficiente sem uma compreensão do mecanismo que uma análise científica permitiria. Tais soluções estritamente
tecnológicas freqüentemente levam a abordagens de pacotes para problemas em que várias
coisas são tentadas de uma vez e, se efetivo, o
pacote permanece o tratamento de escolha, embora só um ou dois elementos possam ser responsáveis pelos efeitos. O segundo problema
ANÁLISE DO COMPORTAMENTO
é relacionado ao primeiro. Quando um pacote
tecnológico não funciona como devia, a menos que os próximos passos sejam articulados,
para o técnico não é claro qual a próxima coisa a ser feita. Desse modo, por exemplo, se recompensar algum comportamento alternativo
apropriado de um adolescente com atraso de
desenvolvimento não aumenta a freqüência
daquele comportamento, a solução estritamente técnica de recompensar um comportamento apropriado não sugere qual o próximo passo em direção a aumentar o comportamentoalvo. Em parte, isso é um problema do quão
específica a tecnologia é, mas quando aplicações tecnológicas começam a incorporar a noção de teorias ou princípios gerais, a distinção
entre tecnologia e ciência é obscurecida. Em
parte, porque não se espera que técnicos saibam os princípios científicos subjacentes; a
menos que se utilizem métodos precisos para
manter a tecnologia como planejada para ser
aplicada, a aplicação da tecnologia pode mudar da sua forma pretendida originalmente.
Essa mudança tecnológica constitui o terceiro
problema da tecnologia servindo tanto como
fonte quanto como recipiente. Particularmente em psicologia, em que muito da tecnologia
envolve pessoas que se comportam de determinadas maneiras, na ausência das condições
originais, o comportamento das pessoas desloca-se de seu treinamento original quando
contingências mais locais, nem sempre consistentes com as metas de longo prazo da intervenção, entram em jogo. Pennypacker (1986),
por exemplo, descreveu os problemas de transferência de tecnologia com respeito a manter
um programa de treinamento para ensinar mulheres a realizar auto-exame de mamas como
uma intervenção de prevenção ao câncer.
Trazendo, para a análise do comportamento,
elementos de outras disciplinas
Desde o início, a psicologia, em geral, e a
análise de comportamento, em particular, têm
utilizado idéias de outras disciplinas. A psicologia propriamente é uma disciplina híbrida,
tendo surgido de um “casamento” peculiar entre a filosofia e a fisiologia. Sendo assim, des-
23
de o início a psicologia tem abstraído idéias e
tecnologias de outros universos de discurso.
Idéias filosóficas, como operacionismo, o pragmatismo, o selecionismo e outras, abundam na
teoria analítico-comportamental moderna tanto “básica” como “aplicada”. Muitos dos problemas científicos mais amplos da psicologia
desenvolveram-se de antigos problemas tratados por filósofos e fisiologistas. Semelhantemente, pesquisas básicas em análise do comportamento sobre questões como a natureza
de reforço e punição (Dinsmoor, 2001), a condição da força da resposta, as variáveis determinantes da escolha e a natureza da equivalência de estímulos (Sidman, 1986) refletem
questões antigas tanto da psicologia como de
outras disciplinas, como a lógica, a matemática e a fisiologia.
Existe uma diferença importante entre a
influência de dados de outras disciplinas e a
incorporação de outras visões de mundo na
metateoria analítico-comportamental. Por
exemplo, um assunto um pouco preocupante
tem sido a relação entre a análise do comportamento e a fisiologia. Schaal (no prelo) notou um número de benefícios derivados da inclusão de dados fisiológicos na análise do comportamento predominante, mas Reese (1996)
sugeriu que a análise do comportamento não
tem nenhuma obrigação de fazer tal inclusão.
Na verdade, Reese discute que fazê-lo pode
obscurecer a distinção entre as duas e custar
à análise do comportamento um pouco de sua
condição como uma disciplina independente.
Trazer a pesquisa e a teoria de outras disciplinas é, porém, tanto inevitável quanto pode
ser altamente útil em expandir o âmbito da
análise do comportamento. Dependendo de
como a mistura é feita, a visão de mundo não
precisa ser necessariamente comprometida.
Por exemplo, Branch (1984) examinou os
modos em que o estudo de ações de drogas
poderia expandir o entendimento dos mecanismos tanto das drogas quanto do comportamento. Sua sugestão é que um contribui
para o entendimento do outro, uma posição
diferente daquela de outros que simplesmente usam os métodos da análise do comportamento como uma tecnologia para estudar a
ação de drogas.
24
ABREU-RODRIGUES, RIBEIRO & COLS.
Tomar elementos de outras disciplinas
não é, claramente, limitado a assuntos
conceituais e teóricos. Thompson (1984) notou as estranhas semelhanças entre os métodos da fisiologia experimental descritos no século XIX por Bernard (1865/1957) e os métodos contemporâneos da análise experimental
do comportamento. Realmente, um dos mais
importantes instrumentos de pesquisa de
Skinner, o registro cumulativo, evoluiu do
quimógrafo, uma invenção do fisiologista experimental alemão, Karl Ludwig. Skinner reformou o registro cumulativo durante a maior
parte de sua carreira de pesquisador, modificando e melhorando as versões antigas até
desaparecer, junto com o tambor de memória,
na era da mais versátil tecnologia adotada e
adaptada, o computador digital.
SELECIONISMO, CIÊNCIA
E TECNOLOGIA
O selecionismo tem sido sugerido como
um modelo para evolução orgânica e também
para mudanças ontogenéticas e culturais
(Skinner, 1981). Reconhecendo a análise de
Skinner como um importante componente da
cultura humana, ciência e tecnologia estão,
desse modo, sujeitas aos mesmos princípios de
variação e de seleção que qualquer outra prática cultural. Petroski (1992) ilustrou a aplicação de um modelo selecionista para entender
a evolução da tecnologia diária na forma de
objetos úteis, como lápis e clipes para papel.
Um quadro de referência selecionista começa
com a variação, porque sem variação não existe nada a ser selecionado por processos naturais. A variação, desse modo, é um elemento
crítico na evolução contínua das práticas culturais de ciência e de tecnologia.
Uma vantagem de conceitualizar a relação entre a ciência e a tecnologia em termos
do modelo interativo mostrado na Figura 1.1
é que ela representa uma descrição mais ampla das fontes de variação nas relações entre
ciência básica, ciência aplicada e tecnologia.
Vários autores têm assinalado a falta de comunicação entre as psicologias operante e nãooperante (Krantz, 1971), entre a análise do
comportamento básica e a aplicada (Poling et
al., 1994) e entre os pesquisadores que trabalham com humanos e os que trabalham comnão-humanos dentro da ciência básica da análise do comportamento (Perone, 1985). Existem razões práticas e científicas razoáveis para
tais comunicações restritas, como foi notado
anteriormente neste capítulo. Mas, do ponto
de vista de um selecionista, um sistema muito
fechado é desvantajoso porque limita a matéria-prima sobre a qual a seleção pode agir. Cada
uma dessas fontes é uma fonte potencial de
variação em idéias para o desenvolvimento de
outras que não estão sendo otimizadas.
Outras fontes de variação também podem
contribuir para a evolução contínua da ciência
e da tecnologia da análise do comportamento.
As muitas outras áreas de ciência e de tecnologia psicológicas servem para essa função, assim como ocorre com o constante influxo de
jovens cientistas e de técnicos em análise do
comportamento. Kuhn (1971) notou que as
mudanças dentro daquela disciplina freqüentemente são provocadas por uma pessoa nova
na disciplina, por uma pessoa jovem ou alguém
mais velho, mas com treinamento diferenciado que só agora está entrando na disciplina.
Dentro da disciplina, pesquisadores básicos
considerando problemas aplicados e pesquisadores aplicados considerando problemas básicos semelhantemente podem introduzir variações saudáveis para as áreas nas quais eles não
trabalharam antes. A variação não é menos
importante para os diferentes empenhos da
análise do comportamento do que é para os
pássaros e para as abelhas.
CONCLUSÃO
Que relações existem entre a ciência básica, a ciência aplicada e a tecnologia da análise do comportamento? A tecnologia depende
das ciências básica e aplicada, mas de outra
forma também as retroalimenta, provendo muitas das ferramentas para o crescimento e o
desenvolvimento futuros.
As ciências básica e aplicada da análise
do comportamento não podem operar de maneira totalmente independente uma da outra,
ANÁLISE DO COMPORTAMENTO
pois cada uma é controlada por um conjunto
de assuntos e de circunstâncias único em seus
ambientes naturais. Elas dependem uma da
outra para idéias e como um meio de examinar a confiabilidade, a validade e a generalidade dos processos e dos mecanismos comportamentais que estão sob investigação. Cada
uma dessas áreas da análise do comportamento também é enriquecida por pesquisas e informações técnicas de outras áreas da psicologia e também de outras ciências. A interação
de todos esses elementos provê fontes ricas de
variação das quais o ambiente natural pode
selecionar as práticas que definirão a análise
do comportamento no futuro.
NOTA DO AUTOR
Uma versão deste capítulo foi apresentada em um colóquio na Universidade de Brasília,
em janeiro de 2003, como parte das comemorações do quadragésimo aniversário do Instituto de Psicologia. Agradeço a Lincoln Gimenes
pelos úteis comentários sobre a versão inicial
e pela tradução do capítulo para a língua portuguesa.
REFERÊNCIAS BIBLIOGRÁFICAS
Bachrach, A. J. (1962). Psychological research: An introduction. New York: Random House.
Baer, D. M. (1991). Tacting “to a fault”. Journal of Applied
Behavior Analysis, 24, 429-431.
Baer, D. M.; Wolf, M. M.; Risley, T. R. (1968). Some
current dimensions of applied behavior analysis. Journal of Applied Behavior Analysis, 1, 91-97.
Baron, A.; Perone, M. (1982). The place of the human
subject in the operant laboratory. The Behavior Analyst,
5, 143-158.
Baum, W. M. (1994). Understanding behaviorism:
Science, behavior, and culture. New York: HarperCollins.
Bernard, C. (1957). An introduction to the study of experimental medicine (H. C. Green, Trad.). New York:
Dover (Obra original publicada em 1865).
Branch, M. (1984). Rate dependency, behavioral
mechanisms, and behavioral pharmacology. Journal of
the Experimental Analysis of Behavior, 42, 511-522.
Cardwell, D. (1994). The Fontana history of technology.
London: Fontana.
Dinsmoor, J. A. (2001). Stimuli inevitably generated
by behavior that avoids electric shock are inherently
25
reinforcing. Journal of the Experimental Analysis of
Behavior, 75, 311-333.
Epling, W. F.; Pierce, W. D. (1986). The basic importance of applied behavior analysis. The Behavior Analyst,
9, 89-99.
Hake, D. F. (1982). The basic-applied continuum and
the possible evolution of human operant social and verbal research. The Behavior Analyst, 5, 21-28.
Hawkins, R. P.; Anderson, C. L. (2002). On the distinction between science and practice: A reply to Thyer and
Adkins. The Behavior Analyst, 25, 115-119.
Hayes, S. C. (1978). Theory and technology in behavior
analysis. The Behavior Analyst, 1, 25-33.
Johnston, J. M. (1996). Distinguishing between applied
research and practice. The Behavior Analyst, 19, 35-47.
Krantz, D. L. (1971). The separate worlds of operant
and non-operant psychology. Journal of Applied
Behavior Analysis, 4, 61-70.
Kuhn, T. S. (1971). The structure of scientific revolutions.
Chicago: University of Chicago Press.
Lattal, K. A. (2001). The human side of animal behavior.
The Behavior Analyst, 24, 147-161.
Lattal, K. A.; Laipple, J. (no prelo). Pragmatism and
behavior analysis. Em K. A. Lattal,; P. N. Chase (Eds.),
Behavior theory and philosophy. New York: Kluwer/
Plenum.
Lattal, K. A.; Neef, N. A. (1996). Recent reinforcement
schedule research and applied behavior analysis.
Journal of Applied Behavior Analysis, 29, 213-230.
Mace, F. C. (1994). Basic research needed for stimulating the development of behavioral technologies.
Journal of the Experimental Analysis of Behavior, 61,
529-550.
Morris, C. (1970). The pragmatic movement in American
philosophy. New York: Braziller.
Moxley, R. D. (1989). Some historical relationships
between science and technology with implications for
behavior analysis. The Behavior Analyst, 12, 45-57.
Moxley, R. D. (2001). Sources for Skinner’s pragmatic
selectionism in 1945. The Behavior Analyst, 24, 201212.
Neef, N. A.; Peterson, S. M. (no prelo). Developmental
disabilities: Scientific inquiry and interactions in behavior analysis. Em K. A. Lattal,; P. N. Chase (Eds.), Behavior theory and philosophy. New York: Kluwer/Plenum.
Pennypacker, H. (1986). The challenge of technology
transfer: Buying in without selling out. The Behavior
Analyst, 9, 147-156.
Perone, M. (1985). On the impact of human operant
research: Asymmetrical patterns of cross-citation
between human and nonhuman research. The Behavior
Analyst, 8, 185-189.
Petroski, H. (1992). The evolution of useful things. New
York: Vintage.
Poling, A.; Alling, K.; Fuqua, R. W. (1994). Self- and
cross-citations in the Journal of Applied Behavior
Analysis and the Journal of the Experimental Analysis
of Behavior: 1983-1992. Journal of Applied Behavior
Analysis, 27, 729-731.
26
ABREU-RODRIGUES, RIBEIRO & COLS.
Reese, H. W. (1996). How is physiology relevant to
behavior analysis? The Behavior Analyst, 19, 61-70.
Ribeiro, A. de F. (1989). Correspondence in children’s
self-report: Tacting and manding aspects. Journal of
the Experimental Analysis of Behavior, 51, 361-368.
Schaal, D. (no prelo). Explanatory reductionism in
behavior analysis. Em K. A. Lattal; P. N. Chase (Eds.),
Behavior theory and philosophy. New York: Kluwer/
Plenum.
Sidman, M. (1986). Functional analysis of emergent
verbal classes. Em T. Thompson,; M. D. Zeiler (Eds.),
Analysis and integration of behavioral units (p. 213-245).
Hillsdale, NJ: Erlbaum.
Skinner, B. F. (1953). Science and human behavior. New
York: Free Press.
Skinner, B. F. (1956). A case history in scientific method.
American Psychologist, 11, 221-233.
Skinner, B. F. (1960). Pigeons in a pelican. American
Psychologist, 15, 28-37.
Skinner, B. F. (1974). About behaviorism. New York:
Knopf.
Skinner, B. F. (1981). Selection by consequences.
Science, 213, 501-504.
Skinner, B. F. (1987). Upon further reflection. Englewood
Cliffs, NJ: Prentice-Hall.
Skinner, B. F.; Heron, W. T. (1937). Effects of caffeine
and benzedrine upon conditioning and extinction.
Psychological Record, 1, 340-346.
Smith, L. D. (1992). B. F. Skinner and the technological
ideal of science. American Psychologist, 47, 216-223.
Thompson, T. (1984). The examining magistrate for
nature: A retrospective review of Claude Bernard’s An
Introduction to the Study of Experimental Medicine.
Journal of the Experimental Analysis of Behavior, 41,
211-216.
Ullman, L. P.; Krasner, L. (1965). Case histories in
behavior modification. New York: Holt, Rinehart, and
Winston.
White, M. (2002). Acid tongues and tranquil dreamers.
New York: Perennial.
ANÁLISE DO COMPORTAMENTO
OPERAÇÕES ESTABELECEDORAS:
UM CONCEITO DE MOTIVAÇÃO
27
2
RACHEL NUNES DA CUNHA
GEISON ISIDRO-MARINHO
O emprego do conceito de motivação
como termo técnico da psicologia requer precisão seja qual for o referencial teórico e metodológico utilizado, de modo a dirimir a ambigüidade que o termo encerra na linguagem
coloquial.
Historicamente, as variáveis motivacionais têm sido consideradas como determinantes da ação humana, aspecto que manteve o
conceito de motivação como um tópico vigente na psicologia. O que torna esse tema fascinante e desafiador para os psicólogos é compreender a que esse conceito se refere no amplo arcabouço teórico, conceitual e metodológico da psicologia. A questão fundamental está
no tratamento e na descrição das variáveis
controladoras do comportamento. Análises sobre o papel da motivação na explicação do comportamento têm conduzido a várias concepções
teóricas e metodológicas que refletem os esforços da psicologia para elucidar uma pergunta básica: por que os homens comportam-se
da maneira como o fazem? O estudo do tópico
de motivação nos conduz à discussão sobre a
natureza das variáveis motivacionais que têm
sido caracterizadas tanto como processos internos quanto como eventos do ambiente externo. Essas diferenças ocorrem porque a psicologia apresenta diversidades na definição de
seu objeto de estudo, de sua metodologia e de
seus pressupostos epistemológicos. Para os analistas do comportamento, as variáveis motivacionais são variáveis ambientais.
Um fator complicador é que “motivação”,
como um termo da linguagem coloquial, pode
apresentar ambigüidades pelas várias acepções
do verbete na língua portuguesa. O dicionário
eletrônico do Instituto Antônio Houaiss (2001)
da língua portuguesa traz o verbete motivação
como um substantivo feminino, e na acepção
de “ato ou efeito de motivar”, o verbete é definido em termos jurídico, lingüístico e semiótico e psicológico. Na rubrica da psicologia,
apresenta como significado um “conjunto de
processos que dão ao comportamento uma intensidade, uma direção determinada e uma
forma de desenvolvimento próprias da atividade individual”. Tal definição é apresentada
no referido dicionário como:
1. motivação altruísta, aquela “que
considera ou favorece o bem-estar
de outrem”;
2. motivação de eficácia, aquela relacionada à competência (capacidade). O dicionário indica como sinônimo e variantes a consulta do verbete “causa”.
Douglas Mook, em seu livro Motivation –
The organization of action (edição de 1987), preocupa-se com a forma como as diferentes abordagens do conceito de motivação têm sido apresentadas. Refere-se, por exemplo, às controvérsias e às questões teóricas que, às vezes, são apresentadas uma em oposição à outra, a exemplo
de impulsos versus instintos (padrões-fixos-deação), impulso animal versus teorias cognitivas,
pesquisa com humanos versus com organismos
não-humanos. Para Mook, esse modo de com-
28
ABREU-RODRIGUES, RIBEIRO & COLS.
paração pode levar-nos a negligenciar algumas
possibilidades de interface que, por exemplo, as
pesquisas com organismos não-humanos e humanos têm, como nos tópicos sobre fome, sede,
afeiçoamento ou simpatia e desamparo. Não
podemos negar essas divergências e devemos
ter o cuidado para não pôr uma teoria contra
outra, porque poderemos cometer erros de natureza lógica, epistemológica e conceitual. Talvez o maior equívoco seja perder as possibilidades de interface entre diferentes concepções que
podem proporcionar uma visão nova ou um melhoramento – ou maior esclarecimento – do conceito de motivação com todo o rigor que a pesquisa exige para descaracterizar o uso coloquial do termo motivação.
O conceito de motivação passou por várias acepções ao longo do tempo – tais como
instinto, impulso e a retomada do conceito de
instinto pelos etologistas –, mas, sem dúvida alguma o termo impulso foi o que teve maior impacto. Esse impacto é refletido, por exemplo,
na postura dos analistas do comportamento ao
definir o conceito de motivação sem fazer referência ao termo impulso, de modo a dissipar a
base mentalista ou organísmica que o termo
recebeu dos behavioristas metodológicos, como,
por exemplo, Clark Hull (1884-1952).
Quando o conceito de impulso tinha um
status fortemente mentalista ou organísmico,
Skinner, em seu livro publicado em 1938, The
behavior of organisms – An experimental
analysis, dedicou dois capítulos a este conceito (Capítulo 9 – “Drive” e Capítulo 10 – “Drive
and conditioning: The interactions of two variables”), nos quais fornece uma abordagem
essencialmente objetiva sobre o tópico. Segundo Skinner, o problema que temos com o conceito de impulso é a natureza causal de propriedades internas que foi atribuída a essa variável. Skinner (1938, 1953/2000) trata a motivação em termos de operações de privação,
saciação e estimulação aversiva, enfatizando
essas operações como variáveis ambientais
controladoras do comportamento.
Skinner (1938, 1953/2000), posteriormente Keller e Schoenfeld (1950/1974),
Millenson (1967) e Millenson e Leslie (1979)
referem-se ao termo impulso como um evento
do meio ambiente, ou seja, como a descrição
de uma operação que pode ser executada sobre o organismo (p. ex.: privá-lo de alimento,
aumentar a temperatura do ambiente acima
das condições adequadas de adaptação e conforto). Verificamos, portanto, que a questão
crucial que gera as divergências na definição
do termo motivação está na concepção da causalidade do comportamento dos organismos.
Skinner (1953/2000, p. 24) abordou os termos causa e efeito em ciência a partir de uma
relação funcional, uma causa foi definida como
“uma mudança em uma variável independente” e um efeito foi definido como “uma mudança em uma variável dependente”. Dessa
forma, para ele, a relação de “causa e efeito”
foi transformada em uma relação funcional.
Para descrever uma relação funcional entre o
organismo e o ambiente, Skinner desenvolveu
um instrumento conceitual que se tornou a ferramenta básica do analista do comportamento: as contingências de reforço.
Para garantir a especificidade de um termo, na acepção psicológica faz-se necessário
um conjunto de ferramentas intelectuais e experimentais, constituído de conceitos básicos
e de princípios que norteiem uma análise sistemática e funcional do comportamento. Essa
exigência está presente na abordagem analítico-comportamental do conceito de motivação,
denominada de Operações Estabelecedoras.
OPERAÇÕES ESTABELECEDORAS
O termo operações estabelecedoras, como
um conceito de motivação, será abordado, considerando os aspectos históricos, metodológicos
e teóricos das pesquisas básica e aplicada.
Considerações históricas
Keller e Schoenfeld (1950/1974) enfatizaram a necessidade de se conceituar a motivação como variáveis ambientais controladoras do comportamento de forma a evitar o
conceito de impulso como variável interna, conforme defendido pelos behavioristas metodológicos, e de acordo com o empreendimento
científico de Skinner denominado de Análise
ANÁLISE DO COMPORTAMENTO
Experimental do Comportamento. Keller e
Schoenfeld chamavam a atenção dos analistas
do comportamento para outros eventos
ambientais, além dos eventos reforçadores, ao
se fazer uma análise de contingências. O aspecto ressaltado nessa advertência refere-se ao
fato de que para um objeto funcionar eficazmente como reforçador, faz-se necessário que
um outro evento ambiental estabeleça sua eficácia. Assim, Keller e Schoenfeld introduziram
o conceito de operação estabelecedora para
identificar esses eventos ambientais e demonstrar sua função motivacional.
Ao empregarem o termo operação estabelecedora (primeiro uso do termo) para definir
a motivação na abordagem analítico-comportamental, Keller e Schoenfeld (1950/1974)
demonstraram que podemos tratar a variável
motivacional como uma variável independente, que pode ser manipulada de maneira experimental. Definir motivação como operações
estabelecedoras implica poder executar certas
operações sobre o organismo (p. ex.: privá-lo
de alimento), as quais têm como efeitos uma
mudança momentânea da efetividade de um
evento como reforçador e uma mudança momentânea da freqüência de qualquer comportamento que tenha sido seguido por esse evento
reforçador.
Keller e Schoenfeld (1950/1974) preocuparam-se em definir o termo impulso não como
estímulo nem como resposta, usando-o como
um recurso de linguagem para descrever um
conjunto de relações. Por exemplo, impulso não
poderia ser confundido com estímulos internos (câimbras estomacais que acompanham a
privação de alimento). Esses estímulos são
discriminativos para a resposta verbal “tenho
fome” (operante verbal – tato). O impulso também não poderia ser confundido com uma resposta produzida pela operação de privação, por
exemplo, o comportamento de comprar um
lanche. Para Keller e Schoenfeld, o impulso
seria mais adequadamente definido como um
conjunto de relações entre o organismo e o ambiente – operações estabelecedoras.
Ao lidar com o conceito de motivação,
Millenson (1967) e Millenson e Leslie (1979)
também enfatizaram o papel das variáveis
ambientais. Para eles, a motivação correspon-
29
deria a operações de impulso, as quais teriam
a função de alterar o valor dos reforçadores.
Esses autores classificaram em dois tipos as
operações de impulso: “(1) uma [operação]
que tem a função de reduzir ou eliminar o valor reforçador (saciação) e (2) outra que trabalha para aumentar o valor dos reforçadores
(privação)” (Millenson, 1967, p. 366).
Preocupado também com a precisão dos
conceitos e com a forma de enunciar relações
funcionais que abrangem interações do indivíduo com o ambiente, Michael (1982, 1993)
retomou o conceito de operação estabelecedora, proposto por Keller e Schoenfeld (1950/
1974), para definir motivação na análise do
comportamento. Em sua análise, Michael
incluiu as variáveis motivacionais aprendidas
que não foram explicitamente tratadas por
Skinner (1938, 1953/2000), Keller e Schoenfeld (1950/1974), Millenson (1967) e Millenson
e Leslie (1979), os quais se limitaram a discutir
as variáveis motivacionais filogeneticamente
determinadas (da Cunha, 1993). Michael fez
uma importante contribuição para a análise do
comportamento, ao estabelecer um novo instrumento conceitual e metodológico, caracterizado como operações estabelecedoras aprendidas, com implicações para as pesquisas básica e aplicada (da Cunha, 1993, 1995; Iwata,
Smith, e Michael, 2000; Sundberg, 1993).
Skinner não utilizou o termo operação
estabelecedora para tratar do conceito de motivação, tratando-o em termos de privação/
saciação e estimulação aversiva. Por outro lado,
pode-se dizer que Skinner (1938, 1953/2000),
Keller e Schoenfeld (1950/1974), Millenson
(1967) e Millenson e Leslie (1979) deram o
mesmo tratamento para as variáveis motivacionais como controladoras do comportamento,
ou seja, as variáveis motivacionais foram tratadas como variáveis ambientais (da Cunha,
1993, 1995, 2000).
Definição
Michael (1993) define uma operação
estabelecedora como uma variável ambiental
em função de seus dois principais efeitos, denominados de efeito estabelecedor do reforço
30
ABREU-RODRIGUES, RIBEIRO & COLS.
e efeito evocativo. O efeito estabelecedor do
reforço é caracterizado pela alteração momentânea da efetividade reforçadora de algum
objeto, evento ou estímulo; o efeito evocativo,
por sua vez, é caracterizado pela alteração
momentânea da freqüência de um tipo de comportamento que tem sido reforçado por aquele
objeto, evento ou estímulo. É importante enfatizar que a definição do conceito é feita a
partir dos efeitos que a variável motivacional
exerce sobre o comportamento do organismo (da Cunha, 1993, 1995, 2002; Keller e
Schoenfeld, 1950/1974; Michael, 1993, 2000).
Uma operação estabelecedora é um
evento ambiental que está correlacionado
filogenética e ontogeneticamente com a eficácia do reforço ou da punição e que evoca
ou suprime um tipo de comportamento que
tenha sido reforçado ou punido por esse evento (privação ou saciação são exemplos de operações estabelecedoras). Skinner (1953/
2000) cita alguns exemplos de efeitos sobre o
comportamento exercidos por essas operações
estabelecedoras: (a) restringindo-se a ingestão
de água (privação), pode-se aumentar a probabilidade de uma criança beber leite; (b) servindo-se grandes quantidades de pão de boa
qualidade antes do jantar (saciação), pode-se
diminuir a probabilidade de um cliente reclamar da pequena quantidade de comida servida no jantar.
Refinamento do conceito
de operações estabelecedoras
Michael (1982) tratou o conceito de motivação como estímulo estabelecedor (SE), o
qual teria a função de modificar a efetividade
de um outro estímulo como reforçador e de
evocar um tipo de comportamento que tenha
sido reforçado por aquele estímulo. Em 1993,
o termo estímulo estabelecedor foi substituído
pelo termo operação estabelecedora como uma
forma genérica de se referir à variável motivacional. A partir da classificação de dois tipos
de operações estabelecedoras e da efetivação
de uma taxonomia comportamental, Michael
sistematizou o conceito de motivação.
As operações estabelecedoras de privação
e saciação trabalham em direções opostas. A
privação de algum objeto implica um período
de tempo de acesso restrito a esse objeto, seja
ele alimento, água ou qualquer outra condição de estímulo, como, por exemplo, interações
sociais. Entretanto as operações ambientais que
trabalham na direção oposta da privação podem variar para um ou outro estímulo e, assim, o termo saciação pode não ser útil. Portanto, Michael (2000) propõe um refinamento conceitual da terminologia motivação, introduzindo o termo operações abolidoras para
fazer referência àquelas operações ambientais
que suprimem a efetividade de um evento
reforçador e a ocorrência de comportamentos
que tenham sido reforçados por esse evento
reforçador.
Classificação
Michael (1993) propôs a classificação
das operações estabelecedoras em duas categorias:
Operações estabelecedoras incondicionadas
São de origem filogenética e variam de
espécie para espécie. Os efeitos de alteração
da eficácia do reforço que esse tipo de operação estabelecedora produz abrangem eventos
ou estímulos reforçadores incondicionados, por
isso Michael denominou essas operações de
operações estabelecedoras incondicionadas.
Nascemos com a capacidade de termos nossos
comportamentos reforçáveis por alimentos ou
pela cessação ou redução de estímulos aversivos, sendo que determinados aspectos do
ambiente podem aumentar ou reduzir a eficácia desses reforços. Embora esses reforços sejam incondicionados, o comportamento evocado por uma operação estabelecedora incondicionada (verificado pelo efeito evocativo) é
sempre aprendido. Por exemplo, a privação de
água torna a água mais efetiva como forma de
reforçador para os mamíferos, como resultado
dessa operação, sem que haja história de apren-
ANÁLISE DO COMPORTAMENTO
dizagem. Porém o repertório comportamental
para adquirir água é sempre aprendido por
esses organismos.
A seguir, apresentamos exemplos de operações estabelecedoras incondicionadas e seus
respectivos efeitos:
1. Saciação de alimento. Esta operação
tem como efeito estabelecedor do reforço a diminuição, momentânea, da
eficácia do alimento como reforçador e, como efeito evocativo, a diminuição, momentânea, da freqüência de qualquer tipo de comportamento que tenha sido reforçado por
algum alimento. Por exemplo, em
uma refeição, comer do prato principal até a saciação pode diminuir a
eficácia reforçadora da sobremesa e
suprimir a freqüência do comportamento de consumo desta.
2. Privação de alimento. Esta operação
tem como efeito estabelecedor do reforço, o aumento momentâneo da
eficácia do alimento como evento
reforçador, e seu efeito evocativo é
demonstrado pelo aumento, também momentâneo, de qualquer tipo
de comportamento que tenha sido
reforçado por alimento. Privando
um indivíduo de alimento, por
exemplo, pode-se alterar a eficácia
reforçadora do alimento e aumentar a freqüência do comportamento
de preparar um lanche.
3. Aumento da temperatura. Esta operação quando está acima do nível
normal das condições de adaptação
e de conforto tem como efeito estabelecedor do reforço a diminuição
do nível da temperatura como um
evento reforçador eficaz. O efeito
evocativo é verificado pelo aumento momentâneo da freqüência de
qualquer comportamento que tenha
sido reforçado pela diminuição do
nível da temperatura. Um exemplo
seria ligar o ventilador em um dia
de calor insuportável.
31
4. Diminuição da temperatura. Esta
operação quando está abaixo do nível normal das condições de adaptação e de conforto tem como efeito
estabelecedor do reforço o aumento do nível da temperatura como um
evento reforçador eficaz. O efeito
evocativo é verificado pelo aumento momentâneo da freqüência de
qualquer comportamento que tenha
sido reforçado pelo aumento do nível da temperatura (p. ex.: ligar o
ar quente do carro na presença de
uma temperatura muito baixa).
5. Estimulação dolorosa. Esta operação
tem como efeito estabelecedor do reforço o aumento da eficácia momentânea da cessação ou da remoção do
estímulo doloroso, e o efeito evocativo é demonstrado pelo aumento
momentâneo de qualquer tipo de
comportamento que tenha sido reforçado pela cessação ou pela remoção da estimulação dolorosa (p. ex.:
tomar um analgésico em função de
uma forte dor de cabeça).
Michael (1993) identificou nove tipos
de operações estabelecedoras incondicionadas, a saber: estimulação dolorosa; diminuição da temperatura abaixo das condições
de adaptação e de conforto, aumento da temperatura acima das condições de adaptação
e de conforto; variáveis relacionadas ao
reforçamento do comportamento sexual. Os
outros cinco tipos de operações estão relacionados às operações de privação e de
saciação de água, de alimento, de oxigênio,
de atividade e de sono.
Operações estabelecedoras condicionadas
São de origem ontogenética e, portanto,
relacionadas à história de reforçamento de cada
organismo. A distinção entre as operações
estabelecedoras incondicionadas e as condicionadas é feita com base no efeito estabelecedor do reforço, pois o evento reforçador
32
ABREU-RODRIGUES, RIBEIRO & COLS.
pode ser inato ou aprendido. No que concerne
às operações estabelecedoras condicionadas,
elas têm recebido maior atenção dos pesquisadores na tarefa de demonstração empírica e
foram classificadas por Michael (1993) em três
tipos:
1. Operação estabelecedora condicionada substituta. Esta operação referese a uma relação simples, envolvendo uma correlação temporal de um
evento, previamente neutro, que sistematicamente antecede uma operação estabelecedora incondicionada ou condicionada e, como resultado desse emparelhamento, aquele evento neutro adquire a característica motivacional da operação
estabelecedora com a qual fora emparelhado (adquire suas funções
evocativas e funções de estabelecimento do valor do reforço). Por
exemplo, ao emparelhar uma luz
(estímulo neutro para a função motivacional) com a redução de temperatura (operação estabelecedora
incondicionada), seria esperado que
a luz adquirisse não só as funções
respondentes (eliciadoras) ou reforçadoras/punitivas, como também as
funções motivacionais da redução
da temperatura. A presença dessa
luz deveria estabelecer o aumento
da temperatura como uma forma eficaz de reforçamento e evocar qualquer tipo de comportamento que
tenha sido reforçado pelo aumento
da temperatura.
2. Operação estabelecedora condicionada reflexiva. Esta envolve uma relação mais complexa em que um evento ou estímulo sistematicamente
precede alguma forma de estimulação aversiva e, se esse estímulo é
removido antes da ocorrência da
estimulação aversiva, a estimulação
aversiva deixa de ocorrer. Os procedimentos de esquiva sinalizada são
exemplos desse tipo de operação
estabelecedora. De acordo com
Michael (1993), o evento ou estímulo sinalizador da esquiva funciona
como uma variável motivacional do
tipo condicionada reflexiva, e não
como um estímulo discriminativo,
como enfatiza a literatura sobre esquiva sinalizada (ver o Capítulo 7
para uma discussão detalhada do
papel do estímulo sinal na esquiva).
A denominação condicionada reflexiva para esse tipo de operação devese ao fato de que o próprio estímulo
antecedente motivacional adquire a
capacidade de estabelecer sua própria remoção como uma forma efetiva de reforçador condicionado e
evoca qualquer tipo de comportamento que tenha produzido a supressão desse estímulo reforçador
condicionado. Por exemplo, a luz do
painel de um automóvel que indica
a quantidade de combustível disponível no tanque possui as propriedades motivacionais de uma operação estabelecedora condicionada reflexiva. Essa luz acesa, aviso de que
o combustível está na reserva, estabelece a sua remoção como uma forma de reforço efetivo, pois sua presença esteve pareada com a aversividade de ter o automóvel sem gasolina. Além disso, evoca o comportamento de abastecer o carro, o qual
tem sido reforçado pela remoção da
luz acesa.
3. Operação estabelecedora condicionada transitiva. Esta operação é a relação mais complexa e foi relacionada
por Michael (1993) com o conceito
de reforçador condicionado condicional. A efetividade de muitas
formas de reforçadores positivos
condicionados podem depender de
uma condição de estímulo antecedente (operação estabelecedora condicionada transitiva), na qual esses
reforçadores positivos condicionados tiveram sua eficácia estabelecida. O estabelecimento da eficácia
desses reforçadores depende de uma
ANÁLISE DO COMPORTAMENTO
história individual do organismo.
Por exemplo, um aparelho de telefone público é ocasião para o comportamento de fazer uma ligação telefônica. Porém, em relação ao cartão telefônico, o aparelho funciona
como uma operação estabelecedora
condicionada transitiva porque estabelece o cartão como uma forma
efetiva de reforço e evoca o comportamento de procurá-lo na carteira.
A demonstração empírica desse tipo
de operação estabelecedora tem recebido atenção de alguns pesquisadores com trabalhos publicados
(McPherson e Osborne, 1968; 1988)
e de outros pesquisadores com trabalhos não-publicados (McPherson,
Trapp e Osborne, 1984; Osborne e
Mcpherson, 1986; Alling, 1990; da
Cunha, 1993 – estes dois últimos
citados em da Cunha, 1995). Essas
demonstrações empíricas têm utilizado pombos como sujeitos experimentais e têm, de certa forma, demonstrado, com algum sucesso, o
desenvolvimento de procedimentos
experimentais para investigar operações estabelecedoras condicionadas transitivas como uma variável
ambiental e uma variável motivacional controladora do comportamento. Nesses procedimentos têm
sido difícil distinguir a função motivacional de um evento ambiental (a
suposta operação estabelecedora
condicionada transitiva) de sua
função discriminativa, caracterizando assim, como aspecto fundamental dessa linha de pesquisa, o desenvolvimento de procedimentos
que nos permitam demostrar empiricamente essa distinção. Surge, assim, uma nova área de investigação na análise experimental do
comportamento que possibilita aos
analistas do comportamento estudar a motivação como uma variável independente e não apenas
contextual (da Cunha, 1993; 1995;
33
2000; Iwata, Smith e Michael,
2000; Sundberg, 1993).
Relação entre os conceitos de operação
estabelecedora (OE) e de estímulo
discriminativo (SD)
Os conceitos de operação estabelecedora
e de estímulo discriminativo estão relacionados, pois ambos são eventos antecedentes ao
comportamento e têm, de forma diferenciada,
implicações com a conseqüência. A análise funcional do comportamento tem sido, geralmente, realizada com ênfase no SD e, conseqüentemente, a unidade de análise utilizada tem sido
a contingência de três termos. Para se fazer
uma análise funcional mais adequada do comportamento, considerando as funções motivacionais e discriminativas dos estímulos antecedentes, faz-se necessário incluir a OE como
um quarto elemento da contingência. A inclusão de mais um termo na relação de contingência implica a necessidade de distinção das
funções discriminativa e motivacional do estímulo antecedente. Nesse sentido, o conceito
de SD é fundamental para a compreensão e para
a demonstração empírica do conceito de OE.
Os estímulos discriminativos são, em geral, denominados como sinais ou pistas para
uma determinada ação, à medida que sinalizam as ocasiões em que as respostas terão certas conseqüências e, portanto, ocasionam comportamento. O conceito de SD tem sido correlacionado às condições antecedentes que são
ocasião para a resposta levando-se em consideração apenas a condição em que uma dada
resposta será reforçada. Michael (1982), entretanto, retoma o conceito de SD enfatizando
as suas duas condições de estímulo: uma condição de estímulo SD, em que, dada a efetividade de um evento como reforçador, a ocorrência de um determinado comportamento será
seguida pelo reforço; e uma condição de estímulo SΔ, em que, dada a efetividade daquele
evento reforçador, a ocorrência desse mesmo
comportamento não será reforçada. Isto é, o
conceito de SD envolve uma história específica
de treino discriminativo com duas condições
de estímulos antecedentes relacionadas à dis-
34
ABREU-RODRIGUES, RIBEIRO & COLS.
ponibilidade diferencial de reforçamento
(Michael, 1993). Como resultado do treino
discriminativo, o SD evoca um dado comportamento com uma história de reforçamento diante desse estímulo, enquanto o SΔ não evoca o
mesmo comportamento. Em resumo, o SD apresenta uma função evocativa sobre o comportamento devido a uma história de correlação temporal com o reforço.
Em uma dada situação experimental, por
exemplo, a função evocativa do SD pode ser claramente observada. Em uma caixa operante,
equipada com uma barra, um bebedouro e uma
lâmpada localizada acima da barra, um rato
privado de água é submetido ao treino discriminativo. Quando a lâmpada acima da barra
está acesa (presença de luz), as respostas de
pressão à barra são seguidas por água como
reforço. Por outro lado, quando a lâmpada está
apagada (ausência de luz), nenhuma conseqüência é dada ao mesmo comportamento do
animal. Após algumas exposições a essas condições, o rato exibe o comportamento de pressão à barra apenas na presença da luz. Diante
da luz como condição de estímulo SD, o comportamento de pressão à barra é reforçado e,
portanto, quando a luz está presente o comportamento é evocado. Diante da ausência de
luz (condição de estímulo SΔ), o comportamento de pressão à barra não é exibido, pois não
há uma história de reforçamento por água nessa condição.
O conceito de OE, no entanto, está relacionado à efetividade do evento reforçador.
Para Michael (1993), a OE como condição de
estímulo antecedente altera momentaneamente a efetividade de um reforço e evoca comportamentos relacionados historicamente com
esse reforço. A privação de água, por exemplo,
altera a efetividade reforçadora da água, e qualquer comportamento que a produza é fortalecido. Na situação experimental anteriormente
citada, a privação alterou o valor da água como
reforço, que ao seguir o comportamento de
pressão à barra passou a selecioná-lo. Por outro lado, além de estabelecer o valor do reforço, a OE evoca o comportamento de pressão à
barra, pois há uma relação histórica entre aquele comportamento e o reforço, cuja efetividade
é estabelecida pela privação.
Semelhantemente ao SD, a OE possui a
função evocativa do comportamento, que, por
vezes, é confundida com a função evocativa
do SD. O que diferencia as referidas condições
de estímulo antecedente é a função estabelecedora do reforço, a qual é apresentada somente pela OE. Essa função é imprescindível
para que, em um treino discriminativo, o SD
adquira a função evocativa. No exemplo anterior, o controle discriminativo só foi possível porque havia um reforço efetivo – água –
e assim o comportamento de discriminar entre a ausência e a presença de luz foi observado. Nesse sentido, pode-se verificar que a OE
aumentou a efetividade evocativa do SD, o
que, para Michael (1993), seria um terceiro
efeito da OE.
A privação como OE tem uma função
motivacional, e a presença da luz (SD) tem uma
função discriminativa. Em situações laboratoriais, a clareza na distinção da OE e do SD
requer mais estudos empíricos. Em situações
aplicadas, essa distinção é obscurecida, algumas vezes, por variáveis como, por exemplo, a
história de vida particular do organismo. Considerar a história do organismo é considerar
as relações das quais resultam as operações
estabelecedoras condicionadas (OEC). Diante
dessas condições, a distinção de uma OEC e
um SD pode tornar-se difícil.
No seguinte contexto aplicado, por exemplo, qual seria a função antecedente de um
pneu furado de um automóvel para o comportamento de trocá-lo ou de procurar por uma
borracharia? Em um primeiro momento, podese considerar essa condição de estímulo como
sendo SD, pois é a ocasião para trocar o pneu
pelo estepe. Entretanto o pneu furado altera a
efetividade reforçadora do estepe e de todos
os objetos (ferramentas) relacionados com a
ação de trocar o pneu, bem como de qualquer
placa de sinalização que indique a presença de
borracharia – função motivacional. Nesse caso,
o pneu furado funciona como uma operação
estabelecedora condicionada transitiva que estabelece o valor reforçador condicionado de
alguns estímulos. A consideração precipitada
apenas da função evocativa do pneu furado
implicaria o equívoco de deixar de lado a função motivacional que essa condição de estímulo
ANÁLISE DO COMPORTAMENTO
tem sobre a definição de certos objetos como
reforçadores.
Outro exemplo a ser considerado na distinção da OE e do SD consiste nos procedimentos de esquiva sinalizada. Um rato na caixa
experimental recebe choques (Ss aversivos) em
um intervalo de tempo variável de um minuto
(VT 1 min). Antes da apresentação de cada choque, um som é apresentado. Ao pressionar a
barra, o animal interrompe a apresentação do
som e do choque. No entanto, se a pressão à
barra ocorrer na presença do som apenas, essa
resposta pode prevenir a apresentação do estímulo aversivo (choque). Nesse procedimento,
o som e o choque são considerados operações
estabelecedoras reflexivas condicionada e
incondicionada, respectivamente, e não estímulos discriminativos (Michael, 1993).
O som, ao ser apresentado junto com o
choque, adquire as funções necessárias para
que sua presença evoque respostas de evitação. Para ser considerado um SD, a situação
experimental deveria possuir uma condição
de estímulo análoga à condição SΔ. Na presença do som, a resposta de esquiva é evocada,
pois há uma conseqüência reforçadora imediata – a eliminação do som. Supondo um
paralelo com a situação de SΔ, a ausência do
som impossibilita o reforçamento negativo por
sua própria remoção – “a efetividade do reforçador negativo depende diretamente da
presença do estímulo aversivo condicionado”
(Miguel, 2000, p. 262), ou seja, depende da
presença do som. O mesmo ocorre na situação de fuga do choque em que o reforçador
negativo só se torna efetivo quando o choque
está presente. Na ausência do estímulo aversivo (suposto SΔ), não há reforço negativo,
portanto não há reforço efetivo. Nesse sentido, o choque não é um SD. Tanto o som quanto o choque estabelecem sua própria remoção como formas de reforço efetivo e evocam
comportamentos que tenham uma relação
histórica com esses reforços e, assim sendo,
devem ser identificados como OEs.
Paralelamente à situação experimental,
no contexto aplicado, a distinção entre SD e
OE em situações de esquiva também é possível. Nos Transtornos de Ansiedade, como o
Transtorno Obsessivo-Compulsivo (TOC), por
35
exemplo, observa-se uma pessoa emitir inúmeras vezes uma série de comportamentos com
função de esquiva, como lavar as mãos, o verificar o fechamento do registro do botijão de
gás e conferir o fechamento de portas e de janelas. As condições dos estímulos antecedentes a esses comportamentos (p. ex.: mãos sujas ou algum tempo sem contato com água e
sabão, registro de gás aberto, portas e janelas
abertas ou destrancadas ou qualquer outra
condição relacionada ao comportamento obsessivo) não são SD para as respostas ditas compulsivas. Essas condições de estímulo são operações estabelecedoras condicionadas reflexivas que estabelecem a efetividade reforçadora
das conseqüências do comportamento compulsivo, semelhantemente à presença do som ou
do choque, nas condições laboratoriais. Nesse
caso, supor uma situação análoga à condição
de SΔ é tão inviável quanto na situação experimental anteriormente descrita.
Em resumo, o SD apresenta uma função,
a função evocativa do comportamento ou
discriminativa – na presença do estímulo
discriminativo há o aumento na probabilidade de ocorrência do comportamento por causa de uma história de correlação entre a condição de SD e o reforçamento, e entre a condição de SΔ e o não-reforçamento. Por outro
lado, conforme indicado por Michael (1993),
a OE apresenta quatro diferentes efeitos comuns relacionados à função motivacional.
São eles:
1. Efeito estabelecedor do reforço: uma
OE aumenta momentaneamente a
efetividade reforçadora/punidora
de um estímulo. A privação de água
torna a água um evento reforçador
eficaz.
2. Efeito evocativo/supressivo direto
da OE sobre o comportamento: evocação/supressão imediata da OE
sobre os comportamentos que tenham uma relação histórica com o
reforçador/punidor cuja efetividade
fora alterada em (1). A privação de
água evoca o comportamento de
pressão à barra que tem sido historicamente reforçado por água.
36
ABREU-RODRIGUES, RIBEIRO & COLS.
3. Efeito da OE sobre a efetividade
evocativa/supressiva do SD: aumento na efetividade evocativa/supressiva dos estímulos discriminativos
correlacionados com o reforçador/
punidor em (1). No treino discriminativo, a privação de água aumenta a efetividade evocativa da luz
como SD, pois a luz tem uma correlação com a água.
4. Efeito da OE sobre o reforçamento/
punição condicionado: aumento da
efetividade reforçadora/punidora
de reforçadores/punidores condicionados cuja efetividade depende
de (1). Na seguinte cadeia comportamental – um som – puxar a corrente → luz → pressionar a barra →
água–, o som aumenta a efetividade da luz como reforço condicionado, que tem uma relação histórica com água (reforçador incondicionado) e o som também evoca o comportamento de puxar a corrente, devido a relação dessa resposta com
um reforço efetivo (luz).
Contribuições da pesquisa básica
Da Cunha (1993) identificou e classificou os primeiros procedimentos experimentais
para investigar os efeitos de operações estabelecedoras, realizados no laboratório animal,
enfatizando as operações estabelecedoras condicionadas transitivas. Entre eles temos os apresentados a seguir.
Procedimento de três discos
McPherson e Osborne (1986, 1988) utilizaram um procedimento de tentativa discreta com três discos de respostas para pombos.
Ao início de cada tentativa, o disco da direita
era iluminado. A primeira resposta nesse disco tinha como conseqüência a iluminação do
disco central. Uma vez iluminado o disco central, bicadas no disco da direita não tinham
conseqüências. O disco da esquerda era iluminado em função de um esquema VT. Quando o
disco da esquerda estava iluminado, uma resposta no disco central era reforçada por alimento. Respostas adicionais de bicar o disco
central não tinham conseqüências programadas. O término de cada tentativa ocorria com
o acesso ao alimento, que era seguido por um
intervalo entre tentativas (ITI). Durante o ITI,
todos os discos permaneciam escuros.
O reforço para a resposta de bicar o disco
da direita foi a iluminação do disco central (um
reforço condicionado, estabelecido por sua relação com o alimento). O estímulo antecedente à resposta de bicar o disco da direita foi a
iluminação do disco da esquerda (suposta OEC
transitiva). Quando o disco da esquerda não
estava iluminado, bicar o disco da direita não
estabelecia o valor da iluminação do disco central como reforçador. De acordo com a concepção teórica de Michael (1982, 1993), a iluminação do disco da esquerda deveria funcionar como uma OEC transitiva, por estabelecer
a iluminação do disco central com uma forma
efetiva de reforçador condicionado (efeito
estabelecedor do reforço) e evocar a resposta
de bicar o disco da direita (efeito evocativo).
A efetividade reforçadora do disco central estava condicionada à iluminação do disco da
esquerda. Um efeito eficaz da operação estabelecedora deveria produzir um desempenho que
consistia em esperar a iluminação do disco da
esquerda, então, bicar o disco da direita, cuja
conseqüência imediata era a iluminação do
disco central e, finalmente, bicar o disco central, que resultava em alimento.
McPherson e Osborne (1986) verificaram
que o controle não foi evidente depois de 60
ou mais sessões. Apenas um entre quatro pombos demonstrou o desempenho previsto. No segundo estudo (McPherson e Osborne, 1988)
alterou-se o tempo de iluminação dos discos
do centro e da esquerda, visando a um maior
controle dos estímulos antecedentes. Quando
o disco da esquerda era iluminado, em média
12 s depois da iluminação do disco central, o
controle pela OEC (iluminação do disco da esquerda) sobre a resposta no disco da direita
foi, em geral, muito fraco.
Os experimentos de McPherson e Osborne
(1986, 1988) trouxeram contribuições para o
início das pesquisas experimentais sobre o con-
ANÁLISE DO COMPORTAMENTO
ceito de operações estabelecedoras, pois foram
analisadas as dificuldades que o procedimento de três chaves apresentava. Entre essas dificuldades, há a possibilidade de que as contingências nos três discos permitam uma interpretação de automodelagem de alguns aspectos do desempenho, porque as respostas de
bicar os discos da direita e do centro foram
automodeladas e, uma vez que esses discos foram iluminados, assim permaneciam até o término da tentativa. Outro fator que talvez tenha dificultado a demonstração empírica dos
efeitos da OE foi o fato de a iluminação do disco central (reforço condicionado para a resposta do disco da direita) permanecer até a
obtenção do alimento. Essa situação poderia
reduzir o contato com tentativas sem uso do
disco central quando o disco da esquerda estava escuro. Se a iluminação do disco central fosse estabelecida em alguns segundos, seria possível um maior controle da função motivacional
do disco da esquerda. Essa característica do procedimento também fez com que a suposta OEC
funcionasse como um estímulo discriminativo
para bicar o disco central quando o mesmo estava iluminado antes da condição de OEC.
Procedimento de pedal-e-disco
Alling (1990) utilizou um procedimento
com topografias de respostas diferentes. A resposta de pressionar um pedal produzia um reforço condicionado, e a resposta de bicar um
disco produzia um reforço incondicionado. Esse
procedimento consistia em uma cadeia de duas
respostas: a resposta de pressionar o pedal
produzia a mudança da cor da luz acima do
pedal – de branca para vermelha – (reforço
condicionado), e a resposta de bicar o disco
produzia 3 s de ração para pombos (reforço
incondicionado). Uma única resposta no pedal tinha como conseqüência a apresentação
do reforço condicionado por 5 s (luz do pedal). Uma única resposta no disco da esquerda, na presença da luz vermelha (luz do pedal), produzia alimento por 5 s, dependendo
da condição da iluminação da câmara experimental que deveria funcionar como a suposta
OEC transitiva para a resposta de pressionar o
37
pedal. A luz da câmara apagada foi definida
como ausência da OE. Quatro pombos foram
distribuídos em dois grupos a fim de balancear as condições experimentais: para o Grupo
1, a presença de luz ambiente funcionava como
presença da OEC, e sua ausência funcionava
como ausência da OEC; para o Grupo 2, as
condições experimentais foram invertidas.
Cada tentativa experimental começava com a
condição de não-OEC, sendo a condição de
OEC gerada com base em um esquema de VT
60 s. Quando a condição de OEC começava,
ela permanecia em efeito até a obtenção de
alimento.
O desempenho esperado era não pressionar o pedal até que a condição de OEC (luz
ambiente acesa ou apagada, dependendo do
grupo) estivesse presente, então, a resposta no
pedal produziria a mudança de cor da luz do
pedal de branca para vermelha e, se em 5 s o
pombo bicasse o disco da esquerda, essa resposta seria seguida por 3 s de acesso ao alimento. Todos os quatro pombos desenvolveram o desempenho previsto (em 90% ou mais
das tentativas verificou-se que a resposta no
pedal ocorria na presença da suposta condição de OEC). Na segunda fase – o teste – removeu-se a conseqüência para a resposta no
pedal, de modo que a luz branca estava sempre presente (luz do pedal). Como resultado
dessa mudança, esperava-se que ocorresse a
quebra na cadeia comportamental, o que não
foi observado. A luz da câmara experimental
pode ter funcionado como um estímulo
discriminativo e não como uma OEC para a
resposta no pedal. Supõe-se que a cadeia de
duas respostas tenha funcionado como um
único bloco de resposta, pois um esquema de
razão fixa (FR 1) controlava a resposta de pressionar o pedal e, provavelmente, a resposta no
disco estivesse mais sob o controle da luz da
câmara experimental do que da luz produzida
pela resposta no pedal. Outro aspecto que pode
ter contribuído para esse resultado foi o uso
de dois estímulos visuais, pois a condição de
iluminação (luz/escuro) poderia criar condições de estímulos diferentes quando a luz do
pedal estivesse branca ou vermelha. Por exemplo, a luz vermelha acima do pedal poderia ser
caracterizada como uma condição de estímulo
38
ABREU-RODRIGUES, RIBEIRO & COLS.
diferente se a câmara operante estivesse iluminada ou escura. A terceira fase consistiu em
retomar as condições experimentais da primeira fase para se verificar a recuperação da resposta sob as duas condições experimentais.
Como resultados dessa fase, os quatro pombos
retomaram a resposta no pedal na presença da
OEC em 90% ou mais das tentativas.
Para dar continuidade aos estudos experimentais de OECs transitivas, da Cunha (1993)
utilizou um esquema de razão variável (VR 6)
para controlar a resposta de pressionar o pedal que produzia a mudança da luz do pedal
(de branca para vermelha) por 5 s. Um estímulo auditivo funcionava como a suposta OEC
(um som tipo bip), cuja apresentação foi controlada por um esquema de tempo randômico
(RT 1 min). Quatro pombos foram distribuídos em dois grupos: para um grupo, a presença do som era a suposta OEC e, para o outro,
sua ausência era a suposta OEC; seus opostos
estabeleciam a condição de não-OEC.
A medida comportamental dos estudos
anteriores foi o percentual de tentativas sem
erro (McPherson e Osborne, 1986, 1988;
Alling, 1990). Da Cunha (1993) verificou que
a taxa de respostas era uma medida mais sensível do que a percentagem de tentativas sem
erro ao introduzir um esquema de reforçamento intermitente para a resposta de pressionar
o pedal. Para todos os sujeitos, verificou-se nitidamente que a taxa de respostas de pressão
ao pedal na condição de OEC foi maior do que
na condição de não-OEC. A taxa de respostas
de pressão ao pedal na presença da suposta
OEC variou de 24 a 27 resp/min, enquanto a
taxa de respostas de pressão ao pedal na ausência da suposta OEC variou de 2 a 8 resp/
min, considerando os dados dos quatro sujeitos. A segunda fase teve como objetivo testar o
controle da suposta variável motivacional, removendo o evento reforçador condicionado da
resposta de pressão ao pedal (luz vermelha do
pedal). Esperava-se uma deterioração da cadeia comportamental durante a fase de teste,
sendo esse resultado observado apenas para
dois dos quatro pombos. Os demais sujeitos
desenvolveram um padrão de pressionar o pedal várias vezes e, então, bicar o disco. A terceira fase do procedimento consistia na reto-
mada da Fase 1. Algumas falhas nesse procedimento também foram observadas; por exemplo, não havia uma contingência punitiva para
as respostas de mudança do pedal para o disco. Verificou-se que os dois sujeitos que mantiveram a resposta no pedal depois da remoção
do reforçador condicionado tiveram, acidentalmente, as respostas de mudança reforçadas.
Observou-se, também, que o decréscimo da
taxa de respostas na condição de não-OEC poderia ter sido mascarado pelo efeito da extinção
presente nessa mesma condição.
Esses estudos contribuíram com sugestões
para refinamentos de delineamentos experimentais e têm reafirmado a importância da distinção dos controles discriminativo e motivacional dos estímulos antecedentes para se demonstrar com clareza os efeitos de uma operação estabelecedora.
Contribuições da pesquisa aplicada
Segundo Sundberg (1993), o conceito de
OE é útil e relevante para a análise funcional
do comportamento, permitindo que a intervenção dos analistas do comportamento seja mais
efetiva. A OE exerce um importante papel na
relação de contingência, uma vez que estabelece a efetividade da conseqüência. É sabido
dos analistas do comportamento que a relação
de contingência (antecedente – comportamento – conseqüência) é fortalecida quando uma
conseqüência reforçadora efetiva é apresentada ao comportamento. A efetividade dessa conseqüência é alterada pela OE que estabelece o
valor do reforço e evoca comportamentos relacionados historicamente com esse reforço. As
conseqüências terão efeitos sobre o comportamento somente se forem efetivas como reforçadores ou punidores, cabendo à OE estabelecer
essa efetividade; portanto, é de fundamental
importância considerar a inclusão da OE como
mais um elemento da relação de contingência.
Como veremos, a pesquisa aplicada tem muito
a dizer sobre a relevância do conceito.
Na tentativa de explicar tanto a ocorrência de comportamentos quanto a efetividade
das conseqüências que os mantém, analistas
do comportamento vêm, cada vez mais, incluin-
ANÁLISE DO COMPORTAMENTO
do o conceito de OE na unidade de análise funcional. Um exemplo disso é a publicação de
um volume do Journal of Applied Behavior
Analysis (JABA) inteiramente dedicado a discussões sobre operações estabelecedoras na
análise aplicada do comportamento (JABA,
2000, 33 [4]).
Para estimular pesquisas sobre o tema,
Iwata e colaboradores (2000) sugerem três
grandes temas de pesquisa para a avaliação das
influências da OE sobre o comportamento em
contextos aplicados:
a) demonstrações gerais das influências
da OE sobre o comportamento;
b) uso da manipulação da OE para clarificar os resultados de avaliações
comportamentais;
c) tentativa de melhorar o repertório
comportamental do sujeito pela incorporação de manipulações da OE como
componente do tratamento.
Friman (2000) apresenta uma demonstração de que objetos chamados de transacionais – objetos que facilitam a transição de crianças jovens de uma fase de dependência para
autonomia – podem ocasionar comportamentos que sugerem a participação de uma OE. O
autor observou uma criança com o comportamento de chupar o dedo, sob duas condições:
em uma condição, a criança estava no berço
sozinha (ausência de estimulação social) e, na
outra, ela estava no colo de um adulto (presença de estimulação social). Nessas condições,
o comportamento de chupar o dedo foi observado em sessões de linha de base (ausência de
um pedaço de pano) e sessões de teste (presença de um pedaço de pano). Os resultados
mostraram que o comportamento de chupar o
dedo na presença do pedaço de pano ocorria
mais freqüentemente quando a criança estava
no berço do que quando estava no colo. Durante a linha de base, nas duas condições de
estimulação a percentagem de intervalos de
chupar o dedo foi zero. A presença do pedaço
de pano pode ter funcionado como uma OE
para o comportamento de chupar o dedo, uma
vez que esse objeto poderia ter alterado a
efetividade reforçadora da conseqüência des-
39
se comportamento. Friman discute que a efetividade reforçadora dessa conseqüência possa
ter ocorrido em função de uma OEC (pedaço
pano), pois o processo pelo qual o objeto altera a efetividade reforçadora de chupar o
dedo, mesmo sendo desconhecido, parece ser
aprendido.
McCommas, Hoch, Paone e El-Roy (2000)
indicaram que exigências ambientais poderiam funcionar como operações estabelecedoras
que evocavam comportamentos agressivos,
autolesivos e perturbadores, reforçados negativamente, em crianças com diagnóstico de
deficiências intelectuais. Essas exigências
envolviam a realização de tarefas acadêmicas
difíceis, repetitivas ou em uma seqüência determinada por um adulto. A manipulação experimental consistiu na presença e na ausência
da suposta OE com três crianças. A primeira
criança, que apresentava dificuldade em operações matemáticas, foi exposta às seguintes
condições:
a) disponibilidade de uma folha de papel com as contas a serem realizadas;
b) disponibilidade de uma folha de papel com as contas, incluindo um ábaco
e uma calculadora.
A segunda criança foi exposta a estas condições:
a) realização de tarefas repetitivas;
b) realização de tarefas não-repetitivas.
A terceira criança foi exposta às seguintes condições:
a) escolha por um adulto da seqüência
de tarefas acadêmicas;
b) escolha pela criança da seqüência de
tarefas.
Os resultados mostraram que a maneira
como as tarefas acadêmicas foram exigidas funcionou como operação estabelecedora. Diante
da segunda condição, os comportamentos-problema não foram observados, sendo essa condição favorável à emissão de comportamentos
acadêmicos mais adequados.
40
ABREU-RODRIGUES, RIBEIRO & COLS.
A intervenção do analista do comportamento com o objetivo de reduzir a ocorrência
de comportamentos inadequados mantidos
por reforçamento negativo torna-se efetiva
quando o conceito de operação estabelecedora
é utilizado. Smith e Iwata (1997) discutiriam
que comportamentos estereotipados e autolesivos são padrões comportamentais que podem ser controlados pela remoção de exigências sociais. A exigência social funciona como
uma operação estabelecedora que determina
sua própria remoção como uma forma efetiva
de reforço (OEC reflexiva). A dificuldade de
uma tarefa, a complexidade do comportamento exigido para essa tarefa e a imprevisibilidade de eventos ambientais são exemplos de exigências sociais. Uma primeira estratégia para a redução de comportamentos
estereotipados e autolesivos evocados nessas
situações seria a mudança das exigências
ambientais para condições de menor aversividade (apresentação de tarefas mais simples,
por exemplo). Uma segunda estratégia seria
o uso do esquema de reforço diferencial de
outros comportamentos (DRO). O terapeuta
pode reforçar os comportamentos mais adequados e submeter os comportamentos estereotipados e autolesivos à extinção. Por exemplo, permitir a fuga de uma exigência social
diante de uma solicitação verbal e não diante
de um comportamento autolesivo. Uma terceira estratégia seria utilizar esquemas de
reforçamento independente da resposta (p.
ex.: os estudos de Durand e Crimmins, 1988;
McGill, 1999).
Durand e Crimmins (1988) e McGill
(1999) sugerem que comportamentos-problema mantidos por atenção, em geral são apresentados em ambientes caracterizados pela
escassez de contato social. A carência produzida por um ambiente com essa natureza pode
ser considerada uma operação estabelecedora
que torna a atenção um reforço efetivo. Se, no
passado, a autolesão e a agressão foram reforçadas pela atenção social, obviamente a privação de atenção evocará o comportamento tido
como problema. Entretanto, se a carência de
contato social (operação estabelecedora) for
substituída por uma condição de maior acesso
ao reforçamento social, pela liberação de aten-
ção em esquemas de tempo fixo (FT), os comportamentos autolesivos e agressivos podem
diminuir de freqüência. Essa diminuição na freqüência comportamental ocorre devido à diminuição da efetividade da atenção como reforço, o que corresponde a uma operação
abolidora.
Em um estudo envolvendo a manipulação da operação estabelecedora como estratégia de tratamento de comportamentos-problema, Kahng, Iwata, Thompson e Hanley
(2000) forneceram evidências de que a apresentação de reforçamento social em esquema
de reforçamento de tempo fixo (FT) promove
a redução desses comportamentos. Duas condições experimentais foram apresentadas a três
indivíduos com diagnóstico de Retardo Mental. Na condição FT-EXT houve a liberação de
reforços sociais de acordo com um esquema
FT e extinção para a ocorrência de comportamentos-problema, durante 10 min. Na condição EXT subseqüente não houve liberação de
reforços sociais durante 20 min. As condições
experimentais foram manipuladas dentro de
uma mesma sessão. Os resultados da condição
FT-EXT revelaram que a apresentação do reforço sob o esquema FT contribuiu para a redução dos comportamentos-problema, em função de dois possíveis efeitos: primeiro, o
reforçamento sob esquema FT pode ter gerado um efeito semelhante à saciação, devido ao
acesso freqüente ao reforço; segundo, a
extinção que ocorria simultaneamente pode ter
sido a responsável pela diminuição na freqüência do comportamento. A condição EXT visou
a testar se esses resultados ocorreram em função da saciação ou da extinção. Se ocorresse
um aumento inicial na freqüência dos comportamentos-problema, poderia ser dito que a
saciação foi a responsável pela redução desses
comportamentos durante o reforçamento sob
o esquema FT. Caso contrário, os resultados
obtidos pela extinção poderiam ser explicados.
Os resultados indicaram que diante da condição EXT, o comportamento-problema permaneceu com baixa freqüência. Esse dado sugere
que os efeitos da extinção durante a apresentação do esquema FT podem ter permanecido
durante a condição EXT. Assim, a transição
entre as condições FT-EXT (reforço presente)
ANÁLISE DO COMPORTAMENTO
e EXT (reforço ausente) pode não ter sido relevante para evocar o comportamento-problema. Os autores discutem ainda que a dificuldade de utilização de esquemas FT deve-se ao
fato de que nesses esquemas há um componente de extinção presente, o qual obscurece
os efeitos diferenciados da saciação e da
extinção, embora ambos os efeitos possam ser
responsáveis pela redução da freqüência do
comportamento (ver também Hagopian,
Crockett, van Stone, DeLeon e Bowman, 2000).
Implicações do conceito de operações
estabelecedoras para a clínica
A clínica analítico-comportamental é caracterizada por uma proposta de intervenção
que visa não só à mudança de comportamentos, mas à identificação das variáveis que os
mantém. Skinner (1953/2000) afirmou que
não se pode esperar uma explicação adequada
do comportamento sem que suas relações com
essas variáveis sejam analisadas. O clínico analítico-comportamental que está interessado em
fazer uma intervenção adequada no contexto
terapêutico deve ter clareza dos diferentes papéis das variáveis das quais o comportamento
é função. Os problemas comportamentais têm
sido explicados com base na contingência
tríplice (antecedente – comportamento – conseqüência), em que os eventos antecedentes
históricos e atuais são identificados sem, às
vezes, serem distinguidos como eventos com
funções comportamentais particulares.
Skinner (1953/2000, p. 34) chamou a
atenção para certos eventos ambientais que
têm funções específicas sobre o comportamento. Esses eventos podem atuar no sentido de,
certamente, produzir comportamento:
É decididamente falsa a afirmação de que se
pode levar um cavalo até a água, mas que não
se pode fazê-lo beber. Privando-o de água por
algum tempo, poderemos estar “absolutamente certos” de que o cavalo irá bebê-la assim
que chegar até ela.
Essa afirmação revela a presença da privação (OE) como variável determinante do
comportamento. É claro que outras variáveis
41
(história de condicionamento, potencial biológico) também participam do processo de produção de comportamento, mas é notório o papel da OE. Desse modo, a clareza do papel dessa
variável permitirá uma intervenção mais efetiva do terapeuta analítico-comportamental.
Sundberg (1993) sugere que o analista do comportamento, ao incluir a análise da OE no contexto clínico, como um termo a mais na relação de contingência, poderá:
a) tatear as operações estabelecedoras no
ambiente natural de vida do cliente;
b) manipular as operações estabelecedoras no momento em que podem estar
atuando com maior força;
c) distinguir seus efeitos motivacionais
dos efeitos discriminativos sobre o
comportamento.
No contexto de vida humana, são observadas algumas operações estabelecedoras comuns. Carências afetivas (atenção, sexo, reconhecimento social, prestígio, popularidade, entre outras), carência de bens de consumo (roupas, automóveis, imóveis entre outras), carência de lazer e diversão são situações que exercem papel de operações estabelecedoras, as
quais estabelecem a efetividade reforçadora de
certos estímulos, objetos ou eventos. Ao realizar a coleta de dados, o terapeuta deve identificar e tatear as possíveis operações estabelecedoras em atuação, bem como verificar seus efeitos sobre os padrões de comportamento apresentados por seu cliente.
Em alguns casos de escassez de contatos
sociais (carência de atenção e de reconhecimento), por exemplo, o indivíduo pode apresentar padrões de comportamento de insistência e cobrança queixosa em relação ao outro.
Esses comportamentos podem, inclusive, ocorrer na relação terapêutica (p. ex.: um cliente
que descreve que ninguém se interessa ou se
preocupa com ele e, fitando os olhos do
terapeuta, diz enfaticamente: “Ninguém me
ama!”). Esse comportamento pode consistir em
um mando disfarçado de tato. O terapeuta pode
apresentar estímulos discriminativos, na presença dos quais a disponibilidade diferencial
de reforço social é maior do que na sua ausên-
42
ABREU-RODRIGUES, RIBEIRO & COLS.
cia e, portanto, o comportamento verbal é evocado. No entanto a privação de afeto (OE) parece ser a variável controladora da queixa em
relação aos outros, que, na verdade, está sendo dirigida ao terapeuta. Uma estratégia a ser
utilizada pelo clínico analítico-comportamental, em casos desse tipo, poderá ser o reforço
diferencial de outras iniciativas comportamentais do cliente (DRO) e a liberação de reforço social em esquemas de tempo fixo (FT),
o que pode minimizar os efeitos da carência
afetiva por meio de um efeito contrário à operação de privação (saciação). Minimizados os
efeitos da carência afetiva, o terapeuta poderá
modelar comportamentos mais adequados no
repertório comportamental do cliente, começando, por exemplo, pela clareza na comunicação do que se quer: “Valorize-me! Dê-me
amor!”.
Michael (1993) define uma OE com base
em seus efeitos momentâneos (efeito evocativo
e efeito estabelecedor do reforço), considerando apenas eventos temporalmente próximos.
Daugher e Hackbert (2000), entretanto, discutem a possibilidade de que eventos temporalmente distantes funcionam como operações
estabelecedoras, as quais apresentam um efeito mais duradouro. Esse efeito poderia ser considerado em termos de cognição e de emoção.
Eventos como a perda de um grande amor, abuso sexual, trauma, seqüestro, entre outros, são
eventos que geram fortes emoções e que alteram a efetividade reforçadora/punidora de outros eventos ambientais, inclusive a longo prazo. Instruções verbais como “mantenha-se longe do casamento, você pode sofrer” ou “você
tem de ser o melhor” estabelecem o valor de
certos objetos, eventos ou condições de estímulo como reforçadores, valor esse que também pode perpetuar-se na vida de uma pessoa. Essas condições, em geral, quando observadas no contexto clínico, caracterizam os efeitos de uma OE a longo prazo. Skinner (1953/
2000) afirma que as relações entre as variáveis ambientais e o comportamento, que delas
é função, são quase sempre complexas e sutis,
adquiridas a partir de uma história de interação
do organismo com o ambiente. Diante dessa
ótica, Daugher e Hackbert sugerem uma análise de relações possivelmente sutis que preci-
sam de esclarecimentos resultantes de muita
reflexão.
As relações entre operações estabelecedoras e estados emocionais podem ser complexas e intrincadas. Contextos históricos de
grave privação de alimento podem manter
comportamentos de estocagem de alimento,
sem que haja necessidade. O mesmo pode acontecer com indivíduos submetidos a privações
de afeto por períodos prolongados. Esses indivíduos podem apresentar alta freqüência de
comportamentos reforçados por afeto, mesmo
em situações em que não haja carência, e sentimentos de menos valia e rejeição, os quais se
perpetuam por longos períodos na vida. Clientes que apresentam histórias prolongadas de
carência afetiva, rejeições, ridicularizações e
críticas têm, em certos eventos ambientais,
reforçadores/punidores efetivos. A história de
interação prolongada efetivamente determina
as funções comportamentais de relações sociais
e interpessoais afetivas como reforçadores e do
isolamento ou solidão como punidores.
Por exemplo, um dos autores atendeu um
cliente que apresentava um quadro de pânico
e observou a presença de respostas emocionais
típicas e de padrões de esquiva das situações
que provocam essas respostas emocionais. O
cliente queixava-se de medo de morte iminente quando se deparava com situações de viagens de avião do casal ou do cônjuge, de necessidade de andar de elevador ou de ter de
sair da sua cidade por mais de dois dias. Os
dados a respeito de sua história de vida indicaram a presença prolongada de críticas e
de ridicularizações dos familiares, desqualificação de qualquer iniciativa comportamental
do cliente e carência afetiva em relação aos
pais e irmãos. Esse contexto de desproteção
afetiva (operação estabelecedora) alterou tanto a efetividade reforçadora de qualquer
interação social e interpessoal afetiva de cuidado e proteção quanto a efetividade punidora
de situações de isolamento, de avaliação, de
críticas e de rejeições. Essas situações, no contexto do referido cliente, provocavam respostas emocionais de pânico e evocavam comportamentos de esquiva.
Em casos de depressão, a persistência de
níveis insuficientes de reforçamento, a perda
ANÁLISE DO COMPORTAMENTO
de grandes fontes de reforço e o excesso de
punições e de estimulações aversivas produzem efeitos comportamentais, como, por exemplo, diminuir a freqüência de comportamentos adequados, eliciar reações emocionais negativas e alterar a efetividade de conseqüências de certos comportamentos. Essas condições de estímulos, como operações estabelecedoras, podem estabelecer a efetividade reforçadora da atenção, da valorização, da assistência e de cuidados especiais, além de potencializar o valor reforçador do alimento, do
isolamento, do sono, de drogas ou álcool. E,
ainda, as contingências geradoras da depressão podem abolir a efetividade reforçadora da
interação social, do trabalho e de atividades
de lazer (Daugher e Hackbert, 2000). Em geral, os comportamentos depressivos são reforçados negativamente. Por exemplo, a esquiva
pode ser reforçada pela prevenção de interações sociais, uma vez que esses tipos de
interações, no passado, estiveram relacionadas
a algum tipo de crítica negativa. Por outro lado,
os comportamentos depressivos podem ser reforçados positivamente pela atenção, pelos cuidados e pela assistência de parentes mais próximos. Uma estratégia de atuação terapêutica,
em casos de depressão, seria apresentar o reforço social contingente aos comportamentos
mais adequados e não aos comportamentos
depressivos. Dessa forma, o aumento na densidade de reforçamento de outros comportamentos pode produzir o aumento na freqüência de comportamentos mais funcionais e a diminuição na freqüência dos comportamentos
depressivos. A partir dessa intervenção, podese modelar comportamentos mais funcionais
no repertório comportamental do cliente, de
modo que as contingências de reforço naturais mantenham esses comportamentos em alta
freqüência.
Na terapia, os comportamentos verbais do
cliente e do terapeuta são de fundamental importância. A audiência não-punitiva estabelecida no contexto terapêutico permite ao cliente falar a respeito de sua vida e de suas experiências sem o risco do julgamento. A verbalização de certos eventos traumáticos permite a diminuição de seu impacto negativo
sobre a vida do cliente, por um processo de
43
dessensibilização, no qual os estímulos eliciadores relacionados à situação traumática perdem gradualmente o poder eliciador de respostas emocionais negativas. Esse processo de
dessensibilização e de extinção respondente
altera as funções reforçadoras positivas e negativas de certas contingências relevantes na
vida do cliente, permitindo o aumento na freqüência de alguns comportamentos adequados
e a diminuição na freqüência de comportamentos inadequados. Esses comportamentos estão
relacionados às contingências de reforço cuja
efetividade é alterada pela verbalização.
Portanto, a alteração da OE funciona
como um ponto-chave para uma intervenção
efetiva por parte do analista do comportamento junto aos casos clínicos apresentados no
consultório de psicologia, na tentativa de melhorar o repertório comportamental do cliente
e, conseqüentemente, sua qualidade de vida.
CONCLUSÃO
Um dos aspectos fundamentais da proposta de Michael é a possibilidade de a análise
do comportamento investigar o controle de variáveis motivacionais, como variáveis independentes, proporcionando, de certa forma, o resgate do tópico de motivação nesta abordagem.
As operações estabelecedoras designam um instrumento conceitual e metodológico para o
estudo experimental do tópico de motivação.
O maior impacto do conceito de operação estabelecedora tem sido sobre a análise
aplicada do comportamento, considerando os
vários contextos de aplicação. Segundo Iwata
e colaboradores (2000), vários temas de pesquisa estão envolvidos na aplicação da operação estabelecedora. Para esses autores, as pesquisas de manipulação da variável motivacional, como componente relevante para a análise funcional do comportamento, são as mais
importantes porque podem potencializar as
intervenções. Inúmeras são as possibilidades
de aplicação do conceito de operação estabelecedora na análise do comportamento, como,
por exemplo, nos contextos de medicina
comportamental, de clínica, de educação, de
organizações, de esportes, entre outros. Inde-
44
ABREU-RODRIGUES, RIBEIRO & COLS.
pendentemente do contexto em que ocorra, o
comportamento sempre será o mesmo – um
fenômeno natural determinado por variáveis
ambientais. A tarefa do analista do comportamento é identificar e analisar as relações entre
o comportamento e os eventos ambientais para,
assim, programar contingências de reforçamento efetivas em sua prática em quaisquer
um desses contextos.
REFERÊNCIAS BIBLIOGRÁFICAS
Alling, K. L. (1990). The effects of a conditioned
establishing operation on performance of two component
chain. Dissertação de Mestrado não publicada, Western
Michigan University, Kalamazoo, MI.
da Cunha, R. N. (1993). An experimental demonstration
of the transitive conditioned establishing operation with
pigeons. Tese de Doutorado não publicada, Western
Michigan University, Kalamazoo, MI.
da Cunha, R. N. (1995). Motivação e análise do comportamento. Temas em Psicologia, 3, 11-18.
da Cunha, R. N. (2000). Motivação: Uma tradução
comportamental. Em R. C. Wielenska (Org.), Sobre
Comportamento e Cognição: Vol. 6. Questionando a teoria e as intervenções clínicas em outros contextos (p. 7882). Santo André, SP: SET.
Daugher, M. J.; Hackbert, L. (2000). Establishing
operations, cognition, and emotion. The Behavior
Analyst, 23, 11-24.
Durand, V. M.; Crimmins, D. B. (1988). Identifying the
variables maintaining self-injurious behavior. Journal
of Autism and Developmental Disorders, 18, 99-117.
Friman, P. C. (2000). “Transitional objects” as
establishing operations for thumb sucking: A case study.
Journal of Applied Behavior Analysis, 33, 507-509.
Hagopian, L. P.; Crockett, J. L.; van Stone, M.; DeLeon,
I. G.; Bowman, L. G. (2000). Effects of noncontingent
reinforcement on problem behavior and stimulus
engagement: The role of satiation, extinction and
alternative reinforcement. Journal of Applied Behavior
Analysis, 33, 433-449.
Instituto Antônio Houaiss (2001). Dicionário eletrônico Houaiss da língua portuguesa (Versão 1.0) [Software].
Rio de Janeiro: Editora Objetiva.
Iwata, B. A.; Smith, R. G.; Michael, J. (2000). Current
research on the influence of establishing operations on
behavior in applied settings. Journal of Applied Behavior
Analysis, 33, 411-418.
Kahng, S.; Iwata, B. A.; Thompson, R. H.; Hanley, G. P.
(2000). A method for identifying satiation versus extinction effects under noncontingent reinforcement schedules. Journal of Applied Behavior Analysis, 33, 419-432.
Keller, F. S.; Schoenfeld, W. N. (1974). Princípios de
psicologia – Um texto sistemático na ciência do comportamento (C. M. Bori,; R. Azzi, trads.). São Paulo: EPU
(Obra publicada originalmente em 1950).
Mace, F. C. (2000), Establishing operation in applied
behavior analysis [Special Section]. Journal of Applied
Behavior Analysis, 33.
McCommas, J.; Hoch, H.; Paone, D.; El-Roy, D. (2000).
Exchange behavior during academic tasks: A preliminary analysis of idiosyncratic establishing operations.
Journal of Applied Behavior Analysis, 33, 479-493.
McGill, P. (1999). Establishing operations: Implications
for the assessment, treatment and prevention of
problem behavior. Journal of Applied Behavior Analysis,
29, 43-51.
McPherson, A.; Osborne, J. G. (1986). The emergence
of establishing-stimulus control. Psychological Record,
36, 375-386.
McPherson, A.; Osborne, J. G. (1988). Control of
behavior by an establishing stimulus. Journal of the Experimental Analysis of Behavior, 49, 213-227.
Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal
of the Experimental Analysis of Behavior, 37, 149-155.
Michael, J. (1993). Establishing operations. The
Behavior Analyst, 16, 191-206.
Michael, J. (2000). Implications and refinements of
establishing operation. Journal of Applied Behavior
Analysis, 33, 401-410.
Miguel, C. F. (2000). O conceito de operação
estabelecedora na análise do comportamento. Psicologia: Teoria e Pesquisa, 16, 259-267.
Millenson, J. R. (1967). Principles of behavioral analysis.
New York: Macmillan.
Millenson, J. R.; Leslie, J. C. (1979). Principles of
behavioral analysis. New York: Macmillan.
Mook, D. G. (1987). Motivation – The organization of
action. New York: W. W. Norton Company.
Skinner, B. F. (1938). The behavior of organisms. New
York: Applenton-Century-Crofts.
Skinner, B. F. (2000). Ciência e comportamento humano (J. C. Todorov; R. Azzi, trads.). São Paulo: Martins
Fontes (Obra publicada originalmente em 1953).
Smith, R. G.; Iwata, B. A. (1997). Antecedent influences on behavior disorders. Journal of Applied Behavior
Analysis, 24, 279-291.
Sundberg, M. L. (1993). The applications of establishing operations. The Behavior Analyst, 16, 211-214.
ANÁLISE DO COMPORTAMENTO
HISTÓRIA DE REFORÇAMENTO
45
3
RAQUEL MOREIRA ALÓ
A sensibilidade comportamental é um fator primordial para a manutenção das espécies, tendo em vista as mudanças constantes
que ocorrem no ambiente. De acordo com
Madden, Chase e Joyce (1998), um comportamento é considerado sensível se apresentar
uma mudança sistemática e replicável diante
de mudanças nas contingências de reforçamento. Por outro lado, se a contingência mudar, mas o comportamento permanecer inalterado, este será considerado insensível às
contingências. A literatura tem demonstrado
que a sensibilidade comportamental é afetada, dentre outras variáveis, pela história passada de reforçamento. Estudos que investigam
os efeitos da história passada procuram produzir um responder estável sob diferentes esquemas de reforçamento, realizando, em seguida, alguma modificação nesses esquemas e
observando se os resultados de tal modificação apresentam diferenças em função dos esquemas iniciais. O efeito de variáveis históricas é exemplificado por estudos que mostram
que o organismo tende a apresentar um responder similar àquele encontrado antes da mudança no esquema de reforçamento em vigor,
principalmente quando essa mudança não é sinalizada (LeFrancois e Metzger, 1993; Ono e
Iwabuchi, 1997; Wanchisen e Tatham, 1991).
Neste capítulo, será apontada a importância de pesquisas sobre história de reforçamento,
bem como serão apresentadas algumas definições para o termo e contribuições de pesquisas básicas e aplicadas sobre esse tema. Finalmente, será discutida a relevância de se consi-
derar variáveis históricas nas mais diversas áreas de atuação do psicólogo e de outros profissionais e será proposta a sistematização de
pesquisas cujo interesse é o efeito de variáveis
históricas.
HISTÓRIA DE REFORÇAMENTO:
RELEVÂNCIA E DEFINIÇÃO
De acordo com Skinner (1953), um dos
objetivos da análise experimental do comportamento é demonstrar que o comportamento
é função do ambiente. Diversos estudos têm
indicado que esse controle ambiental pode ser
estabelecido por uma história de exposição a
contingências de reforçamento e punição
(Baron e Leinenweber 1995; Bickel et al., 1988;
Cohen et al., 1994; Cole, 2001; Freeman e
Lattal, 1992; Johnson et al., 1991; LeFrancois
e Metzger, 1993; Nader e Thompson, 1987;
Nevin e Grace, 2000; Ono e Iwabuchi, 1997;
Poppen, 1982; Taylor, O’Reilly e Lancioni,
2000; Urbain et al., 1978; Wanchisen, 1990;
Wanchisen e Tatham, 1991; Wanchisen,
Tatham e Mooney, 1989; Weiner, 1964; 1965;
1969).
Entretanto muitos pesquisadores em análise do comportamento têm mostrado desinteresse pelos efeitos da história de reforçamento,
os quais comumente são minimizados ou ocultados (Baer, Detrich e Weninger, 1988; Hayes
et al., 1985). Tal desinteresse está baseado em
dois argumentos. Primeiro, os efeitos de história, quando observados, denotariam deficiên-
46
ABREU-RODRIGUES, RIBEIRO & COLS.
cia no controle experimental: se as variáveis
manipuladas na contingência atual não produziram mudanças sistemáticas no desempenho, conclui-se que o controle experimental
não foi adequado para minimizar os efeitos de
variáveis passadas às quais o sujeito foi exposto. Segundo, apesar das condições passadas de
reforçamento e punição, a única maneira de
modificar o comportamento seria a partir de
manipulações nas contingências atuais; portanto, o interesse principal deveria ser a elaboração de intervenções eficazes para mudar
comportamentos inadequados, não importando investigar como esses comportamentos foram adquiridos.
Esses argumentos apresentam alguns problemas. Primeiro, de acordo com Cirino (2001,
p. 138), quando os resultados de um estudo são
atribuídos a variáveis históricas não-controladas, transforma-se a história de reforçamento
na “lata de lixo” da análise do comportamento.
Para evitar que isso ocorra, por outro lado, é
necessário que os efeitos de contingências históricas sejam investigadas como variáveis independentes. Segundo, de acordo com Lattal e
Neef (1996), como as contingências atuais afetam o comportamento em função de histórias
de reforçamento distintas, a compreensão dos
efeitos da história possibilitaria a elaboração de
intervenções eficazes no sentido de tornar um
comportamento inadequado (ou um comportamento adequado), produzido por contingências passadas, menos (ou mais) resistente aos efeitos das contingências atuais.
Ainda que os efeitos de variáveis históricas sejam considerados relevantes, a falta de
uma definição consensual para o termo “história de reforçamento” dificulta a identificação
dos estudos que investigam tais variáveis. Como observou Cirino (2001), essa indefinição é
refletida na profusão de termos utilizados indistintamente para se referir aos efeitos de contingências passadas sobre o comportamento
atual e sem uma preocupação em apontar suas
definições; por exemplo, história de condicionamento, história comportamental, história
passada, história operante, história de esquema, história latente, história de desempenho e
história de reforçamento. Uma vez que cada
um desses termos pode ser definido diferente-
mente, a sistematização dos estudos sobre efeitos de história fica comprometida.
Tatham e Wanchisen (1998) apresentaram
uma definição para história comportamental ao
argumentar que qualquer estudo sobre condicionamento operante pode ser considerado um
estudo sobre os efeitos de história. De fato, qualquer mudança no comportamento descrita como
aprendizagem operante revela o efeito de uma
história de reforçamento. Por exemplo, em procedimentos de modelagem, um desempenho só
é alcançado porque houve, no passado,
reforçamento diferencial de aproximações sucessivas ao desempenho final desejado; um estímulo só adquire propriedades discriminativas
devido a uma história de reforçamento diferencial na presença desse estímulo (isto é, o reforçamento é mais provável na presença do estímulo do que em sua ausência) e um estímulo
só adquire propriedades reforçadoras condicionadas por meio de uma história de pareamento
sistemático com estímulos reforçadores incondicionados ou condicionados.
No entanto definir história comportamental como condicionamento operante acarretaria problemas que inviabilizariam os estudos de história, a saber:
a) o termo se tornaria demasiado abrangente para justificar seu uso, já que,
de acordo com Tatham e Wanchisen
(1998), todos os estudos que incluem
comportamentos operantes aprendidos seriam, então, estudos sobre história de reforçamento;
b) o uso do termo seria desnecessário e
redundante, dada a existência do termo condicionamento operante que incluiria os mesmos fenômenos;
c) não é possível a delimitação entre variáveis atuais e variáveis históricas,
pois nenhum limite arbitrário no tempo é estabelecido;
d) é inviável acessar o efeito de todos os
condicionamentos que ocorrem ao
longo da vida de um organismo
(Cirino, 2000).
Autores como Metzger (1992), Freeman
e Lattal (1992), Wanchisen (1990) e Sidman
ANÁLISE DO COMPORTAMENTO
(1960) propuseram outras definições de história de reforçamento. De acordo com Metzger
(1992), o termo história comportamental refere-se a exposições anteriores a contingências de reforçamento e punição, as quais estiveram em vigor tanto dentro quanto fora do
laboratório. Dessa forma, estudos de história
incluiriam todas as variáveis que afetaram o
comportamento do organismo durante toda
a sua vida. Essa definição apresenta os mesmos problemas da definição anteriormente
discutida.
Outra definição, proposta por Freeman
e Lattal (1992), afirma que a história de
reforçamento é caracterizada por seus efeitos, observados quando o controle exercido
pelas contingências atuais é nitidamente influenciado por contingências passadas. Essa
definição parece apresentar os mesmos problemas encontrados nas definições anteriores; entretanto, de acordo com Cirino (2000),
ela apresenta também um avanço na discussão sobre variáveis históricas, uma vez que
enfatiza os efeitos da interação de contingências atuais e históricas sobre o comportamento, o que não havia sido considerado nas definições anteriores.
Uma outra definição de história comportamental a ser considerada é aquela proposta
por Wanchisen (1990, p. 32). De acordo com
essa definição, história consiste na “exposição
a contingências respondentes e operantes cuidadosamente controladas em laboratório antes da fase de teste desejada”. Dessa forma,
um estudo só poderia ser definido como estudo de história se seu objetivo for, em uma fase
de teste, acessar os efeitos das contingências
passadas que contribuíram para a aquisição e
para a manutenção da resposta atual. Cirino
(2000) apresenta duas vantagens dessa definição. A primeira vantagem refere-se à
parcimônia, isto é, a definição apresenta uma
delimitação: uma determinada história é
construída e seus efeitos são avaliados em detrimento dos efeitos de outras variáveis históricas não-manipuladas, o que torna a definição mais econômica. Segundo, a definição
aponta a possibilidade de teste dos efeitos de
variáveis históricas, como variáveis independentes, sobre o comportamento.
47
A proposta de Sidman (1960) para a definição de história comportamental é consistente com a de Wanchisen (1990). Sidman argumentou que variáveis históricas podem ser
estudadas sistematicamente se forem arranjadas certas experiências e se forem avaliados os efeitos dessas experiências no comportamento subseqüente. Ou seja, estudos de história seriam aqueles que investigam a interação entre padrões comportamentais anteriores (p. ex.: taxas de respostas altas ou
baixas, pausas no responder) e contingências
atuais. Os estudos baseados na proposta de
Sidman têm utilizado o delineamento intrasujeito ou de grupo, em que a exposição a
esquemas de reforçamento diferentes, até que
o desempenho alcance um determinado critério de estabilidade, precede a exposição a
um único esquema de reforçamento, que consiste no teste. Alguns desses estudos serão
descritos a seguir.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
Com o objetivo de investigar os efeitos
de duas histórias diferentes de condicionamento sobre a sensibilidade comportamental
em esquemas de intervalo fixo em humanos,
Weiner (1964) expôs três participantes a um
esquemas de razão fixa 40 (FR, em que cada
reforço é contingente à emissão de um determinado número de respostas) e três participantes a um esquema de reforçamento diferencial de taxas baixas 20 s (DRL, em que
cada reforço é liberado apenas se houver
transcorrido um intervalo mínimo entre duas
respostas). Cada esquema foi sinalizado por
um estímulo luminoso distinto e nenhuma
instrução foi fornecida sobre a realização da
tarefa. Em seguida, todos os participantes foram expostos a um esquema de intervalo fixo
10 s (FI, em que uma resposta é reforçada se
for emitida após transcorrido um determinado intervalo a partir do último reforço). Durante a história de condicionamento sob o
esquema FR 40 os participantes emitiram
taxas de respostas relativamente altas e constantes, enquanto sob o esquema DRL 20 s os
participantes emitiram taxas de respostas bai-
48
ABREU-RODRIGUES, RIBEIRO & COLS.
xas. Quando ambos os esquemas foram mudados para um FI 10 s, foi observada a manutenção das taxas de respostas anteriormente aprendidas, indicando insensibilidade do
desempenho à mudança na contingência em
função da história passada. Essa manutenção do desempenho sugere ainda que a variabilidade da taxa de respostas em esquemas
FI, observada em muitos estudos, pode ser
atribuída a variáveis históricas não-controladas.
Em um estudo posterior, Weiner (1965,
Emperimento 1) investigou se os efeitos da
história passada seriam alterados pela adição de uma contingência de custo da resposta. Para tanto, durante o treino, três grupos
foram expostos a um esquema FR 40, FI 10 s
ou DRL 20 s. O reforço consistia na adição
de 100 pontos a um contador. Em seguida,
os participantes foram expostos a um esquema FI 10 s com custo de resposta, que consistia na perda de um ponto para cada resposta emitida antes do final do intervalo.
Durante o treino sob o esquema FR 40, os
participantes emitiram taxas de respostas relativamente altas e constantes; sob o esquema DRL 20 s, os participantes emitiram taxas de respostas baixas, apresentando pausas entre respostas e, sob o esquema FI 10 s,
os participantes responderam em taxa intermediária e constante. Durante o teste, os participantes do grupo FR 40 emitiram respostas antes do término do intervalo, o que provocou perda de pontos. Por outro lado, os
participantes dos grupos FI 10 s e DRL 20 s
obtiveram uma pontuação mais alta, pois
emitiram poucas respostas entre os reforços.
Esses resultados indicaram que o desempenho em FI foi influenciado pela história anterior de condicionamento, apesar da perda
de pontos que o comportamento controlado
por variáveis históricas produziu.
Visando a dar continuidade aos estudos
anteriores sobre a história de reforçamento e
custo da resposta, no Experimento 2, Weiner
(1969) expôs os participantes de um dos três
grupos experimentais a um esquema DRL 20
s seguido de um esquema FR 40. Depois dessa história de condicionamento, os participantes foram expostos a um esquema FI 10 s com
custo. Cada esquema de reforçamento foi sinalizado por um estímulo luminoso diferente. O esquema DRL produziu taxas de respostas baixas e pausas entre respostas, enquanto
o esquema FR produziu taxas de respostas altas e constantes; sob o esquema FI ocorreu
um decréscimo na taxa de respostas, tendo os
participantes apresentado taxas de respostas
semelhantes àquelas observadas sob o esquema DRL. Para os participantes dos outros dois
grupos, expostos ao esquema FR 40 ou DRL
de 20 s, foi observada a manutenção das taxas de respostas anteriormente aprendidas
(taxas alta e baixa, respectivamente), durante o teste com o esquema FI 10 s com custo
ou FI 600 s sem custo. Novamente, os resultados mostraram que o responder em taxas
altas e baixas pode ser produzido e controlado experimentalmente por meio da manipulação das histórias de reforçamento. Além disso, o fato de ter sido observada uma mudança na taxa de respostas sob o esquema FI com
custo apenas para os participantes que foram
expostos ao esquema DRL seguido do esquema FR indica que a exposição prévia ao esquema DRL pode anular a insensibilidade
comportamental resultante da exposição ao
esquema FR.
No Experimento 3 (Weiner, 1969), os efeitos da história comportamental no desempenho subseqüente em esquemas FI foram investigados como o uso de delineamento intra-sujeito. Dois participantes foram expostos aos seguintes esquemas, nessa ordem: FR 40, FI 10 s
com custo, DRL 10 s com custo, FI 10 s com
custo, FR 40 e FI 10 s com custo, sendo cada
esquema sinalizado por um estímulo luminoso
diferente. Ambos os participantes apresentaram taxas altas no esquema FR 40 inicial, que
se mantiveram no esquema FI 10 s com custo
subseqüente. Quando expostos ao esquema
DRL 10 s com custo, ocorreu uma diminuição
na taxa de respostas. Após esse esquema, ambos os participantes apresentaram taxas baixas de respostas sob o esquema FI 10 s com
custo, mesmo depois de reexpostos ao esquema FR 40, no qual responderam em taxas altas. Esses resultados indicaram, novamente,
que a exposição ao esquema DRL pode gerar
taxas baixas sob esquemas FI, mesmo depois
ANÁLISE DO COMPORTAMENTO
de terem sido produzidas taxas altas no esquema FR. Resultados similares foram observados
com a utilização de um esquema de tempo fixo
10 s (FT, em que o reforço é liberado após transcorrido um intervalo fixo de tempo, independente da emissão de respostas) com custo
(Weiner, 1969, Experimento 4).
Com o objetivo de investigar se os resultados encontrados por Weiner (1969, Experimentos 2 a 5) seriam replicados com sujeitos não-humanos, LeFrancois e Metzger
(1993) separaram seis ratos em dois grupos.
Os sujeitos do primeiro grupo foram expostos ao esquema DRL 20 s e os sujeitos do
segundo grupo, expostos ao esquema DRL de
20 s seguido de um esquema FR de valores
diferentes para cada sujeito. Em seguida, os
sujeitos de ambos os grupos foram expostos
a diferentes esquemas FI com valores determinados pela média de reforços obtidos nos
esquemas anteriores. Todos os sujeitos apresentaram taxas baixas de resposta sob o esquema DRL. Quando expostos ao esquema
FR, os sujeitos do segundo grupo apresentaram um aumento na taxa de respostas, sendo observada uma relação direta entre a taxa
e o valor do esquema FR. No esquema FI, os
sujeitos do primeiro grupo apresentaram um
pequeno aumento na taxa de respostas; os
sujeitos do segundo grupo, por outro lado,
mantiveram as taxas altas de respostas observadas no esquema FR. Esses resultados indicaram que o desempenho sob o esquema
FI variou em função da taxa de respostas produzida no esquema imediatamente anterior
e que a história de reforçamento sob o esquema DRL não diminuiu a insensibilidade
comportamental produzida pela exposição
mais recente ao esquema FR.
Esses resultados são inconsistentes com
aqueles encontrados por Weiner (1969, Experimentos 2 a 5), em que a exposição prévia ao
esquema DRL gerou taxas baixas sob o esquema FI. A discrepância entre os resultados pode
ser atribuída a diferenças entre humanos e nãohumanos relativas às histórias pré-experimentais e a diferenças nos procedimentos, como o
método utilizado em cada estudo para a aquisição do comportamento, o tipo de reforço utilizado e o fato de, no estudo realizado por
49
LeFrancois e Metzger (1993), não terem sido
utilizados estímulos sinalizadores diferentes
para cada esquema de reforçamento, ao contrário do estudo realizado por Weiner (1969),
em que a mudança do estímulo discriminativo
sinalizava a alteração do esquema.
O efeito da história de condicionamento
também foi investigado com o uso de drogas
que afetam o desempenho em esquemas de
reforçamento. Urbain e colaboradores (1978),
por exemplo, investigaram se variáveis históricas afetariam os efeitos da d-anfetamina sobre o desempenho de ratos em um esquema
FI. O primeiro grupo foi exposto ao esquema
FR 40, enquanto outro grupo foi exposto ao
esquema DRL 11 s. Os valores dos esquemas
foram estabelecidos de forma a igualar o número de reforços liberados por sessão para os
dois grupos. Em seguida, todos os sujeitos foram expostos ao esquema FI 15 s, durante o
qual receberam ou uma injeção de salina, ou
diferentes doses de d-anfetamina. Os resultados mostraram que a taxa de respostas no esquema FI, antes da aplicação da droga, variou
em função da história experimental: taxas altas ou baixas produzidas pelos esquemas FR
ou DRL, respectivamente, foram mantidas sob
o esquema FI. Com a aplicação da droga, a taxa
de respostas dos sujeitos que foram expostos
anteriormente ao esquema FR diminuiu em
relação à taxa de respostas na sessão com administração de salina, enquanto a taxa produzida pelo esquema DRL anterior aumentou. Os
resultados indicaram que a história de
reforçamento pode afetar o desempenho sob o
esquema FI, o que replica os resultados dos estudos anteriormente descritos, e que o efeito
da d-anfetamina foi função da história de
reforçamento nos esquemas FR e DRL.
Nos estudos anteriores, não somente os
esquemas utilizados durante a fase de história
eram diferentes, como também eram diferentes as taxas de reforços liberados pelos esquemas (ver Urbain et al., 1978). Esse fato pode
ter sido responsável pelos efeitos observados,
já que vários estudos têm indicado que quanto
maior a taxa de reforços obtida em um dado
esquema de reforçamento menor será a mudança na taxa de respostas diante de mudanças no esquema (p. ex.: Cohen, Riley e Wiegle,
50
ABREU-RODRIGUES, RIBEIRO & COLS.
1993; Hearst, 1961, Experimento 1; Nevin,
1974, Experimento 2). Para investigar essa possibilidade, Freeman e Lattal (1992, Experimento 1) expuseram três pombos a duas sessões
diárias separadas por um intervalo de 6 h: na
primeira, o animal foi exposto a um esquema
DRL e, na segunda, a um esquema FR (Fase
1). Os estímulos luminosos foram diferentes
para cada esquema, e o valor do DRL determinava o valor do FR na sessão posterior de forma a igualar a taxa de reforços nos dois esquemas. Em seguida, os esquemas FR e DRL foram substituídos por dois esquemas FI (Fase
2), cujo valor foi determinado pela média do
intervalo entre reforços (IRI) das 10 últimas
sessões da fase anterior. Os estímulos luminosos não foram alterados. Na Fase 1, a taxa de
respostas no esquema FR foi mais alta do que
no esquema DRL. Na Fase 2, inicialmente, a
taxa de respostas foi mais alta na presença do
estímulo previamente correlacionado com o esquema FR do que na presença do estímulo
correlacionado com o esquema DRL. No entanto a taxa de respostas na presença dos dois
estímulos luminosos tendeu a convergir para
um valor intermediário ao longo das sessões.
No Experimento 2, Freeman e Lattal
(1992) investigaram se os efeitos de história
seriam menos observados quando os esquemas
FR e DRL fossem alterados para um esquema
VI, uma vez que a taxa de respostas estável
sob os esquemas FR e DRL produz regularidade temporal na liberação de reforços, o que
não acontece em esquemas VI. Para isso, três
pombos ingênuos foram expostos às mesmas
fases e condições do Experimento 1, porém esquemas VI estavam em vigor na Fase 2. Assim
como no Experimento 1, a taxa de respostas
no esquema FR foi mais alta do que no esquema DRL durante a Fase 1 e, no início da Fase 2,
as taxas continuaram diferenciadas. Entretanto, para dois sujeitos, as taxas de respostas na
presença dos estímulos luminosos convergiram
para valores intermediários em um número
menor de sessões do que no Experimento 1,
indicando que o efeito da experiência prévia
sobre a resposta foi menor no esquema VI do
que no esquema FI e sugerindo que a distribuição temporal irregular entre reforços pode
minimizar os efeitos da história (cf. Lattal,
1975). Os resultados encontrados nas primeiras exposições à Fase 2, nos dois experimentos, indicaram controle dos estímulos discriminativos presentes na fase de história sobre o
responder subseqüente: isto é, a taxa de respostas durante as primeiras sessões no esquema FI ou VI dependeram do estímulo sinalizador relacionado a cada componente do esquema múltiplo.
Outros estudos, como aquele realizado
por Hanna, Blackman e Todorov (1992), apoiaram os resultados encontrados por Freeman
e Lattal (1992), ao mostrar que, quando os
estímulos discriminativos permaneceram inalterados após as mudanças em um esquema
concorrente VI VI, houve manutenção dos padrões comportamentais anteriormente reforçados; por outro lado, quando os estímulos
discriminativos foram modificados, as taxas de
respostas ajustaram-se aos novos esquemas.
Dessa forma, os estudos de Freeman e Lattal
(1992) e de Hanna e colaboradores (1992)
indicam que, além da relação entre a resposta
e o reforço (contingência R-S), uma outra variável que afeta os efeitos da história de
reforçamento é a relação entre o estímulo
discriminativo e o reforço (contingência S-S).
Okouchi (2003) também avaliou o papel
do controle discriminativo nos efeitos da história de reforçamento mas, em vez de usar estímulos exteroceptivos, seu interesse recaiu
sobre as funções discriminativas dos IRIs. Especificamente, foi investigado se IRIs idênticos àqueles observados durante a Fase de História funcionariam como estímulos discriminativos e, assim como ocorre com estímulos
exteroceptivos, controlariam os efeitos dessa
história. Estudantes universitários foram expostos, na Fase de Treino, a um esquema mix FR
DRL, no qual a mudança de um componente
para o outro não é sinalizada. Os valores dos
esquemas FR e DRL foram estabelecidos de
forma a produzir IRIs diferentes em cada componente. Em seguida, os participantes foram
expostos à Fase de Teste, que consistiu em um
esquema misto (mix) FI 5 s e FI 20 s por 12
sessões (Experimento 1) ou em seis esquemas
FI, cujos valores variaram entre 5 s e 40 s (Experimento 2). Sob o esquema mix FR DRL foram produzidas taxas de respostas diferencia-
ANÁLISE DO COMPORTAMENTO
das e maiores no esquema FR. Na Fase de Teste, as taxas de respostas sob o esquema FI foram mais altas quando os IRIs desse esquema
assemelhavam-se aos IRIs produzidos anteriormente pelo esquema FR; por outro lado,
quando os IRIs do esquema FI assemelhavamse àqueles produzidos anteriormente pelo esquema DRL, as taxas de respostas foram baixas. Esses resultados sugerem que os IRIs podem desenvolver propriedades discriminativas
e, dessa forma, afetar os efeitos da história.
O objetivo do estudo conduzido por Ono
e Iwabuchi (1997) foi investigar se o intervalo
temporal entre a exposição às contingências de
treino e de teste afetaria a adaptação do responder às novas contingências, uma vez que,
na maioria dos estudos sobre história, a fase
de teste é iniciada no dia seguinte à última sessão do treino (p. ex.: Freeman e Lattal, 1992;
Wanchisen, Tatham e Mooney, 1989). Na primeira condição da primeira fase, os sujeitos
(pombos) foram expostos a um esquema múltiplo – mult DRH (reforçamento diferencial de
taxas altas, em que uma resposta é reforçada
apenas se for emitida antes de transcorrido um
determinado intervalo desde a última resposta) DRL –, sinalizados por luzes verde e vermelha, respectivamente, e com taxas de reforços semelhantes. A segunda condição, iniciada no dia posterior ao término da primeira,
consistia em um esquema VI sinalizado por
uma luz branca, cujo valor foi determinado pelo
intervalo médio entre reforços das 10 últimas
sessões da condição anterior. Em seguida, os
sujeitos foram expostos à condição de teste que
consistia em um esquema VI de valor idêntico
àquele da segunda condição; entretanto, em
sessões alternadas, a sinalização do esquema
era idêntica à da primeira condição (luz verde
e vermelha apresentadas randomicamente) ou
à da segunda condição (luz branca). A segunda fase do experimento foi idêntica à primeira, entretanto a primeira condição foi separada das condições subseqüentes por um intervalo de seis meses. Os resultados da primeira
fase indicaram que, após 10 sessões de teste,
as taxas de respostas no esquema VI continuaram diferenciadas na presença dos estímulos
correspondentes ao esquema DRH e ao esquema DRL; entretanto, na segunda fase do estu-
51
do, a diferença entre as taxas de respostas na
presença dos estímulos previamente relacionados ao esquema DRH e ao esquema DRL foi
menor e menos duradoura do que na primeira
fase, indicando que os efeitos de história foram amenizados em função do intervalo de
tempo entre o final da fase de história e o início da fase de teste.
Manipulações no nível de saciação dos
sujeitos também têm sido usadas para avaliar
os efeitos da história passada. Um procedimento comumente utilizado para manipular o nível de saciação consiste na alimentação prévia, ou seja, no fornecimento de diferentes
quantidades de alimento em algum momento
antes da sessão experimental. Tal procedimento
representa uma mudança na relação respostaconseqüência porque modifica o valor do reforço, alterando, assim, a taxa de respostas
(para uma discussão mais completa sobre variáveis que alteram o valor do reforço, ver Capítulo 2), entretanto a maneira como a taxa de
respostas é alterada depende do esquema de
reforçamento presente na fase de história (Aló,
2002) e de características desse esquema, tais
como a densidade, a magnitude e o atraso do
reforço (p. ex.: Bell, 1999; Harper, 1996; Nevin,
Mandell e Atak, 1983).
Para investigar os efeitos de manipulações
no nível de saciação e da história de reforçamento sobre a sensibilidade a mudanças nas
contingências, Aló (2002) expôs pombos a um
esquema mult FR DRL durante as três primeiras condições experimentais. Inicialmente, foi
determinada a quantidade máxima de alimento que cada sujeito, pesando 80% de seu peso
livre, era capaz de consumir. Na condição de
Linha de Base, todo o alimento diário era obtido na sessão experimental (economia fechada). Em seguida, iniciou-se a condição de Teste de Sensibilidade 1, em que os sujeitos foram separados em dois grupos: o Grupo 100%
teve acesso a 100% da quantidade máxima de
consumo, antes das sessões, enquanto o Grupo 20% teve acesso somente a 20% dessa quantidade. Após a reexposição à Linha de Base, o
procedimento de saciação foi repetido na condição de Teste de Sensibilidade 2. O esquema
em vigor era um mult FI FI com valores idênticos, sendo que os estímulos sinalizadores pre-
52
ABREU-RODRIGUES, RIBEIRO & COLS.
sentes nas condições anteriores não foram alterados. Os resultados indicaram que, quando
o esquema múltiplo não foi modificado (Teste
de Sensibilidade 1), a taxa de respostas no componente FR apresentou decréscimos apenas no
maior nível de saciação (100%), enquanto a
taxa DRL permaneceu inalterada nos dois níveis de saciação. Quando o esquema foi modificado (Teste de Sensibilidade 2), as taxas “FR”
(aquelas obtidas sob o estímulo sinalizador anteriormente correlacionado com o esquema FR)
decresceram até o maior nível de saciação e
permaneceram inalteradas no menor nível de
saciação, enquanto as taxas “DRL” (aquelas obtidas sob o estímulo sinalizador previamente
correlacionado ao esquema DRL) aumentaram
para ambos os níveis de saciação, de modo que
as taxas nos dois componentes alcançaram valores semelhantes (como seria esperado em um
esquema mult FI FI de valores idênticos) mais
rapidamente para os sujeitos do Grupo 100%.
Esses resultados mostraram que:
a) a sensibilidade das taxas produzidas
a despeito da mudança no esquema
FR dependeu do aumento no nível de
saciação, apesar da mudança no esquema;
b) a sensibilidade das taxas produzidas
pelo esquema DRL dependeu da mudança no esquema de reforçamento,
a despeito do nível de saciação;
c) os efeitos do aumento no nível de
saciação foram modulados pela história de reforçamento, contribuindo, assim, para uma transição mais rápida
do controle da contingência passada
para a contingência atual.
Em suma, os estudos sobre história de
reforçamento têm indicado, de uma forma geral, que a história de exposição a esquemas de
reforçamento pode produzir insensibilidade a
mudanças nesses esquemas. Entretanto tal insensibilidade pode ser amenizada por variáveis
como a exposição prévia a determinados tipos
de esquema (Aló, 2002, Fase 2; Weiner, 1969,
Experimentos 2 e 3), a diferença na regularidade temporal da liberação dos reforços nas
fases de treino e de teste (Freeman e Lattal,
1992, Experimento 2; Okouchi, 2003), a diferença entre os estímulos sinalizadores nas fases de treino e de teste (Hanna et al., 1992), o
atraso entre o final da contingência histórica e
o início do teste (Ono e Iwabuchi, 1997) e aumentos no nível de saciação (Aló, 2002).
CONTRIBUIÇÕES DA
PESQUISA APLICADA
Apesar de muitas pesquisas básicas indicarem a importância de variáveis históricas
para a compreensão do comportamento exposto a novas contingências, tais variáveis não vêm
sendo explicitamente investigadas em pesquisas aplicadas (Lattal e Neef, 1996). Um levantamento bibliográfico realizado no periódico
mais importante da área, o Journal of Applied
Behavior Analysis, revela apenas duas pesquisas cujo objetivo consistiu em avaliar os efeitos da exposição a determinadas condições experimentais sobre o comportamento em condições subseqüentes. Esses estudos serão descritos a seguir.
Martens, Bradley e Eckert (1997) procuraram investigar os efeitos de três histórias de reforçamento diferentes sobre o engajamento de duas crianças em tarefas escolares
durante o período de extinção. O procedimento incluiu quatro condições, nas quais o
contato entre o experimentador e o participante ocorria de acordo com um esquema FI
30 s durante os dois primeiros minutos de
cada sessão; os oito minutos finais da sessão
consistiam em extinção. Na Condição A, os
observadores apenas registraram o engajamento dos participantes nas tarefas propostas
pelo professor. Em seguida, os participantes
foram expostos à Condição B, na qual receberam quatro elogios consecutivos (p. ex.:
“Bom trabalho!”), contingentes ao engajamento na tarefa escolar. Durante a Condição
C, os participantes receberam os mesmos elogios contingentes ao envolvimento na tarefa
escolar durante o primeiro e o terceiro intervalo de 30 s dos dois primeiros minutos
da sessão; durante o segundo e o quarto intervalos de 30 s foram fornecidas instruções
para que os participantes voltassem a estu-
ANÁLISE DO COMPORTAMENTO
dar, caso não estivessem engajados na tarefa
proposta pelo professor (p. ex.: “Por favor,
pare de conversar e trabalhe na sua tarefa”).
Durante a Condição D, o procedimento foi
semelhante àquele utilizado na Condição C;
no entanto, no segundo e no quarto intervalos de 30 s, os participantes receberam atenção do experimentador contingente a comportamentos de não-engajamento na tarefa
escolar (p. ex.: “algumas vezes é bom fazer
uma pausa no trabalho”).
Considerando-se os dois primeiros minutos de cada sessão (esquema FI 30 s), os
resultados indicaram acréscimos na freqüência do comportamento de estudo na Condição B, para os dois participantes, em relação
à freqüência observada na Condição A. Para
o primeiro participante, a freqüência do comportamento de estudo permaneceu constante
a partir da segunda condição; para o segundo participante, essa freqüência apresentou
acréscimos adicionais na Condição C e decresceu na Condição D. Com relação aos períodos
de extinção, para o primeiro participante, a
freqüência do comportamento de estudo em
relação à freqüência média desse comportamento nos dois primeiros minutos da sessão
manteve-se constante na Condição B, apresentou aumentos na Condição C e diminuiu
na Condição D. Para o segundo participante,
foram observados decréscimos na freqüência
do comportamento de estudo em relação aos
dois primeiros minutos da sessão nas Condições B, C e D, sendo mais abrupto na Condição D. Esses resultados indicam que a história de elogios para o comportamento de estudar (Condição B), principalmente quando aliada a instruções para o estudo (Condição C),
produziu uma menor sensibilidade à retirada
do reforço que a história de elogios para estudar alternada com atenção para pausas no
estudo (Condição D). No entanto a falta de
sistematicidade dos resultados encontrados
para os dois sujeitos indica que o controle experimental deveria ser aprimorado.
O segundo estudo na área aplicada que
discutiu efeitos da história de reforçamento foi
realizado por Progar e colaboradores (2001).
O participante desse estudo foi uma criança
com diagnóstico de autismo, que apresentava
53
comportamentos agressivos mantidos por esquiva de tarefas aversivas. O participante e seus
dois terapeutas haviam sido transferidos para
uma nova instituição após o fechamento da instituição em que o tratamento foi iniciado. Esse
tratamento consistia no fornecimento de itens
comestíveis contingentes ao seguimento de instruções fornecidas pelo terapeuta e à ausência
de comportamentos agressivos (esquema de
reforçamento diferencial de outros comportamentos – DRO). Na nova instituição, o mesmo tratamento foi utilizado, realizado por quatro terapeutas: os dois terapeutas que já haviam trabalhado com o participante e dois que
não lhe eram familiares. Foram realizadas no
mínimo 10 sessões de 10 min por dia, em que
os comportamentos agressivos foram registrados em intervalos de 10 s por dois observadores treinados. Os resultados indicaram diferenças sistemáticas na freqüência dos comportamentos agressivos direcionados aos terapeutas
familiares versus não-familiares, sendo essa freqüência consistentemente mais alta com os
terapeutas que já haviam trabalhado com o
participante. De acordo com os autores, a alta
freqüência de comportamentos agressivos
direcionada aos dois terapeutas familiares pode
ser explicada pela história de exposição a situações aversivas na antiga instituição em que o
participante foi tratado por esses dois terapeutas; tais situações incluíram mudanças freqüentes na medicação utilizada, restrições de movimentos e reclusão em um ambiente fechado.
No entanto, considerando-se que não houve
manipulação das variáveis históricas apontadas, essa interpretação deve ser considerada
com cautela.
Concluindo, as duas pesquisas apresentadas que discutem explicitamente efeitos de
história de reforçamento, encontradas no periódico de pesquisas aplicadas de maior renome, apresentam problemas de controle experimental que comprometem a discussão dos
efeitos das variáveis históricas de interesse.
Considerando-se os resultados de pesquisas
básicas que demonstram a importância de variáveis históricas na determinação do comportamento atual (o que inclui a determinação da
eficácia do tratamento utilizado), é imperativo que sejam desenvolvidas pesquisas aplica-
54
ABREU-RODRIGUES, RIBEIRO & COLS.
das sobre o efeito de tais variáveis. Para o aprimoramento do controle experimental que favoreceria conclusões acerca dos efeitos dessas
variáveis, poderia ser adotado um procedimento-padrão para o estudo na pesquisa aplicada,
assim como vem sendo feito na pesquisa básica por estudos baseados nas propostas de
Sidman (1960) e de Wanchisen (1990). Ou
seja, o estudo sistemático da história de
reforçamento por meio da exposição a certas
experiências e avaliação dos efeitos dessas experiências no comportamento subseqüente
deveria ser adaptado e adotado em pesquisas
aplicadas interessadas nos efeitos de variáveis
históricas.
DA PESQUISA BÁSICA
PARA A APLICAÇÃO
Em conjunto, os resultados obtidos por
estudos na área de história de reforçamento
indicam que as variáveis históricas devem ser
consideradas para a compreensão do ajustamento do comportamento a novas contingências, bem como para a elaboração de intervenções eficazes em todos os contextos de aplicação da psicologia e de outras áreas que compartilhem do interesse pelo comportamento
humano.
É importante ressaltar, no entanto, que
alguns cuidados devem ser tomados com relação à aplicação do conhecimento adquirido
por meio da pesquisa básica. A obtenção de
resultados sistemáticos em uma pesquisa no
laboratório não implica a possibilidade de aplicação direta desses resultados para o comportamento humano no ambiente natural. Para
que os resultados possam ser úteis no contexto humano, é necessário que se verifique a sua
replicabilidade com outros sujeitos da mesma espécie e nas mesmas condições (replicação direta), e com sujeitos de outras espécies em condições diferentes daquelas do experimento original (replicação sistemática), o
que aumenta a fidedignidade e a generalidade dos resultados inicialmente encontrados
(Sidman, 1960). À medida que crescem as evidências sobre os efeitos das variáveis em questão (isto é, na medida em que os resultados
são consistentemente replicados), novos tipos
de análise funcional e de intervenção podem
ser elaborados.
Ainda que sejam necessárias replicações
que favoreçam a fidedignidade e a generalidade dos resultados aqui descritos, o fato de
que os estudos empíricos têm sistematicamente demonstrado que histórias de reforçamento
diferentes resultam em desempenhos diferencialmente sensíveis a mudanças nas contingências sugere que variáveis históricas devem
ser consideradas nas intervenções comportamentais das mais diversas áreas da psicologia. No contexto da psicologia organizacional,
por exemplo, a produtividade e a satisfação
dos funcionários de uma empresa podem ser
favorecidas se houver uma preocupação da
parte dos profissionais responsáveis em planejar a contratação, a alocação e o remanejamento de pessoal, levando-se em conta o histórico de cada funcionário. Outras instituições
que seriam favorecidas pela consideração de
variáveis históricas são aquelas cujo interesse
primário é a aprendizagem (p. ex.: escolas).
Por exemplo, atrasos (ou acelerações) no desenvolvimento, que, em muitos casos, são atribuídos a outras variáveis (p. ex.: herança genética), podem ser prioritariamente função da
história de reforçamento sob contingências
que prejudicaram (ou favoreceram) a aprendizagem. Conhecendo-se os efeitos de diferentes histórias, seria possível não somente
prever questões relacionadas ao desenvolvimento de cada indivíduo, mas também elaborar intervenções para produzir um desenvolvimento mais acelerado quando este for o
interesse.
O conhecimento acerca da importância de
variáveis históricas pode ser útil, também, no
contexto clínico. A história de reforçamento de
um cliente muitas vezes é negligenciada, ou
sua importância é minimizada, porque muitos
terapeutas acreditam que, qualquer que seja
essa história, nada pode ser feito para modificála e, portanto, a terapia deve focalizar as contingências atuais. Entretanto, uma vez que o
papel das contingências atuais é modulado por
variáveis históricas, conhecer essa história parece ser imprescindível para a compreensão do
controle do comportamento (Lattal e Neef,
ANÁLISE DO COMPORTAMENTO
1996). Somente por meio de análises funcionais precisas estaria o clínico habilitado a desenvolver estratégias de intervenção eficazes.
A importância de variáveis históricas para o
processo terapêutico pode ser ilustrada com o
caso clínico descrito a seguir.
Pedro (nome fictício), 22 anos, morava
em uma cidade do interior, onde as pessoas
eram “muito moralistas e religiosas”. Ele relatava que, desde sua infância, engajava-se em
“jogos sexuais” com alguns primos e amigos e
que se sentia sexualmente atraído por meninos. Ao mesmo tempo, ouvia de sua mãe e de
outras pessoas que o homossexualismo era
“sujo e pecaminoso”, que era “uma escolha de
uma pessoa má” e que os homossexuais, quando morressem, “iriam para o inferno”. Para se
esquivar de seus pensamentos (e possíveis atos)
“pecaminosos”, ele se dedicou intensamente
aos estudos e passou a ser reconhecido na cidade como um menino “bonzinho, ingênuo e
inteligente”. Sua vida social era muito restrita
e permaneceu dessa forma até ocorrer uma mudança de cidade para iniciar um curso superior, o que representou uma grande alteração
nas contingências: Pedro foi morar no alojamento estudantil, onde passou a dividir um
apartamento com outros alunos da universidade que, de acordo com ele, interessavam-se
muito mais por atividades sociais do que por
atividades acadêmicas. No começo, ele negava convites para sair, argumentando que tinha
de estudar. No entanto, após alguns meses, ele
passou a sair com os amigos e conheceu um
rapaz por quem se interessou e com quem iniciou um namoro; seu tempo dedicado aos estudos diminuiu drasticamente, e ele passou a
ser reprovado em várias matérias. O comportamento de estudar, quando ocorria, era sempre na véspera de testes e de provas, o que não
era suficiente para ser aprovado nas disciplinas. Decidiu, então, procurar uma terapia.
O levantamento do histórico desse cliente foi muito útil para a compreensão de seu
caso e para a elaboração da intervenção. Suas
dificuldades atuais relacionadas ao estudo
eram, em última instância, fruto das experiências passadas que produziram um padrão
comportamental inadequado para as atuais
contingências. Ficou claro que seu comporta-
55
mento em relação ao estudo, até o início da
faculdade, estava sendo mantido prioritariamente por reforçamento negativo (esquiva de
críticas e rejeição) e não por reforçamento positivo (p. ex.: aprendizagem, boas notas, prestígio entre colegas e professores). Além disso,
esse comportamento era ineficiente uma vez
que, embora o ajudasse a ter um bom desempenho escolar, consumia todo o seu tempo fora
da escola (mesmo não envolvendo conteúdos
e exercícios além daqueles exigidos pelos professores). Quando as contingências foram alteradas, inserido no contexto o reforçamento
positivo de atividades sociais e de práticas homossexuais, seu comportamento em relação ao
estudo, como seria esperado, declinou substancialmente, passando a ocorrer somente em
ocasiões de forte controle aversivo (possibilidade de reprovação). As novas contingências,
portanto, exigiam um equilíbrio entre estudo
e lazer, algo que não fazia parte do repertório
comportamental de Pedro. Para tanto, era necessário que seu comportamento em relação
ao estudo se tornasse mais eficiente e passasse
a ser controlado prioritariamente por contingências reforçadoras positivas, o que se tornou
um dos objetivos terapêuticos.
Outro caso clínico que ilustra a importância de se considerar variáveis históricas no contexto terapêutico é o de Sandra (nome fictício), 24 anos, que vinha de uma cidade do interior, onde morava com a mãe e três irmãos.
Os primeiros seis meses de terapia dessa cliente pareceram pouco proveitosos: ela tinha dificuldades em detalhar eventos que lhe haviam
acontecido, especialmente aqueles relacionados à sua família, e em discriminar sentimentos relacionados a esses eventos. Quanto a seu
namorado, afirmava que não sabia o que sentia por ele, mas que ele a amava muito, a ponto de lhe dizer que ela era “a maior de todas as
suas conquistas” e de ter tentado suicídio quando ela terminou o namoro. Sandra relatou que
todos os seus ex-namorados foram profundamente apaixonados por ela, mas não sabia dizer o que havia sentido por eles. Os namoros
eram sempre terminados por iniciativa dela,
talvez porque, segundo ela, era uma mulher
muito independente e auto-suficiente. Percebendo que ela se esquivava de falar sobre o
56
ABREU-RODRIGUES, RIBEIRO & COLS.
seu relacionamento familiar e sobre seus sentimentos, a terapeuta procurou bloquear essa
esquiva, insistindo em assuntos relacionados à
sua família e criando situações que provocassem determinadas emoções, principalmente
aquelas que a cliente revelava nunca sentir (p.
ex.: raiva, ciúme). Nessas situações, no entanto, Sandra continuava esquivando-se e dizia
que a terapeuta estava interpretando seu comportamento de maneira errônea. Eventualmente, Sandra decidiu abandonar a terapia,
argumentando que não estava preparada para
falar dos assuntos que a terapeuta insistia em
abordar. Após três meses de intervalo, a terapeuta entrou em contato com a cliente e esta
decidiu, então, voltar à terapia. Após seu retorno, a cliente passou a relatar sobre seu histórico familiar e afetivo.
Esses relatos foram extremamente úteis
para a compreensão do caso e para a intervenção. De acordo com Sandra, sua mãe (empregada doméstica) era muito apaixonada por seu
pai (vendedor ambulante), mas o sentimento
não era recíproco. Seu pai viajava com muita
freqüência, sem data para voltar e, quando isso
acontecia, a família passava fome. Sua mãe foi
descrita como “uma pessoa sem o menor controle emocional”: nos períodos em que o marido estava ausente, falava alto e sem parar durante todo o dia, principalmente reclamando
do marido e afirmando que ele queria matá-la.
Além disso, atirava objetos pela janela e nas
pessoas que não acatavam as suas ordens, e,
por isso, de acordo com a cliente, a casa “vivia
toda quebrada”. Quando o marido retornava,
a mãe parecia ficar ainda mais nervosa, gritando e brigando com ele o tempo inteiro. Seus
irmãos acabaram ficando “perturbados” devido à convivência com a mãe: um irmão era
“depressivo”, outro tornou-se um “fanático religioso” e o último comportava-se de forma
muito semelhante à de sua mãe. Diante da fragilidade emocional da mãe e da ausência do
pai, Sandra passou a assumir grande parte das
responsabilidades familiares. Nos períodos em
que estava em casa, seu pai era muito carinhoso e atencioso com ela, dizendo-lhe freqüentemente que sua mãe e seus irmãos eram “loucos” e que o principal motivo para ele voltar
para casa era ela, sua filha preferida e a única
pessoa equilibrada da família. Sempre que relatava esses eventos, Sandra chorava muito e
dizia que se sentia abandonada pela única pessoa em quem confiava e a quem mais amava,
que era seu pai. Ela relatava que não sabia exatamente o que sentia por todos os outros membros de sua família, mas que era algo “confuso
e ruim”. Esse sentimento de “confusão” foi descrito pela cliente em diversas outras situações,
quando se referia a episódios relacionados a
seu namorado (p. ex.: quando outra mulher
demonstrava interesse por ele) e a sua vida
profissional (uma vez que ela não estava certa
a respeito da profissão que iria seguir).
A análise funcional do caso de Sandra indicou que o déficit no repertório de tato discriminado, por ela apresentado, tinha como origem a ausência de modelos apropriados e a
falta de reforçamento diferencial para tal comportamento. Além disso, seu contexto familiar
apresentava uma alta probabilidade de punição para o relato de sentimentos e de pensamentos. Ou seja, expressar opiniões e revelar
o que sentia poderiam torná-la mais vulnerável à agressividade de sua mãe e gerar a perda
do afeto de seu pai, uma vez que ele afirmava
que ela era sua filha preferida justamente por
ser a mais diferente da mãe, ou seja, por não
fazer cobranças, não se queixar de nada, ser
sempre carinhosa com ele, enfim, a única “emocionalmente controlada” na família. Diante
desse contexto, a cliente desenvolveu estratégias de esquiva que, no início, consistiam em
não revelar sentimentos e pensamentos e que,
no momento da terapia, eram caracterizadas
por uma dificuldade generalizada de discriminar o que pensava e sentia, tanto em situações
aversivas quanto em situações reforçadoras.
Além disso, esse padrão de esquiva, antes limitado ao ambiente familiar, passou a ser emitido nos demais relacionamentos interpessoais
da cliente, incluindo o relacionamento com a
terapeuta. Ou seja, em função de uma história
de exposição a contingências aversivas, as quais
selecionaram o comportamento de esquiva
emocional, a cliente apresentava insensibilidade às contingências reforçadoras presentes em
seus contextos atuais.
O acesso ao histórico de Sandra, além de
ter sido útil para o fortalecimento do vínculo
ANÁLISE DO COMPORTAMENTO
terapêutico, uma vez que esse histórico incluía
informações muito íntimas e delicadas para a
cliente, também permitiu a compreensão do
quadro funcional de suas dificuldades atuais.
Essa compreensão, por sua vez, foi fundamental para que a terapeuta abandonasse estratégias anteriormente utilizadas (p. ex.: bloqueio
da esquiva), as quais tinham um forte teor
aversivo para a cliente e, assim, acabaram reforçando o padrão de esquiva que se desejava
extinguir. A terapeuta decidiu, então, implementar estratégias terapêuticas caracterizadas
pelo uso de modelação e modelagem. Os relatos sobre a história familiar, bem como aqueles sobre os acontecimentos atuais, permitiram
que Sandra “revivesse” momentos difíceis em
um local seguro, onde era permitido que ela
“perdesse o controle emocional” sem que isso
implicasse a perda de afeto por parte da
terapeuta. Ou seja, a terapeuta procurou construir uma nova história de relacionamento
interpessoal, diferente daquela vivida com os
pais da cliente, oferecendo modelos e reforçando diferencialmente a expressão de sentimentos e também a emissão de opiniões, de
comentários e de sugestões. Sandra foi, pouco
a pouco, aprendendo a discriminar seus sentimentos, de forma que os relatos sobre “sentimento de confusão” foram gradativamente
substituídos por relatos de raiva, de ciúme, de
afeto e de admiração, por exemplo. Ela também foi gradualmente aprendendo a expressar suas opiniões e, assim, a construir relacionamentos interpessoais mais reforçadores. Em
suma, esse caso ilustra como o conhecimento
sobre a história de reforçamento e punição
pode ser extremamente útil para a análise funcional e para a intervenção terapêutica, e não
somente para o conhecimento das origens do
comportamento.
A relevância de se considerar variáveis históricas não se restringe apenas ao trabalho do
psicólogo, mas também diz respeito a todas as
ciências sociais e políticas, uma vez que a história de uma população ou grupo social é refletida na forma como esse grupo reage às mais
diversas contingências. Conhecendo o efeito de
variáveis históricas, poderíamos tentar prever,
por exemplo, como um degredado político
adapta-se a um país com uma cultura diferen-
57
te da sua, como os valores atuais do gênero
feminino são função, em grande parte, das lutas feministas do passado e como uma população reage com ataques terroristas a uma longa
história de imperialismo e subjugo, por exemplo. Dessa forma, é importante que educadores, psicólogos, sociólogos e todos os profissionais interessados na saúde de homens ou de
grupos humanos estudem os efeitos da história de reforçamento e que considerem tais efeitos na elaboração de suas intervenções. Grande parte do conhecimento sobre os efeitos de
história tem sido construída com a realização
de pesquisas básicas; portanto, é importante
que os mais diversos profissionais considerem
a importância de tais pesquisas e que se beneficiem de seus achados.
CONCLUSÃO
Investigações sobre os efeitos de variáveis
históricas vêm sendo desenvolvidas por diversas áreas de pesquisa em análise do comportamento. No entanto observa-se uma falta de sistematização dos estudos realizados nessas áreas, uma vez que eles não são reconhecidos
como estudos de história de reforçamento e,
conseqüentemente, seus resultados não são integrados com aqueles obtidos em pesquisas de
história. A integração dos resultados dessas pesquisas poderia contribuir para o acúmulo do
conhecimento sobre o comportamento humano (e não-humano), por vários motivos. Primeiro, porque os resultados de alguns estudos
poderiam ser considerados replicações sistemáticas de resultados obtidos em uma outra área,
favorecendo a fidedignidade e a generalidade
dos dados encontrados, além de evitar gastos
desnecessários de tempo e de recursos financeiros com outras replicações. Segundo, porque variáveis que alteram os efeitos da história de reforçamento, identificadas em uma área
de pesquisa, poderiam ser manipuladas de
modo a aumentar o controle experimental de
estudos de outras áreas que também investigam efeitos de história. Terceiro, porque os
resultados de estudos em uma dessas áreas de
pesquisa poderiam suscitar questões a serem
58
ABREU-RODRIGUES, RIBEIRO & COLS.
investigadas, também, por outras áreas de
pesquisa.
Para que os resultados dos estudos que
investigam os efeitos de variáveis históricas
sejam integrados, é necessária uma retomada
da definição anteriormente apresentada de
história de reforçamento. De acordo com a definição proposta por Wanchisen (1990), um
estudo poderá ser considerado um estudo de
história quando o seu objetivo for acessar, em
uma fase de teste, os efeitos da exposição prévia a diferentes condições experimentais. Dentre os estudos com tais objetivos encontramse aqueles da área denominada resistência à
mudança (apresentada no Capítulo 4 deste livro). Ou seja, as pesquisas que investigam a
resistência à mudança e os efeitos da história
de reforçamento compartilham o mesmo interesse: a sensibilidade do desempenho previamente reforçado diante de mudanças nas
contingências (Santos, 2001). Quanto menor
a sensibilidade comportamental observada,
maior a resistência à mudança ou, alternativamente, maior o efeito da história de
reforçamento sobre o responder atual. No
entanto os procedimentos utilizados nas duas
áreas de investigação guardam algumas diferenças. Primeiro, a variável histórica é diferente nas duas áreas: enquanto os estudos de
história investigam os efeitos da exposição,
na fase de treino, a dois ou mais esquemas de
reforçamento diferentes (p. ex.: FR e DRL),
estudos sobre resistência investigam os efeitos da liberação de reforços com taxa, magnitude ou atraso diferentes sob um único esquema de reforçamento (p. ex.: um esquema
mult de VI 1 min VI 3 min), na fase de treino.
Segundo, enquanto os estudos sobre história
geralmente investigam a sensibilidade
comportamental à mudança nas contingências, utilizando esquemas diferentes nas fases
de treino e de teste, estudos sobre resistência
à mudança investigam a sensibilidade implementando outros tipos de alterações nas contingências vigentes, tais como aumentos
no nível de saciação, apresentação de um estímulo sinalizador de choques inevitáveis e
extinção. Possivelmente devido a essas diferenças, estudos sobre resistência à mudança
não são reconhecidos como estudos de história de reforçamento.
Os estudos de resistência à mudança têm
consistentemente indicado que os efeitos de
mudanças nas condições experimentais são alterados por diversas variáveis históricas. Por
exemplo, vários experimentos têm indicado que
aumentos no nível de saciação, sobrepostos ao
esquema em vigor, produzem um menor
declínio na taxa de respostas produzida pelo
esquema de reforçamento que envolve a liberação de reforços com maiores magnitudes
(Harper e McLean, 1992, Experimento 1;
Nevin, 1974, Experimento 3; Nevin, Mandell e
Yarensky, 1981, Experimento 1), maiores taxas (Cohen et al., 1993, Experimentos 3 e 4;
Nevin, 1974, Experimento 1) e menores atrasos (Grace, Schwendiman e Nevin, 1998, Fase
2; Nevin, 1974, Experimento 4). No entanto
os efeitos de tais variáveis não foram ainda
investigados em função da mudança no esquema de reforçamento, isto é, utilizando-se o procedimento mais comum na área de história
comportamental.
Outros estudos em análise do comportamento que investigam efeitos de variáveis históricas, de acordo com a definição proposta por
Wanchisen (1990), são aqueles incluídos na
área de desamparo aprendido, apresentada no
Capítulo 5. De uma forma geral, estudos sobre
desamparo aprendido utilizam três grupos experimentais que são expostos, na fase de treino, a eventos aversivos independentes da resposta, eventos aversivos dependentes da resposta ou não recebem nenhum tipo de tratamento; na fase de teste, todos os grupos são
expostos a uma única situação experimental,
na qual os efeitos da exposição às condições
anteriores são avaliados.
Assim como os estudos sobre resistência
à mudança, estudos sobre desamparo aprendido não são reconhecidos como investigações
sobre história de reforçamento, uma vez que
os procedimentos utilizados nessas duas áreas
guardam algumas diferenças. Primeiro, a variável histórica cujos efeitos são investigados não
é a mesma: enquanto estudos de história investigam os efeitos da exposição, na fase de
treino, a dois ou mais esquemas de reforçamento, estudos de desamparo investigam os
ANÁLISE DO COMPORTAMENTO
efeitos da exposição a dois esquemas (VI e VT),
em que há ocorrência de eventos aversivos (p.
ex.: choques ou tons altos) dependentes ou
independentes da resposta nessa mesma fase.
Segundo, enquanto estudos de história envolvem condições em que há uma relação de dependência entre o evento e a resposta, tanto
na fase de treino quanto na fase de teste, estudos de desamparo geralmente envolvem condições em que há independência entre a resposta e o evento na fase de treino e dependência entre a resposta e o evento, na fase de teste. Terceiro, as variáveis dependentes avaliadas nas duas áreas de investigação são diferentes: enquanto estudos de história investigam os efeitos de manipulações em variáveis
históricas sobre a sensibilidade da taxa de respostas, estudos de desamparo investigam os
efeitos dessas variáveis sobre o tempo de reação
e o número de acertos na nova contingência.
Os resultados de estudos sobre desamparo aprendido têm indicado que o grupo exposto a eventos independentes da resposta apresenta maiores déficits na aprendizagem (tempos de reação mais longos e menor número de
acertos) subseqüente do que os demais grupos
(Benson e Kennely, 1976; Overmier e Seligman,
1967). Em outras palavras, a história de exposição a eventos independentes da resposta diminui a sensibilidade à alteração nas condições
experimentais (de independência para dependência), uma vez que o sujeito permanece comportando-se como se não houvesse relação de
contingência entre suas respostas e o reforço.
Além disso, muitos estudos sobre desamparo
indicam que a exposição a condições em que a
ocorrência dos eventos depende da resposta,
antes da fase de treino ou entre esta e a fase de
teste, pode anular os efeitos da história de independência entre os eventos e as respostas,
não sendo observado, assim, o desamparo
aprendido na fase de teste (Prindaville e Stein,
1978; Williams e Maier, 1977; Yano e Hunziker,
2000, Experimento 2). Tais condições têm sido
denominadas como “imunização” e “terapia”,
respectivamente.
Diversas variáveis investigadas na área de
história de reforçamento não foram ainda
investigadas na área de desamparo aprendido.
Considerando-se os resultados de estudos que
59
indicam que a diferença na regularidade temporal da apresentação dos eventos nas fases
de treino e de teste (Freeman e Lattal, 1992),
aumentos no atraso entre a fase de treino e a
fase de teste (Ono e Iwabuchi, 1997) e aumentos no nível de saciação (Aló, 2002) promovem a sensibilidade à mudança nas contingências ou, alternativamente, minimizam os efeitos da história de exposição a diferentes esquemas de reforçamento, seria interessante investigar se essas variáveis diminuiriam também
os efeitos da história de independência entre
os eventos e o responder.
O objetivo dos estudos sobre comportamento governado por regras (CGR, apresentado no Capítulo 12) também consiste em investigar, na fase de teste, os efeitos da exposição
prévia a determinadas condições experimentais e, portanto, também podem ser considerados estudos sobre história de reforçamento, de
acordo com a definição proposta por Wanchisen
(1990). No entanto esses estudos não são reconhecidos como tais, provavelmente em função de diferenças entre os procedimentos
adotados nas duas áreas. Primeiro, as variáveis históricas investigadas são diferentes: enquanto estudos sobre história investigam os
efeitos da exposição prévia a diferentes esquemas de reforçamento, estudos sobre CGR investigam os efeitos da exposição prévia a regras. Segundo, estudos de história geralmente
envolvem apenas contingências não-verbais,
enquanto estudos de CGR envolvem dois tipos
de contingências de reforçamento: verbais e
não-verbais. Terceiro, enquanto os estudos sobre história investigam a sensibilidade comportamental à mudança nas contingências utilizando esquemas diferentes nas fases de treino
e de teste, estudos sobre CGR não envolvem,
necessariamente, mudanças no esquema de
reforçamento. Para avaliar a sensibilidade do
CGR, são utilizadas duas metodologias básicas.
Na primeira, uma regra é fornecida ao participante, que é, então, exposto a uma contingência; em seguida, essa contingência é modificada, enquanto a regra permanece a mesma.
Na segunda, ocorre o inverso, a regra é modificada, e a contingência permanece inalterada.
Caso a modificação da contingência seja acompanhada de mudanças no desempenho, o com-
60
ABREU-RODRIGUES, RIBEIRO & COLS.
portamento é considerado sensível e, caso contrário, insensível. Alternativamente, caso a mudança na regra seja acompanhada de mudanças no desempenho, este é considerado insensível; caso contrário, o desempenho é considerado sensível.
Diversos estudos têm demonstrado que a
história de reforçamento por seguir regras pode
promover insensibilidade a mudanças nas contingências ambientais (Hayes et al., 1976;
Kaufman, Baron e Kopp, 1966; Otto, Torgrud e
Holborn, 1999). Outros estudos têm indicado
que essa insensibilidade pode ser minimizada
ou anulada por variáveis como o contato com a
discrepância entre a regra e a contingência
(Buskist e Miller, 1986; Galizio, 1979), a história de exposição a instruções ou esquemas de
reforçamento variados (LeFrancois, Chase, e
Joyce, 1988) e a utilização de esquemas com
freqüência alta de reforços (Newman et al.,
1994). Entretanto os efeitos da interação entre
a história de reforçamento por seguir regras e
outras variáveis estudadas na área de história
de reforçamento não foram ainda investigados.
Considerando-se os resultados dessa área que
indicam que a saciação, por exemplo, pode
minimizar os efeitos da história, seria plausível
supor que aumentos no nível de saciação dos
reforços fornecidos na contingência não-verbal
minimizariam a insensibilidade produzida pela
história de reforçamento por seguir regras.
Concluindo, áreas de pesquisa que investigam os efeitos da história de reforçamento,
como aquelas denominadas de resistência à mudança, desamparo aprendido e comportamento governado por regras, vêm se desenvolvendo independentemente, não se beneficiando mutuamente com os resultados obtidos. Muitas vezes, pesquisadores interessados em uma área de
pesquisa realizam experimentos com base apenas no que tem sido discutido na área específica, não procurando integrar os resultados obtidos com os de outras áreas. Conforme se procurou ilustrar aqui, os resultados encontrados por
estudos em diferentes áreas poderiam contribuir para o aprimoramento do controle experimental, para suscitar novas questões de investigação, ou para complementar as questões formuladas por pesquisadores de outras áreas. A
identificação de estudos cujas variáveis de inte-
resse são comuns, de uma forma geral, poderá
promover a integração dos resultados obtidos
em diversas áreas, favorecendo a predição e o
controle do comportamento humano.
REFERÊNCIAS BIBLIOGRÁFICAS
Aló, R. M. (2002). História de reforçamento e operações
estabelecedoras: Efeitos sobre a sensibilidade comportamental. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF.
Baer, R. A.; Detrich, R.; Weninger, J. M. (1988). On the
functional role of the verbalization in correspondence
training procedures. Journal of Applied Behavior
Analysis, 21, 345-356.
Baron, A.; Leinenweber, A. (1995). Effects of a variableratio conditioning history on sensitivity to fixed-interval
contingencies in rats. Journal of the Experimental
Analysis of Behavior, 63, 97-110.
Bell, M. C. (1999). Pavlovian contingencies and resistance to change in a multiple schedule. Journal of the
Experimental Analysis of Behavior, 72, 81-96.
Benson, J. S.; Kennely, K. J. (1976). Learned
helplessness: The result of controllable reinforcements
or uncontrollable aversive stimuli? Journal of Personality
and Social Psychology, 34, 138-145.
Bickel, W. K.; Higgins, S. T.; Kirby, K.; Johnson, M.
(1988). An inverse relationship between baseline fixedinterval response rate and the effects of a tandem
response requirement. Journal of the Experimental
Analysis of Behavior, 50, 211-218.
Buskist, W. F.; Miller, H. L.; Jr. (1986). Interaction
between rules and contingencies in the control of
human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 36, 109-116.
Cirino, S. (2000). O que é história comportamental.
Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M.
C. Scoz (Orgs.), Sobre comportamento e cognição: Vol.
7. Expondo a variabilidade (p. 153-158). Santo André,
SP: ESETec.
Cirino, S. (2001). Detecção da história de reforçamento:
Problemas metodológicos para lidar com a história passada. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz
e M. C. Scoz (Orgs.), Sobre comportamento e cognição:
Vol. 8. Expondo a variabilidade (p. 137-147). Santo
André, SP: ESETec.
Cohen, S. L.; Pedersen, J.; Kinney, G. G.; Myers, J.
(1994). Effects of reinforcement history on responding
under progressive-ratio schedules of reinforcement.
Journal of the Experimental Analysis of Behavior, 61,
375-387.
Cohen, S. L.; Riley, D. S.; Wiegle, P. A. (1993). Tests of
behavior momentum in simple and multiple schedules
with rats and pigeons. Journal of the Experimental Analysis of Behavior, 60, 255-291.
Cole, M. R. (2001). The long-term effect of high- and
low-rate responding histories on fixed-interval respon-
ANÁLISE DO COMPORTAMENTO
ding in rats. Journal of the Experimental Analysis of Behavior, 75, 43-54.
Freeman, T. J.; Lattal, K. A. (1992). Stimulus control
of behavioral history. Journal of the Experimental Analysis of Behavior, 57, 5-15.
Galizio, M. (1979). Contingency-shaped and rulegoverned behavior: Instructional control of human loss
avoidance. Journal of the Experimental Analysis of
Behavior, 31, 53-70.
Grace, R. C.; Schwendiman, J. W.; Nevin, J, A. (1998).
Effects of unsignaled delay of reinforcement on
preference and resistance to change. Journal of the
Experimental Analysis of Behavior, 69, 247-261.
Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992).
Stimulus effects on concurrent performance in transition. Journal of the Experimental Analysis of Behavior,
58, 335-347.
Harper, D. N. (1996). Response-independent food
delivery and behavioral resistance to change. Journal
of the Experimental Analysis of Behavior, 65, 549-560.
Harper, D. N.; McLean, A. P. (1992). Resistance to
change and the law of effect. Journal of the Experimental Analysis of Behavior, 57, 317-337.
Hayes, S. C.; Brownstein, A. J.; Zettle, R. D.; Rosenfarb,
I.; Korn, Z. (1976). Rule-governed behavior and sensitivity to changing consequences of responding. Journal
of the Experimental Analysis of Behavior, 45, 237-256.
Hayes, S. C.; Rosenfarb, I.; Wulfert, E.; Munt, E. D.;
Korn, Z.; Zettle, R. D. (1985). Self-reinforcement
effects: An artifact of social standard setting? Journal
of Applied Behavior Analysis, 18, 201-214.
Hearst, E. (1961). Resistance-to-extinction functions
in the single organism. Journal of the Experimental
Analysis of Behavior, 4, 133-144.
Johnson, L. M.; Bickel, W. K.; Higgins, S. T.; Morris, E.
K. (1991). The effects of schedule history and the
opportunity for adjunctive responding on behavior during a fixed-interval schedule of reinforcement. Journal
of the Experimental Analysis of Behavior, 55, 313-322.
Kaufman, A.; Baron, A.; Kopp, R. E. (1966). Some
effects of instructions on human operant behavior.
Psychonomic Monograph Supplements, 1, 243-250.
Lattal, K. A. (1975). Reinforcement contingencies as
discriminative stimuli. Journal of the Experimental
Analysis of Behavior, 23, 241-246.
Lattal, K. A.; Neef, N. A. (1996). Recent reinforcementschedule research and applied behavior analysis.
Journal of Applied Behavior Analysis, 29, 213-230.
LeFrancois, J. R; Chase, P. N.; Joyce, J. H. (1988). The
effects of a variety of instructions on human fixedinterval performance. Journal of the Experimental
Analysis of Behavior, 49, 383-393.
LeFrancois, J. R.; Metzger, B. (1993). Low-responserate conditioning history and fixed-interval responding
in rats. Journal of the Experimental Analysis of Behavior,
59, 543-549.
Madden, G. J.; Chase, P. N.; Joyce, J. H. (1998). Making
sense of sensitivity in the human operant literature.
The Behavior Analyst, 21, 1-12.
61
Martens, B. K.; Bradley, T. A.; Eckert, T. L. (1997). Effects
of reinforcement history and instructions on the
persistence of student engagement. Journal of Applied
Behavior Analysis, 30, 569-572.
Metzger, B. (1992). Stimulus control of behavioral
history and subsequent fixed-interval performance. Tese
de doutorado não publicada. West Virginia University,
Morgantown, WV, USA.
Nader, M. A.; Thompson, T. (1987). Interaction of
methadone, reinforcement history, and variable-interval
performance. Journal of the Experimental Analysis of
Behavior, 48, 303-315.
Nevin, J. A. (1974). Response strength in multiple
schedules. Journal of the Experimental Analysis of
Behavior, 21, 389-408.
Nevin, J. A.; Grace, R. C. (2000). Preference and
resistance to change with constant-duration schedule
components. Journal of the Experimental Analysis of
Behavior, 74, 79-100.
Nevin, J. A.; Mandell, C.; Atak, J. R. (1983). The
analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39, 49-59.
Nevin, J. A.; Mandell C.; Yarensky, P. (1981). Response
rate and resistance to change in chained schedules.
Journal of Experimental Psychology: Animal Behavior
Processes, 7, 278-294.
Newman, B.; Hemmes, N. S.; Buffington, D. M.;
Andreopoulos, S. (1994). The effects of schedules of
reinforcement on instruction-following in human
subjects with verbal and nonverbal stimuli. The Analysis
of Verbal Behavior, 12, 31-41.
Okouchi, H. (2003). Effects of differences in interreinforcer intervals between past and current schedules on
fixed-interval responding. Journal of the Experimental
Analysis of Behavior, 79, 49-64.
Ono, K.; Iwabuchi, K. (1997). Effects of histories of
differential reinforcement of response rate on variableinterval responding. Journal of the Experimental Analysis
of Behavior, 67, 311-322.
Otto, T. L.; Torgrud, L. J.; Holborn, S. W. (1999). An
operant blocking interpretation of instructed insensitivity to schedule contingencies. Journal of the Experimental Analysis of Behavior, 49, 663-684.
Overmier, J. B.; Seligman, M. E. P. (1967). Effects of
inescapable shock on subsequent escape and avoidance
learning. Journal of Comparative and Physiological
Psychology, 63, 28-33.
Poppen, R. (1982). Human fixed-interval performance
with concurrently programmed schedules: A parametric
analysis. Journal of the Experimental Analysis of Behavior, 37, 251-266.
Prindaville, P.; Stein, N. (1978). Predictability, controllability, and inoculation against learned helplessness. Behavior Research and Therapy, 16, 263-271.
Progar, P. R.; North, S. T.; Bruce, S. S.; DiNovi, B. J.;
Brett, J. N.; Eberman, E. M.; Bailey, J. R.; Jr.; Nussbaum,
C. N. (2001). Putative behavioral history effects and
aggression maintained by escape from therapists.
Journal of Applied Behavior Analysis, 34, 69-72.
62
ABREU-RODRIGUES, RIBEIRO & COLS.
Santos, C. V. (2001). Efeitos do contexto social sobre a
resistência a mudança. Dissertação de mestrado não-publicada. Universidade de Brasília, Brasília, DF.
Sidman, M. (1960). Tactics of scientific research. New
York: Basic Books.
Skinner, B. F. (1953). Science and human behavior. New
York: Free Press.
Tatham, T. A.; Wanchisen, B. A. (1998). Behavioral history: A definition and some common findings from two
areas of research. The Behavior Analyst, 21, 241-251.
Taylor, I.; O’Reilly, M. F.; Lancioni, G. (2000). Behavioral history: Implications for applied behavior analysis. Em J. C. Leslie; D. Blackman (Eds.), Experimental and applied analysis of human behavior (p. 235-250).
Reno, Nevada: Context Press.
Urbain, C.; Poling, A.; Millam, J.; Thompson, T. (1978).
d-Amphetamine and fixed-interval performance: Effects
of operant history. Journal of the Experimental Analysis
of Behavior, 29, 385-392.
Wanchisen, B. A. (1990). Forgetting the lessons of
history. The Behavior Analyst, 13, 21-37.
Wanchisen, B. A.; Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling
human operant behavior. Behavior Analyst, 14, 139-144.
Wanchisen, B. A.; Tatham, T. A.; Mooney, S. E. (1989).
Variable-ratio conditioning history produces high- and
low-rate fixed-interval performance in rats. Journal of
the Experimental Analysis of Behavior, 52, 167-179.
Weiner, H. (1964). Conditioning history and human
fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7, 383-385.
Weiner, H. (1965). Conditioning history and maladaptive human operant behavior. Psychological Reports, 17,
935-942.
Weiner, H. (1969). Controlling human fixed-interval
performance. Journal of the Experimental Analysis of
Behavior, 12, 349-373.
Williams, J. L.; Maier, S. F. (1977). Transituational
immunization and therapy of learned helplessness in
the rat. Journal of Experimental Psychology, 3, 240-252.
Yano, Y.; Hunziker, M. H. L. (2000). Desamparo aprendido e imunização com diferentes respostas de fuga.
Acta Comportamentalia, 8, 143-166.
ANÁLISE DO COMPORTAMENTO
MOMENTO COMPORTAMENTAL
63
4
CRISTIANO VALÉRIO DOS SANTOS
A manutenção da resposta em face de modificações nas condições ambientais é uma
questão de extrema relevância, tanto para
quem trabalha com pesquisa básica quanto para
quem está interessado em propiciar mudanças
duradouras no comportamento de seus clientes. Quem trabalha com pesquisa básica ou aplicada dentro do referencial teórico analíticocomportamental, muito freqüentemente, usa
delineamentos nos quais as variáveis são manipuladas intra-sujeito, e conhecer como manipulações prévias podem afetar o desempenho sob contingências atuais torna-se crítico.
Similarmente, quem se preocupa com a aplicação direta dos princípios da análise do comportamento em situações fora do laboratório
constantemente se questiona sobre como conseguir resultados duradouros ou sobre comportamentos especialmente difíceis de modificar.
Em ambos os casos, conhecer as variáveis responsáveis pela maior ou menor persistência da
resposta é imprescindível.
Tradicionalmente, essa questão tem sido
tratada, em análise do comportamento, sob o
rótulo de “força da resposta”. Mais recentemente, esse termo vem sendo substituído pelo conceito de “momento comportamental”, que envolve a observação de duas medidas: a freqüência com que essa resposta é emitida por unidade de tempo (taxa de respostas) e o grau de
alteração no responder quando alguma condição é alterada (resistência a mudanças). Embora as variáveis que afetam a taxa de respostas já tenham sido amplamente estudadas, somente a partir da década de 1980 procurou-se
estudar mais detalhadamente a resistência a
mudanças (Nevin e Grace, 2000).
O produto da taxa de respostas e a resistência a mudanças é chamado “momento
comportamental”, em analogia à noção de
quantidade de movimento na Mecânica Clássica: a taxa de respostas seria equivalente à
velocidade com que um corpo se desloca e a
resistência a mudanças seria equivalente à
massa (quantidade de inércia) desse corpo
(Nevin, Mandell e Atak, 1983). Por exemplo,
a força necessária para parar um carro a 100
km/h é maior do que a força necessária para
parar esse mesmo carro se ele estiver a 60
km/h. Por outro lado, parar um caminhão
requer um esforço muito maior do que parar
um carro, pois o caminhão tem maior massa.
Analogamente, seria necessária uma alteração maior nas condições ambientais para perturbar o responder que apresenta alto momento comportamental.
Este capítulo é basicamente sobre resistência a mudanças. Inicialmente, serão discutidas questões metodológicas presentes nos
estudos de resistência a mudanças, com ênfase na definição e na mensuração desse fenômeno. Em seguida, será feita uma revisão sobre as principais variáveis que afetam a resistência a mudanças e sobre seus processos determinantes. A isso, segue-se um item no qual
serão discutidas as semelhanças e as diferenças entre o conceito de resistência a mudanças
e outros conceitos presentes na análise do comportamento. Por fim, serão apresentados alguns
estudos que tentaram fazer uma ponte entre
64
ABREU-RODRIGUES, RIBEIRO & COLS.
os dados obtidos em laboratório sobre resistência a mudanças e possíveis aplicações práticas desse conceito.
MOMENTO COMPORTAMENTAL:
PESQUISA BÁSICA
A pesquisa básica sobre momento comportamental, em especial sobre resistência a
mudanças, tem sido desenvolvida ao longo dos
últimos 30 anos. Antes desse período, já havia
estudos conduzidos com o objetivo de avaliar
a resistência do ato de responder em face de
mudanças nas contingências, principalmente
diante de procedimento de extinção, mas alguns problemas na forma como os dados foram analisados, discutidos a seguir, tornam difícil uma comparação entre esses estudos e os
conduzidos mais recentemente. Assim, a revisão que se segue focalizará os estudos mais
recentes que não apresentam tais problemas e
que se enquadram dentro do quadro conceitual
do momento comportamental.
Questões metodológicas
Uma forma de se estudar a resistência a
mudanças no laboratório poderia ser feita expondo um organismo a um esquema de reforçamento qualquer e observando mudanças na
resposta quando alguma condição (p. ex.: nível de privação) é modificada. Contudo Nevin
(1979) apontou que esse procedimento pode
não ser o mais adequado: é possível que a resposta não seja alterada sob aquele esquema de
reforçamento, como também pode ser que
aquela mudança no nível de privação não afete a resposta sob nenhum esquema. Assim sendo, pouca ou nenhuma informação sobre resistência é obtida.
Um procedimento mais adequado para
o estudo da resistência a mudanças envolve a
exposição de um organismo a duas ou mais
contingências diferentes. Essas contingências
são, em geral, apresentadas em um esquema
múltiplo, que envolve a apresentação sucessiva de dois ou mais esquemas de reforçamento e com sinalização antecedente diferencia-
da para cada esquema. O esquema múltiplo é
preferido por garantir que uma condição ambiental vai afetar a resposta em todas as contingências aproximadamente da mesma forma e intensidade. Depois da obtenção de uma
taxa de respostas estável em todas as contingências, alguma condição ambiental é modificada, e alterações na taxa de respostas são
observadas. Uma resposta é considerada mais
resistente a mudanças quanto menos ela se
alterar em face das modificações nas condições ambientais. Grandes alterações são indicativas de menor resistência.
Uma outra questão importante para a
qual se deve atentar é a medida de resistência
a mudanças. Observem que o interesse não é
mais na taxa de respostas em si, mas na maior
ou menor manutenção da resposta – que pode
ser a taxa de respostas ou qualquer outra dimensão do comportamento – em face de alguma mudança. Se a dimensão de interesse for
semelhante entre os componentes do esquema múltiplo e for observado que, depois da
mudança em alguma condição, essa dimensão
foi afetada em graus diferentes entre os componentes, a identificação do componente no
qual a obtenção da resposta era mais resistente é bastante clara. Contudo considerem o seguinte exemplo: em um dos componentes de
um esquema múltiplo, a taxa de respostas era
de 100 respostas por minuto (R/min); no outro componente, a taxa era de 50 R/min. Após
a alteração de alguma condição, a taxa de respostas no primeiro componente passou a ser
de 80 R/min e no segundo, de 30 R/min. Em
ambos, a taxa de respostas sofreu um decréscimo absoluto semelhante: 20 R/min. No entanto esse mesmo valor representa uma redução de 20% no primeiro componente e uma
redução de 40% no segundo. Assim, não faz
sentido dizer que ambos os componentes apresentam igual resistência se, em relação à condição anterior, a redução no segundo componente foi duas vezes maior. Esse problema é
contornado usando-se uma medida relativa ou
uma escala que leve em conta o nível da resposta antes da alteração (p. ex.: escala logarítmica). A maioria dos estudos apresentados a seguir tomou esse cuidado; em caso de exceção,
esse fato será ressaltado explicitamente.
ANÁLISE DO COMPORTAMENTO
Um exemplo do procedimento comumente utilizado para estudar resistência a mudanças no laboratório é apresentado no estudo de
Bouzas (1978). Nesse estudo, pombos foram
expostos a um esquema múltiplo com dois
componentes. Em um deles, vigorava um esquema de reforçamento de intervalo variável
(VI) 1 min; no outro, vigorava um esquema de
VI 4 min. Assim que a taxa de respostas tornou-se estável nos dois componentes, uma condição ambiental foi alterada: uma contingência de punição foi sobreposta ao esquema múltiplo. Em ambos os componentes, choques de
intensidades variadas eram liberados de acordo com um esquema de VI 30 s. Essa alteração
ambiental provocou um decréscimo na taxa de
respostas nos dois componentes, como era de
se esperar. Entretanto esse decréscimo foi maior
no componente que liberava menos reforços
(VI 4 min). De acordo com a definição já apresentada, a resposta mantida pelo esquema VI
4 min foi menos resistente à mudança na contingência.
A introdução de uma contingência de punição é somente uma entre várias condições
que podem ser alteradas. Outras operações que
freqüentemente são realizadas incluem o procedimento de extinção (retirada da conseqüência mantenedora da resposta), alterações no
nível de privação (em especial, saciação antes
da sessão experimental), acréscimo de “reforçadores” livres dentro do próprio componente
ou em um intervalo entre componentes, introdução de estímulos que sinalizam a ocorrência de estímulos aversivos inevitáveis, entre
outras. A lista não pretende ser exaustiva; é
possível pensar em vários outros procedimentos que vão, de alguma forma, afetar a resposta, aumentando-a ou diminuindo-a, e qualquer
um deles pode ser considerado uma operação
que vai, de alguma forma, alterar o curso normal da resposta (DO, do inglês Disrupting
Operation).
Usando como referência a Mecânica Clássica, o modelo de momento comportamental
pode ser expresso matematicamente conforme
a seguinte função:
log (Bx /Bo) = -f/m (1)
65
Nessa função Bo e Bx representam a taxa
assintótica de respostas durante a linha de base
e após a introdução da DO, respectivamente; f
é o valor da DO (p. ex.: taxa de “reforçadores”
livres, quantidade de alimento fornecido antes da sessão ou número de sessões de
extinção), e m é a massa comportamental (resistência a mudanças). O sinal negativo antes
de f indica que a DO diminui a taxa de respostas e, uma vez que o lado esquerdo da equação é adimensional, f e m devem ser medidos
nas mesmas unidades.
A função logarítmica presente na equação é preferida por três motivos principais:
a) como já mencionado, a escala logarítmica leva em consideração o nível da resposta antes da introdução
da DO;
b) essa escala evita o efeito “chão”, uma
vez que vai até – ∞;
c) as funções que relacionam log (Bx /Bo)
aos valores da DO são aproximadamente lineares (Nevin, 2002).
Um dado interessante apresentado por
Nevin é o fato de que a medida de resistência
a mudanças apresenta propriedades aditivas,
o que a qualifica como uma escala de razão.
Por exemplo, se duas DOs são combinadas (p.
ex.: introdução de “reforçadores” livres durante
o intervalo entre componentes e extinção), essa
combinação terá o mesmo efeito, numericamente, que a soma algébrica dos efeitos das
DOs isoladas. O mesmo vale para combinação
de diferentes dimensões dos reforçadores (p.
ex.: taxa e magnitude).
Variáveis que afetam
a resistência a mudanças
Ao contrário do que acontece na Mecânica Clássica, na qual a massa de um corpo em
movimento raramente muda de um momento
para outro, a resistência da resposta a mudanças pode ser afetada por uma série de variáveis. Muitas delas afetam igualmente a taxa
de respostas; porém, como veremos adiante,
os processos determinantes da taxa de respos-
66
ABREU-RODRIGUES, RIBEIRO & COLS.
tas e da resistência a mudanças podem ser diferentes. Além disso, a resistência a mudanças
pode ser diferencialmente afetada pelo tipo de
mudança que é realizado.
Dentre as variáveis que afetam a resistência a mudanças da resposta mantida por
reforçamento positivo, destacam-se a magnitude, o atraso e a taxa de reforços. Tanto a magnitude quanto a taxa de reforços, em geral,
apresentam uma relação direta com a resistência a mudanças; o atraso do reforço e a resistência a mudanças, por outro lado, apresentam uma relação inversa.
O efeito da magnitude do reforço é
exemplificado no estudo de Harper e McLean
(1992, Experimento 1), no qual pombos foram
expostos a um esquema múltiplo VI 120 s VI
120 s, cujos componentes diferiam somente
na duração de acesso ao alimento que era fornecido (6 s ou 2 s). Em seguida, 3 s de alimento livre foram fornecidos no intervalo
entre componentes de acordo com esquemas
de tempo variável (VT) 30 ou 120 s. Todas as
condições foram mantidas até que a taxa de
respostas atendesse a um critério de estabilidade. As mudanças na taxa de respostas em
face da liberação de alimento livre foram analisadas tanto nas cinco sessões iniciais quanto nas cinco últimas sessões. Em ambos os
casos, a taxa de respostas no componente que
liberava o reforço de maior magnitude apresentou um menor decréscimo com a introdução de alimento livre, indicando, portanto,
maior resistência a essa manipulação. Resultados semelhantes a esses foram obtidos em
outras ocasiões usando extinção (Pavlik e
Collier, 1977), diferentes magnitudes de alimento livre no intervalo entre componentes
(Harper, 1996) e saciação (Nevin, Mandell e
Yarensky, 1981) como DO.
O atraso do reforço, em geral, diminui a
resistência a mudanças, como demonstrado nos
estudos de Nevin (1974) e Grace, Schwendiman e Nevin (1998). Entretanto esse efeito
pode ser revertido caso o atraso seja sinalizado. Bell (1999) treinou pombos em um esquema múltiplo com três componentes, separados
por períodos de blackout. No primeiro componente, vigorava um esquema VI de 120 s e a
primeira resposta após o término do intervalo
iniciava um atraso não sinalizado de 3 ou 8 s.
O segundo componente era idêntico ao primeiro, com exceção de que o atraso após o esquema VI era sinalizado por uma mudança na cor
do disco. No terceiro componente vigorava um
esquema VI de 123 ou 128 s, dependendo do
atraso em vigor nos outros dois componentes.
Três testes de resistência foram realizados:
saciação, apresentação de alimento livre durante os períodos de blackout e extinção. Os
três procedimentos provocaram decréscimos na
taxa de respostas nos três componentes, porém de forma mais acentuada no componente
com atraso não-sinalizado; o decréscimo na
taxa de respostas do componente com atraso
sinalizado foi semelhante ao do componente
sem atraso.
De todas as variáveis estudadas, a taxa
de reforços é a que tem recebido maior
atenção dos pesquisadores. Um grande número de pesquisas investigou os efeitos de
reforçamento contínuo (CRF) versus reforçamento parcial (PRF) sobre a resistência à
extinção, e um dado foi sistematicamente
obtido: o ato de responder mantido por
reforçamento parcial, geralmente, apresentou
maior resistência à extinção. Esse efeito ficou
conhecido como o “efeito do reforçamento
parcial” (PRE, do inglês partial reinforcement
effect). O PRE tem sido compreendido como
resultado do que se chama decréscimo de generalização. Após um treino extensivo, os
reforçadores passam a fazer parte da situação de estímulo na qual o treino ocorre e,
quando a extinção começa, há uma mudança
maior na situação de estímulo da condição
de CRF para extinção do que da condição de
PRF para extinção, pois o PRF já inclui períodos em que não ocorre reforçamento. Essa
maior mudança na situação de estímulo
provocada pela transição de CRF para
extinção geraria um decréscimo maior na taxa
de respostas (Grace e Nevin, 2000).
Contudo, mais recentemente, esses dados
têm sido alvo de questionamentos, sendo o
principal deles o tipo de medida utilizado para
avaliar a resistência à extinção. A medida de
resistência à extinção nos estudos que demonstraram o PRE, em geral, era expressa em valores absolutos. Essa medida, como exposto an-
ANÁLISE DO COMPORTAMENTO
teriormente, não é uma medida fidedigna de
resistência uma vez que não leva em consideração o nível da resposta antes da extinção.
Ao fazer uma reanálise desses estudos usando, como medida de resistência, a taxa de respostas ao longo das sessões de extinção expressa como proporção da taxa de respostas
na primeira sessão de extinção, Nevin (1988)
observou que a inclinação da curva de extinção variava de um estudo para outro em função do total de reforços obtidos na condição
anterior à extinção: quanto maior o total de
reforços recebidos, mais a resistência à extinção da resposta mantida por CRF aumentava em relação à resistência à extinção da
resposta mantida por PRF, chegando freqüentemente a superá-la.
Os dados apresentados por Nevin (1988),
junto com outros (Blackman, 1968; Bouzas,
1978; Nevin, 1974, 1984; Nevin, Mandell e
Atak, 1983; Nevin et al., 1990), têm sugerido
que a resistência a mudanças é função direta
da taxa de reforços obtidos. Apesar da sistematicidade dos resultados obtidos nesses estudos, algumas variáveis importantes devem ser
consideradas. Primeiro, a relação direta entre
taxa de reforços e resistência a mudanças é
observada basicamente com o uso de esquemas múltiplos, cujos componentes alternam
com uma freqüência relativamente alta (durante a mesma sessão); se as diferentes taxas
de reforços forem apresentadas em esquemas
simples ou se os componentes alternarem a
cada dia ou a cada semana, essa relação direta
não se mantém (Cohen, 1998; Cohen, Riley e
Wigley, 1993). Segundo, os estudos que obtiveram essa relação direta utilizaram, em sua
grande maioria, procedimentos de operante livre, enquanto estudos que obtiveram PRE usaram procedimentos de tentativa discreta. Com
esse segundo tipo de procedimento, o PRE pode
ser observado apesar do uso de uma medida
relativa e, até o momento, não se sabe exatamente que aspecto desse procedimento levaria a esse resultado. Por fim, a resistência a mudanças, assim como a taxa de respostas, não é
determinada somente pela taxa de reforços obtidos em um componente isolado, mas depende da taxa de reforços de todos os outros comportamentos alternativos, fenômeno esse co-
67
nhecido como contraste comportamental
(Nevin, 1992).
Além das várias dimensões do estímulo
reforçador, o tipo de evento usado como
reforçador também pode afetar diferencialmente a resistência a mudanças. Mace e colaboradores (1997, Experimento 3) expuseram ratos
a um esquema múltiplo cujos componentes diferiam somente no estímulo que era usado
como reforçador (sacarina versus ácido cítrico). Em uma condição anterior, foi observado
que os ratos apresentavam preferência por sacarina em relação ao ácido cítrico. Quando
colocados em extinção, a resposta mantida por
sacarina mostrou-se mais resistente do que a
resposta mantida por ácido cítrico, sugerindo
que a qualidade do reforçador também é uma
variável importante.
Variáveis sociais também podem afetar
a resistência a mudanças. Santos (2001) investigou o efeito da presença de um outro indivíduo da mesma espécie sobre a resistência
a saciação. Inicialmente, ratos foram expostos a um esquema múltiplo com dois componentes (VI 10 s e VI 90 s). Após a obtenção de
taxa de respostas estável, os sujeitos foram
submetidos a um procedimento de saciação
antes da sessão experimental e expostos novamente ao esquema múltiplo. Contudo, nas
sessões em que ocorria a saciação, os sujeitos
poderiam estar sozinhos na caixa experimental ou na presença de outro rato, que poderia
estar igualmente respondendo ou meramente presente. A mera presença do outro rato
aumentou tanto a taxa absoluta de respostas
quanto a resistência à saciação, porém o efeito sobre a resistência a mudanças só foi
significante no componente VI 10 s.
A própria topografia da resposta, ou a forma como a resposta é organizada, também
pode ser afetada diferencialmente por mudanças no ambiente. Doughty e Lattal (2001), por
exemplo, observaram que o comportamento de
variação pode ser mais resistente a mudanças
do que o comportamento de repetição. Nesse
estudo, pombos foram expostos a um esquema múltiplo com dois componentes, sendo que,
em ambos, a unidade de análise era seqüências de quatro respostas, emitidas em dois discos: E, para o disco da esquerda e D, para o
68
ABREU-RODRIGUES, RIBEIRO & COLS.
disco da direita. Em um dos componentes, somente a seqüência EDED seria reforçada (componente de repetição); no outro, qualquer seqüência poderia ser reforçada desde que sua
freqüência relativa se situasse abaixo de um
patamar predeterminado (componente de variação). A taxa de reforços foi igualada entre
os componentes e foram realizados dois testes
de resistência: saciação antes da sessão e introdução de alimento livre entre os componentes. A resposta no componente de variação foi
ligeiramente mais resistente aos dois testes realizados do que a resposta no componente de
repetição, indicando que a resposta pode ser
afetada diferencialmente por mudanças no
ambiente em função da própria organização
da resposta em análise.
Os dados mencionados até o momento referem-se a pesquisas com animais não-humanos. Existem poucas pesquisas que investigaram o efeito de diferentes taxas de reforços
sobre a resistência a mudanças com humanos,
usando o modelo proposto por Nevin (1974).
Desses, dois merecem destaque, ambos realizados com participantes que apresentavam
atraso de desenvolvimento. Mace e colaboradores (1990) expuseram dois indivíduos com
retardo mental a um esquema múltiplo com
dois componentes. Em ambos os componentes, a tarefa dos sujeitos consistia em agrupar
talheres em conjuntos de garfos, facas e colheres. Os componentes eram sinalizados pela cor
dos talheres (verde e vermelho), e reforços
eram liberados de acordo com diferentes esquemas VI em cada um. O comportamento sob
investigação foi alterado pela introdução de um
videoteipe durante a tarefa. A taxa de respostas caiu em ambos os componentes, porém mais
acentuadamente no componente com menor
taxa de reforço. Além disso, em uma segunda
parte do experimento, reforços adicionais foram introduzidos, em um dos componentes,
independentes da resposta dos sujeitos. Essa
manipulação diminuiu a taxa de respostas nesse
componente, porém aumentou a resistência à
mudança quando o videoteipe foi introduzido.
Dube e McIlvane (2001) obtiveram resultado
semelhante, usando como tarefa um procedimento simples de discriminação condicional
(pareamento de identidade) e esquemas de razão variável (VR) no lugar de esquemas VI.
Se a quantidade de pesquisas sobre resistência a mudanças com reforçamento positivo
já não é tão grande, menor ainda é a quantidade de pesquisas sobre a resistência de comportamentos mantidos por reforçamento negativo. Além disso, as poucas pesquisas que investigaram esse assunto são, em sua maioria, antigas e apresentam os mesmos problemas na
análise dos dados que as primeiras pesquisas
com reforçamento positivo (uso de uma medida absoluta em vez de uma medida relativa),
de forma que seus resultados devem ser lidos
com cautela. Dos estudos existentes, todos investigaram a resistência à extinção dos comportamentos de fuga e esquiva, usando choque como o estímulo aversivo, obtendo-se os
seguintes resultados: a resistência à extinção
dos comportamentos de fuga e esquiva aumenta com o aumento na intensidade do choque
(Franchina, 1969; Stavely, 1966), com o acréscimo de um estímulo aviso (Shnidman, 1966)
e com o aumento na freqüência de choques
liberados (Courtney e Perone, 1992). Por outro lado, um aumento na probabilidade de reforço provoca uma diminuição na resistência
à extinção de comportamentos de esquiva
(Galvani, 1971; 1973; Olson, Davenport e
Kamichoff, 1971). Dos estudos sobre resistência à extinção de comportamentos mantidos
por reforçamento negativo, o trabalho de
Courtney e Perone (1992) foi o único que usou
uma medida relativa de resistência e o único
em que a variável de interesse (freqüência de
choques liberados) foi manipulada entre os
componentes de um esquema múltiplo concorrente.
Processos determinantes
da resistência a mudanças
A taxa de respostas durante o condicionamento e a resistência a mudanças (entendida como maior ou menor alteração em alguma medida da resposta quando alguma operação que a modifique é realizada) geralmente
têm sido consideradas medidas de força da res-
ANÁLISE DO COMPORTAMENTO
posta. No entanto, já em 1938 (p. 85), Skinner
sugeriu uma baixa correlação entre essas duas
medidas:
A definição de condicionamento que foi dada
aqui é em termos de uma mudança na força
do reflexo, mas o ato de reforçamento tem
outro efeito distinto. Ele estabelece a potencialidade de uma curva de extinção subseqüente, cujo tamanho é uma medida da extensão
do condicionamento. Não há uma relação simples entre essas duas medidas. É possível atingir uma taxa máxima de respostas (uma força
máxima) muito rapidamente. Reforços adicionais não afetam essa medida, mas continuam
a fortalecer a reserva descrita por uma curva
de extinção subseqüente. O efeito típico do
“supercondicionamento” é sentido não em alguma propriedade imediata do comportamento, mas sobre suas mudanças subseqüentes durante a extinção. (A ausência de uma relação
entre as duas medidas não é incompatível com
o pressuposto de uma relação entre taxa e reserva devido à interposição da reserva imediata limitada.) (itálico adicionado)
Alguns estudos têm reforçado a proposição de uma ausência de relação entre taxa de
respostas e resistência a mudanças. Fath e colaboradores (1983), por exemplo, expuseram
pombos a um esquema múltiplo VI 60 s VI
60 s, aos quais sobrepuseram um procedimento de pacing, segundo o qual as respostas só
seriam reforçadas se ocorressem em uma taxa
específica. Essa estratégia experimental diferenciou a taxa de respostas entre os componentes, mantendo a taxa e a probabilidade de
reforços constantes entre eles. Taxas de respostas diferentes mantidas pela mesma probabilidade de reforço apresentaram a mesma resistência quando alimento livre foi introduzido entre os componentes. Por outro lado,
Blackman (1968), usando um procedimento
de supressão condicionada, observou que taxas de respostas semelhantes mantidas por diferentes taxas de reforços apresentaram resistência diferenciada.
Esses dados levaram Nevin (1984) a sugerir que a taxa de respostas e a resistência a
mudanças seriam determinadas por processos
distintos. Mais precisamente, a taxa de respos-
69
tas seria determinada pela relação de contingência entre resposta e conseqüência (relação
R-S), enquanto a resistência a mudanças seria
determinada pela relação de contingência entre estímulo antecedente e conseqüência (relação S-S). Existe uma relação de contingência entre dois eventos A e B quando a probabilidade de B ocorrer dada a presença de A for
maior do que em sua ausência. Assim, quanto
maior a probabilidade de a conseqüência ocorrer na presença de um estímulo ou de uma resposta, em comparação com sua ausência, mais
forte será a relação entre eles.
Uma série de estudos tem sido realizada
com o objetivo de avaliar a proposta de Nevin
(1984) e, de forma geral, essa proposta tem
recebido algum apoio empírico (Nevin et al.,
1990; Nevin, Smith, e Roberts, 1987). Em um
estudo freqüentemente citado, Nevin e colaboradores (1990), enfraqueceram a relação RS, ao mesmo tempo em que fortaleceram a relação S-S, ao fornecerem uma fonte alternativa de reforços na presença do mesmo estímulo antecedente. No Experimento 1, os sujeitos
foram expostos a um esquema múltiplo no qual
esquemas VI idênticos vigoravam nos dois componentes. Em um dos componentes, além do
esquema VI, o alimento era liberado independentemente da resposta, de acordo com um
esquema VT, em uma taxa que variava de 40 a
240 reforços por hora. Dessa forma, a relação
R-S foi enfraquecida – visto que parte do alimento liberado no componente era independente da resposta – e o enfraquecimento dessa
relação provocou um decréscimo na taxa de
respostas que foi diretamente relacionado à
quantidade de alimento livre obtido. Contudo
a relação S-S foi fortalecida no componente
com reforços adicionais, já que uma maior
quantidade de alimento era recebida na presença do estímulo que sinalizava aquele componente. Para avaliar a proposta de que a resistência a mudanças seria aumentada pelo fortalecimento da relação S-S, dois testes de resistência a mudanças foram realizados: saciação e extinção. Nos dois testes, a proposta
foi confirmada: quanto maior a taxa de reforços obtidos, contingentes ou não à resposta,
maior foi a resistência. No Experimento 2, re-
70
ABREU-RODRIGUES, RIBEIRO & COLS.
sultados semelhantes foram obtidos, usando
um procedimento ligeiramente diferente: nesse caso, os reforços adicionais poderiam ser
obtidos respondendo em outro disco, cuja cor
era a mesma que sinalizava o componente.
Além disso, um outro estudo mostrou que
os reforçadores liberados independentemente
da resposta podem ser qualitativamente diferentes dos reforçadores liberados dependentes da resposta e, mesmo assim, a resistência é
aumentada. No estudo de Grimes e Shull
(2001), os sujeitos (ratos) respondiam em um
esquema múltiplo e recebiam pelotas de alimento como reforçador. Em um dos componentes, leite condensado era liberado independentemente da resposta e, após a obtenção de
taxas de respostas estáveis, a extinção era realizada. A resistência à extinção foi maior no
componente no qual o leite condensado era
liberado independentemente da resposta, resultado semelhante ao de Nevin e colaboradores (1990). Esses resultados, em conjunto, salientam a importância de se considerarem todas as conseqüências que estão sendo liberadas dentro de um contexto ou mesmo em contextos semelhantes, a despeito do tipo de conseqüência.
Apesar disso, mais recentemente, tem-se
observado a influência de algumas relações RS sobre a resistência a mudanças (Bell, 1999;
Nevin et al., 2001). No estudo de Bell, descrito anteriormente, em um dos componentes vigorava um esquema VI 120 s mais um atraso
não-sinalizado de 3 s, enquanto em outro componente vigorava um esquema VI 123 s. Dessa
forma, o tempo entre o início do componente
e a liberação do reforço era idêntico entre os
componentes (igual relação S-S), porém o atraso não-sinalizado enfraquecia a relação R-S.
Como descrito, o atraso do reforço não-sinalizado enfraqueceu a resistência a mudanças,
mostrando que esta também pode ser afetada
por modificações na relação R-S.
Resistência a mudanças e preferência
As variáveis que afetam a resistência a
mudanças parecem também afetar a preferência de uma alternativa entre várias dispostas
em esquemas concorrentes encadeados. Nevin
(1979) sugeriu que tanto a resistência a mudanças quanto a preferência são manifestações
de um constructo maior, a massa comportamental, que seria análoga à massa de um corpo físico.
Alguns estudos têm mostrado que a resistência a mudanças e a preferência entre elos
terminais de esquemas concorrentes encadeados realmente são co-variantes. Grace e
Nevin (1997) expuseram pombos a duas situações na mesma sessão experimental. Na
primeira parte da sessão, vigoravam esquemas concorrentes encadeados com elos iniciais iguais e elos terminais que diferiam somente na taxa de reforços liberados. Na segunda parte, os elos terminais dos esquemas
concorrentes encadeados usados na primeira
parte da sessão foram apresentados em esquemas múltiplos. A resistência a mudanças foi
testada com a liberação de alimento livre no
intervalo entre os componentes do esquema
múltiplo, e a preferência foi avaliada pela proporção de respostas nos elos iniciais. Tanto a
preferência quanto a resistência a mudanças
mostraram-se diretamente relacionadas à taxa
de reforços liberados. Além disso, preferência e resistência apresentaram alta correlação
entre si, o que sugere que essas duas medidas
podem ser expressões diferentes e independentes de um mesmo constructo, como sugerido por Nevin (1979). Resultados semelhantes foram obtidos com componentes de duração constante ou variável (Grace e Nevin,
2000) e com manipulações na magnitude do
reforço (Grace, Beddel e Nevin, 2002).
Resistência a mudanças versus
sensibilidade comportamental versus
efeitos da história de reforçamento
Outras áreas dentro da análise do comportamento, além daquela sobre resistência a
mudanças, observam a manutenção de padrões
de respostas após a alteração de alguma variável ambiental. Entre elas, destacam-se os estudos sobre a sensibilidade comportamental e sobre os efeitos de história de reforçamento e
punição. Embora a nomenclatura seja diferen-
ANÁLISE DO COMPORTAMENTO
te, todas essas áreas compartilham um mesmo
interesse: a persistência de padrões de comportamento anteriormente reforçados quando
mudanças nas contingências são realizadas.
Essa persistência tem sido denominada, por
diferentes grupos de pesquisadores, de alta
resistência a mudanças, baixa sensibilidade
comportamental ou efeito de história.
O termo sensibilidade comportamental é
geralmente usado em dois contextos diferentes. O primeiro deles se refere à área de escolha e de preferência. Nas pesquisas dessa área,
o procedimento padrão consiste em expor os
sujeitos a um esquema concorrente, cujos componentes são, em geral, esquemas VI que liberam diferentes taxas de reforços. Após as taxas de respostas tornarem-se estáveis, os valores dos esquemas VI são alterados ao longo de
várias condições, e a proporção de respostas
em cada uma das alternativas é calculada.
Herrnstein (1961) observou que a proporção
de respostas em cada alternativa igualava a
proporção de reforços liberados naquela alternativa. Esse resultado ficou conhecido como a
lei da igualação e tem sido replicado várias vezes (p. ex.: Brownstein e Pliskoff, 1968;
Reynolds, 1963).
Baum (1974), entretanto, observou que
a lei da igualação parecia não descrever acuradamente alguns resultados obtidos por meio
do procedimento já descrito. Alguns sujeitos
apresentavam grandes mudanças na proporção de respostas em face de pequenas mudanças na proporção de reforços; outros sujeitos,
por sua vez, apresentavam o padrão contrário. Em função disso, foram acrescentados dois
parâmetros à lei da igualação: o viés e a sensibilidade. O viés refere-se a uma preferência
por uma das alternativas que se mantém apesar das manipulações na taxa de reforços. A
sensibilidade, por outro lado, é uma medida
que mostra o quanto o comportamento muda
em função de mudanças na taxa de reforços.
Nesse sentido, a sensibilidade comportamental
seria o contrário da resistência a mudanças:
uma alta sensibilidade seria equivalente a uma
baixa resistência a mudanças e vice-versa. A
única diferença seria o tipo de operação utilizada (ver Capítulo 9 para uma discussão mais
detalhada sobre escolha e preferência).
71
É interessante notar que a sensibilidade
comportamental estudada na área de escolha
pode ser influenciada, assim como a resistência a mudanças, pela relação de contingência
entre o estímulo antecedente e a conseqüência. Por exemplo, Todorov e colaboradores
(1983) expuseram alguns pombos a diferentes pares de esquemas concorrentes VI VI em
9 condições de 30 sessões cada (Fase 1) e a 5
condições de 55 sessões cada (Fase 2). Os mesmos estímulos antecedentes foram utilizados
em todas as condições. Os resultados mostraram que a sensibilidade comportamental em
ambas as fases diminuiu com o aumento no
número de condições experimentais e aumentou com o aumento no número de sessões. O
decréscimo da sensibilidade com o aumento
no número de condições pode ter sido devido
ao fato de que, apesar de os valores dos esquemas VI terem mudado, o estímulo antecedente permaneceu o mesmo. Ao se mudarem os
valores dos esquemas, padrões anteriormente
reforçados na presença dos estímulos antecedentes tenderam a persistir, sendo tal persistência evidenciada na baixa sensibilidade (ou
alta resistência) às mudanças nos valores dos
esquemas.
Um suporte adicional para essa possibilidade foi fornecido posteriormente por Hanna,
Blackman e Todorov (1992). Nesse estudo, seis
pombos foram expostos a 20 combinações de
cinco valores de esquemas VI arranjados concorrentemente, em uma sessão de 5 h. Na primeira fase, para três sujeitos, cada valor de
intervalo era sinalizado por uma cor diferente,
enquanto para os outros três, a cor do disco de
resposta era sempre a mesma, independente
do esquema em vigor. Na segunda fase, as condições de estímulos foram revertidas para cada
pombo. A presença de estímulos diferentes
sinalizando diferentes esquemas exerceu um
controle sobre a taxa de respostas logo na primeira hora de sessão; já nas condições com
estímulos antecedentes iguais, as taxas de respostas foram inicialmente semelhantes, tornando-se diferenciadas após a segunda hora de
sessão. A sensibilidade comportamental também foi afetada pela presença de diferentes
estímulos, sendo alta desde o início da sessão
(valores próximos a 1) em comparação com a
72
ABREU-RODRIGUES, RIBEIRO & COLS.
condição na qual os esquemas foram sinalizados pela mesma cor. Novamente, quando o estímulo antecedente permaneceu o mesmo,
pode-se supor que padrões de comportamento
anteriormente reforçados tenderam a permanecer, diminuindo a sensibilidade (ou aumentando a resistência) às mudanças nas contingências. Esses dados, em conjunto, apontam
para a importância da relação entre o estímulo antecedente e a conseqüência como
determinante da sensibilidade em procedimentos de escolha, assim como da resistência a
mudanças em esquemas múltiplos.
O segundo contexto no qual o termo sensibilidade é utilizado é na área de comportamento governado por regras. Vários estudos
presentes na literatura têm mostrado que o
uso de regras pode tornar o comportamento
insensível a mudanças nas contingências
ambientais (Catania, Shimoff e Matthews,
1989; Hayes et al., 1986; Otto, Torgrud e
Holborn, 1999). O procedimento básico para
a avaliação da insensibilidade do comportamento governado por regras envolve a exposição dos sujeitos a uma contingência precedida por uma instrução. Depois de algum tempo, a contingência é modificada e mudanças
no comportamento são registradas. Se o comportamento for alterado em função da mudança na contingência, ele é dito sensível; caso
contrário, é considerado insensível (Madden,
Chase e Joyce, 1998). Alternativamente, podese manter a contingência e mudar as instruções fornecidas. Nesse caso, o comportamento seria dito sensível caso não se alterasse com
a mudança nas instruções. Um exemplo desse último tipo de procedimento foi apresentado no estudo de Kauffman, Baron e Kopp
(1966), no qual estudantes universitários foram expostos a uma tarefa por seis sessões de
30 min, nas quais estava em vigor um esquema VI 1 min. Além disso, os autores forneceram instruções precisas e imprecisas aos sujeitos: para alguns deles, foi dito que deveriam responder de acordo com um esquema VI
1 min; para outros, que deveriam responder
de acordo com um esquema FI 1 min e, para
os demais, de acordo com um esquema VR
150. Todos os participantes responderam conforme o padrão descrito na instrução, da pri-
meira à última sessão, mostrando insensibilidade à contingência programada ou, alternativamente, alta resistência a mudanças (ver
Capítulo 12 para informações mais detalhadas sobre a sensibilidade do comportamento
governado por regras).
Apesar de alguns autores terem argumentado que a insensibilidade é uma característica intrínseca ao comportamento governado por
regras, ela também pode ser entendida à luz
do conceito de resistência a mudanças. As instruções utilizadas nos procedimentos dessa
área são estímulos antecedentes verbais que
podem funcionar como estímulos discriminativos (Okouchi, 1999), operações estabelecedoras (Michael, 1982) ou operações que alteram a função de outros estímulos (Schlinger,
1993). Independentemente da função exercida,
as instruções são correlacionadas com a ocorrência de reforçamento, tanto positivo quanto
negativo. Essa alta correlação entre estímulo
antecedente e conseqüência pode ser responsável pela resistência a mudanças comumente
observada em comportamentos sob controle
funcional de instruções. Por outro lado, se a
relação entre a instrução e a conseqüência é
enfraquecida, o comportamento rapidamente
muda em face das contingências alteradas,
como demonstrou Galizio (1979). No Experimento 3 desse estudo, dois participantes foram expostos a quatro componentes de um
esquema múltiplo e lhes foi dito que os estímulos antecedentes sinalizavam a ocorrência
de perdas monetárias, que poderiam acontecer ou não a cada 10, 30 ou 60 s, dependendo
do componente. Inicialmente, a contingência
de perda não estava em vigor (condição sem
contato); em seguida, perdas monetárias aconteciam a cada 10 s, independente do componente (condição com contato), após a qual a
condição sem contato foi retomada. Além disso, em cada uma das condições, o experimentador dizia aos participantes que, na presença
de uma luz laranja, as instruções recebidas seriam sempre precisas; quando uma luz púrpura se acendesse, as instruções seriam inacuradas. Na primeira condição sem contato, o
desempenho dos participantes foi de acordo
com as instruções recebidas, a despeito de sua
precisão. Na condição com contato, os partici-
ANÁLISE DO COMPORTAMENTO
pantes continuaram comportando-se de acordo com as instruções quando estas eram “precisas”, mas as abandonaram rapidamente quando eram “imprecisas”. Nessa condição, a correlação entre a instrução (estímulo antecedente) e a conseqüência foi diminuída. Na condição seguinte (sem contato), os participantes
abandonaram as instruções quando estas eram
imprecisas, ao contrário do que aconteceu na
primeira exposição a essa condição, indicando uma alta sensibilidade à contingência ou,
alternativamente, baixa resistência a mudanças. Esses dados sugerem que, novamente, a
relação de contingência entre antecedente e
conseqüência parece ser uma importante variável na determinação da (in)sensibilidade
comportamental.
Uma segunda variável que guarda semelhança com a resistência a mudanças é o chamado “efeito de história”. Esse efeito também
se refere à observação da persistência de padrões de respostas, anteriormente reforçadas
sob um tipo de esquema de reforçamento,
quando as contingências são alteradas. Um
experimento típico delineado para investigar
o efeito de história envolve a exposição dos sujeitos a um tipo de esquema de reforçamento,
o qual posteriormente é substituído por outro.
O efeito de história é observado quando padrões de respostas emitidos no primeiro esquema permanecem no esquema seguinte.
Wanchisen, Tatham e Mooney (1989), por
exemplo, observaram o efeito de história expondo ratos a um esquema VR e, em seguida,
a um esquema FI. Um segundo grupo (controle) foi exposto somente ao esquema FI. Em
contraste com o grupo controle, os ratos inicialmente expostos ao esquema VR exibiram,
no esquema FI, taxas de respostas altas e pausas pós-reforço curtas, padrões de respostas tipicamente encontrados sob o esquema VR,
sugerindo que a resposta sob contingências
atuais pode ser influenciada por contingências
passadas. Essa persistência da resposta é comumente descrita como efeito da história de
reforçamento, mas pode igualmente ser considerada como evidência de alta resistência ou
baixa sensibilidade a mudanças (ver Capítulo
3 para informações mais detalhadas sobre história de reforçamento).
73
O efeito de história pode igualmente ser
influenciado pela taxa de reforços, assim como
a resistência a mudanças. Okouchi e Lattal
(2000) testaram essa possibilidade ao treinarem pombos em um esquema múltiplo em cujos
componentes vigoravam esquemas tandem VI
DRL. Os valores dos esquemas VI foram ajustados de maneira a tornar a taxa de reforços em
um dos componentes maior do que no outro.
Em seguida, os esquemas tandem VI DRL foram
substituídos por esquemas FI de diferentes valores, porém os estímulos que sinalizavam cada
componente foram mantidos. Durante o treino,
os sujeitos responderam em taxas baixas e semelhantes nos dois componentes. Quando houve a mudança para o esquema FI, a resposta
permaneceu em taxas baixas (padrão anteriormente reforçado no esquema DRL) na presença
do estímulo associado com a maior taxa de reforços durante o treino por mais tempo do que
a resposta no componente com menor taxa de
reforços, replicando os resultados encontrados
na literatura de resistência a mudanças.
Com isso, podemos concluir que a análise dos conceitos de resistência a mudanças, de
sensibilidade comportamental e de efeito de
história acaba por revelar grandes semelhanças ou, até mesmo, superposições. Nos três
casos, a variável de interesse é a persistência
de padrões de comportamento. Em segundo
lugar, o mesmo processo parece ser responsável pela ocorrência dessas três variáveis: a relação entre o estímulo antecedente e a conseqüência, como os estudos citados têm demonstrado. Apesar de existirem diferenças de procedimento e de as variáveis de interesse não
serem exatamente as mesmas, as semelhanças
encontradas levantam a possibilidade, pouco
estudada, de interação entre diferentes áreas
de pesquisas. Conforme Sidman (1960), o mais
produtivo para a ciência é a busca de similaridades, e não de diferenças. Por exemplo, interrelações entre fenômenos podem conduzir à
integração de áreas de pesquisa, e perguntas
de uma área podem ser esclarecidas ou
complementadas por outra. Além disso, perguntas que já foram formuladas em uma área
podem suscitar outros questionamentos em áreas afins. Assim, pesquisadores que, até o momento, trabalharam separadamente poderiam
74
ABREU-RODRIGUES, RIBEIRO & COLS.
beneficiar-se dos conhecimentos produzidos
em outras áreas que não se restringem às discutidas aqui, caso semelhanças entre elas sejam identificadas.
APLICAÇÕES DOS CONCEITOS
DE MOMENTO COMPORTAMENTAL
E DE RESISTÊNCIA A MUDANÇAS
O conceito de resistência a mudanças, junto com os dados obtidos em pesquisa básica,
tem sido utilizado por alguns pesquisadores na
solução de problemas aplicados. O comportamento sobre o qual existe um maior número
de trabalhos aplicados é a aquiescência a instruções (Strand, 2000). O procedimento padrão nesses estudos compreende a apresentação de uma instrução a que o participante raramente obedece (instrução de baixa probabilidade), precedida por um conjunto de instruções a que o participante freqüentemente obedece (instruções de alta probabilidade). Com
o uso desse procedimento, ocorre um aumento na freqüência com a qual a instrução de
baixa probabilidade controla o comportamento do participante.
A lógica por trás do uso desse procedimento é a seguinte: o comportamento de seguir instruções é uma classe de respostas de
ordem superior (nesse caso, chamada aquiescência), que abarca várias instâncias nas quais
instruções são fornecidas. Dentro dessa classe,
algumas instruções controlam mais facilmente o comportamento do participante e são aquelas a que o participante obedece com uma alta
probabilidade; outras instruções dificilmente
controlam o comportamento do participante.
Usando a metáfora do momento comportamental, a introdução de instruções que o participante dificilmente segue pode ser considerada uma DO, algo que vai alterar o fluxo
comportamental normal do indivíduo. Contudo, uma vez que tanto as instruções de alta
probabilidade quanto as instruções de baixa
probabilidade pertencem à mesma classe de
respostas de ordem superior (aquiescência), o
reforçamento de algumas instâncias dessa classe pode aumentar a resistência a mudanças da
classe como um todo, inclusive das instâncias
com baixa probabilidade de ocorrência. Esse
fenômeno foi observado nos exemplos a seguir.
Mace e colaboradores (1988) realizaram
uma série de experimentos, investigando os
efeitos do reforçamento da aquiescência a uma
série de instruções de alta probabilidade sobre
a aquiescência a uma instrução de baixa probabilidade, com participantes que apresentavam atraso no desenvolvimento. No Experimento 1, o participante foi exposto a cinco
condições. Na linha de base, instruções de baixa probabilidade, tanto afirmativas (p. ex.: “Por
favor, afaste sua lancheira”) quanto negativas
(p. ex.: “por favor, não coloque sua lancheira
na mesa”), eram apresentadas em intervalos
de 1 min e, se seguidas, tinham como conseqüência um elogio. Nas condições seguintes,
ora as instruções de baixa probabilidade afirmativas, ora as negativas, eram precedidas por
três ou quatro instruções de alta probabilidade (p. ex.: “venha cá e me dê um abraço”),
afirmativas ou negativas, respectivamente,
também tinham um elogio como conseqüência. A introdução de instruções de alta probabilidade aumentou significativamente a aquiescência às instruções de baixa probabilidade.
No Experimento 2, os autores adicionaram uma
condição-controle, na qual somente atenção era
dada ao participante antes de uma instrução
de baixa probabilidade, o que não foi suficiente para aumentar a aquiescência; o reforçamento do seguimento de instruções de alta probabilidade foi necessário para que esse aumento ocorresse.
No Experimento 3, foi investigado o efeito da taxa de reforços sobre a aquiescência. O
procedimento foi semelhante ao do Experimento 1. Contudo em algumas condições o experimentador, depois de ter fornecido a última instrução de alta probabilidade, fazia uma pausa
de 20 s antes de fornecer a instrução de baixa
probabilidade; em outras condições, a pausa
era de 5 s. Uma pausa maior entre as instruções supostamente diminuiria a taxa de reforços, e os resultados, condizentes com a literatura de pesquisa básica, mostraram que o aumento da pausa diminuiu a probabilidade de
aquiescência. No Experimento 4, o procedimento de instruções de alta probabilidade foi
usado para diminuir a latência ao iniciar tare-
ANÁLISE DO COMPORTAMENTO
fas instruídas e, no Experimento 5, o procedimento foi usado para diminuir o tempo de execução de tarefas (no caso, os vários passos que
deveriam ser realizados ao tomar banho). O
procedimento foi semelhante ao do Experimento
1. Novamente, o fornecimento de instruções de
alta probabilidade diminuiu a latência para iniciar uma tarefa exigida e o tempo para a execução de tarefas.
Os efeitos observados no estudo de Mace
e colaboradores (1988) também podem ser
influenciados pelo tipo de reforçador utilizado. Conforme anteriormente descrito, Mace
e colaboradores (1997, Experimento 3) mostraram que o comportamento de ratos mantido por sacarina foi mais resistente à extinção
do que o comportamento mantido por ácido
cítrico, apesar de a taxa de reforços ter sido
semelhante nos dois casos. Nos Experimentos 1 e 2 desse mesmo estudo, os autores observaram o efeito da exposição ao procedimento de instruções de alta probabilidade, de
forma semelhante ao estudo de Mace e colaboradores (1988), porém manipulando o tipo
de reforçador. Em algumas condições, seguir
as instruções de alta probabilidade era reforçado com elogios; em outras, com alimento.
Seguir as instruções de baixa probabilidade,
apresentadas em seguida às instruções de alta
probabilidade, era reforçado sempre com elogio, independentemente da condição. Os resultados dos dois experimentos mostraram
uma relação clara entre o tipo de reforçador
e o aumento na probabilidade de aquiescência: quando o alimento era usado como
reforçador, a probabilidade de aquiescência
era maior do que quando eram usados elogios como reforço. Além disso, esses resultados
são compatíveis com a noção de que a resistência a mudanças e a preferência estão intimamente relacionadas, pois, nos três experimentos, o reforçador que se mostrou mais eficaz em aumentar a resistência foi o mesmo
para o qual os participantes já apresentavam
uma preferência anterior. Esses dados, juntamente com aqueles obtidos por Grace e Nevin
(1997), sugerem que uma boa forma de se
identificar os reforçadores que serão mais eficazes em produzir alta resistência é identificar os eventos preferidos pelos participantes.
75
O procedimento de instruções de alta probabilidade também foi usado com sucesso para
melhorar o desempenho na resolução de problemas matemáticos em participantes sem atraso no desenvolvimento e sem o uso de reforçadores arbitrários. Belfiore, Lee, Vargas e
Skinner (1997) realizaram inicialmente uma
avaliação de preferência entre exercícios de
multiplicação com um ou três dígitos. As participantes foram duas adolescentes que estudavam em uma escola alternativa, pois haviam
sido expulsas da escola regular, em função de
se recusarem a iniciar tarefas e a obedecer às
normas da escola. Os resultados da avaliação
de preferência mostraram que ambas as participantes preferiam exercícios de multiplicação
com um único dígito. Em seguida, a latência
para iniciar os problemas de multiplicação com
três dígitos foi avaliada em duas condições: na
primeira, as participantes eram simplesmente
expostas aos problemas com três dígitos; na
segunda, antes de cada problema com três dígitos, as participantes eram expostas a três problemas de multiplicação com um único dígito.
Nenhum tipo de feedback era fornecido pelos
investigadores em nenhuma condição. A latência para iniciar os problemas de três dígitos
diminuiu significativamente com a introdução
dos três problemas de multiplicação com um
único dígito. Esses resultados foram replicados
posteriormente por Belfiore, Lee, Scheeler e
Klein (2002).
Esses dados são interessantes ao se pensar na generalidade da aplicação do procedimento de instruções de alta probabilidade. Primeiro, nesses dois estudos, as atividades de alta
probabilidade e as atividades de baixa probabilidade eram funcionalmente relacionadas, uma
vez que ambas consistiam na resolução de problemas matemáticos equivalentes, diferindo
somente no grau de complexidade (em contraste
com estudos anteriores, nos quais as instruções
de alta probabilidade não tinham uma relação
tão clara com as de baixa probabilidade). Segundo, o evento reforçador para os problemas
era a própria conclusão do problema, e não algum evento estabelecido arbitrariamente (p. ex.:
elogio). Em uma situação natural, é praticamente impossível dar a atenção individual que seria
necessária para a liberação de reforçadores ar-
76
ABREU-RODRIGUES, RIBEIRO & COLS.
bitrários. O uso de reforçadores naturais aumenta, assim, a generalidade da aplicação do procedimento para situações nas quais o controle
das conseqüências pelo investigador não pode
ser feito individualmente, como em uma sala
de aula, por exemplo.
A metáfora do momento comportamental
tem sido empregada em várias outras situações,
como, por exemplo, em hospitais. Esses estudos têm demonstrado um aumento da aquiescência aos procedimentos médicos (McComas,
Wacker e Cooper, 1998), iniciação de contatos
sociais (Davis et al., 1994), redução de comportamentos autolesivos e agressão (Horner et al.,
1991) e redução de estereotipias (Mace e Belfiore,
1990). Outros estudos, apesar de não terem sido
diretamente delineados dentro do quadro
conceitual do momento comportamental, podem ser considerados como tal. Por exemplo,
Parpal e Maccoby (1985) observaram que um
aumento nas interações parentais recíprocas
com crianças durante brincadeiras aumentava
a probabilidade de elas obedecerem aos pedidos posteriores de suas mães para que guardassem os brinquedos. Dentro da perspectiva do
momento comportamental, ao se engajarem em
interações recíprocas com as crianças, os pais
podem acabar reforçando uma ampla classe de
respostas que poderiam ser denominadas de
cooperação. O reforçamento dessa classe de respostas durante as brincadeiras pode ter aumentado a resistência a mudanças dessas respostas,
fazendo com que as mesmas permanecessem,
mesmo na ausência de reforçamento.
A metáfora do momento comportamental
e o procedimento de alta probabilidade também podem ter funções heurísticas até mesmo
em áreas nas quais um teste experimental não
pode ser facilmente realizado, como na análise de jogos esportivos. Por exemplo, Mace e
colaboradores (1992) analisaram sete jogos de
basquete e investigaram, por meio de correlações, duas questões:
a) se a resposta de um time de basquete
a uma situação aversiva – considerada uma DO – durante o jogo estaria
relacionada à taxa local de reforços
que precedia a situação aversiva;
b) se um pedido de tempo seria uma
intervenção efetiva na redução do
momento comportamental do time
adversário.
Para responder à primeira questão, eles
calcularam a porcentagem de adversidades a
que um time respondeu favoravelmente em
função da taxa de reforços anterior à adversidade (a taxa de reforços foi calculada dividindo-se o número de eventos considerados reforçadores por períodos de 3 min e agrupada em
classes discretas). Esse cálculo mostrou que a
porcentagem de adversidades a que um time
respondia favoravelmente apresentou correlação positiva com a taxa de reforços anterior. A
segunda questão foi avaliada calculando-se a
razão de reforço (taxa de reforços do time adversário dividida pela do time alvo) 3 min antes e 3 min depois de um pedido de tempo.
Esse cálculo revelou que o pedido de tempo
foi eficaz na redução da taxa de reforços do
time adversário. Esses resultados, apesar de
correlacionais, são consistentes com os resultados de Mace e colaboradores (1988), que observaram que a probabilidade de se engajar em
um comportamento de baixa probabilidade era
aumentada se este fosse precedido por reforçamento de comportamentos de alta probabilidade pertencentes à mesma classe e que esse
efeito é afetado pelo tempo desde o último reforço (Experimento 3).
A metáfora do momento comportamental,
junto com os dados de pesquisas sobre resistência a mudanças, também pode lançar luz
sobre tratamentos já tradicionais em análise
aplicada do comportamento. Por exemplo, um
dos procedimentos mais usados no tratamento de comportamentos disfuncionais é o reforçamento diferencial de outros comportamentos (DRO), que consiste no fornecimento
de reforçadores para comportamentos incompatíveis ou quaisquer outros comportamentos
que não sejam o comportamento-alvo. Esse
procedimento provoca uma redução na freqüência do comportamento-alvo, como predito pela Lei da Igualação (McDowell, 1982). Entretanto um efeito colateral indesejável pode
ocorrer em função do uso desse procedimento. Nevin e colaboradores (1990) mostraram
ANÁLISE DO COMPORTAMENTO
que a adição de reforçadores, contingentes ou
não a uma outra resposta, no mesmo contexto
diminui a freqüência da resposta sob análise,
mas aumenta sua resistência a mudanças. O
uso do procedimento DRO, nesse sentido, pode
diminuir a taxa da resposta sob análise, mas
pode aumentar sua persistência quando alguma condição for alterada. Segundo Mace
(2000), ele e seus colaboradores testaram essa
possibilidade, usando dois procedimentos de
extinção de comportamentos problemáticos
com crianças com atraso no desenvolvimento.
Em uma fase, o procedimento de extinção foi
precedido por uma linha de base de reforçamento intermitente. Em outra, o procedimento de extinção foi precedido por tratamento
com reforçamento diferencial de comportamentos adaptativos no mesmo contexto no qual
os comportamentos problemáticos ocorriam e
eram reforçados. A freqüência de comportamentos problemáticos diminuiu com o reforçamento diferencial de comportamentos adaptativos, porém os comportamentos problemáticos foram muito mais resistentes à extinção
quando esta era precedida por DRO, em comparação com reforçamento intermitente. Apesar de não ter havido uma condição na qual o
procedimento DRO ocorria em um contexto diferente do contexto em que os comportamentos problemáticos eram reforçados, esse estudo sugere que o contexto no qual o procedimento DRO ocorre deve ser levado em consideração por clínicos e por pesquisadores que o
utilizarem como forma de intervenção.
A pesquisa básica sobre resistência a mudanças também pode lançar luz sobre outras
áreas em análise aplicada do comportamento.
A análise que Rachlin (1995) fez do autocontrole, por exemplo, tem semelhanças com o
modelo de momento comportamental. Esse
autor propôs que o autocontrole envolve um
padrão de engajamento em comportamentos
altamente valorizados (p. ex.: um estilo de vida
sadio), apesar da presença de alternativas tentadoras (p. ex.: comidas gordurosas, consumo
de bebidas alcoólicas, etc.). As alternativas tentadoras, nesse caso, podem ser entendidas dentro do modelo de momento comportamental
como formas de DO, já que podem alterar o
progresso dos comportamentos altamente va-
77
lorizados. Esses comportamentos altamente
valorizados seriam reforçados por conseqüências de grande magnitude (p. ex.: saúde) e, se
elas fossem imediatas e ocorressem com alta
freqüência, esses comportamentos seriam realmente muito resistentes às tentações. Contudo as conseqüências que mantêm esses comportamentos são geralmente atrasadas ou podem nunca acontecer, o que dificulta a aquisição e a manutenção dos mesmos. Ainda com
base nos dados de Nevin e colaboradores
(1990), Nevin e Grace (2000) sugeriram que a
escolha por comportamentos saudáveis, por
exemplo, poderia ser aumentada com a adição
de reforçadores adicionais não relacionados à
saúde, tal como ouvir músicas preferidas em ambientes associados à emissão de comportamentos saudáveis. Essa análise é obviamente
especulativa e merece a realização de trabalhos
empíricos que a investiguem com mais detalhes,
mas fornece uma sugestão bastante promissora
de como aumentar os comportamentos de
autocontrole (ver Capítulo 10 para informações
mais detalhadas sobre autocontrole).
CONCLUSÃO
Com os avanços metodológicos e refinamentos na análise dos dados, têm sido obtidas relações sistemáticas e quantificáveis entre o grau de persistência da resposta em face
de modificações no ambiente e algumas variáveis ambientais, tais como a taxa e a magnitude de reforços. A obtenção dessas relações
sistemáticas e a identificação dos processos
comportamentais por trás delas têm ressaltado a relevância do papel do contexto no qual
o comportamento ocorre, das relações entre
os estímulos antecedentes à resposta e os estímulos que a sucedem. Cada vez mais, observamos que os estímulos que sucedem a
ocorrência de uma resposta não selecionam
simplesmente classes de respostas, mas relações entre os estímulos antecedentes e essas
classes de respostas. São esses estímulos antecedentes que servirão de guia para o comportamento em situações futuras (Donahoe e
Palmer, 1994); são eles que fazem a ponte
entre o passado, o presente e o futuro.
78
ABREU-RODRIGUES, RIBEIRO & COLS.
A observação de que existem conceitos intimamente relacionados, tal como mostraram
Grace e Nevin (1997) em relação à resistência
a mudanças e à preferência, ou como foi sugerido anteriormente, mesmo que especulativamente, em relação aos conceitos de resistência
a mudanças, sensibilidade e efeito de história,
aponta para uma possibilidade instigante: a possibilidade de uma teoria unificada do comportamento, coerente internamente e com alto grau
de generalidade. Precisamos de mais estudos
que lidem diretamente com essa questão, de
análises que sistematizem melhor os dados existentes. O conceito de momento comportamental, com seus componentes velocidade e
massa comportamental, tem muito a oferecer,
desencadeando esse processo de unificação.
REFERÊNCIAS BIBLIOGRÁFICAS
Baum, W. M. (1974). On two types of deviation from
the matching law: Bias and undermatching. Journal of
the Experimental Analysis of Behavior, 22, 231-242.
Belfiore, P. J.; Lee, D. L.; Scheeler, M. C.; Klein, D.
(2002). Implications of behavioral momentum and
academic achievement for students with behavior disorders: Theory, application, and practice. Psychology in
the Schools, 39, 171-179.
Belfiore, P. J.; Lee, D. L.; Vargas, A. U.; Skinner, C. H.
(1997). Effects of high-preference single-digit mathematics problem completion on multiple-digit mathematics problem performance. Journal of Applied Behavior Analysis, 30, 327-330.
Bell, M. C. (1999). Pavlovian contingencies and
resistance to change in a multiple schedule. Journal of
the Experimental Analysis of Behavior, 72, 81-96.
Blackman, D. (1968). Response rate, reinforcement
frequency, and conditioned suppression. Journal of the
Experimental Analysis of Behavior, 11, 503-516.
Bouzas, A. (1978). The relative law of effect: Effects of
shock intensity on response strength in multiple
schedules. Journal of the Experimental Analysis of
Behavior, 30, 307-314.
Brownstein, W. N.; Pliskoff, S. S. (1968). Some effects
of relative reinforcement rate and changeover delay
on response independent concurrent schedules of
reinforcement. Journal of the Experimental Analysis of
Behavior, 11, 683-688.
Catania, A. C.; Shimoff, E.; Matthews, B. A. (1989). An
experimental analysis of rule-governed behavior. Em
S. C. Hayes (Ed.), Rule-governed behavior: Cognition,
contingencies and instructional control (p. 119-150).
New York: Plenum Press.
Cohen, S. L. (1998). Behavioral momentum: The effects
of the temporal separation of the rates of reinforcement.
Journal of the Experimental Analysis of Behavior, 69,
29-47.
Cohen, S. L.; Riley, D. S.; Wiegley, P. A. (1993). Tests of
behavior momentum in simple and multiple schedules
with rats and pigeons. Journal of the Experimental
Analysis of Behavior, 60, 255-291.
Courtney, K.; Perone, M. (1992). Reduction in shock
frequency and response effort as factors in reinforcement by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 58, 485-496.
Davis, C. A.; Brady, M. P.; Hamilton, R.; McEvoy, M. A.;
Williams, R. E. (1994). Effects of high-probability
requests in the acquisition and generalization of social
interaction skills of young children with severe disabilities. Journal of Applied Behavior Analysis, 27, 619-638.
Donahoe, J. W.; Palmer, D. C. (1994). Learning and
complex behavior. Massachusetts: Allyn and Bacon.
Doughty, A. H.; Lattal, K. A. (2001). Resistance to
change of operant variation and repetition. Journal of
the Experimental Analysis of Behavior, 76, 195-215.
Dube, W. V.; McIlvane, W. J. (2001). Behavioral momentum in computer-presented discrimination in individuals with severe mental retardation. Journal of the
Experimental Analysis of Behavior, 75, 15-23.
Fath, S. J.; Fields, L.; Mallot, M. K.; Grosset, D. (1983).
Response rate, latency and resistance to change. Journal
of the Experimental Analysis of Behavior, 39, 267-274.
Franchina, J. J. (1969). Escape behavior and shock
intensity: Within-subject versus between-groups
comparisons. Journal of Comparative and Physiological
Psychology, 69, 241-245.
Galizio, M. (1979). Contingency-shaped and rulegoverned behavior: Instructional control of human loss
avoidance. Journal of the Experimental Analysis of
Behavior, 31, 53-70.
Galvani, P. F. (1971). The effects of partial reinforcement
on the acquisition and extinction of avoidance behavior
in gerbils. Psychonomic Science, 24, 242-244.
Galvani, P. F. (1973). Punished and classical-trial
extinction of avoidance in gerbils following partial and
continuous reinforcement. Psychological Reports, 32,
723-729.
Grace, R. C.; Bedell, M. A.; Nevin, J. A. (2002).
Preference and resistance to change with constant- and
variable-duration terminal links: Independence of
reinforcement rate and magnitude. Journal of the Experimental Analysis of Behavior, 77, 233-255.
Grace, R. C.; Nevin, J. A. (1997). On the relation
between preference and resistance to change. Journal
of the Experimental Analysis of Behavior, 67, 43-65.
Grace, R. C.; Nevin, J. A. (2000). Comparing preference
and resistance to change in constant- and variableduration schedule components. Journal of the Experimental Analysis of Behavior, 74, 165-188.
Grace, R. C.; Schwendiman, J. W.; Nevin, J. A. (1998).
Effects of unsignaled delay of reinforcement on
ANÁLISE DO COMPORTAMENTO
preference and resistance to change. Journal of the
Experimental Analysis of Behavior, 69, 247-261.
Grimes, J. A.; Shull, R. L. (2001). Response-independent milk delivery enhances persistence of pelletreinforced lever pressing by rats. Journal of the Experimental Analysis of Behavior, 76, 179-194.
Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992).
Stimulus effects on concurrent performance in transition. Journal of the Experimental Analysis of Behavior,
58, 335-347.
Harper, D. N. (1996). Response-independent food
delivery and behavioral resistance to change. Journal
of the Experimental Analysis of Behavior, 65, 549-560.
Harper, D. N.; McLean, A. P. (1992). Resistance to
change and the law of effect. Journal of the Experimental Analysis of Behavior, 57, 317-337.
Hayes, S. C.; Brownstein, A. J.; Zettle, R. D.; Rosenfarb,
I.; Korn, Z. (1986). Rule-governed behavior and sensitivity to changing consequences of responding. Journal
of the Experimental Analysis of Behavior, 45, 237-256.
Herrstein, R. J. (1961). Relative and absolute strength
of response as a function of frequency of reinforcement.
Journal of the Experimental Analysis of Behavior, 4, 267272.
Horner, R.; Day, H. M.; Sprague, J.; O’Brien, M.;
Heathfield, L. (1991). Interspersed requests: A nonaversive procedure for decreasing aggression and selfinjury during instructions. Journal of Applied Behavior
Analysis, 24, 265-278.
Kaufmann, A.; Baron, A.; Kopp, R. E. (1966). Some
effects of instructions on human operant behavior. Psychonomic Monograph Supplements, 1, 243-250.
Mace, F. C. (2000). Clinical applications of behavioral
momentum. Behavioral and Brain Sciences, 23, 105-106.
Mace, F. C.; Belfiore, P. (1990). Behavioral momentum
in the treatment of escape-motivated stereotypy. Journal
of Applied Behavior Analysis, 23, 507-514.
Mace, F. C.; Hock, M. L.; Lalli, J. S.; West, B. J.; Belfiore,
P.; Brown, D. K. (1988). Behavioral momentum in the
treatment of noncompliance. Journal of Applied
Behavior Analysis, 21, 123-141.
Mace, F. C.; Lalli, J. S.; Shea, M. C.; Lalli, E. P.; West, B.
J.; Roberts, M.; Nevin, J. A. (1990). The momentum of
human behavior in a natural setting. Journal of the Experimental Analysis of Behavior, 54, 163-172.
Mace, F. C.; Lalli, J. S.; Shea, M. C.; Nevin, J. A. (1992).
Behavioral momentum in college basketball. Journal
of Applied Behavior Analysis, 25, 657-663.
Mace, F. C.; Mauro, B. C.; Boyajian, A. E.; Eckert, T. L.
(1997). Effects of reinforcer quality on behavioral
momentum: Coordinated applied and basic research.
Journal of Applied Behavior Analysis, 30, 1-20.
Madden, G. J.; Chase, P. N.; Joyce, J. H. (1998). Making
sense of sensitivity in the human operant literature.
The Behavior Analyst, 21, 1-12.
McComas, J. J.; Wacker, D. P.; Cooper, L. J. (1998).
Increasing compliance with medical procedures:
Application of the high-probability request procedure
79
to a toddler. Journal of Applied Behavior Analysis, 31,
287-290.
McDowell, J. J. (1982). The importance of Herrnstein’s
mathematical statement of the law of effect for behavior
therapy. American Psychologist, 37, 771-779.
Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal
of the Experimental Analysis of Behavior, 37, 149-155.
Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior,
21, 389-408.
Nevin, J. A. (1979). Reinforcement schedules and
response strength. Em M. D. Zeiler; P. Harzem (Eds.),
Advances in analysis of behaviour: Vol. 1. Reinforcement
and the organization of behaviour (p. 117 – 158). New
York: John Wiley e Sons.
Nevin, J. A. (1984). Pavlovian determiners of behavioral
momentum. Animal Learning and Behavior, 12, 363370.
Nevin, J. A. (1988). Behavioral momentum and the
partial reinforcement effect. Psychological Bulletin, 103,
44-56.
Nevin, J. A. (1992). Behavioral contrast and behavioral
momentum. Journal of Experimental Psychology: Animal Behavior Processes, 18, 126-133.
Nevin, J. A. (2002). Measuring behavioral momentum.
Behavioural Processes, 57, 187-198.
Nevin, J. A.; Grace, R. C. (2000). Behavioral momentum
and the Law of Effect. Behavioral and Brain Sciences,
23, 73-90.
Nevin, J. A.; Grace, R. C.; Holland, S.; McLean, A. P.
(2001). Variable-ratio versus variable-interval schedules: Response rate, resistance to change, and preference. Journal of the Experimental Analysis of Behavior,
76, 43-74.
Nevin, J. A.; Mandell, C.; Atak, J. R. (1983). The analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39, 49-59.
Nevin, J. A.; Mandell, C.; Yarensky, P. (1981). Response
rate and resistance to change in chained schedules.
Journal of Experimental Psychology: Animal Behavior
Processes, 7, 278-294.
Nevin, J. A.; Smith, L. D.; Roberts, J. (1987). Does contingent reinforcement strengthen operant behavior?
Journal of the Experimental Analysis of Behavior, 48,
17-33.
Nevin, J. A.; Tota, M. E.; Torquato, R. D.; Shull, R. L.
(1990). Alternative reinforcement increases resistance
to change: Pavlovian or operant contingencies? Journal
of the Experimental Analysis of Behavior, 53, 359-379.
Okouchi, H. (1999). Instructions as discriminative
stimuli. Journal of the Experimental Analysis of Behavior,
72, 205-214.
Okouchi, H.; Lattal, K. A. (2000, julho). Reinforcement
rate as a determinant of the effects of behavioural history.
Trabalho apresentado no Quatrième Congrès Européen
pour l’Analyse Experimentale du Comportement,
Amiens, França.
80
ABREU-RODRIGUES, RIBEIRO & COLS.
Olson, R. D.; Davenport, D. G.; Kamichoff, N. (1971).
Discriminated avoidance and the partial reinforcement
effect. Psychonomic Science, 22, 12-14.
Otto, T. L.; Torgrud, L. J.; Holborn, S. W. (1999). An
operant blocking interpretation of instructed insensitivity to scheduled contingencies. Journal of the Experimental Analysis of Behavior, 49, 663-684.
Parpal, M.; Maccoby, E. E. (1985). Maternal responsiveness and subsequent child compliance. Child
Development, 56, 1326-1334.
Pavlik, W. B.; Collier, A. C. (1977). Magnitude and
schedule of reinforcement on rat’s resistance to extinction – within subjects. American Journal of Psychology, 90, 195-205.
Rachlin, H. (1995). Self-control: Beyond commitment.
Behavioral and Brain Sciences, 18, 109-121.
Reynolds, G. S. (1963). On the determinants of choice
in pigeons. Journal of the Experimental Analysis of
Behavior, 15, 249-251.
Santos, C. V. (2001). Efeitos do contexto social sobre a
resistência a mudança. Dissertação de Mestrado não
publicada, Universidade de Brasília, Brasília, DF.
Schlinger, H. D. (1993). Separating discriminative and
function-altering effects of verbal stimuli. The Behavior
Analyst, 16, 9-23.
Shnidman, S. S. (1966). Extinction of Sidman
avoidance behavior. Journal of the Experimental Analysis
of Behavior, 11, 153-156.
Sidman, M. (1960). Tactics of scientific research. Boston:
Authors Cooperative, Inc.
Skinner, B. F. (1938). The behavior of organisms. New
York: Appleton-Century-Crofts.
Stavely, H. E. (1966). Effect of escape duration and
shock intensity on the acquisition and extinction of an
escape response. Journal of Experimental Psychology,
72, 698-703.
Strand, P. S. (2000). A modern behavioral perspective
on child conduct disorder: Integrating behavioral momentum and matching theory. Clinical Psychology
Review, 20, 593-615.
Todorov, J. C.; Oliveira-Castro, J. M.; Hanna, E. S.;
Bittencourt de Sá, M. C. N.; Barreto, M. Q. (1983).
Choice, experience, and the generalized matching law.
Journal of the Experimental Analysis of Behavior, 40,
99-111.
Wanchisen, B. A.; Tatham, T. A.; Mooney, S. E. (1989).
Variable-ratio conditioning history produces high- and
low-rate fixed-interval performance in rats. Journal of
the Experimental Analysis of Behavior, 52, 167-179.
ANÁLISE DO COMPORTAMENTO
DESAMPARO APRENDIDO
81
5
ELISA TAVARES SANABIO-HECK
KARINA DE GUIMARÃES SOUTO E MOTTA
Um dos objetivos principais da Psicologia é compreender o comportamento humano. De acordo com a Análise do Comportamento, as causas dos comportamentos podem ser
encontradas nas relações entre o organismo e
o ambiente. Como apontado por Skinner
(1953/1994), a explicação do comportamento deve sempre levar em consideração as variáveis que “estão fora do organismo, em seu ambiente imediato e em sua história ambiental”
(p. 42). Para identificar essas variáveis, utiliza-se o conceito de contingência, mais especificamente, o conceito de contingência tríplice,
definida como uma relação entre eventos ambientais ou entre comportamento e eventos
ambientais, na forma “se, então” (Todorov,
1985). Uma análise das contingências irá especificar sob que condições presentes ou antecedentes um comportamento irá produzir,
como conseqüência, alguma alteração no
ambiente.
Em uma análise de contingências, o papel da conseqüência é fundamental, pois além
de gerar aumentos ou diminuições na probabilidade futura de emissão do comportamento, também possibilita que a condição antecedente adquira funções de controle sobre o desempenho do organismo (Skinner, 1974/
1993). A importância das conseqüências fica
evidente quando Skinner (1981) propõe um
modelo para se tentar compreender as variáveis de controle do comportamento dos organismos. Segundo esse modelo, a partir da
interação do organismo com o ambiente, de-
terminadas conseqüências ambientais passariam a selecionar não só características anatômicas e fisiológicas dos indivíduos ao longo de
gerações (seleção filogenética), mas também
características comportamentais de um indivíduo no decorrer de sua vida (seleção ontogenética) (Matos e Tomanari, 2002).
Uma vez que o comportamento ocorre em
função de conseqüências passadas, a Análise
do Comportamento esbarra em uma dificuldade (Hunziker, 2001): como é possível se ter
acesso a uma classe de eventos que não existe
mais? Uma alternativa seria a utilização dos
relatos, seja do próprio sujeito ou de outros
indivíduos, acerca das contingências passadas.
Entretanto os relatos nem sempre correspondem com precisão às contingências às quais os
indivíduos foram expostos (Simonassi, Fróes e
Sanabio, 1995; Simonassi, Oliveira e Gosch,
1997; Simonassi, Oliveira e Sanabio, 1994), podendo estar sob controle de outras variáveis
ambientais (Critchfield, 1993, 1996; Critchfield
e Perone, 1990, 1993; Sanabio e AbreuRodrigues, 2002).
Para tentar resolver esse problema, a análise das contingências passadas poderia ser realizada em situações experimentalmente controladas. Ou seja, “pode-se estabelecer experimentalmente uma série de relações de contingência que se sucedem de forma a permitir uma
investigação sistemática da influência das contingências passadas sobre o comportamento
atual” (Hunziker, 2001, p. 230). Um exemplo
dessa forma de investigação é fornecido pelos
82
ABREU-RODRIGUES, RIBEIRO & COLS.
estudos sobre os efeitos da história de incontrolabilidade. De acordo com a literatura, a
exposição a situações de incontrolabilidade,
caracterizadas por uma relação de independência entre os eventos programados e o comportamento do organismo, produz um retardo na
aquisição de novos desempenhos em situações
subseqüentes envolvendo eventos controláveis.
Diferentes hipóteses e teorias foram propostas para explicar os efeitos da história de
incontrolabilidade (para uma discussão detalhada das teorias, ver Maier e Seligman, 1976),
dentre as quais se destaca a teoria do desamparo aprendido. A idéia central na teoria do
desamparo aprendido é que os organismos expostos a eventos incontroláveis aprendem que
os eventos ambientais são independentes de
suas respostas, uma aprendizagem que irá interferir futuramente na aquisição de novos desempenhos. Segundo Maier e Seligman (1976),
essa aprendizagem ocorre de acordo com duas
etapas. Primeiramente, os arranjos entre o comportamento e o meio fornecem a informação
sobre a relação de independência. Em um segundo momento, a informação sobre a relação de independência é “processada e transformada em uma representação cognitiva da
contingência” (Maier e Seligman, 1976, p. 17).
Tal representação é definida como a expectativa de que respostas e eventos ambientais são
independentes. Em função dessa expectativa,
o organismo pode apresentar três tipos de
déficits: déficit motivacional (diminuição da
motivação para emitir respostas), déficit
cognitivo (interferência na aprendizagem de
relações de controlabilidade) e déficit emocional (alterações fisiológicas como perda de peso,
perda de apetite, aparecimento de úlceras estomacais e passividade).
A dificuldade na aprendizagem de novos
comportamentos ou, alternativamente, a redução na sensibilidade a novas contingências,
resultante da exposição a condições de incontrolabilidade, tem sido denominada tanto de
efeito do desamparo aprendido (Maier e
Seligman, 1976; Seligman e Beagley, 1975;
Seligman, Rosellini e Kozak, 1975) como de
efeito de interferência (p. ex.: Crowel e
Anderson, 1981; Glazer e Weiss, 1976a;
1976b). Hunziker (1981) considera o termo
efeito do desamparo aprendido inadequado, por
envolver uma formulação teórica sobre o fenômeno ainda sujeita a questionamentos, podendo a mesma observação ser aplicada ao termo efeito de interferência. Uma vez que o presente trabalho propõe-se a abordar os efeitos
da exposição a eventos incontroláveis a partir
de uma perspectiva analítico-comportamental
e que os termos desamparo aprendido e efeito
de interferência estão comprometidos com uma
visão cognitiva desse fenômeno, serão adotados
aqui os termos efeitos da história de incontrolabilidade ou efeitos da exposição a eventos
incontroláveis,1 os quais foram escolhidos em
função de seu caráter estritamente descritivo.
Ou seja, tais termos indicarão apenas que a
aquisição de novos comportamentos após uma
história de incontrolabilidade não ocorreu tão
prontamente quanto na ausência dessa história.
A revisão da literatura a seguir apresentará, inicialmente, um panorama da pesquisa
básica sobre os efeitos da experiência prévia
com eventos não-controláveis, enfatizando a
metodologia comumente empregada na área,
os procedimentos de prevenção e reversão
desses efeitos, bem como o papel dos relatos
verbais. Finalmente, algumas implicações clínicas relacionadas aos achados empíricos serão analisadas.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
Uma das primeiras demonstrações do
efeito da história de incontrolabilidade foi feita por Overmier e Seligman (1967). Durante a
Fase de Treino, cães eram presos a arreios. Os
sujeitos do Grupo Controle não foram expostos a choques, sendo apenas colocados nos arreios. Os três grupos restantes foram expostos
a choques inescapáveis, isto é, nenhuma resposta emitida pelo sujeito poderia eliminar a
ocorrência destes, e se diferenciaram em relação ao número, à duração e ao intervalo médio entre os choques. Na Fase de Teste, todos
os sujeitos foram expostos a uma contingência
1Os
autores mantiveram o termo desamparo aprendido no título do capítulo em função de sua ampla
utilização na literatura pertinente.
ANÁLISE DO COMPORTAMENTO
de fuga e esquiva, ou seja, o sujeito poderia
eliminar ou evitar o choque, caso a resposta de
saltar uma barreira que dividia a caixa experimental fosse emitida. Os três grupos expostos
aos choques inescapáveis apresentaram tempos de reação mais longos nas respostas de fuga
e esquiva do que o Grupo Controle, não havendo diferenças entre os primeiros. A partir
desses resultados, os autores concluíram que a
exposição a choques inescapáveis interfere na
aquisição de respostas de fuga e esquiva.
A questão se tal interferência é produto
da exposição aos choques em si ou da incontrolabilidade dos mesmos foi investigada por
Seligman e Maier (1967, Experimento 1), por
meio de um modelo triádico (Tabela 5.1). Na
Fase de Treino, um grupo de cães recebeu choques escapáveis, os quais eram interrompidos
quando os sujeitos emitiam uma resposta de
pressão a um painel (Grupo Escapável). Um
segundo grupo foi exposto ao mesmo padrão
de choques (mesma duração, intensidade e número de choques) que o Grupo Escapável, mas
as respostas dos sujeitos não interrompiam os
choques (Grupo Inescapável). O terceiro grupo não foi exposto a choques (Grupo Controle). Na Fase de Teste, todos os sujeitos foram
expostos a uma contingência de fuga e esquiva semelhante àquela descrita por Overmier e
Seligman (1967). O efeito da história de
incontrolabilidade foi observado no Grupo
Inescapável, que apresentou tempos de reação
mais longos e mais falhas na aprendizagem das
respostas de fuga e esquiva do que os grupos
Escapável e Controle, que não diferiram entre
si. Isto é, o Grupo Inescapável não aprendeu
as respostas de fuga e esquiva, enquanto os dois
outros grupos aprenderam essas respostas rapidamente. Seligman e Maier concluíram que
a incontrolabilidade dos choques foi a variável
TABELA 5.1 Modelo triádico
Grupos
Condições
Treino
Teste
Escapável
Inescapável
Controle
Controlabilidade
Incontrolabilidade
Controle
Controlabilidade
Controlabilidade
Controlabilidade
83
responsável pela dificuldade de aprendizagem
das respostas de fuga e esquiva, uma vez que:
a) os grupos Escapável e Inescapável foram semelhantes em relação à exposição aos choques, mas diferiram em
termos de grau de controlabilidade
dos mesmos, tendo apresentado desempenhos diferentes;
b) os grupos Escapável e Controle diferiram em relação à exposição aos choques, mas apresentaram desempenhos
semelhantes.
O efeito da exposição a eventos incontroláveis também foi demonstrado com participantes humanos. Em um estudo realizado por
Hiroto (1974), estudantes universitários foram
expostos a um estímulo auditivo durante a Fase
de Treino. Para o Grupo Escapável, o estímulo
auditivo poderia ser interrompido pela emissão da resposta de pressão a um botão; para o
Grupo Inescapável, as respostas dos participantes não tinham controle sobre a eliminação do
som. Para o Grupo Controle, não foram programadas apresentações do som. Na Fase de
Teste, todos os participantes foram expostos a
tentativas de fuga e esquiva em que, na presença de um estímulo ou sinal, o participante
deveria mover uma alavanca para eliminar ou
interromper o som. Os resultados foram semelhantes àqueles obtidos por Seligman e Maier
(1967) e Overmier e Seligman (1967): o Grupo Inescapável demonstrou efeitos da história
de incontrolabilidade, com tempos de reação
mais longos nas respostas de fuga e esquiva do
que os grupos Escapável e Controle, que não
demonstraram diferenças entre si (ver também
Hiroto e Seligman, 1975; Lamb, Davis, Tramill
e Kleinhammer-Tramill, 1987).
Hunziker (1981) apontou um problema
metodológico nos estudos que demonstram o
efeito da história de incontrolabilidade. Tal problema é relacionado à programação da situação de incontrolabilidade, que se refere a um
arranjo experimental em que a probabilidade
de um evento, dada uma resposta específica, é
igual à probabilidade desse evento, dada a nãoocorrência da mesma resposta. Entretanto, nesses estudos, o critério para a apresentação do
84
ABREU-RODRIGUES, RIBEIRO & COLS.
evento, não é a ocorrência ou não de uma resposta específica, e sim a passagem do tempo.
A ocorrência do evento ambiental em função
da passagem de tempo não garante uma ausência de relação entre resposta e evento, pois
esta pode ser estabelecida por reforçamento
acidental. Dessa forma, a afirmação de que a
dificuldade de aprendizagem de um novo comportamento resulta de experiências prévias com
situações de incontrolabilidade é questionável,
uma vez que os arranjos experimentais comumente utilizados não têm atendido as exigências da definição de incontrolabilidade.
Prevenção e reversão do efeito
da história de incontrolabilidade
O efeito da história de incontrolabilidade
pode ser prevenido ou revertido por meio de
dois procedimentos. No primeiro deles, uma
situação de controlabilidade é programada
antes de o organismo ser exposto a eventos
incontroláveis. Tal processo é chamado de
imunização, uma vez que previne a ocorrência do efeito da exposição a eventos incontroláveis. No segundo procedimento, denominado de terapia, o efeito é revertido: após a experiência com incontrolabilidade e anterior à
Fase de Teste, o organismo é exposto a uma
situação na qual os eventos são controláveis
(Tabela 5.2).
Imunização
O estudo pioneiro que investigou os efeitos do procedimento de imunização foi realizado por Seligman e Maier (1967, Experimento 2), utilizando cães como sujeitos experimentais. Os grupos I, II e III foram expostos a diferentes seqüências de choques inescapáveis e
escapáveis ao longo das fases de imunização,
treino e teste. O Grupo I (imunização) foi exposto à seqüência choques escapáveis → choques inescapáveis → choques escapáveis, o Grupo II foi exposto a choques inescapáveis → choques escapáveis e o Grupo III recebeu choques
escapáveis → choques escapáveis. De acordo
com os resultados, o efeito da história de
incontrolabilidade só foi observado para o Grupo II, tendo o Grupo I e o Grupo III apresentado desempenhos semelhantes. Ou seja, quando expostos a choques escapáveis, antes de
serem expostos a choques inescapáveis, os participantes não demonstraram uma diminuição
na sensibilidade às novas contingências. Tais
resultados evidenciam a eficácia do procedimento de imunização para prevenir o efeito
da história de incontrolabilidade.
Douglas e Anisman (1975, Experimento
3) demonstraram os efeitos do procedimento
de imunização com participantes humanos. Durante a Fase de Imunização, o Grupo I deveria
pressionar botões para desligar luzes coloridas,
enquanto o Grupo II deveria encontrar a saída
de labirintos impressos em folhas de papel. Para
ambos os grupos, as tarefas eram solucionáveis.
Na Fase de Treino, os grupos I e II foram solicitados a pressionar botões para desligar luzes.
Contudo, nessa fase, pressionar botões e desligar luzes eram eventos independentes. Na Fase
de Teste, a tarefa consistia na mesma da Fase
de Treino (pressionar botões), mas agora as
respostas de pressionar desligavam as luzes. O
Grupo III foi exposto apenas às fases de treino
e teste, que foram idênticas àquelas programadas para os grupos I e II. O Grupo IV, que
funcionou como controle, foi exposto apenas
à Fase de Teste. Os resultados da Fase de Teste
demonstraram que os grupos I e II, expostos
às tarefas solucionáveis antes de receberem tarefas insolucionáveis, apresentaram um melhor
desempenho (maior número de respostas cor-
TABELA 5.2 Procedimentos de imunização e terapia
Condições
Procedimento
Treino de
imunização
Treino
Terapia
Teste
Imunização
Terapia
Controlabilidade
________
Incontrolabilidade
Incontrolabilidade
________
Controlabilidade
Controlabilidade
Controlabilidade
ANÁLISE DO COMPORTAMENTO
retas) quando comparados aos outros grupos.
Os autores concluíram que o procedimento de
imunização previne a ocorrência de efeitos da
história de incontrolabilidade também em participantes humanos, e que a imunização ocorre a despeito de as tarefas utilizadas no prétreino e no treino serem iguais (Grupo I) ou
diferentes (Grupo II).
A relação entre diferentes esquemas de
reforçamento e o procedimento de imunização foi investigada por Jones, Nation e Massad
(1977). Os participantes eram expostos a uma
tarefa de discriminação visual que consistia na
apresentação de quatro problemas diferentes,
em blocos de 10 tentativas. A cada problema,
o experimentador selecionava uma característica dentre cinco dimensões diferentes: letra
(A ou T), cor (vermelha ou preta), tamanho
(grande ou pequeno), borda ao redor da letra
(círculo ou quadrado) e posição (direita ou
esquerda). Em cada tentativa, era apresentada uma configuração composta pelas cinco dimensões, cabendo aos participantes a tarefa
de adivinhar a característica selecionada pelo
experimentador. Para tanto, eles deveriam indicar se a configuração apresentada incluía ou
não a característica pré-selecionada. Na Fase
de Imunização, o Grupo 0% Imunizado recebeu quatro problemas insolucionáveis de discriminação. Tais problemas não tinham solução específica, uma vez que cada resposta era
sempre seguida do feedback “Incorreto”. O Grupo 50% Imunizado recebeu dois problemas
insolucionáveis e dois problemas solucionáveis
(as respostas sempre produziam o feedback
“Correto”). O Grupo 100% Imunizado e o Grupo Solucionável foram expostos a quatro problemas solucionáveis. Na Fase de Treino, todos os grupos receberam quatro problemas de
discriminação diferentes daqueles apresentados na fase anterior. Para os três primeiros grupos, os problemas eram insolucionáveis; para
o último grupo, os problemas eram solucionáveis. O Grupo Controle foi exposto aos problemas de discriminação, mas não foi solicitado a resolvê-los. Na Fase de Teste, todos os grupos foram expostos a anagramas solucionáveis.
Cada anagrama era compostos de cinco letras
embaralhadas. A tarefa do participante consistia em ordenar corretamente as letras para for-
85
mar uma palavra. A ordem de apresentação
das letras era a mesma para todos os anagramas (3-4-2-5-1), e os participantes eram alertados de que todos poderiam ser resolvidos de
uma mesma maneira.
Dos dois grupos que foram expostos a problemas solucionáveis durante a Fase de Imunização (grupos 50% e 100%), apenas o Grupo
50% demonstrou o efeito de imunização, apresentando um desempenho na tarefa do anagrama semelhante aos grupos solucionável e
controle. Por outro lado, os grupos 100% e 0%
mostraram desempenhos semelhantes, caracterizados por tempos de reação mais longos e
maior número de falhas na resolução do anagrama do que o desempenho do Grupo 50%.
Segundo Jones e colaboradores (1977), os resultados do Grupo 100% são contrários à literatura animal, a qual prediz que, quanto
maior a exposição a eventos controláveis,
maior o efeito de imunização observado. Esses autores explicam tal divergência com base
na noção de intermitência do reforço. O Grupo 50% foi exposto a uma situação de reforçamento intermitente na Fase de Imunização:
problemas solucionáveis seriam equivalentes
ao reforçamento, e os problemas insolucionáveis, à ausência de reforçamento. Em função dessa experiência com reforçamento e
extinção, os participantes apresentaram uma
maior persistência nas respostas de resolução
nas fases seguintes, o que minimizou a influência da história de incontrolabilidade. Em
contrapartida, os participantes do Grupo 100%
foram expostos a uma situação de reforçamento contínuo (apenas problemas solucionáveis), produzindo respostas de resolução
menos persistentes. Conseqüentemente, os
efeitos da exposição a eventos incontroláveis
foram observados (ver também Prindaville e
Stein, 1978).
Terapia
Como citado anteriormente, além de serem prevenidos por meio do procedimento de
imunização, os efeitos da história de incontrolabilidade podem também ser revertidos pelo
procedimento de terapia, ou seja, pela expo-
86
ABREU-RODRIGUES, RIBEIRO & COLS.
sição a eventos controláveis após a experiência com incontrolabilidade e anterior à Fase
de Teste.
O efeito do procedimento de terapia foi
inicialmente investigado por Seligman e colaboradores (1975), que utilizaram ratos como
sujeitos. Inicialmente, os sujeitos foram expostos a 80 tentativas de choques inescapáveis,
liberados de acordo com um esquema de intervalo variável de 1 min (VI 1 min). Posterior
a essa exposição, os animais foram testados em
uma nova situação, na qual o choque poderia
ser interrompido a cada três respostas de pressão à barra. Os sujeitos que não apresentaram
respostas de fuga durante 20 s, o que foi considerado como evidência do efeito da história
de incontrolabilidade, foram selecionados para
constituir os grupos experimentais. Em um grupo, os sujeitos eram puxados pelo experimentador por meio de uma correia e forçados
a emitir a resposta de pressionar uma barra
(Grupo Fuga Forçada). Tal procedimento era
finalizado quando os sujeitos emitissem respostas de fuga em 10 tentativas consecutivas
sem intervenção do experimentador. Um segundo grupo foi acoplado ao Grupo Fuga Forçada recebendo, assim, o mesmo número e
duração de choques. Os sujeitos desse grupo
também eram puxados pelo experimentador,
mas não eram forçados a pressionar a barra
(Grupo Controle). Os sujeitos do terceiro grupo não eram puxados pelo experimentador
nem forçados a emitir respostas de pressão à
barra (Grupo Controle Acoplado), além de receberem o mesmo número e duração de choques que os sujeitos dos grupos fuga forçada e
controle. Os sujeitos do Grupo Fuga Forçada
conseguiram atingir o critério de escapar do
choque por 10 tentativas consecutivas, sem
qualquer intervenção por parte do experimentador. Por outro lado, os sujeitos do Grupo Controle e Grupo Controle Acoplado não
atingiram o critério, ou seja, apresentaram efeitos da história de incontrolabilidade. Os autores concluíram, então, que a terapia forçada
foi um procedimento efetivo na reversão do
efeito produzido pela exposição a eventos
aversivos incontroláveis.
Klein e Seligman (1976, Experimento 1)
investigaram os efeitos do procedimento de terapia com humanos. Na Fase de Treino, estudantes universitários deveriam eliminar tons.
Entretanto os tons programados eram inescapáveis. Na Fase de Terapia, problemas de discriminação visual eram apresentados aos participantes: um grupo recebeu 12 problemas
solucionáveis (Grupo Solucionável 12), um segundo grupo foi exposto a quatro problemas
solucionáveis (Grupo Solucionável 4) e um terceiro grupo foi apenas exposto aos problemas
sem resolvê-los (Grupo Controle). Na Fase de
Teste, todos os grupos deveriam mover uma
alavanca para eliminar ou interromper tons.
Os participantes expostos aos problemas
solucionáveis (grupos solucionável 12 e solucionável 4) demonstraram tempos de reação
mais curtos e um menor número de falhas nas
respostas de fuga e esquiva do que o Grupo
Controle, o que demonstra que a exposição
prévia à incontrolabilidade não afetou o desempenho posterior.
Os efeitos do procedimento de terapia
também foram investigados por Nation e
Massad (1978). Estudantes universitários foram distribuídos em quatro grupos. Na Fase
de Treino, o Grupo SOL recebeu quatro problemas solucionáveis de discriminação visual.
Para esse grupo, cada resposta emitida pelo
participante era seguida de feedbacks precisos.
Os grupos IN-CRF e IN-PRF receberam quatro
problemas insolucionáveis. Ou seja, a ordem
dos feedbacks (“Correto” e “Incorreto”) era programada previamente, independente das respostas emitidas pelos participantes. O Grupo
NOT não recebeu tratamento (era exposto aos
problemas sem resolvê-los). Na Fase de Terapia, os participantes deveriam pressionar um
botão para eliminar ou interromper tons. Para
os grupos SOL, IN-CRF e NOT, todos os tons
eram escapáveis. Ou seja, os participantes desses grupos foram expostos a um esquema de
reforçamento contínuo. O Grupo IN-PRF, por
sua vez, poderia eliminar ou interromper apenas 50% dos tons apresentados, isto é, esse
grupo era exposto a um esquema de reforçamento parcial. Na Fase de Teste, todos os par-
ANÁLISE DO COMPORTAMENTO
ticipantes receberam tons inescapáveis, o que
diferencia este estudo dos anteriores, nos quais
a Fase de Teste era caracterizada como uma
situação de controlabilidade.
Os resultados observados ao final da Fase
de Terapia indicaram que os grupos expostos
a problemas insolucionáveis durante a Fase de
Treino e a problemas solucionáveis na Fase de
Terapia (IN-CRF e IN-PRF) apresentaram desempenhos semelhantes aos dos grupos expostos apenas a problemas solucionáveis (SOL e
NOT), sugerindo que tanto uma situação de
reforçamento contínuo (grupos IN-CRF, SOL e
NOT) como uma situação de reforçamento parcial (Grupo IN-PRF) são eficazes para reverter
o efeito da exposição a eventos incontroláveis.
Contudo, na Fase de Teste, quando novamente
expostos a uma situação de incontrolabilidade,
os participantes expostos ao esquema de
reforçamento parcial (IN-PRF) mostraram desempenhos mais persistentes quando comparados aos participantes expostos ao reforçamento contínuo (IN-CRF), uma vez que se mantiveram respondendo por mais tempo (para
uma discussão sobre os efeitos de reforçamento
contínuo e parcial na Fase de Terapia, ver também Carvalho, 1998).
O papel dos estímulos verbais
nos estudos sobre história de
incontrolabilidade
Conforme já descrito anteriormente, os
efeitos da história de incontrolabilidade têm
sido atribuídos a diferentes variáveis. Autores
como Maier e Seligman (1976) propõem que,
quando exposto a eventos incontroláveis, o
indivíduo desenvolve uma expectativa de independência entre respostas e eventos ambientais, sendo essa expectativa considerada a variável de controle mais relevante para o efeito
da história de incontrolabilidade.
As possíveis funções exercidas pelas expectativas dos indivíduos são investigadas por
meio de duas metodologias. Na primeira, os
participantes são expostos a situações de controlabilidade e/ou incontrolabilidade, assumin-
87
do-se que essas diferentes situações irão produzir diferentes expectativas (p. ex.: Alloy,
Peterson, Abramson e Seligman, 1984; Levine,
Rotkin, Jankovic e Pitchford, 1977; Prindaville
e Stein, 1978; Tiggeman e Winefield, 1987).
Na segunda, os participantes também são expostos a controlabilidade e/ou incontrolabilidade; entretanto, os participantes recebem, diferentes tipos de instruções (p. ex.:
Hiroto, 1974; Klein, Fencil-Morse e Seligman,
1976; Mikulincer, 1986; Oakes e Curtis, 1982,
Experimento 2; Tennen, Gillen e Drum, 1982)
ou, na ausência de instruções, eles são expostos a diferentes tarefas (p. ex.: Douglas e
Anisman, 1975; Ford e Neale, 1985; Klein e
Seligman, 1976; Oakes e Curtis, 1982, Experimento 1; Tennen, Drum, Gillen e Stanton,
1982). Esses estudos assumem que as instruções apresentadas ou as diferenças de tarefas
(p. ex.: fáceis e difíceis) deverão produzir expectativas distintas.
Tanto nos estudos que apenas expõem os
participantes a situações de controlabilidade
e/ou incontrolabilidade quanto naqueles que
manipulam a instrução e o tipo de tarefa, o
experimentador tem acesso às expectativas por
meio dos relatos dos participantes (p. ex.: Ford
e Neale, 1985; Klein et al., 1976; Klein e
Seligman, 1976; Mikulincer, 1986; Oakes e
Curtis, 1982; Tennen, Drum et al., 1982; Tennen
Gillen et al., 1982, Experimento 2). Tais relatos podem ser solicitados antes do experimento, por meio de questionários e inventários, ou
podem ser solicitados ao longo do estudo, após
as fases de treino ou teste. A prática de solicitar relatos sugere que os mesmos são considerados descrições precisas das expectativas dos
participantes. Entretanto, é possível encontrar
estudos nos quais os relatos não são solicitados
e, nesses casos, a expectativa é inferida somente com base nas manipulações efetuadas
(p. ex.: Douglas e Anisman, 1975; Hiroto,
1974).
Além dessas diferenças, é comum encontrar variações nos tipos de relatos solicitados.
Por exemplo, em alguns estudos (Alloy et al.,
1984; Klein et al., 1976; Mikulincer, 1986;
Oakes e Curtis, 1982; Tennen, Drum et al.,
88
ABREU-RODRIGUES, RIBEIRO & COLS.
1982; Tennen, Gillen et al., 1982), o relato do
participante deve indicar os eventos ambientais
responsáveis por seu desempenho. Tais relatos serão denominados, daqui por diante, de
julgamentos de causalidade e podem ser divididos em seis tipos principais:
a) global: relatos que descrevem o desempenho como produto de fatores
presentes em diversas situações;
b) específico: relatos que descrevem o
desempenho como produto de fatores presentes apenas em uma dada situação;
c) estável: relatos que descrevem o desempenho como produto de fatores
que se mantêm ao longo do tempo;
d) instável: relatos que descrevem o desempenho como produto de fatores
temporários;
e) interno: relatos que indicam que o próprio desempenho exerceu controle sobre os eventos ambientais;
f) externo: relatos que indicam que o
desempenho não afetou os eventos
ambientais.
Os julgamentos de causalidade são coletados por meio de escalas: para formular julgamentos de causalidade global ou específica,
por exemplo, os participantes devem escolher
um valor em uma escala de 0 a 10, de modo
que 0 corresponde a “fatores globais”, e 10, a
“fatores específicos”.
Os participantes também podem ser solicitados a relatar o grau de controle que seus
desempenhos exercem sobre os eventos ambientais (Ford e Neale, 1985; Klein e Seligman,
1976; Mikulincer, 1986; Oakes e Curtis, 1982;
Prindaville e Stein, 1978; Tennen, Drum et al.,
1982; Tennen, Gillen et al., 1982; Tiggeman e
Winefield, 1987). Nesse caso, os relatos são
denominados de julgamentos de controle, que
também são coletados por meio de escalas. Por
exemplo, para responder à pergunta “Quanto
você acha que seu desempenho produziu o término do tom?”, o participante deve escolher
um valor em uma escala de 0 a 10, sendo o
valor 0 correspondente à opção “muito pouco”
e o valor 10 correspondente a “totalmente”.
Há ainda um terceiro tipo de relato: após
serem expostos a uma determinada tarefa, os
participantes são solicitados a descrever a solução para o problema apresentado. Nesse caso,
os relatos são denominados de descrições do
desempenho, as quais são formuladas sem a
utilização de escalas, isto é, o participante pode
apresentar qualquer descrição para o problema (p. ex.: Levine et al., 1977).
Correspondência entre o comportamento
verbal e o comportamento não-verbal
Conforme assinalado anteriormente, ao
serem expostos a situações de controlabilidade
e incontrolabilidade, os participantes são solicitados a relatar seus julgamentos acerca da
situação experimental. Esses julgamentos consistem em descrições de prováveis relações
comportamento-ambiente (ou, simplesmente,
do próprio comportamento) em vigor. Quando tais descrições referem-se a relações futuras entre comportamento e ambiente (ou a
comportamentos futuros), elas são denominadas de expectativas. Dessa forma, julgamentos
e expectativas são comportamentos verbais. Os
estudos sobre os efeitos da história de incontrolabilidade comumente assumem uma correspondência entre julgamentos e expectativas,
sendo atribuído a essas expectativas o status
de “causa” dos déficits de aprendizagem observados. Ou seja, caso o participante relate
que suas respostas não exercem controle sobre os eventos ambientais (julgamento de ausência de controle), uma expectativa de ausência de controlabilidade é inferida e considerada como a variável responsável pela dificuldade de aprendizagem em situações subseqüentes, em detrimento da experiência prévia com
incontrolabilidade per si.
Um exemplo dessa forma de utilização
dos relatos é fornecido por Alloy e colaboradores (1984) ao investigarem o papel da similaridade entre as tarefas de treino e de teste,
bem como dos julgamentos de causalidade, em
situações de incontrolabilidade. Estudantes
universitários foram divididos em seis grupos
conforme o tipo de julgamento emitido (global ou específico) e o tipo de tratamento rece-
ANÁLISE DO COMPORTAMENTO
bido (controlabilidade, incontrolabilidade e ausência de tratamento). Os julgamentos eram
coletados por meio de um questionário que
continha seis eventos positivos (p. ex.: receber
elogio de um amigo) e seis eventos negativos
(p. ex.: não ser bem-sucedido em uma tarefa).
Os participantes deveriam, então, relatar a principal causa de cada evento, como se estes tivessem sido experienciados por eles próprios.
Após relatar as causas, os participantes deveriam classificá-las utilizando uma escala de 0 a
7, sendo o valor 7 correspondente a julgamentos de causalidade global, e o valor zero correspondente a julgamentos de causalidade específica.
No Experimento 1, durante a Fase de Treino, os participantes foram expostos a 50 tons.
Os participantes com julgamentos globais e
com julgamentos específicos foram subdivididos em três grupos cada: para o Grupo
Escapável, os tons podiam ser interrompidos
ou eliminados pressionando um botão; o Grupo Inescapável era acoplado ao Grupo Escapável em relação à duração e ao número de
tons, mas estes eram inescapáveis; o Grupo
Controle recebeu a mesma quantidade de tons
sem emitir respostas de fuga e esquiva. Na Fase
de Teste, uma tarefa semelhante à tarefa do
treino foi programada: 20 tons eram apresentados e, para interrompê-los ou evitá-los, os
participantes deveriam mover uma alavanca.
Foi observado que apenas os grupos inescapáveis (tanto aquele com julgamentos globais
quanto aquele com julgamentos específicos)
apresentaram uma aprendizagem mais lenta
das respostas de fuga e esquiva. Ou seja, os
julgamentos não afetaram diferencialmente os
participantes, sendo seus desempenhos no teste
determinados pelas condições de treino. O
Experimento 2 apresentou uma única diferença em relação ao Experimento 1: na Fase de
Teste, os participantes deveriam resolver 20
anagramas, de modo que as tarefas do treino e
do teste eram diferentes. Dentre os participantes do Grupo Inescapável, apenas aqueles com
julgamentos de causalidade global apresentaram déficits de aprendizagem.
A partir dos resultados dos experimentos
1 e 2, Alloy e colaboradores (1984) concluíram que as duas variáveis investigadas contri-
89
buíram para a ocorrência de efeitos da exposição a eventos incontroláveis:
a) os julgamentos de causalidade que os
participantes formulam a respeito dos
eventos incontroláveis;
b) a semelhança entre a situação atual
(teste) e a situação original (treino).
Caso os julgamentos de causalidade sejam globais, o efeito da exposição à incontrolabilidade ocorrerá em situações semelhantes ou
distintas da situação original. Caso os julgamentos sejam específicos, o efeito da exposição à incontrolabilidade será observado apenas quando a situação for semelhante à situação original.
Mikulincer (1986) investigou se o efeito
da história de incontrolabilidade poderia ser
atribuído aos julgamentos de controle dos participantes. Na Fase de Treino, os participantes
deveriam resolver quatro problemas de discriminação visual. Para o primeiro grupo, os problemas apresentados eram solucionáveis (Grupo Solucionável). Para o Grupo Insolucionável,
os quatro problemas não tinham solução programada. O Grupo Controle resolvia os quatro
problemas, mas não recebeu feedbacks após as
respostas de resolução. Outros dois grupos receberam problemas insolucionáveis e instruções
que se diferenciavam em termos de conteúdo:
um grupo de participantes recebeu uma instrução global, enquanto um outro grupo recebeu
uma instrução específica. Antes de iniciar a Fase
de Teste, julgamentos de controle eram solicitados e, após responder, todos os participantes
eram expostos a problemas solucionáveis de
discriminação diferentes daqueles apresentados
na Fase de Treino. Os participantes expostos a
problemas insolucionáveis sem instruções e
aqueles expostos a problemas insolucionáveis
com instruções globais apresentaram tempos de
reação mais longos e um maior número de erros na resolução dos problemas do que os grupos restantes (ver também Mikulincer e Nizan,
1988), além de serem os únicos a apresentarem julgamentos de baixo controle. Ou seja, os
participantes que apresentaram esse tipo de julgamento também demonstraram o efeito da história de incontrolabilidade.
90
ABREU-RODRIGUES, RIBEIRO & COLS.
Diferente dos estudos descritos, Levine e
colaboradores (1977) não solicitaram julgamentos de causalidade ou de controle, mas sim
descrições de desempenho. Esse procedimento foi adotado porque, segundo os autores,
quando expostos a uma determinada situação,
os participantes formulam diferentes descrições
de desempenho, até que a mais precisa seja
selecionada pela contingência em vigor. Quando uma nova tarefa é apresentada, o desempenho seria insensível às novas contingências em
função das descrições formuladas anteriormente. Para avaliar essa possibilidade, os autores
expuseram os participantes a problemas de discriminação visual durante a Fase de Treino. O
primeiro grupo (Solucionável) recebeu 40 problemas solucionáveis. O segundo grupo
(Insolucionável) era exposto a 40 problemas
sem nenhuma solução programada, isto é, os
feedbacks “Correto” e “Incorreto” eram apresentados aleatoriamente, independentemente
das respostas dos participantes. O terceiro grupo recebeu 30 problemas insolucionáveis. Entretanto, nos 10 problemas finais, apenas o
feedback “Correto” era apresentado (Grupo
Insolucionável-Correto). Após essa fase, todos
os participantes eram solicitados a descrever a
solução para o problema apresentado. Na Fase
de Teste, 40 novos problemas solucionáveis de
discriminação eram apresentados a todos os
grupos.
Os resultados indicaram que o Grupo Solucionável apresentou um número menor de
tentativas para resolver o problema do que os
grupos insolucionável e insolucionável-correto. Uma vez que esses dois últimos grupos apresentaram desempenhos semelhantes, Levine e
colaboradores (1977) concluíram que a exposição a eventos incontroláveis não é o aspecto
crítico para a dificuldade na aprendizagem de
uma nova tarefa. A principal variável de controle seria as descrições de desempenho, uma
vez que os participantes que formularam descrições simples (baseadas em uma dimensão
dos estímulos) mostraram tempos de reação
mais curtos na resolução do problema na Fase
de Teste do que aqueles que apresentaram descrições complexas (baseadas em seqüências,
combinações ou padrões irrelevantes dos estímulos).
Em suma, nos estudos descritos anteriormente, o comportamento verbal dos participantes (julgamentos de controle e causalidade, descrições do desempenho e expectativas) foi considerado como a variável crítica para a ocorrência do efeito da história de incontrolabilidade, a despeito da experiência com eventos
incontroláveis per si.
Ausência de correspondência
entre o comportamento verbal
e o comportamento não-verbal
Enquanto os estudos anteriormente descritos apontam a ocorrência de correspondência entre o comportamento verbal e o comportamento não-verbal em situações de incontrolabilidade e, a partir desse resultado, afirmam
que julgamentos/expectativas dos indivíduos
determinam o retardo na aprendizagem de
novos comportamentos não-verbais, outros
estudos têm demonstrado ausência de correspondência entre comportamento verbal e nãoverbal em situações semelhantes, o que sugere
que o retardo na aprendizagem é controlado
por outras variáveis.
Oakes e Curtis (1982) apontaram um problema metodológico nos estudos que afirmam
que a dificuldade de aprendizagem é produto
dos relatos dos participantes. Nesses estudos,
após serem expostos a uma situação de incontrolabilidade e relatarem os eventos ambientais como sendo independentes de seus desempenhos, os participantes apresentaram um
retardo na aprendizagem subseqüente de novos comportamentos. Uma vez que a exposição a eventos incontroláveis e o relato de
incontrolabilidade ocorrem simultaneamente,
não é possível indicar a contribuição de cada
uma dessas variáveis para a ocorrência de tal
retardo. Para separar os efeitos dessas variáveis, Oakes e Curtis (1982) programaram uma
situação caracterizada pela ausência de correspondência entre o relato e as condições experimentais em vigor.
No Experimento 1, durante a Fase de Treino, os participantes receberam uma tarefa de
tiro ao alvo, sendo o tiro um feixe de luz. A
resposta de tiro ao alvo poderia ser seguida
ANÁLISE DO COMPORTAMENTO
pela apresentação de um tom ou pela ausência deste. A sala experimental era iluminada
de maneira a impedir a discriminação da relação de independência entre respostas e ocorrência do tom. Para o Grupo Contingente Positivo, apenas as respostas corretas (tiro no alvo)
eram seguidas da apresentação do tom, enquanto para o Grupo Contingente Negativo,
apenas as respostas incorretas eram seguidas
da apresentação do tom. Os grupos não-contingente positivo e não-contingente negativo
eram acoplados aos grupos contingente positivo e negativo, respectivamente, em relação ao
número e à seqüência de tons apresentados. O
Grupo Controle foi exposto apenas à Fase de
Teste, na qual todos os participantes receberam anagramas solucionáveis. Nessa fase, os
participantes deveriam indicar o grau de controle que exerciam sobre a tarefa (julgamentos de controle) e o grau em que acertos e erros dependiam de sua própria habilidade, dificuldade da tarefa, esforço, sorte ou controle
do experimentador (julgamentos de causalidade). Os participantes dos grupos não-contingentes apresentaram um tempo de reação mais
longo e maior número de erros nas respostas
de resolução do anagrama quando comparados aos grupos contingentes e controle, que
não diferiram entre si. Em relação aos julgamentos de controle, estes foram semelhantes
para todos os grupos, o mesmo ocorrendo com
os julgamentos de causalidade (o fator “controle do experimentador” foi descrito como o
principal responsável pelos desempenhos).
Durante o Experimento 2, a discriminação da relação de independência entre respostas e eventos ambientais foi manipulada por
meio de diferentes instruções. As fases de treino e de teste foram semelhantes àquelas do
experimento anterior, com a seguinte exceção:
apenas a condição positiva estava em vigor. Na
Fase de Teste, metade dos participantes do
Grupo Contingente e metade dos participantes do Grupo Não-Contingente foi informada
de que, durante a fase anterior, os tons eram
independentes das respostas emitidas. Dessa
forma, formaram-se cinco grupos experimentais diferentes: Contingente Informado, Contingente Não-Informado, Não-Contingente Informado, Não-Contingente Não-Informado e
91
Controle. Após a Fase de Teste, todos os participantes deveriam emitir julgamentos de controle e de causalidade, de maneira semelhante
àquela descrita no Experimento 1. Os resultados foram semelhantes aos do Experimento 1:
apesar dos julgamentos de controle terem sido
semelhantes para os participantes dos grupos
contingente e não-contingente, o desempenho
na tarefa do anagrama foi diferente, tendo os
grupos não-contingentes (com e sem instrução)
demonstrado dificuldades para resolver os anagramas. Em relação aos julgamentos de causalidade, os participantes que receberam a instrução, tanto do Grupo Contingente quanto do
Grupo Não-Contingente, tenderam a atribuir
os acertos e os erros a fatores externos (p. ex.:
dificuldade da tarefa, controle do experimentador). Os participantes que não receberam
instrução não apresentaram julgamentos de
causalidade com diferenças significativas entre os fatores apresentados (sua própria habilidade, dificuldade da tarefa, esforço, sorte ou
controle do experimentador).
Os resultados dos experimentos 1 e 2 indicam que a experiência prévia com eventos
contingentes ou não-contingentes foi um fator
preditivo do desempenho posterior, o que não
ocorreu com os julgamentos de controle e de
causalidade; ou seja, efeitos da história de
incontrolabilidade foram observados apenas
para os participantes do Grupo Não-Contingente, os quais apresentaram julgamentos de controle e de causalidade semelhantes àqueles dos
participantes do Grupo Contingente. De acordo com Oakes e Curtis (1982), se tais julgamentos fossem responsáveis por esse efeito,
ambos os grupos deveriam ter apresentado dificuldades na resolução dos anagramas, o que
não foi observado. A partir disso, esses autores sugeriram que o efeito da exposição a eventos incontroláveis provavelmente é produzido
pela condição de incontrolabilidade e não pelos julgamentos em si (ver também Ford e
Neale, 1985; Tiggeman e Winefield, 1987).
Resultados semelhantes foram encontrados por Tennen, Gillen e colaboradores (1982).
Na Fase de Treino do Experimento 1, os participantes eliminavam ou interrompiam tons.
Para o primeiro grupo, os tons eram escapáveis
(Grupo Escapável). Os quatro grupos restan-
92
ABREU-RODRIGUES, RIBEIRO & COLS.
tes receberam tons inescapáveis e eram acoplados ao Grupo Escapável em relação ao número e à duração dos tons. Dois grupos receberam uma instrução informando que a ocorrência dos tons não dependia apenas do desempenho do participante, mas também das
respostas de outro participante. Para o Grupo
Inescapável-Ajuda, essas respostas eram emitidas, na verdade, pelo próprio experimentador; para o Grupo Inescapável-Sem Ajuda,
tais respostas não eram emitidas. Por fim, o
Grupo Controle recebeu tons inescapáveis. Na
Fase de Teste, os participantes resolviam anagramas solucionáveis. Após essa fase, os participantes eram solicitados a julgar o grau de
controle sobre a tarefa. Os participantes do Grupo Inescapável e do Grupo Inescapável-Ajuda
apresentaram tempos de reação mais longos e
um maior número de falhas na resolução dos
anagramas do que os participantes expostos a
tons escapáveis, demonstrando também julgamentos de baixo controle. Tal resultado é inconsistente com os resultados de Oakes e Curtis
(1982), pois mostra uma correspondência entre os julgamentos dos participantes e seus desempenhos. A ausência de correspondência, entretanto, foi observada para os participantes
dos grupos inescapável-sem ajuda e controle,
os quais, apesar de terem mostrado um desempenho semelhante ao dos participantes do Grupo Escapável (tempos de reação reduzidos e
poucas falhas na resolução do anagrama), apresentaram julgamentos de baixo controle, o que
corrobora os dados de Oakes e Curtis (1982).
Esses resultados indicam, portanto, relações inconsistentes entre julgamentos de controle e
desempenho no teste.
O procedimento utilizado no Experimento 2 foi semelhante ao utilizado no Experimento
1. Após o treino, além de descreverem seus julgamentos de controle, os participantes formulavam julgamentos de causalidade. Os resultados mostraram que os julgamentos de causalidade global versus específica, estável versus instável e interna versus externa foram semelhantes para os participantes de todos os grupos,
isto é, apesar de apresentaram desempenhos
distintos entre si, os participantes de todos os
grupos relataram seus desempenhos como sendo produto dos mesmos fatores. Baseados na
ausência de correspondência entre os julgamentos de causalidade e o desempenho no teste, os autores concluíram que tais julgamentos
não exerceram controle sobre o comportamento dos participantes (ver também Tennen,
Drum et al., 1982).
IMPLICAÇÕES CLÍNICAS
Diversos autores têm considerado os estudos sobre o efeito da história de incontrolabilidade como um modelo experimental de
depressão (p. ex.: Alloy e Abramson, 1979;
Hiroto, 1974; Hiroto e Seligman, 1975; Klein
et al., 1976; Klein e Seligman, 1976), uma vez
que os participantes expostos a uma situação
experimental de incontrolabilidade apresentam
com-portamentos semelhantes àqueles observados em clientes depressivos. Na situação experimental, a experiência com eventos incontroláveis diminui a freqüência da resposta. Essa
diminuição generaliza-se para situações em que
existe uma relação de controlabilidade entre
os eventos ambientais e o responder, ocasionando a perda de reforços disponíveis. Similarmente, indivíduos depressivos comumente
apresentam uma história de exposição a eventos incontroláveis, uma redução generalizada
de responder, bem como um baixo nível de
reforçamento positivo.
Entretanto comportamentos classificados
como depressivos são multideterminados, e a
incontrolabilidade é apenas uma de suas variáveis de controle. Por exemplo, é possível que
um indivíduo apresente um quadro depressivo
em função de uma história passada de reforçamento para comportamentos de isolamento social (p. ex.: brincar sozinho em casa quando
criança) e uma história de punição para comportamentos sociais (p. ex.: trazer colegas para
brincar em casa). Nesse caso, as contingências
de reforçamento/punição, juntamente (ou não)
com uma possível exposição a eventos incontroláveis (p. ex.: pais ora punem, ora não punem o
mesmo comportamento), deveriam ser incluídas na análise funcional do repertório comportamental desse indivíduo.
No caso de clientes com história de exposição a eventos incontroláveis, os resultados
ANÁLISE DO COMPORTAMENTO
da pesquisa básica sugerem que a experiência
com eventos controláveis pode ser efetiva na
reversão dos efeitos dessa história (Carvalho,
1998; Nation e Massad, 1978; Seligman et al.,
1975; Williams e Maier, 1977); ou seja, indivíduos expostos a eventos incontroláveis e, em
seguida, a eventos controláveis não apresentam dificuldade de aprendizagem de novos
comportamentos. Em termos de prática clínica, esses resultados sugerem que o terapeuta
deve estabelecer situações discrimináveis de
controlabilidade ou criar condições para que o
cliente discrimine situações de controlabilidade
já existentes, o que pode ser feito na própria
sessão terapêutica. Tais intervenções serão feitas de modo a promover a aprendizagem de
novos comportamentos (ou aumentar a freqüência de comportamentos adequados anteriormente aprendidos), visando à generalização dos mesmos para o ambiente natural do
indivíduo.
Partindo do pressuposto de que os principais dados a respeito da história de vida do
cliente já foram levantados pelo terapeuta, assim como as informações sobre contingências
atuais, algumas propostas de intervenção serão apresentadas a seguir.
Treino de auto-observação
O contato com situações controláveis
pode ser favorecido a partir da auto-observação, ou seja, da observação do próprio comportamento e de eventos ambientais relevantes. Alguns clientes apresentam dificuldades de
auto-observação, sendo necessário que o terapeuta promova o treino desse comportamento. Para tanto, o terapeuta pode utilizar, dentre outros, dois procedimentos: a modelação e
o registro comportamental. No primeiro procedimento, o terapeuta fornece modelos de
auto-observação, descrevendo seu próprio
comportamento e identificando variáveis de
controle antecedentes e conseqüentes, passadas e atuais. O comportamento-alvo pode ter
sido emitido tanto fora como dentro da sessão
terapêutica. O mesmo pode ser feito em relação aos comportamentos do cliente. No segundo procedimento, o terapeuta solicita ao clien-
93
te registros constantes de comportamentos
emitidos fora do setting terapêutico que foram
(ou não) efetivos na obtenção de reforços. Esses registros permitem a identificação, por parte do cliente (e também do terapeuta), dos reforços disponíveis em seu ambiente. Tanto os
modelos fornecidos pelo terapeuta como os
registros de comportamentos e suas conseqüências poderão auxiliar o cliente a discriminar
situações de controlabilidade.
Treino de repertórios não-verbais
Ao discriminar as situações de controlabilidade na sua história passada e atual, o
cliente estará identificando as contingências
às quais será mais provável que se exponha e,
a partir de então, a exposição a essas contingências pode ser programada. Dessa forma, a
exposição a situações de controlabilidade deve
começar levando-se em consideração os comportamentos já presentes no repertório do
cliente. Por exemplo, considere uma cliente
que apresenta um quadro de isolamento social (p. ex.: só sai de casa para trabalhar, raramente interage com os familiares, não sai
com amigos, chora freqüentemente) após uma
história de repetidos fracassos em relacionamentos amorosos. Ao longo das sessões, algumas contingências reforçadoras passadas
são identificadas: no trabalho, ela era
prestigiada pelo chefe por suas habilidades no
computador; em casa, ajudava a mãe e os irmãos com os serviços bancários e era valorizada por isso; com os amigos, era elogiada
por seus conselhos “sempre úteis”. A partir
da identificação desses comportamentos e de
suas conseqüências, é possível programar atividades nas quais a cliente terá grande probabilidade de emitir tais comportamentos e
nas quais os mesmos provavelmente serão
reforçados. A reexposição a essas contingências reforçadoras poderá minimizar os efeitos
da exposição anterior a eventos aversivos
incontroláveis e, assim, promover a generalização desses comportamentos para novas
situações.
Quando as condições para a emissão de
comportamentos mais eficientes e adequados
94
ABREU-RODRIGUES, RIBEIRO & COLS.
envolvem eventos aversivos para o cliente (p.
ex.: situações novas, possibilidade de rejeição
e crítica), o terapeuta pode programar a exposição às contingências por meio de aproximações sucessivas. Uma cliente cujo isolamento
social consiste em esquiva do risco de outras
desilusões afetivas poderá ser treinada a se expor gradualmente a situações que favoreçam
relacionamentos amorosos e, simultaneamente, a se comportar de maneira mais efetiva
nesses relacionamentos. Por exemplo, ela poderá iniciar conversas com pessoas mais próximas de seu convívio diário, isto é, a aprendizagem desses comportamentos deve ser iniciada em contextos interpessoais com baixo teor
aversivo. O ambiente terapêutico, bem como
o ambiente familiar, caso sejam caracterizados como reforçadores, também podem oferecer um contexto inicial. Em ambas as situações, a cliente pode aprender a discriminar
quando e como emitir comportamentos socialmente relevantes, tais como expressar sentimentos, fazer e negar pedidos, criticar, elogiar, etc. Os próximos passos envolveriam um
potencial de risco gradativamente maior. A
cliente poderia ser incentivada a se relacionar mais intensamente com os amigos e, em
seguida, com pessoas desconhecidas visando
ao desenvolvimento de um relacionamento
amoroso. No decorrer desse processo de aproximações sucessivas, é de extrema importância ressaltar todo e qualquer progresso do
cliente, tanto pelo simples fato de se expor a
situações de “risco” como também pelos reforços obtidos em função de seus novos comportamentos. Isso deve ser feito para que o
cliente aprenda a discriminar as contingências reforçadoras presentes em seu ambiente
e, assim, tornar a exposição a tais contingências cada vez mais provável.
Treino de repertórios verbais
Um aspecto importante do processo terapêutico refere-se à identificação do grau de
correspondência entre as regras do cliente e
as contingências em vigor em seu cotidiano.
Considere um cliente adolescente com uma
história de vida caracterizada pela indepen-
dência entre sucessos/fracassos e seus comportamentos (p. ex.: não passou no vestibular apesar de ter estudado muito, ganhou um
carro dos pais sem um motivo especial). Em
decorrência dessa história, o cliente desenvolveu a regra “não adianta fazer A ou B, as coisas acontecem quando têm de acontecer”, e
sempre a verbaliza quando quer justificar o
fato de não lutar por seus objetivos. É importante lembrar que seguir essa regra pode gerar reforços eventualmente (já que situações
de incontrolabilidade fazem parte do nosso
cotidiano), o que torna difícil o seu abandono (Abreu-Rodrigues e Sanabio, no prelo).
Uma vez identificado o grau de correspondência entre regra e contingências, cabe ao
terapeuta ajudar o cliente a discriminar quando tal regra é precisa e quando é imprecisa (o
Capítulo 12 contém informações mais detalhadas sobre controle verbal).
No diálogo (fictício) que se segue é exemplificado o uso de frases paradoxais com o objetivo de colocar o cliente em contato com a
imprecisão da regra.
C: – Nada do que eu faço adianta...
T: – É, realmente, nada do que você faz
adianta.
C: – Como assim?
T: – Você disse que nada do que você faz
adianta, talvez você tenha razão.
C: – Mas não é bem assim... Sei lá...
T: – Como é então?
C: – Eu devo conseguir às vezes. Todo
mundo consegue algo que deseja de
vez em quando, né?
T: – É?
C: – É.
T: – Você sabe identificar o que e quando
você consegue?
C: – Hum, deixa eu ver... Ah, por exemplo,
quando eu quero muito acampar com
meus amigos nos finais de semana, eu
converso com meus pais e quase
sempre consigo convencê-los a me
deixarem ir.
T: – É um bom exemplo de algo que você
consegue conquistar em função do
que você mesmo fez. Lembra de mais
algum?
C: – Na escola, por exemplo, eu estudo
bastante em época de prova e sempre
consigo tirar boas notas.
ANÁLISE DO COMPORTAMENTO
T: – Isso mesmo, mais um ótimo exemplo!
Você parece conseguir conquistar
algumas coisas então, né?
C: – É verdade... Eu consigo muita coisa,
mas muitas vezes eu não percebo. Por
que isso acontece?
Nesse exemplo, é possível observar que o
terapeuta, além de não reforçar o comportamento verbal inadequado do cliente (“nada do
que eu faço adianta”), apresenta estímulos
discriminativos diferentes daqueles usualmente
apresentados em seu ambiente (“é, realmente,
nada do que você faz adianta”, “... talvez você
tenha razão”) de modo a evocar comportamentos alternativos (“Como assim?”, “Mas não é
bem assim...”). Essa estratégia poderá auxiliar
o cliente a discriminar suas regras inadequadas,
assim como algumas das contingências reforçadoras presentes em sua história.
Os relatos dos clientes fornecem informações importantes sobre atribuição de causalidade. Em função de uma história de exposição
a explicações mentalistas, os indivíduos comumente atribuem seus comportamentos a eventos internos e, conseqüentemente, seus objetivos na terapia focalizam a eliminação de sentimentos e pensamentos negativos (p. ex.: “se
eu perder essa insegurança e melhorar minha
auto-estima, acho que as coisas vão melhorar”).
Outras vezes, as explicações fornecidas pelo cliente apóiam-se em eventos ambientais, mas
uma análise cuidadosa revela que os eventos
apontados são irrelevantes para a ocorrência
do comportamento (p. ex.: “não tenho estudado porque ler muito me dá dor de cabeça”
quando, na realidade, o cliente está esquivando-se do estudo em função de dificuldades na
compreensão do conteúdo). Ambos os relatos
não apresentam a interação comportamentoambiente como o foco da atenção.
Diante desse quadro, é importante que o
terapeuta considere com cautela os relatos do
cliente, uma vez que eles podem descrever variáveis irrelevantes para a compreensão do
comportamento (ver Sanabio e Abreu-Rodrigues, 2002). Embora essa imprecisão possa ser
de interesse à medida que sugere contingências de reforçamento e punição às quais o cliente foi (ou continua sendo) exposto, é impor-
95
tante estabelecer contingências para gerar relatos acurados. Para tanto, o terapeuta pode
promover o treino de auto-observação, anteriormente discutido. Dessa forma, o cliente irá
aprender a identificar, com acurácia, relações
funcionais entre seus comportamentos e os
eventos ambientais, uma aprendizagem que geralmente ocorre a partir de modelos fornecidos pelo terapeuta ou por meio de reforçamento diferencial por ele estabelecido. A modelagem das verbalizações do cliente, assim
como a modelação, pode ser feita a partir dos
eventos que ocorrem na própria relação terapêutica (Kohlenberg e Tsai, 1991/2001).
CONCLUSÃO
De acordo com a proposta de Maier e
Seligman (1976), os efeitos da história de
incontrolabilidade seriam produto das expectativas dos indivíduos, as quais são avaliadas
por meio dos relatos. Entretanto a sugestão desses autores apresenta alguns problemas, ampliando a necessidade de manipulações experimentais mais rigorosas na área.
O primeiro deles se refere ao status de
“causa” atribuído às expectativas dos participantes. Para que qualquer evento seja considerado como variável de controle do comportamento, é necessário demonstrar que há relação funcional entre esse evento e o comportamento. Para isso, o evento é alterado de maneira sistemática (variável independente), enquanto possíveis alterações sobre o comportamento (variável dependente) são observadas.
Quando a variável dependente varia sistematicamente com manipulações da variável independente, tem-se uma relação funcional. Dessa forma, afirmar que a variável dependente
está funcionalmente relacionada à variável independente implica dizer que, sob determinadas condições ambientais, mudanças na primeira ocorrerão em função de mudanças na
segunda; em condições ambientais diferentes,
é possível que tal relação não seja observada.
Nesse caso, a variável independente não é considerada a causa (Chiesa, 1994), uma vez que
uma relação causal sugere que a ocorrência de
um evento é condição necessária e suficiente
96
ABREU-RODRIGUES, RIBEIRO & COLS.
para a ocorrência de outro evento, o que raramente é observado na natureza (Johnston e
Pennypacker, 1993). Os estudos sobre o efeito
da exposição a eventos incontroláveis que investigam o papel das expectativas dos indivíduos não identificam relações funcionais entre tais expectativas e o comportamento dos
participantes. Isso porque as expectativas, enquanto eventos não-observáveis, não são manipuladas, sendo apenas inferidas a partir dos
relatos dos indivíduos, os quais também não
são diretamente manipulados.
Um segundo problema está relacionado
ao uso do relato como instrumento de coleta
de dados. Conforme discutido anteriormente,
essa prática apóia-se no pressuposto de que os
relatos retratam com fidedignidade as expectativas dos indivíduos. Entretanto vários estudos (p. ex.: Critchfield e Perone, 1990; 1993;
Critchfield, 1993; 1996; Sanabio e AbreuRodrigues, 2002; Shimoff, 1986; Simonassi et
al., 1994, 1995, 1997) têm demonstrado que
os relatos podem estar sob controle de inúmeras variáveis e, assim, podem consistir em descrições imprecisas das contingências em vigor.
Uma vez que os relatos podem não descrever
com precisão eventos públicos, é viável supor
que o mesmo pode ocorrer com relação aos
relatos de eventos privados, principalmente se
for considerado que a comunidade verbal não
pode prover reforçamento diferencial consistente para tais relatos. Dessa forma, eles devem ser considerados com cautela nas tentativas de explicar o comportamento.
Considerar o efeito de uma história de
incontrolabilidade como produto da expectativa (um evento privado) gera um terceiro problema. De acordo com abordagens mentalistas,
modificações no ambiente externo produziriam
modificações em comportamentos privados
não-observáveis, sendo estes últimos considerados como a variável de controle dos comportamentos públicos. Ou seja, o foco de interesse dessas abordagens seria os processos
comportamentais não-observáveis diretamente. Sob uma perspectiva analítico-comportamental, entretanto, o mentalismo representa
um problema, pois, conforme apontado por
Skinner (1953/1994, p. 41), “o hábito de buscar dentro do organismo uma explicação do
comportamento tende a obscurecer as variáveis que estão ao alcance de uma análise científica”. Assim sendo, as variáveis de controle
devem ser buscadas no ambiente. Quando isso
ocorre, o controle do comportamento torna-se
possível, uma vez que eventos ambientais podem ser manipulados.
O quarto problema é que os estudos sobre efeito de uma história de incontrolabilidade
comumente negligenciam as funções de controle exercidas pelas variáveis manipuladas. Todos os estudos da área manipulam a história
de controlabilidade/incontrolabilidade. Outros, adicionalmente, manipularam o conteúdo das instruções apresentadas (Hiroto, 1974;
Klein et al., 1976; Mikulincer, 1986) ou o tipo
de tarefa às quais os participantes foram expostos (Douglas e Anisman, 1975; Klein e
Seligman, 1976). Nesses estudos, entretanto,
a história, as instruções e o tipo de tarefa não
foram considerados como fontes primárias de
controle do desempenho não-verbal. De fato,
essas variáveis só eram relevantes à medida
que, supostamente, alteravam as expectativas
dos participantes.
Um quinto problema também pode ser
apontado: os resultados sobre as possíveis relações entre os relatos e os efeitos da exposição a eventos incontroláveis são inconsistentes. Enquanto alguns autores (p. ex.: Alloy et
al., 1984; Douglas e Anisman 1975; Hiroto
1974; Klein et al., 1976) demonstraram correspondência entre os relatos e o desempenho
não-verbal, outros autores (p. ex.: Ford e Neale
1985; Oakes e Curtis 1982; Prindaville e Stein
1978; Tennen, Drum et al., 1982; Tennen,
Gillen et al., 1982) demonstraram independência entre esses dois comportamentos. Essa inconsistência de resultados sugere a necessidade de estudos adicionais para identificar as
variáveis responsáveis pela correspondência
entre os relatos e os efeitos da exposição a eventos incontroláveis.
Apesar desses problemas, os estudos sobre a exposição a eventos incontroláveis são
importantes porque apontam a possibilidade
de contingências verbais influenciarem o comportamento não-verbal dos indivíduos, além
de investigarem a influência de contingências
não-verbais passadas sobre o comportamen-
ANÁLISE DO COMPORTAMENTO
to atual. A identificação de variáveis históricas justifica-se por duas razões: porque permite aprimorar o controle experimental, uma vez
que efeitos da história passada, quando não
“desejáveis”, poderiam ser minimizados, ou
mesmo eliminados, e porque contribui para a
elaboração de intervenções comportamentais
eficazes, à medida que contingências atuais influenciam o comportamento de maneiras diferenciadas em função de histórias de reforçamento/punição distintas (Aló, 2002).
Os estudos sobre a história de incontrolabilidade também são relevantes por fornecerem subsídios para a prática clínica. No momento, as intervenções terapêuticas, embora
se mostrem efetivas no tratamento de indivíduos expostos a situações de incontrolabilidade, parecem não se beneficiar dos achados
da pesquisa básica. Similarmente, os terapeutas
têm apontado diversas variáveis envolvidas no
fenômeno da incontrolabilidade, mas essas variáveis ainda não foram experimentalmente
investigadas. Da mesma forma que a prática
clínica pode ser enriquecida com dados experimentais que contribuam para o estabelecimento de intervenções mais eficazes, fenômenos e processos clínicos podem gerar questões
experimentais de suma relevância. É preciso,
então, que clínicos e pesquisadores promovam
a interação entre essas duas áreas.
REFERÊNCIAS BIBLIOGRÁFICAS
Abreu-Rodrigues, J.; Sanabio, E. T. (no prelo). Instruções e auto-instruções: Contribuições da pesquisa básica. Em C. N. Abreu; H. J. Guilhardi (Orgs.), Manual
prático de psicoterapia comportamental, cognitiva e
construtivista. São Paulo: Editora Roca.
Alloy, L. B.; Abramson, L. Y. (1979). Judgment of
contingency in depressed and nondepressed students:
Sadder but wiser? Journal of Experimental Psychology:
General, 108, 441-485.
Alloy, L. B.; Peterson, C.; Abramson, L. Y.; Seligman,
M. E. P. (1984). Attributional style and the generality
of learned helplessness. Journal of Personality and Social Psychology, 46, 681-687.
Aló, R. M. (2002). História de reforçamento e operações
estabelecedoras: Efeitos sobre a sensibilidade comportamental. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF.
Carvalho, M. V. (1998). Interação entre eventos aversivos
controláveis/incontroláveis e reforçamento contínuo parcial: Efeitos sobre a sensibilidade à mudança de estímu-
97
los. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF.
Chiesa, M. (1994). Radical behaviorism: The philosophy
and the science. Boston: Authors Cooperative, Inc.
Publishers.
Critchfield, T. S. (1993). Signal-detection properties of
verbal self-reports. Journal of the Experimental Analysis
of Behavior, 60, 495-514.
Critchfield, T. S. (1996). Differential latency and
selective nondisclosure in verbal self-reports. The
Analysis of Verbal Behavior, 13, 49-63.
Critchfield, T. S.; Perone, M. (1990). Verbal self-reports
of delayed matching-to-sample by humans. Journal of
the Experimental Analysis of Behavior, 53, 321-344.
Critchfield, T. S.; Perone, M. (1993). Verbal self-reports
about matching-to-sample: Effects of the number of
elements in a compound sample stimulus. Journal of
the Experimental Analysis of Behavior, 59, 193-214.
Crowell, C. R.; Anderson, D. C. (1981). Influence of
duration and number of inescapable shocks on
intrashock activity and subsequent interference effects.
Animal Learning e Behavior, 9, 28-37.
Douglas, D.; Anisman, H. (1975). Helplessness or expectation incongruency: Effects of aversive stimulation on
subsequent performance. Journal of Experimental
Psychology: Human Perception and Performance, 1, 411-417.
Ford, C. E.; Neale, J. M. (1985). Learned helplessness
and judgments of control. Journal of Personality and
Social Psychology, 49, 1330-1336.
Glazer, H. I.; Weiss, J. M. (1976a). Long-term and
transitory interference effects. Journal of Experimental
Psychology: Animal Behavior Processes, 2, 191-201.
Glazer, H. I.; Weiss, J. M. (1976b). Long-term
interference effect: An alternative to “learned helplessness”. Journal of Experimental Psychology: Animal Behavior Processes, 2, 202-213.
Hiroto, D. S. (1974). Locus of control and learned
helplessness. Journal of Experimental Psychology, 102,
187-193.
Hiroto, D. S.; Seligman, M. E. P. (1975). Generality of
learned helplessness in man. Journal of Personality and
Social Psychology, 31, 311-327.
Hunziker, M. H. L. (1981). Um estudo sobre incontrolabilidade: Considerações metodológicas. Tese de doutorado não publicada, Universidade de São Paulo, São
Paulo, SP.
Hunziker, M. H. L. (2001). O estudo do desamparo aprendido como estratégia de uma ciência histórica. Em H. J.
Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz
(Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo
a variabilidade (p. 227-233). Santo André: ESETec.
Johnston, J. M.; Pennypacker, H. S. (1993). Strategies
and tactics of human behavioral research. Hillsdale, N.J.:
Lawrence Erlbaum.
Jones, S. L.; Nation, J. R.; Massad, P. (1977). Immunization against learned helplessness in man. Journal of
Abnormal Psychology, 86, 75-83.
Klein, D. C.; Seligman, M. E. P. (1976). Reversal of
performance deficits and perceptual deficits in learned
98
ABREU-RODRIGUES, RIBEIRO & COLS.
helplessness and depression. Journal of Abnormal
Psychology, 85, 11-26.
Klein, D. C.; Fencil-Morse, E.; Seligman, M. E. P. (1976).
Learned helplessness, depression and the attribution
of failure. Journal of Personality and Social Psychology,
33, 508-516.
Kohlenberg, R. J.; Tsai, M. (2001). Psicoterapia analítica funcional – Criando relações terapêuticas intensas e
curativas (F. Comte; M. Delliti; M. Z. Brandão; P. R.
Oerdyk; R. R. Kerbauy; R. C. Wielenska; R. A. Banaco
e R. Starling, trads.). Santo André: ESETec (Obra publicada originalmente em 1991).
Lamb, D. G.; Davis, S. F.; Tramill, J. L.; KleinhammerTramill, P. J. (1987). Noncontingent reward-induced
learned helplessness in humans. Psychological Reports,
61, 559-564.
Levine, M.; Rotkin, L.; Jankovic, I. N.; Pitchford, L.
(1977). Impaired performance by adult humans:
Learned helplessness or wrong hypotheses? Cognitive
Therapy and Research, 1, 275-285.
Maier, S. F.; Seligman. M. E. P. (1976). Learned helplessness: Theory and evidence. Journal of Experimental Psychology: General, 105, 3-46.
Matos, M. A.; Tomanari, G. Y. (2002). A análise do comportamento no laboratório didático. Barueri, S.P.:
Manole.
Mikulincer, M. (1986). Attributional processes in the
learned helplessness paradigm: Behavioral effects of
global attributions. Journal of Personality and Social
Psychology, 51, 1248-1256.
Mikulincer, M.; Nizan, B. (1988). Causal attribution,
cognitive interference, and the generalization of learned
helplessness. Journal of Personality and Social
Psychology, 55, 470-478.
Nation, J. R.; Massad, P. (1978). Persistence training:
A partial reinforcement procedure for reversing learned
helplessness and depression. Journal of Experimental
Psychology: General, 107, 436-451.
Oakes, W. F.; Curtis, N. (1982). Learned helplessness:
Not dependent upon cognitions, attributions, or other
such phenomenal experiences. Journal of Personality,
50, 387-408.
Overmier, J. B.; Seligman, M. E. P. (1967). Effects of
inescapable shock upon subsequent escape and
avoidance responding. Journal of Comparative
Physiological Psychology, 63, 28-33.
Prindaville, P.; Stein, N. (1978). Predictability, controllability and inoculation against learned helplessness.
Behavior Research and Therapy, 16, 263-271.
Sanabio, E. T.; Abreu-Rodrigues, J. (2002). Efeitos de
contingências de punição sobre os desempenhos ver-
bal e não-verbal. Psicologia: Teoria e Pesquisa, 18, 161172.
Seligman, M. E. P.; Beagley, G. (1975). Learned helplessness in the rat. Journal of Comparative Physiology
and Psychology, 88, 534-541.
Seligman, M. E. P.; Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology,
74, 1-9.
Seligman, M. E. P.; Rosellini, R. A.; Kozak, M. J. (1975).
Learned helplessness in the rat: Time course, immunization, and reversibility. Journal of Comparative and
Physiological Psychology, 88, 542-547.
Shimoff, E. (1986). Post-session verbal reports and the
experimental analysis of behavior. The Analysis of Verbal Behavior, 4, 19-22.
Simonassi, L. E.; Fróes, A. C.; Sanabio, E. T. (1995).
Contingências e regras: Considerações sobre comportamentos conscientes. Estudos (Goiânia), 22, 71-82.
Simonassi, L. E.; Oliveira, C. I.; Gosch, C. S. (1997). Exposição a contingências, conteúdo de instrução e formulação
de regras. Psicologia: Teoria e Pesquisa, 13, 189-195.
Simonassi, L. E.; Oliveira, C. I.; Sanabio, E. T (1994).
Descrição sobre possíveis relações entre contingências
programadas e formulação de regras. Estudos (Goiânia),
21, 97-112.
Skinner, B. F. (1981). Selection by consequences.
Science, 213, 501-504.
Skinner, B. F. (1993). Sobre o behaviorismo (M. P.
Villalobos, trad.). São Paulo: Cultrix (Obra publicada
originalmente em 1974).
Skinner, B. F. (1994). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins
Fontes (Obra publicada originalmente em 1953).
Tennen, G.; Drum, P. E.; Gillen, R.; Stanton, A. (1982).
Learned helplessness and the detection of contingency:
A direct test. Journal of Personality, 50, 426-442.
Tennen, H.; Gillen, R.; Drum, P. E. (1982). The
debilitating effect of exposure to noncontingent escape: A test of the learned helplessness model. Journal of
Personality, 50, 409-425.
Tiggemann, M.; Winefield, A. H. (1987). Predictability
and timing of self-report in learned helplessness experiments. Personality and Social Psychology Bulletin, 13,
253-269.
Todorov, J. C. (1985). O conceito de contingência
tríplice na análise do comportamento humano. Psicologia: Teoria e Pesquisa, 1, 75-81.
Williams, J. L.; Maier, S. F. (1977). Transituational
immunization and therapy of learned helplessness in
the rat. Journal of Experimental Psychology: Animal
Behavior Processes, 3, 240-252.
ANÁLISE DO COMPORTAMENTO
COMPORTAMENTO ADJUNTIVO:
DA PESQUISA À APLICAÇÃO
99
6
LINCOLN DA SILVA GIMENES
ALESSANDRA DE MOURA BRANDÃO
MARCELO FROTA BENVENUTI
Nosso problema não é o da analogia, mas o
de conseguir uma compreensão suficiente tanto dos ratos como dos homens, para que possamos reconhecer semelhanças nos processos
comportamentais. Temos de ser capazes de
classificar nossas variáveis de uma tal maneira que nos permita reconhecer semelhanças
entre os seus princípios de operação, apesar
de suas especificações físicas poderem ser bem
diferentes (Sidman, 1960/1976, p. 35-36).
Comportamento adjuntivo pode ser genericamente definido como um comportamento
que é mantido de maneira indireta pelas variáveis, que tipicamente controlam um outro comportamento, em vez de ser mantido diretamente por suas próprias variáveis controladoras
(Falk, 1971). Em geral, diz-se que o comportamento diretamente controlado é governado pela
contingência (tanto R-S – resposta dependente
– como S-S – resposta independente), enquanto o comportamento adjuntivo é induzido pela
contingência. Essa distinção é importante pelo
fato de aquele ser programado por meio das relações contingenciais, enquanto este ocorre
como um correlato dessas relações.
Em um estudo pioneiro, Falk (1961a) observou a ocorrência sistemática de um comportamento não-programado pela contingência inicial. Em seu experimento com ratos, no
qual pressões à barra eram reforçadas com
pelotas de alimento, segundo um esquema de
intervalo variável de 60 s, ele observou um con-
sumo excessivo de água (polidipsia) disponível durante a sessão experimental, sem que os
sujeitos estivessem submetidos a qualquer privação da mesma. A polidipsia ocorria principalmente após o consumo da pelota de ração e
mantinha-se por toda a sessão que tinha a duração de aproximadamente 3 h. Para alguns
sujeitos, o consumo de água durante a sessão
excedeu em dois terços seu peso corporal e
mostrou-se superior ao consumo de água na
gaiola-viveiro nos períodos entre as sessões experimentais. A polidipsia também foi observada
na utilização de um esquema de liberação de
alimento não-contingente à resposta, com duração fixa de 60 s, mas não sob um esquema
de reforçamento contínuo (Falk, 1961b). Falk
denominou o fenômeno de polidipsia psicogênica, sugerindo que sua natureza seria comportamental, e não fisiológica.
Os objetivos deste capítulo são apresentar ao leitor os fundamentos experimentais do
comportamento adjuntivo, bem como sugerir
o modelo desse comportamento como uma alternativa para a compreensão de transtornos
comportamentais. Com esses objetivos serão
apresentadas inicialmente as características do
comportamento adjuntivo, incluindo uma discussão da pertinência da classificação desse
comportamento em uma terceira classe, além
da descrição de diferentes tipos de comportamentos adjuntivos e da generalidade desse fenômeno comportamental. A seguir, serão apre-
100
ABREU-RODRIGUES, RIBEIRO & COLS.
sentados exemplos de transtornos comportamentais, para cuja compreensão o modelo de
comportamento adjuntivo pode contribuir. Esses exemplos incluem drogadição, obesidade
e bulimia, anorexia por atividade e a síndrome
do cólon irritável. Finalmente será discutido o
controle de estímulos sobre o comportamento
adjuntivo e suas implicações para a análise funcional do comportamento.
CARACTERÍSTICAS DO
COMPORTAMENTO ADJUNTIVO
Baseando-se nos trabalhos sobre polidipsia,
Falk (1971) destacou sete características básicas do comportamento adjuntivo:
• A maior taxa desse comportamento
ocorre logo após a apresentação do
reforço/estímulo, isto é, a distribuição
do comportamento no intervalo entre
reforços/estímulos é representada por
uma curva decrescente negativamente acelerada.
• O comportamento depende da duração dos intervalos entre a apresentação dos reforços/estímulos, resultando em uma relação bitônica (curva em
forma de U invertido) entre o tamanho do intervalo e a taxa do comportamento, com taxas reduzidas quando o intervalo é pequeno ou muito
grande, e altas quando o intervalo é
de um valor intermediário.
• O comportamento varia de acordo
com o nível de privação dos sujeitos,
apresentando uma relação direta entre o nível de privação e a taxa do comportamento.
• O comportamento ocorre em excesso se
comparado às condições de controle.
• O comportamento pode ser induzido
tanto por esquemas dependentes
(contingências R-S) como por esquemas em que a liberação dos estímulos não depende da resposta (contingências S-S).
• O comportamento pode ser usado
como reforço para outros comportamentos, por exemplo, um rato pode
aprender uma nova resposta conseqüenciada pelo acesso à água quando
exposto a um esquema intermitente
de apresentação de alimento.
• O comportamento depende dos estímulos ambientais disponíveis, com as
taxas variando em função dos arranjos do ambiente, como, por exemplo,
a localização e o tipo de vasilhame utilizado para apresentação da água.
Além dessas características, os comportamentos adjuntivos também estão sujeitos
aos efeitos de algumas manipulações ambientais que afetam o comportamento operante.
Dessa forma, o comportamento adjuntivo pode
ser afetado tanto por contingências de punição – diminuição na taxa do comportamento
(Pellon e Blackman, 1987) – como pela administração de diferentes drogas, tais como
apomorfina – diminuição na taxa de comportamento (Snodgrass e Aleen, 1988), d-anfetamina e diazepam – alterações na distribuição
do comportamento dentro do intervalo entre
reforços, mas sem alterar as taxas (Flores e
Pellon, 1997; Pellon e Blackman, 1992), e
amperozide – diminuição na taxa do comportamento (Tung et al., 1994). Os efeitos da radiação ionizante observados sobre o comportamento operante também foram observados
sobre o comportamento adjuntivo de ingestão
de água – diminuição na taxa do comportamento (Brandão, Gimenes e Rodrigues, 2003).
Assim como o operante, o comportamento
adjuntivo pode também interagir com outras
variáveis biológicas, como, por exemplo, o ritmo circadiano – a taxa do comportamento
adjuntivo reflete a distribuição do comportamento ao longo de 24 h em condições de livre
acesso sem imposição de contingências, isto é,
o horário da sessão experimental afeta a taxa
do comportamento para mais ou para menos,
de acordo com as taxas observadas no mesmo
horário do dia na condição de livre acesso
(Gimenes e Melo, 1993; Melo et al., 1991).
ANÁLISE DO COMPORTAMENTO
Comportamento adjuntivo
como uma terceira classe
A polidipsia observada nos arranjos experimentais descritos veio a ser designada
como comportamento adjuntivo ou comportamento induzido pelo esquema (esses dois termos têm sido utilizados de forma intercambiável na literatura), para diferenciá-lo do comportamento governado pelo esquema, o
operante em questão, como definido anteriormente. O termo comportamento induzido por
esquemas de reforçamento surgiu a partir do
trabalho de Staddon e Simmelhag (1971), no
qual o efeito de contingências estímulo-estímulo sobre o comportamento de pombos e suas
implicações para a compreensão do comportamento de uma forma mais geral foram explicitamente explorados. Esses autores observaram que os pombos que recebiam acesso ao
alimento de acordo com esquemas temporais,
dependentes ou independentes das respostas,
passaram a apresentar um padrão típico e estereotipado de respostas entre as apresentações do alimento. O padrão geral dos sujeitos
consistiu em respostas variadas logo após a
apresentação do alimento e respostas de bicar
o comedouro pouco antes da apresentação do
alimento. Portanto, respostas variadas ocorriam freqüentemente no início dos intervalos
entre as apresentações do alimento, e foram
denominadas de respostas interinas. Respostas
de bicar, que se tornavam muito prováveis para
todos os sujeitos conforme se aproximava uma
nova liberação do alimento foram denominadas de respostas terminais. Outras respostas,
que ocorreriam durante o intervalo, entre as
respostas interinas e as respostas terminais,
mas sem aumento na sua probabilidade em
função do esquema, foram denominadas de
respostas facultativas, sendo o comportamento
de correr em uma roda de atividade um exemplo apresentado por Staddon e Ayres (1975).
Staddon e Simmelhag (1971) consideraram
que respostas interinas e respostas terminais
seriam induzidas pelo esquema, no sentido de
que são respostas que se tornam mais prováveis de ocorrer na vigência do esquema indutor,
101
e não na sua ausência. Nesse contexto, o termo comportamento induzido por esquema serviria para enfatizar que a ocorrência de respostas terminais e interinas não poderia ser explicada por reforçamento. A ocorrência e as características definidoras dos comportamentos
induzidos por esquemas dificilmente poderiam
ser entendidas a partir dos princípios até então utilizados na análise do comportamento
operante. Para Staddon (1977), a polidipsia
induzida por esquemas de reforçamento seria,
assim, um tipo de resposta interina.
Algumas das características do comportamento adjuntivo, tais como excesso, dependência dos parâmetros do esquema intermitente de reforçamento (principalmente parâmetros
temporais), localização da ocorrência dentro
do intervalo entre reforços, distribuição bitônica em função do tamanho dos intervalos dos
esquemas, propriedades motivadoras desses
comportamentos, entre outras, levaram Falk
(1971) a propor uma nova classe de comportamentos. Essa terceira classe, a de comportamentos adjuntivos, viria a se contrapor ou a
complementar as outras duas, a de comportamentos operantes e a de comportamentos respondentes. A propriedade dessa classificação
foi, e ainda é, questionada (ver Wetherington,
1982, para uma análise detalhada dessa
questão).
Tipos e generalidades
dos comportamentos adjuntivos
Os achados iniciais de Falk, pelas características aberrantes da polidipsia observada,
geraram um grande interesse pelo fenômeno
e desencadearam uma longa empreitada de
pesquisas na área. Além da polidipsia, outros
comportamentos adjuntivos têm sido demonstrados em estudos realizados com animais,
como, por exemplo, o consumo de álcool em
ratos (Lester, 1961), ingestão de materiais nãocomestíveis (pica) em macacos (Villareal,
1967), agressão em pombos (Hutchinson, Azrin
e Hunt, 1968), uso da roda de atividades em
ratos (Levitsky e Collier, 1968), lambedura de
102
ABREU-RODRIGUES, RIBEIRO & COLS.
jatos de ar em ratos (Mendelson e Chillag,
1970), motilidade intestinal em ratos (Rayfield,
Segal e Goldiamond, 1982), hiperfagia em ratos (Wilson e Cantor, 1987) e auto-administração de drogas em ratos (Falk et al., 1990). Apesar de não mencionar o termo comportamento
adjuntivo, Fernandez e Timberlake (2003) demonstraram a ocorrência de diferentes comportamentos estereotipados em ursos polares
quando eles eram alimentados segundo esquemas temporais específicos. Além dos diferentes tipos de comportamentos adjuntivos, os
mesmos têm sido observados em uma ampla
variedade de espécies. Segundo Falk (1998), a
polidipsia tem sido observada em várias linhagens de ratos, camundongos, porquinhos-daíndia, gerbilo da Mongólia, chinchilas, macacos rhesus, macacos de Java, chimpanzés, pombos e humanos.
A generalidade do fenômeno do comportamento adjuntivo (p. ex.: Roper, 1981) e sua
ocorrência em seres humanos (p. ex.: Overskeid,
1992) têm sido ocasionalmente questionadas.
Entretanto vários estudos têm demonstrado em
algum grau sua ocorrência tanto em crianças
como em adultos. Enquanto os comportamentos adjuntivos de beber, de comer, de atividades motoras, de fumar e de asseio foram observados em adultos em uma situação de jogos (Fallon, Allen e Butler, 1979; Wallace e
Singer, 1976; Wallace, Sanson e Singer, 1978),
crianças submetidas a esquemas de intervalo
fixo para operação de uma chave telegráfica
apresentaram comportamentos adjuntivos de
vocalização, de beber e de atividades motoras
(Porter, Brown e Goldsmith, 1982) (para uma
resposta às críticas sobre a ocorrência de comportamentos adjuntivos em humanos, ver Falk,
1993).
COMPORTAMENTO ADJUNTIVO E
TRANSTORNOS COMPORTAMENTAIS
A seguir serão apresentados alguns transtornos comportamentais juntamente com os
fundamentos experimentais que fornecem elementos para um modelo de comportamento
adjuntivo como um modelo alternativo para a
compreensão dessas disfunções.
Drogadição
A diversidade de excessos comportamentais que podem ocorrer sob um esquema de
reforçamento indutor localiza o abuso de drogas como um caso especial dentro de um contexto em que condições ambientais podem gerar muitos tipos de disfunções comportamentais (Falk, 1993). Quando água ou outras soluções são disponibilizadas sob um esquema
indutor, seu consumo excessivo e a manutenção da auto-administração dessas substâncias
podem ocorrer. O consumo excessivo de diferentes drogas, tais como etanol, barbitúricos,
opióides, benzodiazepínicos, cocaína e nicotina, tem sido investigado sob o modelo experimental de comportamento adjuntivo por serem substâncias de adição em seres humanos.
Para algumas substâncias, tem sido demonstrado o desenvolvimento de dependência física, enquanto para outras tem-se observado
conseqüências comportamentais negativas
após a sua ingestão, como, por exemplo, “alterações no controle motor” (Samson e Falk,
1974).
Em um estudo pioneiro, Lester (1961)
observou a intoxicação por etanol em ratos
submetidos a um esquema de reforçamento
de intervalo variável, utilizando alimento
como reforço e com uma solução de etanol a
5,6% disponível durante a sessão experimental. Após 3 h de sessão, pôde-se observar um
aumento elevado na concentração de etanol
no sangue dos animais e sinais de intoxicação. Investigações posteriores confirmaram
que ratos sob esquemas indutores semelhantes ingeriram grande quantidade de solução
de etanol em sessões com duração de até 3,5 h
de duração (Everett e King, 1970; Freed,
Carpenter e Hymowitz, 1970). A ingestão de
etanol induzida por esquema de reforçamento
também pôde ser observada em outras
espécies, como camundongos e macacos, com
o consumo de grandes quantidades de etanol,
resultando em alta concentração sangüínea
dessa substância (Mello e Mendelson, 1971;
Woods e Winger, 1971).
A auto-administração oral induzida por
esquema de reforçamento de outras substâncias, como cocaína, também tem sido alvo
ANÁLISE DO COMPORTAMENTO
de diversos trabalhos. Tang e Falk (1987) observaram que ratos expostos a um esquema
de reforçamento de tempo fixo, com pelotas
de alimentos utilizadas como reforço, aumentaram drasticamente a ingestão de uma solução de cocaína, sendo que seu consumo aumentou em função do aumento da concentração da droga na solução. Posteriormente,
Falk e colaboradores (1990), em um estudo
sob condições semelhantes em que água e
uma solução de cocaína em baixa concentração eram disponibilizadas, não observaram
uma preferência pela droga. Os autores notaram que a preferência pela solução de cocaína só foi observada quando sacarina e
glicose foram acrescentadas à solução, mostrando que o sabor da substância pode ser
considerado como um fator relevante da
ingestão por via oral.
Uma série de estudos estendeu os procedimentos de auto-administração induzida por
esquemas de reforçamento de diferentes agentes tóxicos, como nicotina e cocaína, para a
rota intravenosa, no sentido de eliminar uma
variável indesejável da administração oral que
é o sabor aversivo da droga (Singer, Oei e
Wallace, 1982; Smith e Lang, 1980). Assim,
ao invés de uma garrafa com água ou uma solução, os animais tinham acesso a uma barra
para obter infusões intravenosas da droga.
Lang, Latiff, McQueen e Singer (1977) observaram em ratos que esquemas de razão fixa 1
(FR 1) de injeções intravenosas de nicotina não
era suficiente para controlar o comportamento de auto-administração. Entretanto, quando
o peso dos animais foi diminuído de 100 para
80% do peso livre, a nicotina passou a funcionar como reforçador e quando essa condição
foi combinada com um esquema de tempo fixo
de 1 min (FT 1 min), a auto-administração de
nicotina aumentou significativamente.
Em humanos, vários estudos têm enfatizado a importância do comportamento adjuntivo de ingestão de substâncias como álcool e
cocaína como um modelo animal para alcoolismo e drogadição. Doyle e Samson (1988)
observaram o consumo de cerveja em humanos sob dois esquemas de intervalo fixo para a
operação de uma máquina caça-níqueis e verificaram que os sujeitos expostos ao esquema
103
de intervalo fixo mais longo ingeriram significativamente mais cerveja do que aqueles expostos ao esquema de intervalo fixo mais curto. Além disso, foram observadas algumas características básicas dos comportamentos adjuntivos para o grupo exposto ao esquema de
intervalo fixo mais longo, sugerindo, assim, que
a ingestão de álcool em humanos ocorre de
maneira similar ao modelo animal de polidipsia
induzida por esquema de reforçamento. Além
disso, os autores sugeriram que a exposição a
esquemas indutores é crucial na formação da
história de consumo, e que a exposição a ambientes nos quais reforçamento intermitente,
talvez na forma de interação social, e álcool
estão disponíveis pode levar a um padrão de
consumo excessivo que pode se tornar habitual
ou potencializado por ambientes similares em
ocasiões futuras.
As drogas que afetam diretamente o sistema nervoso central podem também produzir fortes efeitos sensoriais. Tanto esses estímulos internos como também os estímulos externos ambientais associados ao comportamento de procura e ingestão da droga formam um
conjunto de estímulos discriminativos que estão associados à interação do indivíduo com a
droga. Alguns desses estímulos, tanto internos
como externos, podem tornar-se condicionados ao efeito farmacológico da droga. Assim,
eles podem levar à ingestão da droga em função da instalação de um quadro de abstinência como também a uma retomada dos comportamentos de busca e ingestão da droga porque esses comportamentos foram associados
aos reforços positivos produzidos pela ação intrínseca dessas substâncias (Falk, 1998). Dessa forma, em humanos, o abuso de drogas não
é um excesso comportamental isolado e único,
ao contrário, ele é apenas um dos aspectos de
uma variedade de outros comportamentos
disfuncionais. A aquisição e a manutenção do
abuso de drogas são facilitados não apenas por
fatores intrínsecos ou propriedades farmacológicas das drogas, mas também por condições econômica e socialmente estabelecidas por
esquemas de reforçamento restritivos que podem proporcionar a geração de esquemas
indutores para esses excessos comportamentais
(Falk, 1993).
104
ABREU-RODRIGUES, RIBEIRO & COLS.
Obesidade e bulimia
Embora o comportamento adjuntivo de
consumo de alimento (hiperfagia) não tenha
sido tão claramente demonstrado quanto a
polidipsia (p. ex.: Carlisle, Shanab e Simpson,
1972; King, 1974; Wetherington e Brownstein,
1979), alguns estudos demonstraram que a
ingestão excessiva de alimentos também pode
ser induzida ou adjuntiva a certas contingências (Bellingham, Wayner e Barone, 1979;
Gimenes e Marinho, 1993; Marinho, Gimenes
e Nogueira, 1991; Wilson e Cantor, 1987). Vale
observar, entretanto, que o consumo de alimento adjuntivo dificilmente pode ocorrer com o
mesmo vigor que a polidipsia adjuntiva. O rato
tem um sistema renal bastante eficiente, capaz de eliminar facilmente líquidos excessivamente ingeridos. Por outro lado, isso não ocorre
com a eliminação do alimento, pois, além das
restrições físicas do estômago para receber alimentos em excesso em um curto período de
tempo, o período para processamento e eliminação é maior.
Bellingham e colaboradores (1979) observaram a ocorrência do consumo de alimento adjuntivo em ratos privados de água quando esta era apresentada em esquemas de intervalo fixo e de tempo fixo. Esse consumo de
alimento foi significativamente superior àquele observado durante a condição de controle
quando os sujeitos recebiam a mesma quantidade de água de uma única vez e tinham acesso ao alimento durante o período da sessão
experimental. Além disso, o consumo de alimento foi maior na condição de tempo fixo do
que na condição de intervalo fixo, lembrando
que nesta última a apresentação da água requeria a emissão de respostas de pressão à
barra. Comparando seus procedimentos com
os de outros estudos, os autores concluíram
que um fator crítico para a produção da
hiperfagia parece ser o arranjo ambiental da
disponibilidade do alimento em relação ao
mecanismo de apresentação da água.
Wilson e Cantor (1987) sugeriram que os
procedimentos de comportamentos adjuntivos
podem fornecer um modelo do consumo de alimento excessivo não-regulador que contribui
para a obesidade em humanos. Esses autores
demonstraram a ocorrência do comer adjuntivo
em ratos não-privados de alimento e expostos
a contingências de intervalo fixo e razão fixa
cujo reforçamento era estimulação elétrica no
cérebro. Durante as sessões experimentais, os
sujeitos tinham acesso a uma mistura (mingau)
de ração e água. Os sujeitos consumiram significativamente mais alimento durante as sessões de reforço intermitente do que durante
as sessões de controle de reforçamento maciço (apresentação de todo o alimento de uma
única vez) ou extinção. Além disso, a maioria
dos sujeitos consumiu, em sessões de 3 h de
duração, o equivalente a aproximadamente
metade da quantidade de alimento consumido em 24 h.
Manipulando o conteúdo calórico da ração de manutenção de ratos, Marinho, Gimenes
e Nogueira (1991; ver também Gimenes e Marinho, 1993) observaram uma relação inversa
entre a quantidade de calorias dessa ração e a
quantidade de consumo de alimento adjuntivo
sob contingências de liberação de água em esquemas de intervalo. Diferentes animais foram
mantidos sob dietas de diferentes concentrações calóricas. Quando privados de água e expostos a sessões de liberação intermitente de
água na qual tinham livre acesso a pelotas regulares de alimento (pelotas industrializadas
de 45 mg), os animais mantidos na dieta
calórica mais baixa apresentaram um consumo de alimento significativamente maior do
que os animais mantidos em dietas de média e
alta concentração calórica. Esses dados sugerem que a falha de muitos de programas de
dieta para redução de peso pode estar no fato
de que, sob certas contingências diárias, a redução do valor calórico da dieta pode potencializar o consumo de alimento.
Embora não sejam encontrados na literatura trabalhos específicos que demonstrem a
hiperfagia induzida por contingências em humanos, casos clínicos podem ilustrar a possibilidade de análise desse comportamento a partir do modelo de comportamento adjuntivo.
Um caso clínico citado por Goldiamond (1984)
apresenta uma paciente bulímica cujo padrão
alimentar era constituído de alguns episódios
diários de consumo excessivo de alimento, seguidos de vômitos provocados. A partir do re-
ANÁLISE DO COMPORTAMENTO
gistro diário das atividades dessa paciente, foi
possível identificar rotinas bem-estabelecidas
que ocorriam anteriormente aos episódios
bulímicos. Mudanças observadas nesses episódios, decorrentes de alterações propostas nas
rotinas diárias, levaram à identificação de variáveis controladoras da bulimia dessa paciente como funcionalmente semelhantes àquelas
que controlam outros comportamentos definidos como adjuntivos. Dessa forma, além do
comportamento bulímico, o consumo excessivo de alimento, não-bulímico, e que geralmente leva à obesidade pode também ser controlado por contingências funcionalmente semelhantes àquelas observadas nos diferentes tipos de comportamentos adjuntivos. Esse tipo
de análise oferece uma alternativa para a compreensão e intervenção em problemas alimentares de alto risco para a saúde.
Anorexia por atividade
Um dos comportamentos adjuntivos que
tem sido relatado na literatura, tanto com humanos como com outros animais, é o relacionado com atividades motoras. Ratos, quando
expostos a certas contingências de reforço para
respostas de pressão à barra, tendem a utilizar
a roda de atividades em uma taxa muito superior àquela observada em situações de controle (Levitsky e Collier, 1968). Humanos, adultos e crianças, quando expostos a contingências similares, também apresentam um aumento nas taxas de atividades motoras (Fallon,
Allen e Butler, 1979; Kachanoff, et al., 1973;
Porter, Brown e Goldsmith, 1982; Wallace,
Sanson e Singer, 1978).
Em geral, as taxas de comportamentos
adjuntivos observadas em animais estão correlacionadas com o nível de privação utilizado
como operação estabelecedora das contingências indutoras desses comportamentos (Falk,
1971). Assim, existe uma relação direta entre
nível de privação e taxa do comportamento
adjuntivo, com maiores taxas do comportamento correlacionadas aos maiores níveis de privação. Independentemente de contingências
programadas para respostas, a restrição ao alimento, além de provocar redução no peso,
105
pode provocar um correspondente aumento de
atividades físicas, o que, por sua vez, pode reduzir o consumo de alimento e subseqüente
perda de peso (Pierce e Epling, 1994). Dessa
forma, a contingência indutora, aliada à privação, pode potencializar as taxas de comportamentos motores, como, por exemplo, o uso
excessivo da roda de atividade em animais ou
o excesso de exercícios físicos em humanos.
Observações clínicas em casos de pacientes com anorexia indicam uma similaridade
funcional entre a anorexia observada em pacientes e as observações no laboratório com
ratos. Pierce e Epling (1994) sugeriram a busca de evidências convergentes para o estabelecimento dessa similaridade funcional. Alguns
fatos, como:
a) atividade física em excesso estar associada com anorexia em humanos;
b) atividade física em excesso diminuir
o consumo de alimentos em humanos
e em animais;
c) a redução no consumo de alimentos
aumentar a atividade física em humanos e em animais;
d) o início do processo de anorexia em
humanos e em animais desenvolverse de modo semelhante e
e) a função reprodutiva ser afetada em
ratos ativos, atletas e pacientes anoréxicos,
constituem exemplos de evidências convergentes que indicam similaridade funcional entre
anorexia em humanos e os dados obtidos com
ratos no procedimento de anorexia por atividade. Podemos incluir, ainda, nessas evidências
o fato de que a exposição a certas contingências induz o aumento da atividade motora em
humanos e em animais. Tomadas em conjunto, essas observações sugerem que o paradigma
de laboratório pode ser um modelo útil para a
exploração de determinantes da anorexia sob
condições controladas.
Baseados em 12 anos de pesquisa, Epling
e Pierce (1988; Pierce e Epling, 1994) propuseram uma teoria biocomportamental de
anorexia por atividade, que se iniciou no laboratório animal e tem demonstrado ser útil na
106
ABREU-RODRIGUES, RIBEIRO & COLS.
compreensão de anorexia em humanos. Esse
modelo de análise enfatiza o impacto cultural
sobre os comportamentos de fazer dieta e exercícios físicos. Esses comportamentos seriam
governados por contingências de reforçamento
estabelecidas pelos grupos sociais referentes,
como o da família e o dos amigos. Sob algumas condições particulares, a restrição alimentar seria combinada com as atividades físicas
para iniciar os processos fisiológicos da
anorexia. Algumas dessas condições particulares poderiam ser contingências indutoras de
atividades físicas, isto é, atividades físicas poderiam surgir como adjuntivas a essas contingências, potencializando, assim, o efeito da
restrição alimentar sobre o comportamento de
fazer exercícios. Essa proposta oferece modos
alternativos de intervenção para o tratamento
dessa alteração comportamental que pode, em
muitos casos, ser fatal.
Síndrome do cólon irritável
Rayfield e colaboradores demonstraram,
no início da década de 1980, que comportamentos autonômicos também poderiam ser induzidos ou adjuntivos a certas contingências
(Rayfield, Segal e Goldiamond, 1982). Utilizando ratos como sujeitos experimentais, esses pesquisadores obtiveram dados sistemáticos do funcionamento intestinal por meio da
manipulação de diferentes tipos de contingências. Os dados iniciais mostraram a ocorrência
sistemática de defecação durante sessões em
que os ratos eram expostos a esquemas temporais de reforçamento por alimento e a ausência de defecação durante sessões cujas contingências eram de razão ou de reforçamento
contínuo. As contingências temporais associadas à defecação eram tanto de intervalo fixo
como variável, ou ainda, de tempo fixo ou variável. Uma das características da distribuição
dos bolos fecais, observada no estudo de
Rayfield e colaboradores (1982), foi a concentração destes no início da sessão, descrevendo
uma curva negativamente acelerada, ao longo
da mesma. Essa característica, entretanto, parece ser um efeito da medida utilizada para
avaliar a ocorrência da motilidade intestinal,
que é medida pelo número de bolos fecais. Assim, essa medida necessita da existência de
material fecal no intestino do animal para que
os bolos fecais sejam produzidos. A curva negativamente acelerada estaria, assim, refletindo o esvaziamento do intestino, e não a diminuição da motilidade do mesmo.
Os dados obtidos por Rayfield e colaboradores (1982) foram replicados com variações
no tipo de reforço (envolvendo diferentes topografias da resposta consumatória) e na densidade de reforçamento, demonstrando a sistematização da motilidade intestinal como
comportamento adjuntivo. Utilizando alimento em pó como reforço e diferentes magnitudes, de forma a igualar a quantidade de alimento consumido em sessões de reforçamento
contínuo e de intervalo fixo, Gimenes, Andronis
e Goldiamond (1987) observaram a sistemática ocorrência de defecação nas sessões de esquema de intervalo fixo e sua ausência nas sessões de esquema de reforçamento contínuo.
Para avaliar a precisão do controle da
motilidade intestinal observada entre as sessões, nesses experimentos, Gimenes, Andronis
e Goldiamond (1988) utilizaram um procedimento de esquema múltiplo no qual períodos
de esquema de reforçamento contínuo e de esquema de intervalo fixo eram alternados ao
longo da sessão. Nesse procedimento, quase a
totalidade dos bolos fecais ocorreu durante os
períodos de esquema de intervalo fixo, demonstrando um estrito controle da contingência sobre a motilidade intestinal dos animais. Além
disso, esse procedimento atenuou a curva negativamente acelerada de distribuição dos bolos fecais ao longo da sessão, demonstrando
também que a motilidade intestinal não é um
comportamento do tipo “tudo ou nada”, isto é,
quando se inicia, continua até o esvaziamento
do intestino; ela pode, sim, ser interrompida e
reiniciada de acordo com as contingências vigentes, mesmo que essas alterações nas contingências ocorram em pequenos intervalos de
tempo.
Buscando avaliar a persistência do controle da motilidade intestinal, Gimenes e colaboradores (1989) registraram a motilidade intestinal de ratos expostos a diferentes contingências em sessões diárias, durante um perío-
ANÁLISE DO COMPORTAMENTO
do superior a um ano. Quatro grupos foram
expostos às seguintes condições: esquema de
reforçamento contínuo, esquema de intervalo
fixo, alternação semanal entre esquema de
reforçamento contínuo e esquema de intervalo fixo e nenhuma contingência, isto é, os animais permaneciam na câmara experimental
durante o período da sessão, mas sem nenhuma contingência programada. Os animais do
grupo sem contingência apresentaram uma
taxa moderada de defecação durante as sessões ao longo do ano. Utilizando esse grupo
como controle, os animais expostos à contingência de esquema de intervalo fixo apresentaram uma taxa superior de defecação. Os animais do grupo exposto à alternação entre esquema de reforçamento contínuo e esquema
de intervalo fixo apresentaram defecação durante as sessões semanais de esquema de intervalo fixo e ausência de defecação durante
as sessões semanais de esquema de reforçamento contínuo. Os animais do grupo exposto
à contingência de reforçamento contínuo apresentaram ausência total de defecação durante
todas as sessões. Esses dados sugerem que a
motilidade intestinal pode ser controlada, via
contingências operando sobre outros comportamentos, tanto em seu aumento como em sua
diminuição. Além disso, o controle parece ser
mais rigoroso quando se trata da diminuição
da motilidade, isto é, contingências de reforçamento contínuo desenvolvem um controle mais
estrito. Os resultados obtidos por Wylie, Layng
e Meyer (1993) tendem a corroborar essa afirmação. Trabalhando com ratos expostos a esquemas de reforçamento contínuo, de razão e
de intervalo, esses pesquisadores observaram
a ausência de defecação sob a condição de
reforçamento contínuo e a sua ocorrência sob
as outras duas condições. Assim, a intermitência ou não da apresentação do alimento (ou
outro estímulo) parece ser o que determina o
aumento ou a redução do comportamento
adjuntivo. O controle mais estrito da contingência de reforçamento contínuo aponta para
cuidados que devem ser tomados quando da
escolha de uma linha de base adequada para
avaliação do comportamento adjuntivo (ver
Roper, 1981, para uma discussão sobre escolha de linha de base).
107
Observações clínicas de pacientes diagnosticados como tendo a Síndrome do Cólon
Irritável fornecem indícios para a proposição
do comportamento adjuntivo como um possível modelo para análise e intervenção nesse
problema de saúde (Gimenes, 1988, 1990,
1997/2000). Essa síndrome é caracterizada por
ocorrências de constipação ou de diarréia, ou
ainda uma combinação de ambas, com ausência de patologias orgânicas. Alguns estudos têm
relacionado a Síndrome do Cólon Irritável com
alterações psicológicas como depressão, ansiedade e somatização (Lynn e Friedman, 1993)
ou ainda com o estresse (Payne et al., 1992;
Suls, Wan e Blanchard, 1994). O tipo de relação entre esses fatores e a síndrome está ainda
aberto a confirmações. Uma vez que os dados
psicológicos são geralmente obtidos após o
diagnóstico da síndrome, ambos podem ser tanto causa como efeito, ou ainda, ambos podem
ser colaterais, isto é, adjuntivos a contingências cotidianas que podem não ser necessariamente aversivas ou estressantes. Além disso, o
estresse, ou o desconforto psicológico, relatado por alguns pacientes pode ser uma “característica de demanda” da situação social. Muitas vezes a audiência desses pacientes espera
uma causa psicológica para o distúrbio intestinal relatado, e são essas expectativas sociais
(as demandas) que governam os relatos subjetivos sobre os desconfortos experienciados por
esses pacientes (cf. Azrin, Holz e Goldiamond,
1961; Azrin et al., 1961).
Dados obtidos a partir de registros de atividades diárias, realizados por dois pacientes
com a Síndrome do Cólon Irritável (Gimenes,
1997), sugerem que pelo menos alguns casos
possam ser explicados a partir do modelo de
comportamento adjuntivo. Em um dos casos,
o de um paciente com um quadro de diarréia
crônica, as atividades diárias eram caracterizadas por tarefas pontuais em determinados
horários, com tempo livre e sem nenhuma programação específica para os períodos entre essas atividades pontuais. Guardadas as devidas
proporções e características, suas atividades
poderiam ser descritas como semelhantes àquelas apresentadas por um organismo sob controle de uma contingência de intervalo fixo. No
segundo caso, uma paciente com quadro de
108
ABREU-RODRIGUES, RIBEIRO & COLS.
constipação crônica apresentava uma rotina de
atividades caracterizada por repetições e por
invariabilidade ao longo do dia. A sua rotina
diária poderia ser caracterizada como semelhante àquela programada por contingências
de razão fixa ou de reforçamento contínuo. As
análises dos registros desses pacientes permitem observar a alteração do comportamento
intestinal quando ocorrem mudanças ou quebra nessas rotinas estruturadas e bemestabelecidas. O tipo de intervenção sugerida,
baseada nessa análise, é o de reestruturação
das atividades por parte do paciente, buscando encontrar um padrão de atividades que
melhor se correlacione com um comportamento intestinal mais regular. No primeiro caso,
atividades e uma rotina mais estruturada deveriam ser sugeridas. No segundo caso, diversificação de atividades e flexibilização da rotina poderiam alterar o padrão do comportamento intestinal.
CONTROLE DE ESTÍMULOS SOBRE
COMPORTAMENTOS ADJUNTIVOS
Segundo Terrace (1966), “controle de estímulos refere-se a extensão na qual o valor de
um estímulo antecedente determina a probabilidade de ocorrência de uma resposta condicionada” (p. 271). Uma das maneiras de se aferir o grau de controle de estímulos do comportamento é a partir da obtenção de gradientes
de generalização. Esses gradientes são obtidos
a partir do registro do número de respostas emitidas na presença de diferentes estímulos que
compõem um mesmo contínuo, incluindo-se aí
o estímulo original ao qual a resposta foi condicionada. Um tipo de gradiente de generalização que indique forte controle de estímulos
pode ser obtido logo após o treino com
reforçamento diferencial. Durante o treino,
respostas são reforçadas na presença de um
estímulo definido pelo experimentador (S+),
mas não são reforçadas na presença de um
outro estímulo (S-). No teste, graduações de
uma certa dimensão do S+ são apresentadas,
e as respostas são registradas na presença de
cada uma dessas graduações, mas sem a ocorrência de reforço. Tipicamente, a resposta será
tão mais freqüente quanto mais próximo do
S+ for o estímulo no teste (p. ex.: Gutman e
Kalish, 1956). O gradiente de generalização,
obtido a partir de condições experimentais
como essa, fornece um parâmetro preciso para
avaliar o grau de controle de um estímulo sobre o comportamento (para uma revisão sobre
generalização de estímulos, ver Capítulo 8).
Hamm, Porter e Kaempf (1981) avaliaram o controle de estímulos sobre a polidipsia
induzida por esquemas de reforçamento por
alimento a partir de um procedimento que possibilitou a obtenção de um gradiente de generalização para o consumo de água. Ratos foram expostos a um esquema múltiplo de tempo randômico e extinção, sendo o componente de tempo randômico sinalizado por um som
de 40 Hz (S+) e o componente de extinção
sinalizado por um som de 10 Hz (S-). Ao final
de 30 sessões de treino, a taxa de consumo de
água foi consistentemente maior durante os
períodos de S+ do que durante os períodos de
S-. Em seguida foram realizados dois testes de
generalização. No primeiro, períodos de S+
foram intercalados por períodos nos quais estímulos-teste, graduações da freqüência do S+,
foram apresentados sob extinção. No segundo
teste de generalização, períodos de S+ foram
intercalados por períodos nos quais estímulosteste foram apresentados ao mesmo tempo que
o alimento. Um gradiente de generalização,
com a forma de “U” invertido, para o consumo
de água foi obtido somente no segundo teste,
mas não no primeiro, no qual os estímulos-teste foram apresentados sob extinção. Para os
autores, o fato de os animais não consumirem
água durante o primeiro teste demonstra a dependência de beber com o alimento, reafirmando o caráter adjuntivo do consumo de água
sob condições nas quais o alimento é periodicamente liberado.
Benvenuti e colaboradores (2000) replicaram o estudo de Hamm e colaboradores
(1981), utilizando um esquema múltiplo com
um dos componentes em extinção e o outro com
reforçamento contingente às respostas – esquema de intervalo variável. O componente de
intervalo variável foi sinalizado por um som
de 40 Hz (S+), enquanto no componente de
extinção o som estava ausente (S-). Para o tes-
ANÁLISE DO COMPORTAMENTO
te de generalização (cinco sessões para cada
sujeito), períodos de S+ foram intercalados por
períodos nos quais estímulos sonoros de diferentes freqüências foram apresentados (estímulos-teste: 0, 5, 10, 40, 120 e 140 Hz). Nos
períodos com os estímulos-teste as respostas
de pressão à barra nunca eram reforçadas. Três
dos quatro sujeitos utilizados apresentaram
gradientes de generalização característicos
para as respostas de pressão à barra, com a
maior freqüência de respostas ocorrendo na
presença do estímulo de 40 Hz, o S+ inicial.
Similarmente, esses três sujeitos apresentaram
também gradientes de generalização para as
respostas de beber, com algumas diferenças nas
curvaturas dos gradientes. Enquanto dois dos
sujeitos apresentaram a maior freqüência de
respostas na presença do estímulo de 40 Hz, o
terceiro apresentou mais respostas na presença dos estímulos de 10 e de 120 Hz. Esses resultados demonstraram a possibilidade de se
desenvolver controle de estímulos sobre o comportamento adjuntivo e que esse controle
reflete o controle exercido sobre a reposta
operante, quando se utilizam esquemas com
reforçamento contingente às respostas.
Além da utilização de procedimentos para
obtenção de gradientes de generalização, outros procedimentos podem ser utilizados para
a avaliação do desenvolvimento de controle de
estímulos sobre o comportamento. No trabalho desenvolvido por Gimenes e colaboradores (1988) sobre a indução de motilidade intestinal por esquema múltiplo de reforçamento,
pode ser observado o controle estabelecido
pelos estímulos sinalizadores dos componentes do esquema múltiplo sobre o comportamento operante governado pelos diferentes componentes. Apesar de os autores não terem realizado nenhum teste de controle de estímulos,
observações dos registros cumulativos das sessões mostram mudanças de padrão de respostas adequadas ao novo componente tão logo
os componentes são alternados acompanhados
da respectiva mudança de estímulos. Gimenes
e colaboradores (1996) replicaram esse estudo, programando sessões de sondagem para
avaliar o controle de estímulos sobre o comportamento adjuntivo de motilidade intestinal
gerado pelo esquema múltiplo. Inicialmente,
109
os sujeitos – ratos – foram expostos a 40 sessões diárias sob um esquema de reforçamento
múltiplo de intervalo fixo e de reforçamento
contínuo, nas quais os dois componentes eram
intercalados ao longo da sessão em um total
de três ciclos. Para alguns sujeitos, o componente de intervalo fixo era sinalizado pela presença de uma luz e o componente de reforçamento contínuo pela ausência da luz; para os
outros sujeitos, a sinalização dos componentes era invertida. Após essas sessões (sessões
de desempenho) os sujeitos foram expostos a
10 sessões semanais de teste, além das sessões
diárias de desempenho. Nas sessões de teste,
os sujeitos eram expostos às mesmas sessões
de desempenho, porém sem a presença da barra na caixa experimental, isto é, durante a sessão os sujeitos eram expostos à alternação dos
estímulos sinalizadores dos componentes do
esquema múltiplo sem a possibilidade de emitir as respostas operantes governadas pelos esquemas de reforçamento. A ocorrência e a ausência de defecação durante as sessões de desempenho replicaram os dados anteriores, isto
é, quase 100% das ocorrências de defecação
aconteceram durante os períodos com o componente de intervalo fixo. Durante as sessões
de teste, cerca de 80% das ocorrências de
defecação aconteceram também durante os
componentes de intervalo fixo. Embora o controle observado nessas sessões de teste não tenha sido da mesma magnitude daquele observado nas sessões de desempenho, esses dados
mostram uma extensão do controle dos estímulos sinalizadores do esquema múltiplo para
o comportamento adjuntivo resultante dessa
contingência.
Os dados sobre controle de estímulos podem nos fornecer pistas para a identificação
de relações funcionais controladoras de comportamentos, que, em uma primeira análise,
parecem não estar relacionados a nenhuma
contingência específica. No caso da motilidade
intestinal, por exemplo, esses comportamentos são, muitas vezes, considerados como
respondentes, principalmente a estímulos
estressores ou associados a estados emocionais
(Ester e Goulston, 1973; Johnsen, Jacobsen e
Forde, 1986; West, 1970). Os dados obtidos
com animais em laboratório, entretanto, têm
110
ABREU-RODRIGUES, RIBEIRO & COLS.
demonstrado que esses comportamentos podem ser produto de contingências positivas, as
quais não são associadas a situações aversivas
ou geradoras de estresse.
CONCLUSÃO
Sumarizando, uma das características principais dos comportamentos adjuntivos é a sua
sistematização, isto é, sua dependência a uma
determinada contingência e ao contexto no qual
essa contingência opera. O comportamento
adjuntivo, além de poder ser alterado por modificações nas relações entre os elementos da contingência, pode ser alterado também por variáveis de contexto, como, por exemplo, as variáveis potenciadoras da contingência – as operações estabelecedoras – ou, ainda, a história de
desenvolvimento da contingência, entre outras.
Diferente dos outros elementos relacionados a uma contingência, o comportamento
adjuntivo não atua sobre a contingência, mas
é colateral às intrincadas relações contingenciais. Dessa forma, os comportamentos adjuntivos podem ser vistos como “sintomas” ou
descritores das contingências, isto é, eles podem indicar o que está acontecendo em um
dado momento, que tipo de contingência está
em operação. Assim, qualquer intervenção direcionada à alteração desses comportamentos, baseada em uma análise linear (cf.
Goldiamond, 1974, 1984) estará sujeita ao
fracasso, pois, como qualquer “sintoma”, esses comportamentos podem ser passíveis de
substituição ou de recorrência. O controle desses comportamentos só é possível por meio
da identificação das contingências às quais
eles são adjuntivos e da intervenção direta sobre essas contingências.
Além dos exemplos apresentados no texto, as emoções podem ser também entendidas
como comportamentos adjuntivos. Nesse contexto, as emoções não são causas das ações de
uma contingência, mas, em vez disso, descrevem a contingência, podendo, assim, serem
consideradas como “tatos não falados” (cf.
Layng, 2000). O relato sobre uma emoção ou
o sentimento de uma emoção como comportamento encoberto podem revelar que tipo de
contingência estava ou está operando no momento daquela emoção. Por exemplo, um sentimento de medo descreve uma contingência
cuja conseqüenciação é para uma resposta de
fuga ou esquiva – nesse caso, o medo é
adjuntivo a essa contingência. A emoção pode
ou não ser expressa, e, quando o é, gera um
comportamento emocional. Assim, essa análise permite diferenciar as emoções do comportamento emocional que, uma vez expresso, pode
satisfazer uma outra contingência e passar a ser
governado por ela, ou, em outras palavras, tornar-se um operante (ver o Capítulo 7 para uma
discussão sobre comportamento emocional).
Concluindo, o modelo de comportamento adjuntivo para a compreensão de diferentes
transtornos comportamentais sugere intervenções dirigidas a alterações nas contingências
das quais esses transtornos são função. Essas
contingências representam, geralmente, as atividades diárias dos indivíduos, entre elas rotinas de trabalho e de estudo além das interações
sociais. Nem sempre, porém, é possível alterar
essas contingências que dependem de um controle externo muitas vezes longe do alcance
do terapeuta ou do indivíduo. Sendo assim, é
necessário, nesses casos, identificar novas contingências no mesmo contexto como alternativas para o desenvolvimento de padrões de comportamento mais salutares e adaptativos.
REFERÊNCIAS BIBLIOGRÁFICAS
Azrin N. H.; Holz, W.; Goldiamond, I. (1961). Response
bias in questionnaire reports. Journal of Consulting
Psychology, 25, 324-326.
Azrin, N. H.; Holz, W.; Ulrich, R.; Goldiamond, I.
(1961). The control of the content of conversation
through reinforcement. Journal of the Experimental
Analysis of Behavior, 4, 25-30.
Bellingham, W. P.; Wayner, N. J.; Barone, F. C. (1979).
Schedule-induced eating in water deprived rats.
Physiology and Behavior, 23, 1105-1107.
Benvenuti, M. F.; Gimenes, L. S.; Brandão, A. M.; Rodrigues, A. V.; Bastos, J. C. (2000). Uma tentativa de estabelecer controle de estímulos sobre polidipsia induzida
por esquemas de reforçamento. Resumos de Comunicações Científicas da XXX Reunião Anual de Psicologia (p.
106). Brasília: SBP.
Brandão, A. M.; Gimenes, L. S.; Rodrigues, J. L. (2003).
Efeitos da radiação ionizante sobre polidipsia induzida
por esquema de reforçamento. Interação em Piscologia,
7, 63-72.
ANÁLISE DO COMPORTAMENTO
Carlisle, H. J.; Shanab, M. E.; Simpson, C. W. (1972).
Schedule-induced behavior: Effects of intermitent water
reinforcement on food intake and body temperature.
Psychonomic Science, 26, 35-36.
Doyle, T. F.; Samson, H. H. (1988). Adjunctive alcohol
drinking in humans. Physiology and Behavior, 44, 775-779.
Epling, W. F.; Pierce, W. D. (1988). Activity-based
anorexia – A biobehavioral perspective. International
Journal of Eat Disorder, 7, 475-485.
Ester, W. K.; Goulston, K. J. (1973). Levels of anxiety in
colonic disorders. New England Journal of Medicine, 288,
16-20.
Everett, R. B.; King, R. A. (1970). Schedule-induced
alcohol ingestion. Psychonomic Science, 18, 278-279.
Falk, J. L. (1961a). Production of polydipsia in normal rats
by an intermittent food schedule. Science, 133, 195-196.
Falk, J. L. (1961b). The behavioral regulation of waterelectrolyte balance. Em M. R. Jones (Ed.), Nebraska
symposium on motivation (p. 1-33). Lincoln, NE:
University of Nebraska Press.
Falk, J. L. (1971). The nature and determinants of
adjunctive behavior. Physiology and Behavior, 6, 577-588.
Falk, J. L. (1993). Schedule-induced drug self-administration. Em F. van Haaren (Ed.), Methods in behavioral pharmacology (p. 301-328). New York: Elsevier
Science Publishers.
Falk, J. L. (1998). Drug abuse as an adjunctive behavior.
Drug and Alcohol Dependence, 52, 91-98.
Falk, J. L.; Vigorito, M.; Tang, M.; Lau, C. E. (1990).
Schedule-induced cocaine drinking: Choice between
cocaine and vehicle. Pharmacology, Biochemistry e
Behavior, 35, 187-193.
Fallon, J. H.; Allen, J. D.; Butler, J. A. (1979). Assessment of adjunctive behaviors in humans using a
stringent control procedure. Physiology and Behavior,
22, 1089-1092.
Fernandez, E. J.; Timberlake, W. (2003, maio). The
effects of fixed and variable time schedules on
stereotypic behaviors in an adult polar bear. Trabalho
apresentado na 29th Annual Convention of the Association
for Behavior Analysis, San Francisco, USA.
Flores, P.; Pellon, R. (1997). Effects of d-amphetamine
on temporal distribution of schedule-induced polydipsia.
Pharmacology, Biochemistry and Behavior, 57, 81-87.
Freed, E. X.; Carpenter, J. A.; Hymowitz, N. (1970).
Acquisition and extinction of schedule-induced polydipsia consumption of alcohol and water. Psychological
Reports, 26, 915-922.
Gimenes, L. S. (1988). Um exemplo de interação entre
pesquisa de laboratório e clínica. Psicologia: Relfexão e
Crítica, 3, 26-31.
Gimenes, L. S. (1990). Alterações intestinais como comportamentos adjuntivos: Análise e possíveis aplicações.
Anais da XX Reunião Anual de Psicologia (p. 266-270).
Ribeirão Preto, SP: SPRP.
Gimenes, L. S. (1997). Comportamento adjuntivo: Um
possível modelo para a análise e intervenção em problemas de saúde. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e
terapia cognitivista (p. 395-403). São Paulo: ARBytes.
Gimenes, L. S. (2000). Pesquisa animal e clínica: Um
caso para divórcio ou casamento feliz? Em R. R. Kerbauy
111
(Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e
no questionamento clínico (p. 53-59). São Paulo: SET.
Gimenes, L. S.; Andronis, P. T.; Goldiamond, I. (1987).
Estudo de algumas variáveis de procedimento na
defecação induzida por esquema de reforçamento. Psicologia: Teoria e Pesquisa, 3, 104-116.
Gimenes, L. S.; Andronis, P. T.; Goldiamond, I. (1988).
Defecação induzida por esquema múltiplo de reforçamento. Ciência e Cultura, 40, 1121-1123.
Gimenes, L. S.; Bezerra, A. C. A.; Dacanal, J. N.; Campos, L. M.; Brandão, A. M. (1996). Controle de estímulos sobre defecação induzida por esquema múltiplo.
Resumos de Comunicações Científicas da XXVI Reunião
Anual de Psicologia (p. 52). Ribeirão Preto: SBP.
Gimenes, L. S.; Marinho, M. C. S. (1993, maio). Effects
of caloric content on schedule-induced food consumption. Trabalho apresentado na 19th Annual Convention
of the Association for Behavior Analysis, Chicago, USA.
Gimenes, L. S.; Melo, R. M. (1993, maio). Circadian
behavioral patterns of water consumption and schedule-induced polydipsia. Trabalho apresentado na 19th
Annual Convention of the Association for Behavior Analysis, Chicago, USA.
Gimenes, L. S.; Melo R. M.; Nalini, L. E. G.; Gonçalves,
F. A. S. (1989). Defecação induzida por contingências
durante um longo período de exposição. Resumos da
40ª Reunião Anual da Sociedade Brasileira para o Progresso da Ciência (p. 837-838). São Paulo: SBPC.
Goldiamond, I. (1974). Alternative sets as a framework
for behavioral formulations and research. Behaviorism,
3, 49-86.
Goldiamond, I. (1984). Training parent trainers and
ethicists in nonlinear analysis of behavior. Em R. F.
Dangle; A. Polster (Eds.), Foundations of research and
practice (p. 504-545). New York: Guilford Press.
Gutman, N.; Kalish, H. I. (1956). Discriminability and
stimulus generalization. Journal of Experimental
Psychology, 51, 79-88.
Hamm, R. J.; Porter, J. H.; Kaempf, G. L. (1981). Stimulus
generalization of schedule-induced polydipsia. Journal
of the Experimental Analysis of Behavior, 36, 93-99.
Hutchinson, R. R.; Azrin, N. H.; Hunt, G. M. (1968).
Attack produced by intermittent reinforcement of a
concurrent operant response. Journal of the Experimental Analysis of Behavior, 11, 489-495.
Johnsen R.; Jacobsen, B. K.; Forde, O. H. (1986).
Associations between symptoms of irritable colon and
psychological and social conditions and lifestyle. British
Medical Journal, 292, 1633-1635.
Kachanoff, R.; Leveille, R.; McClelland, J. P.; Wayner,
M. J. (1973). Schedule induced behavior in humans.
Physiology and Behavior, 11, 395-398.
King, G. (1974). Wheel running in the rat induced by a
fixed-time presentation of water. Animal Learning and
Behavior, 2, 325-328.
Lang, W. J.; Latiff, A. A.; McQueen, A.; Singer, G. (1977).
Self-administration of nicotine with and without a food
delivery schedule. Pharmacology, Biochemistry and
Behavior, 13, 657-662.
Layng, J. (2000). Emoções e comportamento emocional. Resumos de Comunicações Científicas da XXX Reunião Anual de Psicologia (p. 84). Brasília: SBP.
112
ABREU-RODRIGUES, RIBEIRO & COLS.
Lester, D. (1961). Self-maintenance of intoxication in the
rat. Quarterly Journal of Studies on Alcohol, 22, 223-231.
Levitsky, D.; Collier, G. (1968). Schedule-induced wheel
running. Physiology and Behavior, 3, 571-573.
Lynn, R. B.; Friedman, L. S. (1993). Irritable bowel
syndrome. The New England Journal of Medicine, 329,
1940-1945.
Marinho, M. C. S.; Gimenes, L. S.; Nogueira, M. V. C.
(1991). Efeitos da dieta alimentar no consumo de alimento induzido por esquemas de reforçamento. Resumos de Comunicações Científicas da XXI Reunião Anual
de Psicologia (p. 73). Ribeirão Preto, SP: SBP.
Melo, R. M.; Gimenes, L. S.; Pereira, A. B.; Coelho, D.
S. (1991). Interações entre polidipsia induzida por esquemas de reforçamento e ritmos circadianos de
ingestão de água. Resumos de Comunicações Científicas
da XXI Reunião Anual de Psicologia (p. 74). Ribeirão
Preto, SP: SPB.
Mello, N. K.; Mendelson, J. H. (1971). Evaluation of a
polydipsia technique to induce alcohol consumption
in monkeys. Physiology and Behavior, 7, 827-836.
Mendelson, J.; Chillag, D. (1970). Schedule-induced
air licking in rats. Physiology and Behavior, 5, 535-537.
Overskeid, G. (1992). Is any human behavior scheduleinduced? The Psychological Record, 42, 323-340.
Payne, A.; Blanchard, E. B.; Holt, C. S.; Schwarz, S. P.
(1992). Physiological reactivity to stressors in irritable
bowel syndrome patients, inflammatory bowel disease
patients and non-patient controls. Behaviour Research
and Therapy, 30, 293-300.
Pellon, R.; Blackman, D. E. (1987). Punishment of
schedule-induced drinking in rats by signalled and
unsignalled delays in food presentation. Journal of the
Experimental Analysis of Behavior, 48, 417-434.
Pellon, R.; Blackman, D. E. (1992). Effects of drugs on
the temporal distribution of schedule-induced polydipsia in rats. Pharmacology, Biochemistry and Behavior,
12, 355-362.
Pierce, W. D.; Epling, W. F. (1994). Activity anorexia:
An interplay between basic and applied analysis. The
Behavior Analyst, 17, 7-23.
Porter, J. H.; Brown, R. T.; Goldsmith, P. A. (1982).
Adjunctive behavior in children on fixed interval food
reinforcement schedules. Physiology and Behavior, 28,
609-612.
Rayfield, F.; Segal, M.; Goldiamond, I. (1982).
Schedule-induced defecation. Journal of the Experimental Analysis of Behavior, 38, 19-34.
Roper, T. J. (1981). What is meant by the term
“schedule-induced”, and how general is schedule
induction? Animal Learning and Behavior, 9, 433-440.
Samson, H. H.; Falk, J. L. (1974). Schedule-induced
ethanol polydipsia: Enhancement by saccharin.
Pharmacology, Biochemistry and Behavior, 2, 835-838.
Sidman, M. (1976). Táticas da pesquisa científica (M.
E. Paiva, trad.). São Paulo: Brasiliense. (Obra publicada
originalmente em 1960).
Singer, G.; Oei, T. P. S.; Wallace, M. (1982). Scheduleinduced self-injection of drugs. Neuroscience and
Biobehavioral Reviews, 6, 77-83.
Smith, L. A.; Lang, W. J. (1980). Changes occurring in
self administration of nicotine by rats over a 28-day
period. Pharmacology, Biochemistry and Behavior, 13,
215-220.
Snodgrass, S. H.; Allen, J. D. (1988). The effects of
apomorphine on the acquisition of schedule-induced
polydipsia in rats. Pharmacology, Biochemistry and
Behavior, 29, 434-488.
Staddon, J. E. R. (1977). Schedule-induced behavior.
Em W. K. Honig; J. E. R. Staddon (Eds.), Handbook of
operant behavior (pp.125-152). Englewood Cliffs, NJ:
Prentice-Hall.
Staddon, J. E. R.; Ayres, S. L. (1975). Sequencial and
temporal properties of behavior induced by a schedule
of periodic food delivery. Behavior, 54, 46-49.
Staddon, J. E. R.; Simmelhag, V. L. (1971). The
“superstition” experiment: A re-examination of its implications for the principles of adaptative behavior.
Psychological Review, 78, 3-43.
Suls, J.; Wan, C. K.; Blanchard, E. B. (1994). A
multilevel data-analytic approach for evaluation of
relationships between daily life stressors and symptomatology: Patients with irritable bowel syndrome.
Health Psychology, 13, 103-113.
Tang, M.; Falk, J. L. (1987). Oral self-administration of
cocaine: Chronic excessive intake by schedule induction.
Pharmacology, Biochemistry and Behavior, 28, 517-519.
Terrace, H. S. (1966). Stimulus control. Em W. K. Honig
(Ed.), Operant behavior: Areas of research and application
(p. 271-344). New York: Appleton-Century-Crofts.
Tung, C. S.; Wu, W. H.; Tseng, C. J.; Yin, T. H. (1994).
Effects of amperozide on schedule-induced polydipsia in
rats. European Journal of Pharmacology, 256, 193-200.
Villareal, J. (1967, maio). Schedule-induced “pica”. Trabalho apresentado no Annual Meeting of the Eastern
Psychological Association, Boston, USA.
Wallace, M.; Singer, G. (1976). Adjunctive behavior
and smoking induced by a maze-solving schedule in
humans. Physiology and Behavior, 17, 849-852.
Wallace, M.; Sanson, A.; Singer, G. (1978). Adjunctive
behavior in humans on a food delivery schedule. Physiology and Behavior, 20, 203-204.
West, K. L. (1970). MMPI correlates of ulcerative colitis.
Journal of Clinical Psychology, 26, 214-219.
Wetherington, C. L. (1982). Is adjunctive behavior a
third class of behavior? Neuroscience and Biobehavioral
Reviews, 6, 329-350.
Wetherington, C. L.; Brownstein, A. J. (1979). Schedule control of eating by fixed-time schedules of water
presentation. Animal Learning and Behavior, 7, 38-40.
Wilson, J. F.; Cantor, M. B. (1987). An animal model of
excessive eating: Schedule-induced hyperphagia in
food-satiated rats. Journal of the Experimental Analysis
of Behavior, 47, 335-346.
Woods, J. H.; Winger, G. D. (1971). A critique of
methods for inducing ethanol self-intoxication in animals. Em N. K. Mello; J. H. Mendelson (Eds.), Recent
advances in alcoholism: An interdisciplinary symposium
(p. 413-436). Washington, DC: Government Printing
Office.
Wylie, A. M.; Layng, M. P.; Meyer, K. A. (1993).
Schedule-induced defecation by rats during ratio and
interval schedules of food reinforcement. Journal of the
Experimental Analysis of Behavior, 60, 611-620.
ANÁLISE DO COMPORTAMENTO
CONTINGÊNCIAS AVERSIVAS
E COMPORTAMENTO EMOCIONAL
113
7
CARLOS EDUARDO CAMESCHI
JOSELE ABREU-RODRIGUES
A psicologia como ciência da mente foi
questionada por Skinner ao longo de toda a
sua trajetória como cientista e filósofo. Seu argumento central é que a origem da mente não
pode ser rastreada a partir de mudanças em
qualquer traço evolutivo, enquanto a origem
do comportamento verbal pode (Skinner,
1990). Assim, Skinner sustenta não haver como
justificar a mente, e sim o comportamento
como o objeto de estudo de uma ciência natural. De qualquer modo, embora a possibilidade de uma ciência do comportamento que inclua o comportamento humano seja ainda um
assunto polêmico e controvertido, uma crítica
das dificuldades formais e das suposições contrárias envolvidas pode ser resumida.
De um lado, as principais dificuldades resultam da falta de consenso nas definições dos
conceitos de “ciência” e de “comportamento”
(Baum, 1994). Por outro lado, os argumentos
contrários baseiam-se na combinação das crenças de que o comportamento humano é muito
complexo para ser redutível a leis científicas,
de que o fato de cada pessoa ser única impossibilita a generalização dos princípios e de que
o comportamento é orientado para eventos futuros, de acordo com a noção de intencionalidade, o que viola as relações causais científicas nas quais as “causas” são antecedentes aos
“efeitos” (Chiesa, 1994).
Com respeito à primeira parte, a sugestão
de Baum, com base no behaviorismo radical de
Skinner, é que a ciência pode ser definida, em
termos pragmáticos, como uma atividade
dirigida à elaboração de termos e de conceitos
descritivos econômicos que tornem a nossa experiência compreensível e que o conceito de
comportamento refere-se a algo natural, isto é,
a qualquer coisa que possamos fazer ou dizer,
incluindo as crenças às quais nos referimos anteriormente e outras relativas à consciência ou à
mente consciente, suas subdivisões e supostos
processos. Nesse sentido, conceitos como estímulo, resposta e reforço, entre outros, permitem a descrição das relações simples e complexas da pessoa com os ambientes natural, físico
e social, de modo parcimonioso e inteligível.
Chiesa (1994) questiona os outros argumentos citados ao sugerir que:
• as ciências naturais também começaram
com a complexidade e, à medida que
foram refinando seus métodos e esquemas conceituais, avançaram em direção
à ordem, isto é, às leis científicas;
• seus objetos de estudo são igualmente únicos, o que não impede descrições de extensas propriedades comuns
em sistemas e em teorias que permitem a predição e a generalização;
• a crença na intencionalidade é produto de esquemas conceituais pré-científicos embutidos nos padrões lingüísticos de nossos modos de falar aprendidos socialmente.
A análise comportamental inclui também
a análise do comportamento verbal, o que pode
114
ABREU-RODRIGUES, RIBEIRO & COLS.
ajudar a esclarecer que, quando nos comportamos em função de eventos futuros, na verdade estamos inclinados a nos comportarmos
de um modo análogo ao que no passado produziu resultados importantes (Baum, 1994;
Chiesa, 1994).
Sidman (1989/1995, p. 74) aponta o espaço em que os cientistas comportamentais
confinam o sujeito experimental, freqüentemente um rato branco, e as simplificações típicas de um laboratório de pesquisa comportamental para, então, perguntar: “O que essa criatura intelectualmente limitada, vivendo em um
espaço ecológica e socialmente estéril possivelmente pode nos dizer sobre a conduta humana?”. As implicações dessa pergunta são extensas, pois traz questionamentos sobre se devemos estudar somente ações que tenham “validade de face”, ou seja, apenas formas exatas
de comportamento. Nesse caso, uma preocupação com a criatividade conduz ao estudo
apenas de artistas e de compositores, ou um
interesse em coerção implica investigar as prisões. Embora possa trazer informações úteis, a
longo prazo essa visão pode limitar a compreensão até mesmo de problemas práticos específicos. Muitos pesquisadores observam somente as formas exatas que os interessam e há diversos tipos de especialistas em psicologia, de
jogo de xadrez a sexo, de programação de computadores a doença mental, dificultando as generalizações além das fronteiras de cada área.
A alternativa para o estudo de ações que
parecem importantes por si mesmas é fazer
exatamente o oposto, isto é, selecionar uma
amostra arbitrária, alguma ação que, por ser
delimitada e artificial, evita todas as limitações
e restrições impostas por nosso julgamento
sobre validade de face. E a vantagem de eliminar essas restrições é tornar a amostra arbitrária representativa de todo comportamento e,
com isso, os resultados podem ter significados
em uma ampla extensão, muito além das ações
específicas que selecionamos para observação
e medida (Sidman, 1989/1995). Em resumo,
o estudo das variáveis que afetam a probabilidade da resposta de pressionar a barra como
um modelo de análise teria generalidade semelhante ao estudo das propriedades de qualquer corpo em movimento feito por Galileu,
por meio da observação de bolas polidas deslizando em planos inclinados (Skinner, 1972).
Portanto, a atitude apropriada na ciência
em geral e em uma ciência do comportamento
em particular é impedir que a fidedignidade, a
validade ou a generalidade de métodos, de resultados e de princípios sejam julgados pela
opinião ou pela especulação, pois são assuntos a serem analisados por meio de testes experimentais (Sidman, 1989/1995). Nessa perspectiva, a ciência da análise do comportamento surgiu e vem evoluindo em suas tentativas
de descrever eficientemente a interação entre
o comportamento e o ambiente, com ênfase
no lado ambiental deste intercâmbio (Hineline,
1984). E, à medida que as descrições de relações funcionais são refinadas, elas esclarecem
as contingências de reforço e punição que formam os operantes e seus subprodutos respondentes, isto é, como o comportamento ocorre
sob o controle de estímulos.
Skinner (1938) distinguiu as categorias
comportamentais em respondentes e em operantes a partir da redefinição de estímulo e
resposta como classes de eventos com efeitos
recíprocos, isto é, como classes funcionais em
vez de eventos observáveis imediatamente. Os
estímulos foram definidos em termos de
energia física e correlacionados com uma classe particular de respostas; estas foram definidas não pela topografia, mas como classes de
eventos suscetíveis ao controle de um estímulo específico. Zeiler (1986) ensinou que, desde então, as velhas unidades estímulo e resposta tornaram-se interdependentes, de modo
que a unidade de análise do comportamento
respondente é a relação funcional S-R, a unidade do comportamento operante é a relação
funcional R-S e a unidade do controle de estímulos é a relação funcional S-R-S.1 Enquanto
1Essas
relações funcionais ilustram: a) S-R: padrões
respondentes incondicionados simples e complexos
(US-UR) e padrões respondentes condicionados (CSCR), em que os estímulos antecedem as respostas;
b) R-S: padrões operantes em que a resposta produz estímulos que afetam sua probabilidade futura;
e c) SD-R-S: padrões operantes, cuja probabilidade
é função do contexto (SD), que estabelece a ocasião
em que a resposta (R) produz a conseqüência (S).
ANÁLISE DO COMPORTAMENTO
a relação R-S define o comportamento a partir
de seus eventos antecedentes imediatos, as relações R-S e S-R-S definem o comportamento
a partir de suas conseqüências, baseando-se
nos princípios de reforçamento e punição
(Skinner,1953/2000).
Este capítulo enfatizará as relações comportamento-ambiente sob controle de contingências aversivas e seus objetivos são:
a) sumariar os principais procedimentos
experimentais utilizados nos estudos
dos efeitos de contingências de controle aversivo e os processos comportamentais resultantes;
b) apontar algumas das implicações desses estudos para a compreensão do
comportamento humano em geral;
c) avaliar criticamente o uso de técnicas
aversivas no processo terapêutico.
CONTINGÊNCIAS AVERSIVAS
A punição, o reforço negativo e a supressão
condicionada ilustram as principais contingências
de controle aversivo estudadas e envolvem vários tipos de operações experimentais.
Punição
O processo de punição ocorre quando
uma resposta produz efeitos que diminuem sua
probabilidade. Se esse efeito ocorre quando a
resposta produz estímulos, o processo é descrito como punição positiva; quando ela remove estímulos, é descrito como punição negativa (Baum, 1994; Catania, 1998/1999). Portanto, no primeiro caso a resposta produz um
estímulo com propriedades aversivas e, no segundo, remove ou adia um estímulo reforçador.
É importante lembrar, no entanto, que nem
todas as conseqüências de uma resposta que
reduzem sua probabilidade futura seriam
exemplos de eventos punitivos (Azrin e Holz,
1966). Esse efeito pode ocorrer também com
outros procedimentos tais como mudança de
estímulos discriminativos, extinção, saciação e
restrição física, conforme mostra o estudo com-
115
parativo de Holz, Azrin e Ayllon (1963). Um
aspecto metodológico peculiar dos estudos de
punição também merece ser destacado. Para
se estudar a punição, uma classe de respostas
deve ter alta probabilidade de ocorrência. Por
isto, nesses estudos, uma classe de respostas
mantida por reforço positivo produz também,
de acordo com alguma programação, estímulos aversivos. A probabilidade da resposta punida varia em função da privação, da freqüência, da duração e da magnitude do reforço positivo, e também da freqüência, da duração e
da intensidade do estímulo aversivo.
A efetividade da punição tem sido alvo
de muitas controvérsias. A punição foi incorporada nas primeiras versões da Lei do Efeito
de Thorndike, que, mais tarde, retirou esse
componente (Catania, 1998/1999). Skinner
(1938) também insistiu em manter a punição
em domínio separado, argumentando que a
punição produz somente efeitos indiretos sobre o comportamento e enfatizou sua ineficácia
com base na recuperação da resposta quando
ela é interrompida. Entretanto, com base em
dados disponíveis, Hineline (1984) e Catania
(1998/1999) argumentam que, de acordo com
o mesmo critério, o reforço positivo também
deve ser considerado ineficaz, porque ambas
as operações têm efeitos temporários: quando
são eliminadas, as respostas retornam aos níveis prévios. Portanto, a punição é paralela ao
reforço, exceto pelo fato de que os efeitos diferem quanto à direção: o reforço torna a resposta reforçada mais provável e a punição reduz a probabilidade da resposta punida.
Azrin e Holz (1966) listam 13 condições
necessárias para a punição levar à completa
supressão do comportamento:
1. não pode haver fuga possível do estímulo punitivo;
2. o estímulo deve ser tão intenso e freqüente quanto possível;
3. a punição tem de ser imediata;
4. a intensidade não pode ser aumentada gradualmente – desde o início,
o estímulo tem de ser tão intenso
quanto possível;
5. se a intensidade for baixa, os períodos de punição devem ser curtos;
116
ABREU-RODRIGUES, RIBEIRO & COLS.
6. a punição não deve ser associada à
apresentação de um estímulo reforçador positivo para não adquirir
propriedades de estímulo discriminativo;
7. a punição deve sinalizar um período de extinção para a resposta;
8. o grau de motivação para a resposta deve ser diminuído;
9. a freqüência de reforço positivo para
a resposta deve ser diminuída;
10. uma resposta alternativa à que é punida deve estar disponível;
11. se não há resposta alternativa na situação, o sujeito deve ser levado
para outra situação com acesso ao
estímulo reforçador;
12. se um estímulo aversivo primário
não pode ser aplicado após a resposta, pode-se usar um estímulo aversivo condicionado;
13. em último caso, a punição pode
ocorrer pela apresentação de timeout ou pelo aumento no custo da
resposta.
Os preconceitos contra a punição geraram comportamentos de esquiva em muitos
pesquisadores da área. Para evitar críticas e
rejeições, por exemplo, procedimentos efetivos foram até mesmo descritos por termos que
não faziam menção à punição, como ocorreu
com o procedimento de esquiva passiva. Considere um rato em uma plataforma acima de
uma grade eletrificada que, ao pisar na grade, recebe um choque e torna-se menos propenso a descer novamente. Pode-se dizer que
a resposta de descer da plataforma é punida,
mas também é possível dizer que o rato está
passivamente se esquivando do choque, evitando descer da plataforma (Catania, 1998/
1999). Dinsmoor (1954) propôs que a ação
supressiva da punição poderia ser atribuída
ao desenvolvimento de reações de esquiva da
emissão do comportamento punido. Ou seja,
engajar-se em qualquer outra atividade alternativa ao comportamento punido e, com isso,
evitar a punição. Azrin e Holz (1966) discordam e sugerem como mais parcimonioso considerar a punição em nível descritivo, sem ape-
lar para mudanças no comportamento que geralmente são inferidas em vez de diretamente medidas. Portanto, descrevem que a punição afeta diretamente a probabilidade da resposta punida, não sendo necessária a ocorrência de respostas de fuga e esquiva para que
o estímulo seja considerado punitivo. Dessa
forma, Dinsmoor (1954; ver também Skinner,
1953/2000) defende que a punição é um processo secundário, pois resultaria da fuga ou
esquiva do estímulo punitivo, enquanto Azrin
e Holz (1966) afirmam que é um processo
primário.
Arbuckle e Lattal (1987) apresentaram
dados favoráveis à concepção da punição
como um efeito secundário do reforçamento
negativo. O objetivo do estudo consistiu em
separar a redução nas taxas de respostas produzida diretamente por um estímulo punitivo daquela produzida pelo reforçamento negativo da omissão da resposta. Pombos foram
expostos a um esquema conjugado no qual
respostas de bicar o disco produziam alimento em um esquema de intervalo variável (VI)
3 min e choques em um esquema VI 30 s (conj
VI 3 min VI 30 s). Em algumas condições, o
choque poderia ser evitado caso não ocorressem respostas durante um período de 5, 10
ou 30 s após o final do intervalo. As taxas de
respostas variaram inversamente com a duração da pausa requerida, mesmo não havendo mudanças na freqüência e na intensidade
do estímulo punitivo. Ou seja, as taxas de respostas foram controladas diretamente pelas
contingências de reforçamento negativo, um
resultado que apóia a posição de Dinsmoor
(1954) e de Skinner (1953/2000) e não a de
Azrin e Holz (1966). Os autores argumentaram que o papel do reforçamento negativo
deve ser reconsiderado em estudos de punição e concluíram que é possível que a redução no responder seja resultado da interação
de contingências de punição e de esquiva. Ao
revisar brevemente essas concepções teóricas
sobre os efeitos supressivos da punição,
Spradlin (2002) concluiu que ambas ajustamse igualmente bem aos dados disponíveis.
A literatura tem identificado algumas variáveis que afetam as propriedades punitivas
de determinados eventos ambientais. Os efei-
ANÁLISE DO COMPORTAMENTO
tos discriminativos dos eventos aversivos, por
exemplo, parecem ser importantes em situações de punição, pois podem sinalizar as ocasiões em que a resposta será também reforçada. Holz e Azrin (1961) relataram um experimento com pombos no qual um choque produzido por uma resposta sinalizava a disponibilidade de comida. Em uma condição, as bicadas do pombo não tinham conseqüências, e,
na outra, cada bicada produzia um choque e
algumas bicadas produziam alimento. Quando as respostas não produziam um choque, a
taxa era baixa porque também não produziam
alimento; mas a taxa aumentou assim que as
respostas começaram a produzir choques, pois
também, ocasionalmente, produziam alimento. Portanto, os estímulos punitivos adquiriram
propriedades discriminativas porque a resposta era reforçada apenas quando também era
punida. Catania (1998/1999) apontou a relevância desse processo para o comportamento
humano, como quando uma criança provoca o
pai a ponto de ser surrada, porque geralmente
a surra é seguida de mais atenção do pai arrependido do que durante as interações menos
traumáticas entre ambos.
Outro aspecto importante é a relação de
contingência entre a resposta e a conseqüência, isto é, quando há uma relação de dependência entre a emissão da resposta e a ocorrência do evento aversivo. Por exemplo, Camp,
Raymond e Church (1967) compararam os
efeitos de choques independentes das respostas e de choques produzidos pelas respostas
de pressões à barra mantidas por reforço alimentar em ratos, em que as taxas de choques
de ambos os grupos foram emparelhadas. Comparados com um grupo controle que não recebeu choque, os resultados mostraram que as
taxas de respostas dos dois grupos expostos ao
choque diminuíram, mas o choque produzido
pela resposta suprimiu mais o responder do
que o choque independente da resposta. Esta
diferença permite afirmar que o choque produzido pela resposta era um estímulo punitivo, e que os eventos afetam mais o comportamento quando o efeito é recíproco, isto é, quando o comportamento também pode afetar esses eventos (Rachlin, 1967).
117
Alguns estudos investigaram as propriedades punitivas do custo da resposta sobre o
comportamento mantido por reforçamento
positivo (p. ex.: Weiner, 1962) e por reforçamento negativo (p. ex.: Weiner, 1963). No estudo de Weiner (1962), a resposta de participantes humanos era mantida, nas condições
sem custo, por pontos adquiridos de acordo
com esquemas VI e de intervalo fixo (FI); nas
condições com custo, essas respostas também
eram punidas por perdas de pontos. Quando
condições com e sem custo foram alternadas,
foi observado que a condição sem custo produziu taxas altas e constantes de respostas em
ambos os esquemas; a condição com custo, por
outro lado, diminuiu as taxas de respostas nos
esquemas VI, sem perturbar a constância do
responder, e gerou um padrão scallop (tipicamente observado com animais) sob os esquemas FI. Quando foram efetuadas manipulações
na seqüência de apresentação dessas condições,
o padrão scallop foi observado também na condição sem custo.
Em um estudo subseqüente, Weiner
(1963) expôs participantes humanos a uma
tarefa de pressionar um botão para manter os
99.999 pontos que tinham disponíveis no início da sessão. Na condição sem custo, foi programado um esquema múltiplo com três componentes de 20 min de duração cada, durante
os quais períodos de perda de pontos (PDP)
foram programadas para ocorrer a cada 10 s.
No componente de esquiva, os participantes
poderiam adiar por 10 s os PDPs; no componente de fuga, não podiam evitá-los, apenas
interrompê-los; e no terceiro componente eram
possíveis tanto a esquiva quanto a fuga. Após
4 h nessas condições sem custo, cada componente foi subdividido em dois, sem e com custo, cada um com 10 min de duração. A condição com custo consistia na perda de um ponto
para cada resposta emitida. Os resultados mostraram que as taxas de respostas de fuga ou
esquiva eram excessivamente altas nas condições sem custo, mas muito baixas nas condições com custo. Os resultados de ambos os estudos (Weiner, 1962, 1963) sugerem que (a) a
perda de pontos funciona como um evento
aversivo com humanos e (b) contingências de
custo exercem efeitos punitivos sobre compor-
118
ABREU-RODRIGUES, RIBEIRO & COLS.
tamentos mantidos por reforçamento tanto positivo como negativo.
Aumentos na intensidade e na freqüência do estímulo punitivo tendem a produzir aumentos correspondentes na supressão da resposta mantida por esquemas de razão fixa (FR)
e de razão variável (VR) e esquemas FI, mas
produz efeitos assistemáticos sobre o responder em esquemas VI. As razões dessa inconsistência foram investigadas por Arbuckle e Lattal
(1992). Pombos foram expostos a um esquema conjugado, no qual respostas de bicar um
disco produziam alimento em um esquema VI
de 180 s, e também choques. No Experimento
1, os choques foram inicialmente apresentados
de acordo com o esquema VI 30 s, que tendia a
punir longos intervalos entre as respostas (IRTs)
e, em seguida, conforme um esquema percentil,
durante o qual eram liberados independentemente da duração do IRT. Ambos os esquemas
reduziram igualmente a freqüência relativa de
IRTs longos. No Experimento 2, os pombos foram expostos à punição diferencial de IRTs longos e curtos ao longo de diferentes condições.
Os resultados mostraram um declínio na freqüência relativa dos IRTs punidos e aumentos
na freqüência dos IRTs opostos aos punidos,
enquanto os efeitos nas taxas de respostas não
foram consistentes. Os autores argumentaram
que os resultados desses experimentos iluminam a importância de se selecionar um nível
apropriado de análise, pois relações ordenadas presentes em um nível (IRTs) podem não
ser reveladas em outro nível (taxa total de respostas) de análise. Eles também apontam que
as relações assistemáticas, comumente descritas em estudos de punição com esquemas VI,
provavelmente resultam do nível de análise
empregado nesses estudos.
Os efeitos da punição sobre a resposta não
punida foram estudados por Crosbie, Williams,
Lattal, Anderson e Brown (1997) com pombos
e com humanos. No Experimento 1, alguns
pombos foram expostos a um esquema mult VI
3 min VI 3 min, no qual os componentes eram
sinalizados por uma luz amarela ou azul (linha de base). Após atingir a estabilidade, cada
resposta durante o componente azul passou a
produzir um choque até que a taxa de respostas nesse componente fosse menor do que 50%
daquela observada na condição anterior sob
as mesmas condições de estímulo. Depois de
restabelecer a linha de base, um esquema mix
VI 3 min VI 3 min entrou em vigor com a luz
amarela do disco em ambos os componentes.
A seguir, foi introduzida a contingência de punição em um dos componentes desse esquema. No Experimento 3, estudantes universitários foram expostos a condições análogas em
que o estímulo punitivo consistia na perda de
pontos. Os resultados de ambos os experimentos mostraram que ocorreu uma supressão da
resposta em todas as condições de punição, independentemente da presença ou da ausência
de sinalização da punição. Com relação à taxa
da resposta não punida, foram observados os
seguintes efeitos:
a) tanto o contraste (aumento na taxa)
quanto a indução (diminuição na
taxa) ocorreram, apesar da manutenção da taxa de reforços ao longo das
condições;
b) a indução foi mais comum do que o
contraste;
c) o contraste ocorreu somente na presença de um estímulo diferente daquele correlacionado com a punição;
d) o contraste diminuiu com a exposição
prolongada à punição.
Os estudos anteriormente resumidos,
embora apontem algumas variáveis relevantes
para a punição, também indicam que sabemos
muito pouco sobre o funcionamento da punição.
Há ainda muitas possibilidades de investigação
dos processos moleculares e molares a ela relacionados, cuja compreensão é fundamental para
orientar a solução de problemas com o uso de
estratégias punitivas. Certamente a punição inclui subprodutos lamentáveis que justificam o
fato de Skinner (1953/2000) ter questionado
sua utilidade prática em um sistema comportamental e, em muitas situações aplicadas, não
deveria ser empregada (Hineline, 1984). A análise de Skinner mostra como seria saudável a
vida sem estimulação aversiva e também esclarece por que a técnica é tão usada: o comportamento de quem aplica a punição é reforçado
pela supressão imediata da resposta punida, ain-
ANÁLISE DO COMPORTAMENTO
da que não funcione a longo prazo (ver também Todorov, 2001). Com freqüência, atacamos
qualquer um que nos ofenda, seja fisicamente
ou com críticas, com desaprovação, com insulto, ou nos ridicularize; mas seus efeitos temporários são acompanhados por uma função de
uma extensa redução da eficiência e da felicidade geral do grupo, pois resultam em sérios
conflitos pessoais entre emitir a resposta que
leva à punição e aquela que a evita (Skinner,
1953/2000). Nesse contexto, a longo prazo, as
pessoas tornam-se revoltadas, ressentidas e
agressivas, e, mesmo a curto prazo, basta infligir
dor ou ameaçar a retirada de recursos para que
estes efeitos sejam observados (Baum, 1994).
Entretanto, mesmo sendo lamentável, a
punição é um fato freqüente nas interações humanas e, em algumas circunstâncias muito especiais julgadas com base em outras alternativas, pode até proporcionar a base mais efetiva
para se alcançar benefícios sociais humanitários (Hineline, 1984). Embora Skinner fosse
contra o uso da punição, posição que resume
afirmando “se eu fiz alguma coisa pela raça
humana, foi achar alternativas para a punição”
(apud em Krasner, 1989, p. 247), ele não era
totalmente contrário a seu uso. Conforme Nye
(2000/2002), no final de sua carreira Skinner
esclareceu sua posição, observando que existem situações excepcionais em que a punição
é justificada. Por exemplo, estímulos aversivos
breves e inofensivos podem ser eficazes no tratamento de crianças autistas que se automutilam. Essas crianças se batem e se mordem,
batem a cabeça contra objetos duros, como
também se machucam de outras maneiras. Punições brandas tendem a remover esse tipo de
auto-abuso, dando espaço à modelagem de
comportamentos apropriados. Mas, mesmo reconhecendo que a punição pode, às vezes, servir a propósitos úteis, Skinner “enfatizou que
seria um verdadeiro erro permanecer satisfeito com a punição sem explorar alternativas que
não a incluam” (Nye, 2000/2002, p. 90).
Sugestões semelhantes foram feitas por
Lerman e Vorndran (2002) após uma revisão
dos estudos sobre punição. Essas autoras relataram que os resultados da pesquisa básica com
choques, com ruídos, com jorros de ar, com
custo da resposta e com timeout confirmaram
119
o rápido declínio na freqüência ou na supressão imediata de respostas punidas em ratos,
em pombos, em macacos e em humanos, e também que o efeito supressivo da punição com
choque ou com perda de pontos ocorre mais
rapidamente do que com o uso de extinção, de
saciação ou de reforço diferencial. Também a
pesquisa aplicada mostrou que o tratamento
clínico com uso de ampla variedade de punidores (reprimenda verbal, restrição física, borrifar com água, suco de limão, choque, retirada de reforços condicionados ou interrupção
de atividades reforçadoras) pode produzir supressão imediata ou substancial de comportamentos problemáticos, mesmo após outras tentativas infrutíferas com procedimentos menos
aversivos. Entretanto, como é ainda relativamente incompleto o conhecimento de muitas
relações complexas importantes, as autoras
defenderam a relevância de pesquisas adicionais na área para desenvolver uma tecnologia
sistemática e efetiva em promover mudanças
no comportamento. As sugestões incluem a
investigação de novas estratégias que melhorem a eficiência de procedimentos menos aversivos, bem como o esvanecimento bem-sucedido do tratamento, isto é, sua interrupção sem
que ocorram reincidências do comportamento
problemático.
Horner (2002) concorda com a análise e
as sugestões de Lerman e Vorndran (2002), considerando a punição como parte natural da vida
e assinalando que a mesma ocorre por meio de
carrancas, reprimendas, multas, notas vermelhas, espancamentos, entre outras inúmeras
possibilidades. Vollmer (2002) também concorda que ignorar a punição como fenômeno natural e suas implicações para uma tecnologia do
comportamento equivale a ignorar a natureza
física do universo. Para ele, uma ciência e uma
tecnologia do comportamento serão incompletas caso não avancem na pesquisa sobre punição (ver também Spradlin, 2002).
Reforço negativo
A contingência de fuga ilustra o processo mais simples de reforço negativo, no qual
uma resposta interrompe um estímulo
120
ABREU-RODRIGUES, RIBEIRO & COLS.
aversivo, enquanto na contingência de esquiva uma resposta evita ou atrasa o estímulo.
Esta terminologia é consistente com o uso
cotidiano: “fugimos de circunstâncias aversivas presentes, mas nos esquivamos de circunstâncias potencialmente aversivas que ainda
não ocorreram” (Catania, 1998/1999, p. 117).
Michael (1975) questionou a utilidade da distinção entre reforço positivo e reforço negativo, em parte porque o uso original de Skinner
(1938) desses conceitos visava, respectivamente, a distinguir entre os efeitos do reforço
e os da punição. Com o tempo, entretanto, a
análise conceitual evoluiu em sintonia com o
objetivo da ciência de descobrir melhores
modos de falar sobre seu objeto de estudo
(Baum, 1994).
A análise funcional estabelece que o termo positivo descreve uma relação de dependência ou contingência entre uma resposta e a
produção de estímulos, e negativo refere-se à
contingência entre uma resposta e a remoção
de estímulos. Por isso, os comportamentos de
fuga e esquiva são processos que pertencem a
um mesmo continuum comportamental: o do
reforço negativo, que varia desde a remoção
ou atenuação de um estímulo presente até o
adiamento ou impedimento de um estímulo
potencial. Como assinalado anteriormente, essa
distinção também se estende à punição, pois
uma resposta pode ser punida por produzir
eventos como o choque (punição positiva) e
por remover ou adiar eventos positivamente
reforçadores (punição negativa).
Fuga
Como vimos antes, as duas formas de coerção – reforçamento negativo e punição – são
estreitamente relacionadas, pois eventos que
são reforçadores negativos em um momento
podem ser punidores em outro, sendo seu papel particular determinado por sua relação com
uma ação (Sidman, 1989/1995). Um exemplo
disso seria alguém continuar fazendo qualquer
coisa que remova a “cara feia” do chefe (fuga),
sendo também provável que pare de fazer qualquer coisa que faça a “cara feia” reaparecer
(punição).
Pesquisas cujo foco principal seja o comportamento de fuga e suas variáveis de controle são raras na literatura. Os trabalhos sobre controle aversivo, que também são escassos, quando comparados com aqueles que envolvem reforçamento positivo, principalmente se forem consideradas as décadas de 1980 e
1990, geralmente têm como prioridade os processos de punição e esquiva. Uma dificuldade
em pesquisar a fuga é que o estímulo aversivo
deve estar presente antes da resposta e, assim,
pode eliciar respostas incompatíveis com a que
foi selecionada para estudo. Nas contingências
de reforço positivo, o reforçador está ausente
quando a resposta reforçada é emitida, de
modo que responder e consumir o reforço são
ações que ocupam tempos diferentes, enquanto nas contingências de fuga pode haver competição entre respostas. Esse aspecto tem sido
apontado por Catania (1998/1999) como o
principal motivo da carência de pesquisas nessa área, cujos desafios são descobrir estímulos
sem efeitos eliciadores concorrentes com a resposta selecionada e encontrar meios de impedir respostas alternativas de fuga. Há casos
análogos na punição, no sentido inverso, se o
estímulo utilizado para eliminar uma resposta
aumenta sua probabilidade, como no caso de
alguém tentar fazer uma criança parar de chorar punindo o choro e ter problemas porque o
estímulo punitivo usado elicia a mesma resposta que ele tenta suprimir.
A despeito dessas dificuldades, os efeitos
de contingências de fuga têm sido demonstrados com ratos e com humanos. No estudo de
Keller (1966), por exemplo, alguns ratos foram treinados a pressionar uma barra para terminar uma luz aversiva por um período de 1
min. Em seguida, os animais foram expostos a
diferentes atrasos (1, 2, 5 e 10 s) não sinalizados entre a emissão da resposta de fuga e o
término da luz. Foi observado que a freqüência relativa de respostas de fuga com latências
longas aumentou com acréscimos no atraso do
reforço. Resultados similares foram obtidos por
Fowler e Trapold (1962), usando uma resposta diferente (correr de um compartimento para
outro da caixa experimental) e um reforço negativo diferente (choque). Esses resultados indicam que respostas mantidas por reforça-
ANÁLISE DO COMPORTAMENTO
mento negativo, da mesma forma que aquelas
mantidas por reforçamento positivo, são sensíveis a manipulações no atraso do reforço.
Em um estudo recente, Cherek, Spiga,
Steinberg e Kelly (1990) estudaram a emissão de respostas agressivas em humanos
mantidas por fuga ou esquiva da perda de
pontos. Os participantes foram instruídos que
cada 100 respostas no botão A (não-agressivas) produziam um ponto e que cada 10 respostas no botão B (agressivas) subtraíam um
ponto de um participante fictício, que também estaria subtraindo pontos deles. As perdas produzidas pelo participante fictício eram
programadas de acordo com um esquema de
tempo randômico (RT). As respostas agressivas também produziam um período livre de
perda de pontos (por meio de fuga ou esquiva), cuja duração foi manipulada sistematicamente. As contingências de esquiva e fuga
programadas foram efetivas na manutenção
do comportamento agressivo. Entretanto, enquanto a contingência de esquiva manteve
taxas altas de respostas agressivas, mesmo
quando as taxas de perda de pontos eram baixas, as contingências de fuga só produziram
taxas altas de respostas agressivas na presença de taxas altas de perda de pontos. Em contraste, quando a perda de pontos não era atribuída ao comportamento de outra pessoa
(mas sim ao computador), não houve manutenção da resposta agressiva. Os autores concluíram que as propriedades funcionais da perda de pontos são afetadas por contingências
sociais.
Esquiva
As controvérsias acerca da efetividade da
punição também existem em relação à esquiva.
Mas, neste caso, as divergências são sobre a
natureza exata do reforço, porque o estímulo
aversivo não está presente nem antes, nem após
a ocorrência da resposta de esquiva. Uma questão em particular, chamada de paradoxo da esquiva, foi debatida pelos primeiros teóricos da
área: “Como pode a não-ocorrência de um evento (choque) servir como um reforço para a resposta de esquiva?” (Cameschi, 1997, p. 144).
121
Bechterev (1913, citado por Herrnstein,
1969), foi o primeiro a investigar esse processo adaptativo, ainda na tradição pavloviana:
um cão era exposto a uma seqüência na qual
um estímulo originalmente neutro precedia um
choque na pata traseira. A resposta reflexa ao
choque era a flexão da pata, e a mudança
adaptativa era a ocorrência da flexão tão logo
o estímulo neutro fosse apresentado, o que terminava o sinal e evitava o choque. As tentativas de descrever a relação sinal-choque como
do tipo CS-US envolviam problemas conceituais, pois o fato de a resposta ser emitida em
vez de eliciada minava a interpretação de que
era exemplo de reflexo condicionado. Tais problemas conduziram a novos estudos experimentais e, conforme Herrnstein, desse esforço
emergiu a primeira teoria bifatorial da esquiva sinalizada, na qual processos respondentes
e operantes foram combinados: a esquiva foi
interpretada como subproduto da fuga (operante) do estímulo aversivo condicionado (CS)
eliciador de “medo” condicionado (respondente). Em resumo, o comportamento de
esquiva não seria um processo comportamental
fundamental, mas derivado de outro mais
básico.
Sidman (1953a) questionou a metodologia tradicional da análise do desempenho em
esquiva com base na diferença entre as médias
de grupos de sujeitos e outras técnicas estatísticas, porque implicavam considerável perda
de dados descritivos e a utilização de inferências para explicar os resultados. Sidman promoveu uma mudança metodológica e teórica
ao elaborar seu procedimento de esquiva de
operante livre: na ausência de respostas, choques curtos e inescapáveis ocorrem regularmente entre períodos fixos de tempo chamados intervalo choque-choque (Intervalo SS).
Uma resposta elimina esse ciclo e inicia um
novo período chamado resposta-choque (Intervalo RS), durante o qual os choques não são
apresentados. Se o intervalo RS transcorre sem
respostas adicionais, então termina com a apresentação de um choque e o retorno ao intervalo SS.
Dessa forma, Sidman (1953a) isolou as
respostas de esquiva das respostas de fuga,
mostrando também que o estímulo aversivo
122
ABREU-RODRIGUES, RIBEIRO & COLS.
condicionado não era necessário. Isso porque
os resultados indicaram que, inicialmente, os
sujeitos emitiam poucas respostas, mas logo
ocorriam aumentos abruptos nas taxas que continuaram altas e constantes, apesar da ausência de estímulos-sinal. Entretanto, sob influência da teoria de competição entre respostas
(Schoenfeld, 1950), Sidman concluiu que a resposta de esquiva emergia por ser a única resposta não punida durante o processo, enquanto todas as outras respostas possíveis na situação eram punidas. Essa é uma das versões da
teoria bifatorial, segundo a qual, exceto a resposta de esquiva, quaisquer respostas serão
seguidas pelo choque e, portanto, elas e os estímulos que produzem adquirem funções eliciadoras condicionadas.
Em um estudo posterior, Sidman (1953b)
manipulou separadamente os intervalos SS e
RS, e suas variações sistemáticas produziram
resultados ordenados em ratos: a taxa da resposta de esquiva diminuiu à medida que aumentou a duração do intervalo RS. Resultados
similares foram obtidos com humanos (Ader e
Tatum, 1961). Sidman (1962a) ficou cético
com respeito à teoria de competição entre respostas. A rapidez com que muitos sujeitos
aprendem a resposta de esquiva descarta a
possibilidade de que alguns poucos choques
possam suprimir todos os outros comportamentos para que essa resposta torne-se preponderante. Nesse estudo, alguns ratos foram inicialmente expostos a um esquema concorrente de
esquiva-esquiva com intervalos SS e RS iguais
(20 s), em ambas as alternativas de escolha.
Os resultados obtidos indicaram que quanto
menor o intervalo SS mais rápida a aquisição
da resposta e menor a tendência em responder apenas em uma das alternativas. Manipulações posteriores dos intervalos SS e RS mostraram um aumento na ocorrência de respostas de esquiva na alternativa que continha o
menor intervalo RS. Ao observar que os animais escolhiam responder na alternativa em
que os choques eram mais prováveis, Sidman
explicou a escolha com base apenas nas conseqüências das respostas, isto é, na redução na
freqüência ou na densidade de grande parte
dos choques programados. Por isso, Sidman
passou a descrever a esquiva como um proces-
so comportamental básico, em vez de derivado de outro mais fundamental, conforme defendido por interpretações bifatoriais.
Para testar a sugestão anterior, Herrnstein
e Hineline (1966) elaboraram um procedimento no qual a resposta de esquiva mudava uma
programação de alta probabilidade de choque
para uma de baixa probabilidade. Assim, nem
sempre ocorria adiamento imediato de um choque programado, mas a resposta mudava a situação de alta para baixa aversividade. A sensibilidade do comportamento a essa contingência sutil corroborou a explicação proposta por
Sidman. Em conseqüência, Herrnstein (1969,
p. 59) sustentou a lei do efeito em si como
modelo suficiente para explicar a esquiva: “uma
resposta, ao produzir um estado de coisas, aumenta em freqüência, sendo o estado de coisas aqui a redução na taxa de choque”. Segundo esse autor, qualquer versão teórica bifatorial
seria antieconômica por apelar a estados internos inferidos – medo, ansiedade, etc. – como
substitutos do estímulo condicionado.
Para Herrnstein (1969), a teoria bifatorial, elaborada para explicar como o CS adquire o controle do comportamento, além de desnecessária e pouco parcimoniosa, apenas exagerou a importância do reforço negativo secundário. Conforme Skinner (1966), o reforço
operante não somente fortalece certa classe de
respostas, como também a deixa sob o controle de outros estímulos. A análise operante mostra mais parcimônia por considerar os “estímulos-sinal” não como provedores de suportes pavlovianos para transpor lacunas no tempo, mas como correlacionados com diversas
variáveis que contribuam para a manutenção
do comportamento (Hineline, 1981, 1984).
Certamente, os estímulos-sinal podem ter funções eliciadoras, mas podem também ser descritos como sinais de mudanças na densidade
de choques e, portanto, seus efeitos nas situações de esquiva envolvem, principalmente,
funções discriminativas que aceleram a aquisição da resposta (Herrnstein, 1969; Hineline,
1981). Além disso, por suas relações com o
choque, tais sinais podem ser descritos como
operações estabelecedoras condicionadas reflexivas (Michael, 1993), porque adquirem a função de evocar a resposta de esquiva e, talvez,
ANÁLISE DO COMPORTAMENTO
essa seja a razão de se confundir a esquiva com
o processo de eliciação (ver Capítulo 2 para
informações detalhadas sobre operações
estabelecedoras).
Hineline (1970) demonstrou que atrasos
imediatos do choque, sem redução na densidade programada, são conseqüências reforçadoras suficientes para modelar e para manter
a resposta de esquiva. Foram programados ciclos de 20 s, nos quais um choque ocorria aos
8 s, a barra era removida aos 10 s e retornava
aos 20 s para reiniciar um novo ciclo. Caso uma
resposta ocorresse antes de 8 s, o choque era
liberado aos 18 s, mantendo o resto inalterado.
Os resultados mostraram a aquisição e a manutenção da resposta, cuja probabilidade aumentou e atingiu o máximo em torno do sexto
segundo do ciclo. No Experimento 2, tudo
permaneceu igual, exceto que a resposta adiava o choque por 8 s e, 2 s após o choque, a
barra retornava, iniciando um novo ciclo. Os
sujeitos que participaram do Experimento 1
logo deixaram de responder, e os sujeitos ingênuos não responderam. Nesse caso, a resposta
atrasava o choque, mas reduzia a duração do
ciclo temporal em que os mesmos eram programados, aumentando, assim, sua densidade,
de modo que os sujeitos deixaram de responder em função dessa contingência punitiva. Portanto, a redução na densidade de eventos
aversivos sem atrasos imediatos (processos
molares) é condição suficiente para o reforço
negativo, embora não necessária, assim como
atrasos imediatos (processos moleculares) são
igualmente suficientes, mas não necessários.
Ou seja, uma ou outra condição pode ser suficiente para modelar e para manter a resposta
de esquiva, ambas ocorrendo no procedimento de Sidman (1953a, b, 1962a).
Embora considerem plausível a argumentação contra uma separação arbitrária entre as
fases de aquisição e de manutenção no condicionamento de esquiva, Todorov, Carvalho e
Menandro (1977) sugeriram que no procedimento de Sidman (1953a) a separação parece
razoável em função dos seguintes aspectos:
a) Uma vez que a estabilidade tenha sido
atingida, as variáveis importantes para
determinar a velocidade da aquisição
123
da resposta de esquiva podem ter pouco ou nenhum efeito sobre as taxas de
respostas e de choques recebidos (p.
ex.: duração do intervalo SS e de intensidade de choque).
b) O procedimento de Sidman combina
três fatores, redução na freqüência de
choque, período livre de choque e nenhum choque logo após a resposta, e
cada qual sozinho poderia ser responsável pela aquisição da resposta de esquiva. Depois de se atingir a estabilidade na resposta, somente mudanças
nas relações temporais entre respostas e choques afetam claramente a
taxa de respostas.
c) Como confunde a influência desses
três fatores, o procedimento torna-se
inadequado para a análise da aquisição do comportamento de esquiva.
Entretanto as relações temporais entre
respostas e choques que ele permite tornam
seu uso uma ferramenta conveniente para o
estudo do tempo como estímulo discriminativo
no controle do comportamento quando este
atinge o estado estável.
O controle de estímulos em esquiva de
operante livre foi investigado por de Souza,
de Morais e Todorov (1992). Nesse estudo, o
intervalo entre a resposta e o choque (R-S2)
era de 25 s, entre a resposta e o estímulo préchoque (R-S1) era de 15 s, e entre o estímulo
pré-choque e o choque (S1-S2) era de 10 s. Na
ausência de resposta, o intervalo choque-choque (S2-S2) era de 25 s. Para um grupo de ratos, foram usados estímulos discriminativos
visuais (luz-escuro) e, para outro grupo, auditivos (som-silêncio). O controle de estímulos
foi avaliado por meio da inclusão de períodos
de sondagem durante a sessão, durante os quais
o intervalo R-S1 foi manipulado. Se a esquiva
estivesse sob controle do estímulo pré-choque,
então a taxa de respostas não deveria ser afetada pelas manipulações no intervalo R-S1;
caso a esquiva estivesse sob controle temporal, então uma relação direta entre a taxa de
respostas e a duração desse intervalo deveria
ser observada. Os resultados indicaram que o
controle exercido pelo estímulo pré-choque de-
124
ABREU-RODRIGUES, RIBEIRO & COLS.
pendia da modalidade desse estímulo. O controle exercido pelo estímulo auditivo foi melhor do que o do estímulo visual e não dependeu de qualquer processo de controle temporal subjacente, o qual teve um papel mais importante no desempenho do grupo exposto ao
estímulo visual.
As relações entre intensidade do choque
e taxas de respostas em estado estável foram
investigadas por de Souza, de Moraes e Todorov
(1984), que submeteram alguns ratos a uma
contingência de esquiva sinalizada de operante
livre. Ao longo do experimento, a intensidade
do choque variou de 0,1 a 8,0 mA, mas sua
duração foi mantida constante (200 ms). Os
resultados indicaram um efeito tudo-ou-nada
da intensidade do choque sobre as taxas de
respostas e de choques, a porcentagem de choques evitados e a freqüência da resposta durante o estímulo pré-choque. Nenhum efeito sistemático da intensidade de choque sobre o controle de estímulos foi observado, seja medido
pela porcentagem de apresentações de estímulos seguidas por respostas ou pela porcentagem de respostas que ocorreram durante os
estímulos pré-choque. Portanto, segundo os
autores, para cada sujeito há uma intensidade
de choque mínima necessária para estabelecer
e manter a resposta de esquiva, de modo que o
aumento na intensidade acima deste valor mínimo tem pouco ou nenhum efeito sobre a taxa
de respostas, exceto o efeito prejudicial geral
do comportamento sob intensidade de choque
muito além desse limite. Esses resultados confirmam o primeiro aspecto apontado por
Todorov e colaboradores (1977), anteriormente descrito, e divergem das suposições presentes na literatura sobre esquiva, na qual geralmente a taxa de respostas é descrita como uma
função monotônica direta e negativamente
acelerada da intensidade de choque (de Souza
et al., 1984).
Embora as análises conceituais e empíricas antes resumidas sustentem a esquiva como
processo básico, a compreensão da natureza
do seu reforço ainda não está livre de controvérsias. Por exemplo, Dinsmoor (1977, 2001)
reinterpreta os resultados experimentais disponíveis com base em sua versão invertida da
teoria bifatorial clássica e no conceito de sinal
de segurança. Para ele, produzir esse sinal é o
reforço crucial do comportamento de esquiva
e, quando há estímulo precedendo o choque,
como ocorre na esquiva sinalizada, remover
o sinal de aviso equivale a produzir o sinal de
segurança. Se não há nenhum sinal programado, Dinsmoor postula que a própria resposta de esquiva induz efeitos fisiológicos que
atuam na função de sinal de segurança, que
tais efeitos se dissipam ao longo do tempo
desde a resposta e que uma nova resposta os
restabelecem em seu valor integral. Para ele,
a explicação baseada na redução na densidade de choques incorre em dificuldade lógica
fatal porque a relação resposta-reforço não
tem localização específica no tempo e, “portanto, [o reforço] não pode ocorrer de modo
contíguo e, assim, selecionar as instâncias individuais da classe de comportamento escolhida como resposta de esquiva” (Dinsmoor,
2001, p. 318).
Com a teoria do sinal de segurança,
Dinsmoor (1977) desarticula a distinção entre
reforço positivo e reforço negativo ao sustentar a produção de estímulos como reforço para
a esquiva, conforme a análise de Cameschi
(1997). Com a ênfase na contigüidade resposta-reforço, Dinsmoor (2001) parece também
desconsiderar a distinção entre instância e probabilidade da resposta embutida no conceito
de classe de respostas. Ao discutir esse conceito, Skinner (1989, p. 36) afirma que:
Reforçamos uma resposta quando tornamos um
reforçador contingente a ela, mas não a alteramos em particular. O que reforçamos, no sentido de fortalecer, é o operante, a probabilidade
de que respostas similares ocorram no futuro.
Isso é mais do que uma distinção entre classes
e membros de uma classe. As respostas nunca
são exatamente iguais, mas surgem mudanças
ordenadas se só contamos as instâncias que têm
uma propriedade definidora. Um operante é
uma classe de respostas e também uma probabilidade, não uma instância.
Como antes descrito, a redução imediata
ou a longo prazo na densidade dos eventos
aversivos podem modelar e manter o desempenho de esquiva (Herrnstein e Hineline, 1966;
Hineline, 1970). Assim, relacionar diretamen-
ANÁLISE DO COMPORTAMENTO
te o desempenho a esses efeitos parece mais
parcimonioso e suficiente para explicar a esquiva, sem necessidade de inferências sobre
estados internos emocionais e/ou fisiológicos
para transpor as lacunas espaciais e temporais.
Sidman (2001, p. 337) aceita com elegância a sugestão de Dinsmoor do sinal de segurança como reforço para o comportamento de
esquiva, mas aponta que “a despeito da demonstração de que o período seguro pode funcionar como um reforço condicionado, sem
qualquer término concomitante de um sinal de
perigo, o reforço negativo ainda é a base para
a criação original do período seguro”. De modo
similar, Galizio e Liborio (1995) descrevem que,
nos estudos sobre os efeitos da remoção da contingência de esquiva contingente a uma resposta alternativa (timeout da esquiva), duas
contingências de reforço negativo são comparadas: esquiva e fuga da esquiva. Esses autores
comentam que o timeout já foi descrito como
caso de reforço positivo por Sidman (1962b) e
por Verhave (1962), mas como deriva suas propriedades da remoção da contingência de esquiva, parece mais apropriado identificá-lo com
reforçamento negativo. Courtney e Perone
(1992) descreveram que uma instância de
timeout da esquiva envolve pelo menos três
mudanças na situação experimental: remoção
de estímulos associados com a contingência de
esquiva, redução na taxa de choques liberados
e a suspensão da necessidade de responder associada à contingência de esquiva. Sidman
(2001, p. 338) completa sua análise, assumindo que o comportamento de esquiva pode ser
reforçado pelo término de estímulos que tenham sido emparelhados com um choque, sejam eles externos, internos ou produzidos pela
resposta; pela fuga do comportamento que foi
correlacionado com o choque; pela redução na
densidade do choque; “e agora, pela produção
de um período seguro”.
Baum (2001), menos condescendente,
acusa Dinsmoor de apoiar sua teoria em experimentos conceitualmente falhos e de omitir a
descrição completa de alguns estudos. Segundo Baum, ao rever o estudo de Weisman e
Litner (1969), por exemplo, Dinsmoor não
mencionou que houve um pré-treino da resposta de esquiva do choque, descrevendo ape-
125
nas que Weisman e Litner descobriram que um
som inversamente correlacionado com a liberação de choques durante o condicionamento
poderia ser usado como reforço para aumentar ou diminuir as taxas de respostas mantidas
sob reforço diferencial de taxas altas (DRH)
ou reforço diferencial de taxas baixas (DRL),
respectivamente. Para Dinsmoor (2001, p.
315), a limitação lógica desse procedimento é
não se poder diferenciar entre a produção de
um sinal de segurança e a remoção de um sinal de aviso, concluindo que “é difícil dizer qual
relação entre o estímulo e o choque seria responsável pelos efeitos sobre o comportamento”. A crítica de Baum é semelhante à de
Sidman, anteriormente mencionada, e pode ser
resumida na seguinte pergunta: “O que torna
o som um reforço condicionado?”. Em conseqüência, Baum analisa o conflito como choque
entre paradigmas e acusa Dinsmoor de defender uma visão molecular do comportamento,
comprometida com o princípio de associação
por contigüidade do atomismo do século XIX,
já superada pela visão molar das contingências entre respostas e conseqüências, que aceita e incorpora lacunas temporais entre elas.
Hineline (2001), assim como Azrin e Holz
(1966), questiona Dinsmoor por avançar além
do nível descritivo e sustenta que todas as explicações são descrições, embora nem todas as
descrições sejam aceitáveis como explicação.
Hineline descarta a dificuldade lógica da hipótese de redução na densidade de choques, afirmando que Dinsmoor reinterpretou os resultados de Herrnstein e Hineline (1966) com base
em atrasos médios do choque; logo também
combinou eventos temporalmente separados e
irregularmente dispersos. Ou seja, os atrasos
médios não são mais localizados temporalmente do que um decréscimo na freqüência de choques. Finalmente, Hineline discorda de que as
concepções molecular e molar sejam mutuamente exclusivas, considerando que sua trajetória científica começou com a exploração de
possíveis aspectos complementares das relações
entre processos comportamentais a curto e longo prazo (cf. Herrnstein e Hineline, 1966;
Hineline, 1970), e sugeriu que devemos avançar mais além da distinção molar-molecular e
126
ABREU-RODRIGUES, RIBEIRO & COLS.
adotar níveis de análise que envolvam múltiplas escalas temporais e suas interações.
Por outro lado, Baron e Perone (2001)
julgam a teoria de Dinsmoor (2001) mais eficaz para explicar o comportamento de esquiva
em função de sua ênfase no intercâmbio entre
contingências respondentes e operantes, encorajando a análise dos estímulos mediadores das
conseqüências molares e, assim, incorporando
o controle tanto dos eventos locais como dos
eventos temporalmente mais remotos, improváveis ou cumulativos. Entretanto eles criticam
o valor heurístico das teorias em confronto, pois
muito pouca pesquisa sobre esquiva foi realizada desde os anos 1970, de modo que “se um
critério para julgar uma boa teoria é sua ‘fertilidade’, nenhuma dessas visões da esquiva parece ajustar-se a ele muito bem” (Baron e
Perone, 2001, p. 360).
Estudos recentes têm investigado contingências de esquiva por meio do procedimento
anteriormente identificado como timeout da
esquiva. Courtney e Perone (1992) expuseram
alguns ratos a um esquema múltiplo com dois
componentes. Em cada componente, vigorava
um esquema concorrente no qual respostas de
pressionar uma barra cancelavam o choque, e
respostas em outra barra suspendiam a contingência de esquiva por 2 min (timeout). Os componentes diferenciavam-se, intra e intercondições, em termos da taxa de choques programada. Após cada condição, foi implementado
um período de extinção durante o qual respostas na barra correlacionada com o timeout não
suspendiam a contingência de esquiva. Foi verificado que a resposta na barra do timeout foi
relativamente insensível à redução na taxa de
choques, e que uma fonte de controle mais potente foi a redução temporária na resposta na
barra de esquiva (ao produzir o timeout, os ratos escapavam da contingência que exigia uma
resposta contínua e iniciavam um período sem
requerimento de resposta). A resistência à
extinção das respostas na barra do timeout aumentou com os acréscimos na redução da freqüência de choques e da exigência de resposta
durante o treino. Os autores concluíram que seus
resultados apóiam a sugestão de Hineline
(1984) de que a aversividade de uma situação
comportamental pode depender de uma série
de eventos ou relações entre eventos (no caso,
a redução no custo da resposta), além do próprio estímulo primário (p. ex.: choque).
A resistência à extinção da resposta mantida por timeout da esquiva foi também examinada por Galizio (1999). No Experimento 1,
alguns ratos foram treinados em um esquema
concorrente no qual as respostas em uma das
barras adiavam o choque de acordo com um
esquema de esquiva de operante livre, e as respostas em outra barra produziam um timeout
sinalizado da contingência de esquiva. Dois tipos de extinção foram estudados. No primeiro
caso, as respostas na barra do timeout não mais
suspendiam a contingência de esquiva e, no
segundo, o procedimento de esquiva foi cancelado uma vez que não havia a liberação de
choques. Os resultados indicaram que taxas de
respostas estáveis foram mantidas em ambas
as barras, sendo que as taxas médias de respostas na barra do timeout foram sempre maiores do que as taxas na barra da esquiva. A suspensão do reforço na barra do timeout produziu uma rápida extinção das respostas nessa
barra. Em contraste, a suspensão do choque
teve pouco efeito na taxas de respostas na barra do timeout, enquanto as taxas de respostas
de esquiva diminuíram ao longo das sessões.
No Experimento 2, durante o qual a suspensão dos choques foi mantida por um longo período, embora tenham sido observados decréscimos em ambas as respostas, as respostas na
barra do timeout foram mais resistentes à extinção do que as respostas de esquiva. Conforme Galizio, a persistência da resposta na barra
do timeout não apóia a suposição de Courtney
e Perone (1992) de que reduções locais na freqüência de respostas são a base das propriedades reforçadoras do timeout e sugere outros
determinantes além da redução do esforço em
responder; a ênfase na redução na densidade
de choques defendida por Herrnstein e Hineline
(1966); as teorias cognitivas que enfatizam a
expectativa do choque como subjacente à esquiva, conforme proposto por Seligman e
Johnston (1973); as predições das teorias
bifatorias tradicionais de que as respostas de
esquiva e de timeout são mantidas pelo térmi-
ANÁLISE DO COMPORTAMENTO
no de estímulos emparelhados com choques e
que as durações da extinção dessas respostas
seriam proximamente relacionadas.
Em função disso, Galizio (1999, p. 10)
concluiu perguntando: “Por que o estímulo
timeout retém suas propriedades reforçadoras
quando a densidade de choque é zero e quando não há base suficiente para supor que o
‘medo’ ou a ‘expectativa’ do choque possam motivar a esquiva?”.
Tendo em vista essa e outras questões anteriormente consideradas, é viável afirmar que
o estudo do controle aversivo do comportamento tem ainda muito a avançar na compreensão
dos processos básicos subjacentes. Entretanto
o conjunto dos experimentos aqui resumidos
atesta a validade do conceito de reforço negativo na descrição das relações entre respostas
e suas conseqüências imediatas e/ou remotas.
Outros estudos experimentais revelam que os
efeitos do reforço negativo também se ajustam
à lei da igualação ou lei do efeito quantitativa.
Ou seja, estudos com esquemas múltiplos (de
Villiers, 1974) e com esquemas concorrentes
(Logue e de Villiers, 1978), em que ajustes
durante o treino preliminar garantiram a distribuição das respostas entre as alternativas,
demonstraram a igualação entre taxas de respostas e redução na freqüência de choques.
Esses resultados são comparáveis à igualação
observada entre taxa de respostas e taxas de
reforços positivos e ajustam-se, portanto, às
equações de Herrnstein (1970) e de Baum
(1973) que resumem matematicamente essas
relações (ver Capítulo 9 para informações mais
detalhadas sobre escolha e preferência).
Higgins e Morris (1984) revisaram a literatura disponível para avaliar a generalidade
do condicionamento de esquiva entre humanos e não-humanos. De acordo com eles, a generalidade foi observada em muitas das áreas
discutidas:
a) aquisição da resposta;
b) manutenção da resposta ao longo de
vários intervalos S-S e R-S e outros esquemas experimentais;
c) programação de estímulos externos;
127
d) administração de agentes farmacológicos.
Algumas diferenças recorrentes, entretanto, também foram observadas e são similares àquelas que também surgem sob contingências de reforço positivo. Entre elas, os autores apontam:
• Os humanos emitem altas taxas de respostas em padrões regulares que produzem mínimo contato com os eventos aversivos, enquanto os animais respondem em taxas mais baixas.
• A menor susceptibilidade a mudanças
nas contingências é devido às diferenças nas taxas, pois o padrão de desempenho em humanos muda somente
quando essas mudanças são sinalizadas por estímulos discriminativos ou
quando são superpostas contingências
de punição.
• O padrão de taxas altas em humanos
mostra-se insensível a mudanças nos
parâmetros dos esquemas de reforço.
Para os autores, essas diferenças podem
ser explicadas com base em outros princípios
estabelecidos sobre as relações entre comportamento e ambiente, e pesquisas adicionais permitiriam o desenvolvimento de procedimentos experimentais para minimizá-las e para
identificar histórias pessoais de reforço extralaboratório e repertórios de comportamentos
verbais como as possíveis fontes dessas diferenças.
Interação operante-respondente:
efeitos emocionais
As contingências de reforço e punição desenvolvem e mantêm o repertório operante,
mas os estímulos envolvidos também exercem
funções antecedentes que afetam o comportamento por meio dos processos de eliciação,
indução e modulação (Hineline, 1984). Esses
processos incluem efeitos emocionais que,
quando resultam do controle aversivo, têm im-
128
ABREU-RODRIGUES, RIBEIRO & COLS.
plicações clínicas extensas, pois são os motivos centrais das queixas das pessoas em situações terapêuticas.
Os estímulos que sinalizam a apresentação de outros estímulos podem ser superpostos sobre linhas de base do comportamento operante. O procedimento de supressão
condicionada, elaborado por Estes e Skinner
(1941), foi apresentado como uma técnica
de estudo da emoção e como uma medida
da “ansiedade condicionada” – comportamento emocional a ser identificado e medido por meio da supressão do comportamento operante. A linha de base era a taxa de
pressão à barra de ratos reforçada com alimento em um esquema VI 2 min, sobre a qual
superposições de um tom de 3 min de duração precediam apresentações de um breve
choque. O tom passou a suprimir as pressões
à barra que, após o choque, retornavam;
quando o choque foi eliminado, as pressões
durante o tom voltaram a ser emitidas em
taxas similares às anteriores. O processo ilustra o condicionamento respondente: um estímulo, o tom, sinaliza um outro estímulo, o
choque; como o choque é um estímulo
aversivo incondicionado (US aversivo), transforma o tom com ele emparelhado em estímulo pré-aversivo condicionado (CS préaversivo). Neste caso, o efeito produzido pelo
CS – supressão do operante – difere do produzido pelo US – voltar a pressionar (Catania,
1998/1999).
Como o CS pré-aversivo não afeta somente a pressão à barra, mas também a taxa cardíaca, a respiração e outros processos fisiológicos, a tendência é invocar a linguagem da
emoção. Essa tendência parece resultar dos esquemas conceituais pré-científicos da linguagem comum que afetam nosso modo de falar
sobre o comportamento (Chiesa, 1994). Quando um evento com propriedades aversivas suprime uma faixa ampla de classes de respostas
diferentes, falamos de medo ou de ansiedade,
assim como falaríamos de raiva se observássemos um comportamento agressivo (Catania,
1998/1999). Não se deve avançar e apontar,
portanto, o medo ou a ansiedade como a cau-
sa da supressão ou a raiva como a causa da
agressão, pois são nomes ou rótulos, e não explicações, dos efeitos comportamentais.
Os efeitos de estímulos pré-aversivos dependem da linha de base sobre a qual são
superpostos. Pode ocorrer maior ou menor supressão, dependendo de variáveis tais como duração e freqüência de apresentação do CS, taxa
de redução dos reforçadores e níveis de privação (Catania, 1998/1999). Se a linha de base
for esquiva de choques, o efeito observado é o
aumento na taxa de respostas (Sidman,
Herrnstein e Conrad, 1957). Esse efeito é comparável ao de estímulos pré-apetitivos, isto é,
estímulos que antecedem apresentações nãocontingentes de reforço positivo, uma operação
que produz, por exemplo, a automodelagem2
ou um aumento na taxa de bicadas no disco
mantida por esquemas DRL (Herrnstein e
Morse, 1957). Nesses casos, por analogia às
referências ao medo ou à ansiedade nos casos
de supressão durante estímulos pré-aversivos,
a tentação tradicional seria mencionar a alegria como a emoção envolvida e responsável
pelos efeitos fortalecedores dos estímulos préapetitivos (Catania, 1998/1999; Rachlin,
1967).
O procedimento de Estes e Skinner (1941)
foi bastante utilizado como estratégia de pesquisa para validar teorias mediacionais que
apelam a estados emocionais e/ou processos
2Brown
e Jenkins (1968) descreveram um procedimento com um pombo já treinado a comer no
alimentador, mas que ainda não bicava o disco. De
tempos em tempos, o disco era iluminado e, alguns
segundos depois, o alimentador era operado de
modo independente do comportamento do pombo.
Com isso, o disco iluminado tornava-se um estímulo que sinalizava alimento e este induzia o comer
que, no caso do pombo, incluía o bicar. As relações
entre o disco iluminado e a apresentação de alimento
induziam o pombo a se orientar em direção ao disco, a se mover em sua direção e a passar a bicar o
disco quando estivesse iluminado. Considerou-se
que a indução do bicar o disco foi gerada por
automodelagem, e a continuação do procedimento
é denominada automanutenção (Williams e
Williams, 1969).
ANÁLISE DO COMPORTAMENTO
cognitivos inferidos para explicar os efeitos
comportamentais. Alguns exemplos seriam as
teorias que descrevem a emoção com base em
associações entre estímulos e as teorias sobre
processamento de informações, respectivamente (Hineline, 1984). Embora o procedimento
seja especialmente útil para detectar efeitos
respondentes inibitórios e excitatórios, os teóricos mediacionais empregaram-no para definir operacionalmente constructos teóricos hipotéticos, tais como “medo condicionado”, que
são, então, oferecidos para explicar o comportamento (Hineline, 1984).
Na visão de Skinner, o comportamento
verbal em geral e nossos relatos introspectivos
evoluíram em função de práticas sociais e culturais, de acordo com critérios vagos de definição que a análise científica corrige e refina
com suas descrições. Conforme resume Skinner
(1974), os estímulos aversivos primários ou
condicionados suscitam reações, principalmente no sistema nervoso autônomo, que são descritas em nível humano como medo e ansiedade. Esses estímulos alteram a probabilidade de
qualquer comportamento positivamente reforçado em andamento e são ocasiões em que o
comportamento negativamente reforçado pode
ser fortalecido. Porém as condições corporais
sentidas, as observações introspectivas e o comportamento alteram-se devido não aos sentimentos, mas às contingências aversivas que são
causas comuns da condição sentida, das mudanças nos sentimentos e no comportamento.
Schoenfeld (1969, p. 669) questionou o
uso de termos do vernáculo comum como sendo apropriados para categorizar os processos
psicológicos, argumentando, com eloqüência,
que “as palavras do vocabulário leigo refletem
atitudes e crenças sociais sobre o comportamento, são definidas por critérios sociais que
agrupam atos por suas conseqüências sociais e
estão quase sempre erradas no que aceitam
como seus referentes comportamentais”. A
ênfase é que os conceitos da análise comportamental devem ser derivados de operações experimentais e não de conversações (Hineline,
1984; Sidman, 1989/1995). Sobre essa questão, Herrnstein (1969) admitiu que, em alguns
129
casos, parece razoável supor que o rato está
como medo do CS, mas somente assumindo
semelhanças entre sua vida subjetiva e a humana, de modo a permitir o vocabulário comum e, com o mesmo critério, reconhecer que
não há medo em outros casos, como na versão
sinalizada do procedimento de Sidman.
A análise comportamental observa que as
semelhanças, de fato, encontram-se nos princípios do comportamento, cujas interações tornaram-se mais e mais complexas ao longo da
evolução das espécies (Skinner, 1966, 1984).
Para Skinner, o comportamento humano é descrito e explicado pela combinação integrada
de três níveis complexos de determinação
(filogenético, ontogenético e cultural), resumidos nos conceitos de seleção de variações
ou seleção por conseqüências (Skinner, 1981,
1990). Desse modo, o behaviorismo radical promove uma visão moderna de ciência molar e
sistêmica, ao contrário das críticas que o descrevem como reducionista e mecanicista. Essas críticas, de fato, atingem tanto os behaviorismos de Pavlov, de Watson, de Tolman e de
Hull quanto, ironicamente, todas as atuais versões de psicologia estímulo-organismo-resposta
(S-O-R) dos modelos teóricos psicodinâmicos,
fisiológicos, cognitivos e motivacionais (Chiesa,
1994).
Portanto, é à luz dessa integração conceitual que são rejeitados os apelos reducionistas
ao cérebro para justificar as teorias mentalistas
e suas concepções de causas internas que, por
sua vez, sustentam a noção de liberdade de
escolha e autodeterminação. Skinner (1990,
p. 1208) questiona o fato de que:
Quanto mais sabemos sobre a relação corpocérebro como uma máquina bioquímica, menos interessante ela se torna como base para
o comportamento. Se há liberdade, ela somente pode ser descoberta no acaso das variações.
Se novas formas de comportamento são criadas, elas são criadas pela seleção. As falhas
na variação e na seleção são fontes de problemas fascinantes. Nós devemos nos adaptar a
novas situações, resolver conflitos e achar soluções rápidas. Uma estrutura bioquímica não
faz nada desse tipo.
130
ABREU-RODRIGUES, RIBEIRO & COLS.
CONTINGÊNCIAS AVERSIVAS
NO PROCESSO TERAPÊUTICO
Apesar das controvérsias sobre a efetividade do controle aversivo, ele vem sendo amplamente empregado nas relações interpessoais ao longo da história da humanidade. Dessa forma, qualquer análise funcional
de relações comportamento-ambiente, para
ser completa, e qualquer estratégia de intervenção, para ser eficiente, devem considerar
não somente contingências de reforçamento
positivo, mas também aquelas que envolvem
reforçamento negativo e punição (Crosbie,
1998). No contexto clínico, o controle
aversivo torna-se particularmente importante
uma vez que as queixas trazidas pelo cliente
são resultantes de contingências históricas e
atuais, de punição e esquiva/fuga. Inegavelmente, os terapeutas têm incluído as contingências aversivas em suas análises funcionais
do repertório comportamental de seus clientes, porém é comum negligenciarem o papel
de tais contingências em suas intervenções
clínicas. Ou seja, a relação terapeuta-cliente, como qualquer outra relação interpessoal,
é suscetível ao controle aversivo, mas pouco
se tem refletido sobre a extensão desse controle no setting terapêutico, como também
pouco se sabe sobre sua contribuição para o
sucesso (ou insucesso) da terapia. A seguir,
será apontada a presença de estratégias
aversivas em algumas práticas clínicas amplamente utilizadas nos dias atuais. O objetivo dessa “denúncia” seria incentivar os
terapeutas comportamentais a promoverem
investigações sistemáticas sobre o papel de
contingências aversivas na relação terapeutacliente.
Nas décadas de 1960 e 1970, as técnicas
comportamentais eram consideradas como o
principal mecanismo de mudança terapêutica
(Follette, Naugle e Callaghan,1996). Nessa época, técnicas aversivas, tais como a inundação,
a implosão, a sensitização encoberta e a punição contingente, fortemente baseadas nos
achados das pesquisas de laboratório, foram
bastante usadas por terapeutas comportamentais (para uma revisão, ver Carrasco, 1996;
Masters, Burish, Hollon e Rimm, 1987). Ape-
sar de a literatura oferecer evidências da eficácia terapêutica dessas técnicas (p. ex.:
Kazdin, 1972; Shipley e Boudewyns, 1980) e
de diversos setores sociais (p. ex.: família, escola, trabalho) adotarem largamente estratégias aversivas, a popularidade das mesmas entre os terapeutas comportamentais declinou
nos últimos 30 anos, em decorrência de diversos aspectos, alguns dos quais apresentados a
seguir.
Primeiro, a terapia comportamental recebeu inúmeras críticas por sua ênfase no uso
de técnicas específicas para modificar determinados comportamentos contraprodutivos,
sendo identificada como uma terapia focal e
tecnicista. De acordo com os críticos, uma terapia focal, isto é, restrita ao comportamentoalvo e suas variáveis controladoras imediatas,
negligencia o quadro complexo de inter-relações que são estabelecidas no repertório comportamental do cliente. Além disso, o uso de
técnicas padronizadas não considera que a relação indivíduo-ambiente seja única e que, assim sendo, as intervenções terapêuticas devem
ser individualizadas. Um segundo aspecto refere-se aos achados da pesquisa básica, os quais
revelaram muitos aspectos indesejáveis da punição, tais como: a recuperação da resposta
após a retirada do agente punitivo; a ocorrência de efeitos emocionais aversivos, que, por
sua vez, geram respostas de fuga e esquiva; o
aumento na probabilidade de comportamentos agressivos e a ausência de aprendizagem
de comportamentos mais apropriados (Sidman,
1989/1995; Skinner, 1953/2000).
O terceiro aspecto está relacionado a
questões éticas. Uma vez que os resultados
da pesquisa básica sugeriam que os procedimentos aversivos não eram justificáveis, houve uma redução drástica nas investigações
sobre o tema. Essa redução ecoou no contexto clínico de tal forma que o uso de técnicas aversivas ficou restrito àquelas situações
em que não havia alternativas terapêuticas
não-aversivas disponíveis (Banaco, 2001). A
idéia dominante era que a rejeição dessas
técnicas produziria a retirada de apoio social
e, conseqüentemente, promoveria a investigação de estratégias alternativas (Rangé,
1988).
ANÁLISE DO COMPORTAMENTO
A repercussão da abordagem construcional, proposta por Goldiamond (1974), também contribuiu para o desuso de técnicas
aversivas na terapia comportamental, consistindo no quarto aspecto a ser considerado. Esse
autor defendeu a posição de que a intervenção terapêutica deveria estabelecer contingências favoráveis à construção de repertórios mais
produtivos, opondo-se, portanto, à postura dominante de que o objetivo da terapia era eliminar comportamentos-problema. O quinto aspecto corresponde ao interesse crescente na
relação terapeuta-cliente como o principal mecanismo de mudança no contexto clínico, observado a partir do início da década de 1980.
Esse interesse está apoiado no argumento de
que comportamentos contraprodutivos são reproduzidos no ambiente terapêutico em decorrência das similaridades funcionais entre a relação terapêutica e as relações interpessoais
que o cliente mantém fora da terapia, o que
consiste em uma oportunidade única para o
terapeuta modelar diretamente alternativas
comportamentais mais efetivas. O papel da
relação terapeuta-cliente é amplamente enfatizado em propostas terapêuticas recentes, tais
como a Terapia Analítica Funcional (FAP), proposta por Kohlenberg e Tsai (1991), e a Terapia da Aceitação e do Compromisso (ACT),
proposta por Hayes, Strosahl e Wilson (1999).
Tanto a FAP quanto a ACT, embora tenham sido influenciadas pelos aspectos já mencionados e, conseqüentemente, promovam a
utilização de estratégias positivamente reforçadoras na prática clínica, não estão totalmente livres da ocorrência de controle aversivo na
relação terapeuta-cliente. A FAP, por exemplo,
advoga que o terapeuta deve evocar comportamentos clinicamente relevantes durante a
sessão, ou seja, se o cliente tem dificuldades
afetivas e comportamentais em seus relacionamentos interpessoais, o terapeuta deve evocar essas dificuldades durante a sessão e
conseqüenciá-las diferencialmente de forma a
promover a aprendizagem de comportamentos mais adaptativos. Ao fazer isso, o terapeuta
deliberadamente coloca o cliente em contato
com os eventos aversivos que controlam seus
comportamentos-problema (Kohlenberg, 1999),
conforme indicado no diálogo (fictício) a seguir:
131
C: Eu gostaria que alguém mais experiente
tomasse conta de mim, me ajudasse a tomar as decisões certas.
T: Eu acho que você gostaria que eu decidisse se você deve ou não aceitar esse emprego. Se isso for verdade, você está fazendo o que não gostaria de fazer, ou seja,
você mais uma vez está se esquivando de
tomar decisões.
C: Não, não é isso... Eu, bem, eu ... (desvia o
olhar, gagueja). Às vezes, tenho saudade
de meu pai... Ele sempre me apontava o
que era certo fazer (chora).
Quando o comportamento-problema é
identificado e descrito pelo terapeuta, o cliente entra em contato com a situação aversiva e
experiencia as conseqüências emocionais negativas desse contato. Assim sendo, evocar
comportamentos-problema pode ser considerado um procedimento aversivo.
Uma outra estratégia terapêutica, a de
apresentar interpretações, muito utilizada por
terapeutas da FAP, também pode incluir propriedades aversivas. Interpretar consiste em
descrever o comportamento e suas variáveis
de controle. A interpretação é um aspecto importante do processo terapêutico porque, geralmente, o cliente só é capaz de observar a
topografia ou o conteúdo do comportamento,
ignorando suas propriedades funcionais
(Perkins, Hackbert e Dougher, 1999). Ao tentar preencher essa lacuna, a interpretação pode
evocar experiências prévias com características aversivas intensas, conforme demonstrado
nos exemplos a seguir:
T: Dizer que é 10 anos mais nova e somente
buscar relacionamentos íntimos com homens bem mais jovens parece ser uma forma de evitar críticas por viver ainda com
os pais e não trabalhar aos 38 anos de
idade.
T: Eu acho que você começou a falar sobre
o autoritarismo de sua mãe porque eu
pedi para você justificar suas faltas.
Quando o cliente entra em contato com
situações (e emoções) aversivas na terapia, é
provável que tente esquivar-se da situação, podendo até agredir o terapeuta. Em tais situações, é comum o terapeuta empregar uma es-
132
ABREU-RODRIGUES, RIBEIRO & COLS.
tratégia denominada de bloqueio da esquiva
(Brandão, 1999), exemplificada a seguir:
C: Esse assunto de emprego já está resolvido. Não se preocupe, desta vez eu sei o
que fazer. Vamos deixar esse assunto de
lado, já está resolvido. Eu gostaria de
aproveitar o tempo que me resta falando
sobre minha namorada (cliente tenta se
esquivar).
T: Antes de mudar de assunto, eu gostaria
de saber como a questão do emprego foi
resolvida. Você poderia me dizer? (terapeuta tenta impedir a esquiva).
C: Eu prefiro deixar esse assunto de lado.
Estou querendo lhe contar o que ocorreu,
sábado, com minha namorada (cliente
continua se esquivando).
T: Tenho a impressão de que você está evitando falar sobre o assunto. A questão do
emprego é urgente. Se você está tendo
dificuldades para tomar uma decisão, vamos conversar sobre essa dificuldade
(terapeuta insiste).
C: Você não me dá uma folga... Tá bem, eu
estou apavorado. É uma decisão muito importante, não me acho capaz de tomar a
decisão acertada. É uma sensação horrível! (cliente começa a chorar).
Diante das tentativas de esquiva do cliente, o terapeuta: impediu o reforçamento dessas tentativas, passou a promover a auto-observação e contribuiu para o contato com a dificuldade de tomar decisões e com as emoções correlacionadas. Esses três aspectos têm
um caráter nitidamente aversivo, sendo sua
implementação justificável em função de sua
relevância para a aceitação de comportamentos e de emoções contraprodutivos, análise funcional da situação-problema e aprendizagem
de comportamentos mais efetivos (Brandão,
1999).
A ACT também inclui diversas estratégias
aversivas. Segundo essa proposta terapêutica,
o cliente geralmente acredita que o comportamento é causado por eventos privados. Dessa
forma, seu objetivo na terapia é aprender a controlar efetivamente seus pensamentos e sentimentos indesejáveis (esquiva emocional), o que
teria como conseqüência a resolução de seus
problemas. De acordo com Hayes e colaboradores (1999), a terapia deve enfraquecer essa
esquiva, cabendo ao terapeuta estabelecer contingências que ajudem o cliente a se conscientizar de que seu comportamento é controlado
por eventos ambientais, a aceitar seus pensamentos e sentimentos indesejáveis e a se comprometer com a mudança comportamental.
Para tanto, a ACT faz um largo uso de metáforas (dentre outras estratégias) já que, devido a
sua ambigüidade, dificilmente produzem aquiescência ou resistência. Algumas dessas metáforas são empregadas para mostrar ao cliente
que as tentativas de eliminar pensamentos e
sentimentos indesejáveis geram conseqüências aversivas, tais como falta de contato com
reforçadores positivos, manutenção de sentimentos dolorosos, aumento da aversividade da
situação e generalização de respostas emocionais (Brandão, 1999).
Na metáfora do polígrafo, por exemplo,
o cliente deve imaginar que está conectado a
um polígrafo, uma máquina que detecta qualquer estado emocional, quer seja de ansiedade ou de relaxamento. Ele deve imaginar também que há uma arma apontada para sua cabeça e que, caso ele se sinta ansioso, a arma
será disparada. Sua tarefa, portanto, é evitar o
sentimento de ansiedade (Hayes et al., 1999).
Essa metáfora tem propriedades aversivas, não
somente porque gera estados emocionais negativos no decorrer do exercício, mas também
porque produz uma condição de desamparo.
Esse desamparo ocorre quando, ao tentar seguir as instruções do terapeuta, isto é, não se
sentir ansioso, o cliente inevitavelmente se defronta com a inutilidade de suas tentativas. Essa
descoberta, por sua vez, contribui para o abandono de antigas estratégias comportamentais
de controle emocional. O problema surge porque o cliente não dispõe, pelo menos no momento, de estratégias alternativas eficazes. É
comum, nessas situações, que o cliente emita
verbalizações com teor negativo, tais como “Tudo que tenho tentado ao longo dos anos está
errado? Se for assim, acho que meu problema
não tem solução. Não sei o que fazer. Acho que
devo me conformar, é meu destino”. Conforme sugerido por Hayes e colaboradores, cabe
ao terapeuta minimizar a aversividade da situação, tornando o desamparo inicial uma condição criativa, de modo que o cliente passe a
ANÁLISE DO COMPORTAMENTO
discutir seus problemas sob perspectivas mais
construtivas.
Outros procedimentos terapêuticos, também conhecidos como não-aversivos, envolvem
situações emocionalmente dolorosas. A dessensibilização sistemática é um exemplo. Esse
procedimento envolve, inicialmente, a construção de uma lista hierarquizada de situações
ansiogênicas e o treino de relaxamento. Posteriormente, o terapeuta contrapõe os estados
de relaxamento e de ansiedade. Isto é, após o
estabelecimento de um nível profundo de relaxamento, uma situação aversiva de baixa intensidade é apresentada pelo terapeuta, cabendo ao cliente imaginar (no modelo mais tradicional) a situação apresentada. Quando a imaginação de uma determinada situação gera
ansiedade, o estado de relaxamento é restabelecido, e, em seguida, o ciclo recomeça. Quando a imaginação de uma determinada situação deixa de gerar ansiedade, uma outra, com
teor aversivo um pouco maior é apresentada,
e assim por diante (Turner, 1996; Wolpe,
1990). Dessa forma, a implementação desse
procedimento envolve, desde a construção da
hierarquia até a imaginação de situações ansiogênicas, um forte conteúdo aversivo.
Uma observação semelhante pode ser feita com relação ao ensaio comportamental. Nesse procedimento, a aprendizagem de respostas mais efetivas ocorre por meio da representação de papéis. Terapeuta e cliente representam relações interpessoais relevantes, podendo este representar a si mesmo ou uma outra
pessoa. No decorrer do ensaio, de vez em quando o terapeuta interrompe a cena para avaliar
o comportamento do cliente e, nessas ocasiões,
reforça aproximações sucessivas ao comportamento final desejado. Apesar da ênfase no
reforçamento positivo, o ensaio comportamental também inclui características aversivas.
Suponha que o cliente deseja comunicar à esposa sua decisão de se divorciar e, para tanto,
está ensaiando o que e como deve ser dito. A
representação do diálogo, per si, coloca o cliente
em contato com diversos estímulos aversivos, o
que usualmente ocasiona sentimentos muitos
dolorosos. Além disso, sempre que o cliente é
solicitado a repetir a cena, fica claro que seu
comportamento continua inapropriado, o que
133
pode deixá-lo ansioso, envergonhado e, até
mesmo, agressivo (Masters et al., 1987).
O controle aversivo também está presente em outras estratégias terapêuticas, além daquelas anteriormente mencionadas, tais como
a terapia de exposição e prevenção de respostas, amplamente utilizada no tratamento do
Transtorno Obsessivo-Compulsivo (p. ex.: Guimarães, 2001; Zamignani, 2000).
Considerando, portanto, que estratégias
terapêuticas de mérito reconhecido e amplamente utilizadas nos dias atuais estão permeadas de controle aversivo, é possível afirmar que
o que caiu em desuso foi o uso isolado de técnicas aversivas ou o uso dessas técnicas como
forma primária de intervenção, ou, ainda, o
uso de técnicas com forte teor aversivo. Na realidade, contingências aversivas continuam sendo implementadas na clínica comportamental,
mas como parte de tratamentos mais amplos
que envolvem reforçamento positivo em larga
escala (Carrasco, 1996). A atividade clínica
fornece evidências de que a administração de
controle aversivo em um ambiente pleno de
reforçamento positivo pode ser favorável ao
desenvolvimento de repertórios comportamentais mais produtivos. Conforme indicado
por Sidman (1989/1995), a administração de
punições suaves pode gerar supressão da resposta (pelo menos temporária), e essa supressão pode consistir em uma ótima oportunidade para o terapeuta treinar alternativas comportamentais mais úteis. Por exemplo, uma
interpretação pode gerar respostas de esquiva
(como tentativas de mudar o tema da conversa). A insistência do terapeuta em permanecer
conversando sobre um determinado tema pode
não somente funcionar como punição, eliminando a tentativa de esquiva, mas também
como uma operação estabelecedora, evocando alternativas comportamentais mais produtivas (como discutir o tema). Essas alternativas podem, então, ser sujeitas a reforçamento
positivo.
O processo terapêutico, caracterizado
pelo uso de reforçamento positivo, mas também incluindo contingências aversivas e, ainda assim, bastante efetivo para promover mudanças comportamentais positivas e duradouras, sugere que não podemos negar ou ignorar
134
ABREU-RODRIGUES, RIBEIRO & COLS.
o papel do controle aversivo na relação terapêutica. Nosso objetivo é evitar o uso incompetente e irresponsável de procedimentos
aversivos. Para tanto, devemos retomar as investigações sobre o controle aversivo, tanto no
âmbito da pesquisa básica quanto no da aplicada. Investigações sobre o seguimento de regras, a correspondência dizer-fazer, a resistência à mudança, o controle por operações
estabelecedoras, os efeitos da história passada, dentre outros fenômenos comportamentais,
em contextos aversivos, poderiam ser úteis para
responder a questões clínicas relacionadas ao
diagnóstico e à intervenção.
CONCLUSÃO
O reconhecimento do controle no comportamento humano tem sido um assunto
muito polêmico e, nesse controvertido debate, o insulto é freqüente (Skinner, 1971). Entretanto os extensos resultados experimentais
de pesquisas com organismos não-humanos e
humanos revelam relações ordenadas e estabelecem o controle como um fato, e não como
uma mera opinião. Esse fato, combinado com
aqueles que resultam da aplicação dessa análise funcional em situações de intervenção,
atestam que a ciência pode esclarecer os diversos tipos de relações entre pessoas, pois
“apesar de gostarmos ou não, de reconhecermos ou não, estamos constantemente reforçando e punindo o comportamento uns dos
outros” (Baum, 1994, p. 172).
Certamente, o uso deliberado de técnicas para mudar o comportamento, coercivas
ou não, envolve sérias questões éticas que devem ser avaliadas e julgadas à luz de alternativas disponíveis. A literatura da liberdade e da
dignidade combate qualquer tipo de modificação do comportamento, seja com o uso de estímulos aversivos ou de reforçadores positivos,
e não reconhece que nosso comportamento
muda a todo instante em função das contingências naturais e das contingências artificiais
socialmente construídas e mantidas (Skinner,
1971). Negar o controle não elimina tais contingências e, portanto, a “melhor defesa contra o mau uso das técnicas comportamentais é
aprendermos o máximo possível sobre como
elas funcionam” (Catania, 1998/1999, p. 128).
Em conseqüência, poderemos oferecer alternativas ao controle coercivo das práticas tradicionais relacionadas à responsabilidade, à
moralidade e à justiça, buscando apoiar o comportamento socialmente desejável com o planejamento e o uso eficiente de contingências
de reforço positivo (Baum, 1994).
Aos que rejeitam uma tecnologia comportamental por ser muito simples, Skinner (1971)
rebateu que uma supersimplificação é o apelo
tradicional a estados da mente, sentimentos e
outros aspectos do homem autônomo que a
análise comportamental vem substituindo. A
facilidade com que podem ser inventadas explicações mentalistas ad hoc talvez seja a melhor medida da pouca atenção que elas merecem. A tecnologia que emergiu da análise experimental só deve ser avaliada em comparação com o que se faz a partir de outras concepções. “É ciência ou nada, e a única solução para
a simplificação é aprender a lidar com a complexidade” (Skinner, 1971, p. 160).
REFERÊNCIAS BIBLIOGRÁFICAS
Ader, R.; Tatum, R. (1961). Free-operante avoidance
conditioning in human subjects. Journal of the Experimental Analysis of Behavior, 4, 275-276.
Arbuckle, J. L.; Lattal, K. (1987). A role for negative
reinforcement of response omission in punishment?
Journal of the Experimental Analysis of Behavior, 48,
407-416.
Arbuckle, J. L.; Lattal, K. (1992). Molecular contingencies in schedules of intermittent punishment.
Journal of the Experimental Analysis of Behavior, 58,
361-375.
Azrin, N. H.; Holz, W. C. (1966). Punishment. Em W.
K. Honig (Org.), Operant behavior: Areas of research
and application (p. 380-447). Englewood Cliffs, NJ:
Prentice-Hall.
Banaco, R. A. (2001). Alternativas não aversivas para
tratamento de problemas de ansiedade. Em M. L. Marinho; V. E. Caballo (Orgs.), Psicologia clínica e da saúde (p. 197-212). Londrina, PR: UEL.
Baron, A.; Perone, M. (2001). Explaining avoidance:
Two factors are still better than one [Reply to Dinsmoor
(2001)]. Journal of the Experimental Analysis of Behavior, 75, 357-361.
Baum, W. M. (1973). The correlation-based law of
effect. Journal of the Experimental Analysis of Behavior,
20, 137-153.
ANÁLISE DO COMPORTAMENTO
Baum, W. M. (1994). Understanding behaviorism:
Science, behavior, and culture. New York, NY: Harper
Collins College Publishers.
Baum, W. N. (2001). Molar versus molecular as a
paradigm clash [Reply to Dinsmoor (2001)]. Journal
of the Experimental Analysis of Behavior, 75, 338-341.
Brandão, M. Z. S. (1999). Terapia comportamental e análise funcional da relação terapêutica: Estratégias clínicas
para lidar com o comportamento de esquiva. Revista Brasileira de Terapia Comportamental e Cognitiva, 2,179-187.
Brown, P. L.; Jenkins, H. M. (1968). Autoshaping of
the pigeon’s key-peck. Journal of the Experimental
Analysis of Behavior, 11, 1-8.
Cameschi, C. E. (1997). Comportamento de esquiva:
Teorias e controvérsias. Psicologia: Teoria e Pesquisa,
13, 143-152.
Camp, D. S.; Raymond, G. A.; Church, R. M. (1967).
Temporal relationship between response and punishment. Journal of Experimental Psychology, 74, 114-123.
Carrasco, J. C. (1996). Procedimentos aversivos. Em V.
E. Caballo (Org.), Manual de técnicas de terapia e modificação do comportamento (p. 249-267). São Paulo: Santos Editora.
Catania, A. C. (1999). Aprendizagem: Comportamento,
linguagem e cognição (D. G. de Souza et al.; trads.).
Porto Alegre: Artes Médicas (Obra publicada originalmente em 1998).
Cherek, D. R.; Spiga, R.; Steinberg, J. L.; Kelly, T. H.
(1990). Human aggressive responses maintained by
avoidance or escape from point loss. Journal of the Experimental Analysis of Behavior, 53, 293-303.
Chiesa, M. (1994). Radical behaviorism: The philosophy
and the science. Boston: Authors Cooperative Publishers
Crosbie, J. (1998). Negative reinforcement and
punishment. Em K. A. Lattal; M. Perone (Eds.), Handbook of research methods in human operant behavior
(p. 163-189). New York: Plenum Press.
Crosbie, J.; Williams, A. M.; Lattal, K. A.; Anderson, M.
M.; Brown, S. M. (1997). Schedule interactions involving
punishment with pigeons and humans. Journal of the
Experimental Analysis of Behavior, 68, 161-175.
Courtney, K.; Perone, M. (1992). Reduction in shock
frequency and response effort as factors in reinforcemente by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 58, 485-496.
de Souza, D. G.; de Moraes, A. B. A.; Todorov. J. C.
(1984). Shock intensity and signaled avoidance
responding. Journal of the Experimental Analysis of
Behavior, 42, 67-74.
de Souza, D. G.; de Moraes, A. B. A.; Todorov. J. C. (1992).
Probing stimulus control in free-operant avoidance. The
Psychological Record, 42, 41-55.
de Villiers, P. A. (1974). The law of effect and avoidance:
A quantitative relationship between response rate and
shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 21, 223-235.
Dinsmoor, J. A. (1954). Punishment: I. The avoidance
hypothesis. Psychological Review, 61, 34-46.
135
Dinsmoor, J. A. (1977). Escape, avoidance, punishment:
Where do we stand? Journal of the Experimental Analysis
of Behavior, 28, 83-95.
Dinsmoor, J. A. (2001). Stimuli inevitably generated
by behavior that avoids electric shock are inherently
reinforcing. Journal of the Experimental Analysis of
Behavior, 75, 311-333.
Estes, W. K.; Skinner, B. F. (1941). Some quantitative
properties of anxiety. Journal of Experimental Psychology,
29, 390-400.
Follette, W. C.; Naugle, A. E.; Callaghan, G. M. (1996).
A radical behavioral understanding of the therapeutic
relationship in effecting change. Behavior Therapy, 27,
623-641.
Fowler, H.; Trapold, M. A. (1962). Escape performance
as a function of delay of reinforcement. Journal of Experimental Psychology, 63, 464-457.
Galizio, M. (1999). Extinction of responding maintained
by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 71, 1-11.
Galizio, M.; Liborio, M. O. (1995). The effects of cocaine
on behavior maintained by timeout from avoidance.
Journal of the Experimental Analysis of Behavior, 63,
19-32.
Goldiamond, I. (1974). Toward a constructional
approach to social problems: Ethical and constitutional
issues raised by applied behavior analysis. Behaviorism,
2, 1-85.
Guimarães, S. S. (2001). Exposição e prevenção de respostas no tratamento do transtorno obsessivo-compulsivo. Em M. L. Marinho; V. E. Caballo (Orgs.), Psicologia clínica e da saúde (p. 177-196). Londrina, PR: UEL.
Hayes, S. C.; Strosahl, K. D.; Wilson, K. G. (1999). Acceptance and commitment therapy: An experential approach
to behavior change. New York: The Guilford Press.
Herrnstein, R. J. (1969). Method and theory in the
study of avoidance. Psychological Review, 76, 49-69.
Herrnstein, R. J. (1970). On the law of effect. Journal
of the Experimental Analysis of Behavior, 13, 243-266.
Herrnstein, R. J.; Hineline, P. N. (1966). Negative
reinforcement as shock-frequency reduction. Journal
of the Experimental Analysis of Behavior, 9, 421-430.
Herrnstein, R. J.; Morse, W. H. (1957). Some effects of
response-independent positive reinforcement on
maintained operant behavior. Journal of Comparative
and Physiological Psychology, 50, 461-467.
Higgins, S. T.; Morris, E. K. (1984). Generality of freeoperant avoidance conditioning to human behavior.
Psychological Bulletin, 96, 247-272.
Hineline, P. N. (1970). Negative reinforcement without
shock reduction. Journal of the Experimental Analysis
of Behavior, 14, 259-268.
Hineline, P. N. (1981). The several roles of stimuli in
negative reinforcement. Em P. Harzem; M. D. Zeiler
(Orgs.), Advances in analysis of behavior: Vol. 2. Predictability, correlation and contiguity (p. 203-246). New
York: Wiley.
136
ABREU-RODRIGUES, RIBEIRO & COLS.
Hineline, P. N. (1984). Aversive control: A separate
domain? Journal of the Experimental Analysis of Behavior, 42, 495-509.
Hineline, P. N. (2001). Beyond the molar-molecular
distinction: We need multi-scaled analyses [Reply to
Dinsmoor (2001)]. Journal of the Experimental Analysis
of Behavior, 75, 342-347.
Holz, W. C.; Azrin, N. H. (1961). Discriminative
properties of punishment. Journal of the Experimental
Analysis of Behavior, 4, 225-232.
Holz, W. C.; Azrin, N. H.; Ayllon, T. (1963). A comparison of several procedures for eliminating behavior.
Journal of the Experimental Analysis of Behavior, 6, 399406.
Horner, R. H. (2002). On the status of knowledge for
using punishment: A commentary. Journal of Applied
Behavior Analysis, 35, 465-467.
Kazdin, A. E. (1972). Response cost: The removal of
conditioned reinforcers for therapeutic change.
Behavior Therapy, 3, 533-546.
Keller, J. V. (1966). Delayed escape from light by the
albino rat. Journal of the Experimental Analysis of Behavior, 9, 655-658.
Kohlenberg, B. S. (1999). Emotion and the relationship
in psychotherapy: A behavior analytic perspective. Em
M. J. Dougher (Ed.), Clinical behavior analysis (p. 271289). Reno, NV: Context Press.
Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic
psychotherapy: Creating intense and curative therapeutic
relationships. New York: Plenum Press.
Krasner, L. (1989). “A utopian voice speaks out”. The
Behavior Therapist, 12, 247-257.
Lerman, D. C.; Vorndran, C. M. (2002). On the status
of knowledge for using punishment: Implications for
treating behavior disorders. Journal of Applied Behavior
Analysis, 35, 431-464.
Logue, A. W.; de Villiers, P. A. (1978). Matching in
concurrent variable-interval avoidance schedules. Journal of the Experimental Analysis of Behavior, 29, 61-66.
Masters, J. C.; Burish, T. G.; Hollon, S. D.; Rimm, D. C.
(1987). Behavior therapy: Techniques and empirical
findings. New York: Harcourt Brace Jovanich.
Michael, J. (1975). Positive and negative reinforcement,
a distinction that is no longer necessary, or a better
way to talk about bad things. Behaviorism, 3, 33-44.
Michael, J. (1993). Establishing operations. The Behavior Analyst, 16, 191-206.
Nye, R. D. (2002). Três psicologias: Idéias de Freud,
Skinner e Rogers (R. B. Taylor, trad.). São Paulo: Pioneira Thomson Learning. (Obra publicada originalmente em 2000).
Perkins, D. R.; Hackbert, L.; Dougher, M. J. (1999).
Interpretation in clinical behavior analysis. Em M. J.
Dougher (Ed.), Clinical behavior analysis (p. 291-302).
Reno, NV: Context Press.
Rachlin, H. (1967). The effect of shock intensity on
concurrent and single-key responding in concurrent-
chain schedules. Journal of the Experimental Analysis
of Behavior, 10, 87-93.
Rangé, B. P. (1988). Algumas notas sobre ética e psicoterapia comportamental. Em H. W. Lettner; B. P. Rangé
(Orgs.), Manual de psicoterapia comportamental (p. 1626). São Paulo: Manole.
Schoenfeld, W. N. (1950). An experimental approach
to anxiety, escape, and avoidance behavior. Em P. H.
Hoch; J. Zubin (Orgs.), Anxiety (p. 70-99). New York:
Grune e Stratton.
Schoenfeld, W. N. (1969). “Avoidance” in behavior
theory. Journal of the Experimental Analysis of Behavior,
12, 669-674.
Seligman, M. E. R.; Johnston, J. C. (1973). A cognitive
theory of avoidance learning. Em F. J. McGuigan e D.
B. Lumsden (Orgs.), Contemporary approaches to conditioning and learning (p. 69-110). Washington, DC: V.
H. Winston e Sons.
Shipley, R. H.; Boudewyns, P. A. (1980). Flooding and
implosive therapy: Are they harmful? Behavior Therapy,
11, 503-508.
Sidman, M. (1953a). Avoidance conditioning with brief
shock and no exteroceptive warning signal. Science,
118, 157-158.
Sidman, M. (1953b). Two temporal parameters of the
maintenance of avoidance behavior by white rat. Journal
of Comparative and Physiological Psychology, 46, 253-261.
Sidman, M. (1962a). Reduction of shock frequency as
reinforcement for avoidance behavior. Journal of the
Experimental Analysis of Behavior, 5, 247-257.
Sidman, M. (1962b). Timeout from avoidance as a
reinforcer: A study of response interaction. Journal of
the Experimental Analysis of Behavior, 5, 423-434.
Sidman, M. (1995). Coerção e suas implicações (M. A.
Andery; T. M. Sério, trads.). Campinas, SP: Editorial
Psy (Obra publicada originalmente em 1989).
Sidman, M. (2001). Safe periods both explain and need
explaining [Reply to Dinsmoor (2001)]. Journal of the
Experimental Analysis of Behavior, 75, 335-338.
Sidman, M.; Herrnstein, R. J.; Conrad, D. G. (1957).
Maintenance of avoidance behavior by unavoidable
shocks. Journal of Comparative and Physiological Psychology, 50, 553-557.
Skinner, B. F. (1938). The behavior of organisms: An
experimental analysis. Acton, MA: Copley Publishing
Group.
Skinner, B. F. (1966). The phylogeny and ontogeny of
behavior. Science, 153, 1025-1213.
Skinner, B. F. (1971). Beyond freedom and dignity. New
York: Knopf.
Skinner, B. F. (1972). Cumulative record: A selection of
papers. New York: Appleton-Century Crofts.
Skinner, B. F. (1974). About behaviorism. New York:
Knopf.
Skinner, B. F. (1981). Selection by consequences.
Science, 213, 501-504.
ANÁLISE DO COMPORTAMENTO
Skinner, B. F. (1984). The evolution of behavior. Journal
of the Experimental Analysis of Behavior, 41, 217-221.
Skinner, B. F. (1989). Recent issues in the analysis of
behavior. Columbus, OH: Merrill Publishing Company.
Skinner, B. F. (1990). Can psychology be a science of
mind? American Psychologist, 45, 1206-1210.
Skinner, B. F. (2000). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins
Fontes (Obra publicada originalmente em 1953).
Spradlin, J. E. (2002). Punishment: A primary process?
Journal of Applied Behavior Analysis, 35, 475-477.
Todorov, J. C. (2001). Quem tem medo de punição?
Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 37-40.
Todorov, J. C.; Carvalho, L. C. F.; Menandro, P. R. M.
(1977). The standard Sidman avoidance procedure as
a temporal differentiation schedule. Revista Mexicana
de Análisis de la Conducta, 3, 151-160.
Turner, R. M. (1996). A dessensibilização sistemática.
Em V. E. Caballo (Org.), Manual de técnicas de terapia e
modificação do comportamento (p. 167-195). São Paulo: Santos Editora.
Verhave, T. (1962). The functional properties of a
timeout from an avoidance schedule. Journal of the Experimental Analysis of Behavior, 5, 391-422.
Vollmer, T. R. (2002). Punishment happens: Some
comments on Lerman and Vorndran’s review. Journal
of Applied Behavior Analysis, 35, 469-473.
137
Weiner, H. (1962). Some effects of response cost upon
human operant behavior. Journal of the Experimental
Analysis of Behavior, 5, 201-208.
Weiner, H. (1963). Response cost and the aversive
control of human operant behavior. Journal of the Experimental Analysis of Behavior, 6, 415-421.
Weisman, R. G.; Litner, J. S. (1969). Positive conditioned reinforcement of Sidman avoidance behavior in
rats. Journal of Comparative and Physiological Psychology, 68, 597-603.
Williams, D. R.; Williams, H. (1969). Automaintenance
in the pigeon: Sustained pecking despite contingent
non-reinforcement. Journal of the Experimental Analysis
of Behavior, 12, 511-520.
Wolpe, J. (1990). The practice of behavior therapy. New
York: Pergamon Press.
Zamignani, D. R. (2000). Uma tentativa de entendimento do comportamento obsessivo-compulsivo: Algumas variáveis negligenciadas. Em R. C. Wielenska
(Org.), Sobre comportamento e cognição: Vol. 6. Questionando e ampliando a teoria e as intervenções clínicas em outros contextos (p. 256-266). Santo André,
SP: SET.
Zeiler, M. D. (1986). Behavioral units: A historical
introduction. Em T. Thompson e M. D. Zeiler (Orgs.),
Analysis and integration of behavioral units (p. 1-12).
Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
GENERALIZAÇÃO DE ESTÍMULOS:
ASPECTOS CONCEITUAIS,
METODOLÓGICOS E DE INTERVENÇÃO
8
YVANNA AIRES GADELHA
LAÉRCIA ABREU VASCONCELOS
O conceito de generalização tem sido
amplamente utilizado tanto na pesquisa básica quanto na aplicada e sua importância é clara também no contexto de atuação do psicólogo. O conceito é central no campo da aprendizagem, isto é, no estudo da aquisição ou do
fortalecimento de respostas no repertório do
organismo. Entretanto observam-se variações
no sentido com que o conceito é utilizado desde a década de 1930. Impõe-se, portanto, como
primeiro passo para a utilização desse constructo, a análise das definições propostas para
o termo generalização, o que é fundamental
para o avanço das interpretações de eventos
ou fenômenos comportamentais (p. ex.:
Goldiamond, 1976; Skinner, 1953/1998). Assim, este capítulo abordará o fenômeno da generalização a partir dos seguintes itens:
a) aspectos teórico-conceituais e metodológicos;
b) estratégias tecnológicas voltadas para
a promoção de generalização;
c) contribuição do estudo desse fenômeno no contexto clínico, com a utilização de exemplos da clínica analíticocomportamental infantil.
QUESTÕES TEÓRICO-CONCEITUAIS
E METODOLÓGICAS
Até o final da década de 1950, poucos
estudos avaliaram a generalização de estímulos envolvendo comportamentos operantes
(Pierrel, 1958). A maioria dos estudos publicados até então utilizava o paradigma de condicionamento respondente para avaliar a mudança na força da resposta condicionada quando o estímulo tornava-se mais dissimilar em
relação ao estímulo condicionado inicialmente. A diminuição na força da resposta era, então, sistematicamente relacionada à diferença
entre os estímulos usados durante a extinção
e o primeiro estímulo condicionado.
Ao realizar uma revisão dos aspectos
conceituais, e também metodológicos, da generalização de estímulos, Honig e Urcuioli (1981)
indicaram que os primeiros estudos, sob o
paradigma do condicionamento respondente,
apresentaram problemas conceituais metodológicos: os dados não eram confiáveis nem
replicáveis (Razran, 1949); os gradientes de
generalização1 referiam-se mais a entidades
teóricas do que a fenômenos empíricos; e não
havia acordo quanto às explicações do gradien-
1A
função que relaciona a força da resposta à similaridade entre os estímulos é conhecida como gradiente de generalização de estímulos.
140
ABREU-RODRIGUES, RIBEIRO & COLS.
te na ausência de treino discriminativo (Lashley
e Wade, 1946). A consideração de uma única
forma de gradiente de generalização impedia
uma visão mais ampla e dinâmica do fenômeno, no qual diferentes formas dos gradientes
podem ser controladas por diferentes dimensões de estímulo e condições de treino e de
teste (Honig e Urcuioli, 1981). O estudo de
Guttman e Kalish (1956) estabeleceu a generalização de estímulos como uma área de pesquisa com a utilização de métodos operantes.
A pesquisa passou a ser dirigida a variáveis que
determinavam a altura, a inclinação e a forma
do gradiente de generalização (Honig e
Urcuioli, 1981).
A generalização de estímulos pode ser
enunciada como um princípio, considerando
que tem sido demonstrada nos comportamentos respondentes e operantes, conforme sugerido por Keller e Schoenfeld (1950/1968, p.
132-133):
A formação da discriminação é um processo
duplo. Através da generalização respondente,
cada reforço direto do estímulo A é somado
ao poder eliciador do estímulo B; cada
extinção do estímulo B subtrai um pouco do
poder de A. Outros reforços darão mais poder
a A do que a B; e outras extinções tiram mais
de B do que de A. A acumulação gradual de
diferenças na força dos reflexos é o cerne do
processo.
A discriminação e a generalização no condicionamento operante são apresentadas por
Keller e Schoenfeld (1950/1968, p. 133-134)
como:
Um reforço na presença do S D [estímulo
discriminativo] aumenta sua eficácia como indício, mas também aumenta, em um grau menor, a eficácia do SΔ [estímulo delta]; uma resposta não reforçada no SΔ diminui sua eficácia e reduz ligeiramente a do SΔ. A alternação
continuada de SD e SΔ provoca a separação do
poder evocativo de ambos.
A relação entre os processos de discriminação e generalização é usualmente apresentada nos estudos sobre a generalização de estímulos. Para Skinner (1953/1998), a discriminação refere-se ao processo por meio do qual
uma resposta terá sua probabilidade aumentada quando um determinado estímulo estiver
presente e diminuída na presença de estímulos
diferentes. A generalização, por sua vez, estabelece um responder sob fraco controle de estímulos, e a probabilidade da resposta é semelhante na presença de qualquer estímulo. Os
fenômenos de generalização e discriminação são
entendidos como operações complementares
(cf. Keller e Schoelfeld, 1950/1968) que sofrem
influência da magnitude da diferença entre SD,
o qual propicia a ocasião em que se seguirá reforço se a resposta for emitida, e o SΔ, que sinaliza uma ocasião de não apresentação de reforço e uma oportunidade para não responder.
Ambos os estímulos, SD e SΔ, são discriminativos
(Keller e Schoenfeld, 1950/1968). A diferença
física entre eles é a variável de maior influência
na formação da discriminação e do gradiente
de generalização (Klein e Rilling, 1974; Pierrel
e Sherman, 1962).
Os gradientes de controle de estímulos
obtidos por meio de manipulações experimentais demonstram tanto o grau de discriminação como o de generalização alcançado
(Catania,1998/1999; Mazur, 1998). Gradientes que possuem forma pontiaguda, com o pico
sobre o valor do estímulo relacionado ao reforço no treino (SD), demonstram um alto grau
de discriminação entre esse estímulo e os demais apresentados no teste (SΔs) e também um
baixo grau de generalização. Gradientes horizontais ou achatados demonstram que foram
emitidas respostas em freqüências semelhantes diante de todos os estímulos usados no teste, ou seja, houve um alto grau de generalização, e a ausência de valor modal demonstra
discriminação ausente, ou em baixo grau, e
controle de estímulos fraco.
Segundo Keller e Schoenfeld (1950/
1968), o fenômeno da generalização confere
ao comportamento as propriedades de estabilidade e coerência, pois se refere a um organismo, condicionado a responder a um estímulo, que responde da mesma maneira a outros estímulos. Isto é, os procedimentos de
reforçamento ou extinção levam ao fortalecimento ou ao enfraquecimento de uma resposta que é acompanhada de acréscimo ou decréscimo na força de outras respostas que tenham
ANÁLISE DO COMPORTAMENTO
propriedades em comum com a primeira. Da
mesma forma, para Millenson (1967/1975), a
generalização não constitui um processo, pois
não é uma mudança no comportamento. Em
vez disso, ela pode ser observada após o fortalecimento ou o enfraquecimento de uma resposta por meio de procedimentos como
reforçamento, punição ou extinção em determinada condição de estímulos.
É interessante destacar as explicações baseadas em procedimentos ou em princípios, em
oposição a um processo. Na análise experimental do comportamento, o reforçamento, por
exemplo, é definido com referência a um procedimento, assim como a um processo. A definição por meio de um procedimento reportase à emissão de uma resposta seguida pela liberação de uma conseqüência e, por meio de
um processo, ao aumento da probabilidade de
uma resposta reforçada (Catania, 1975). Entretanto o fenômeno de generalização de estímulos tem sido apresentado como um procedimento ou um princípio.
Outros conceitos foram apresentados por
Razran (1949) na tentativa de explicação do
fenômeno da generalização. Dois tipos de generalização foram definidos: a pseudogeneralização e a generalização verdadeira. A pseudogeneralização refere-se a uma falha na associação de estímulos na qual o sujeito é incapaz de notar características específicas do
estímulo condicionado. Ela pode ser exemplificada pela emissão do comportamento de
dizer “cachorro” diante de qualquer animal
de quatro patas. Na generalização verdadeira, apesar de o indivíduo notar características específicas do estímulo condicionado, ele
emite uma mesma resposta, diante de outros
estímulos, controlada pela categorização. Um
exemplo é a resposta de um adulto de dizer
“cachorro” na presença de diferentes raças
dessa espécie. Ademais, Razran (1949) considerou que a generalização desenvolve-se não
durante o treino original das condições de estímulo, mas durante o teste subseqüente de
generalização. Entretanto, para Skinner
(1953/1998), a generalização de estímulos
precisa ser entendida com base na relação
entre os estímulos do treino e os estímulos do
teste de generalização.
141
Em 1946, Lashley e Wade consideraram
a generalização como resultado de um controle de estímulos ineficiente, ou seja, o sujeito responderia aos estímulos de generalização no
período de teste porque ainda não estaria condicionado a responder diferencialmente ao aspecto relevante do estímulo condicionado, definido pelo experimentador (cf. Terrace, 1966).
Assim, a generalização é vista como uma ausência de controle de um aspecto do estímulo
sobre o comportamento. Brown, Bilodeau e
Baron (1951) também se referiram à generalização como resultado de uma falha em responder diferencialmente a um estímulo. Para
esses autores, essa seria a definição operacional
da generalização de estímulos.
Mednick e Freedman (1960) e Honig e
Urcuioli (1981) apresentaram algumas variáveis importantes para a ocorrência da generalização de estímulos, como: o tipo e a quantidade de treino, a intensidade e a dimensão do
estímulo, o nível de motivação, as diferenças
individuais e a história de reforçamento. Para
esses autores, a generalização de estímulos é o
espalhamento da resposta a um estímulo previamente condicionado para os estímulos de generalização. Esse processo é favorecido quando as “condições do treino” são programadas
visando ao teste de generalização que será
conduzido. Portanto, a extensão das respostas
dos sujeitos será proporcional à diferença entre o estímulo condicionado no treino e os estímulos do teste. A variável “quantidade de treino” na presença do estímulo condicionado tem
um efeito marcante sobre o grau de generalização. Desse modo, a maior exposição do sujeito à condição de treino na qual um estímulo
SD sinaliza que uma resposta será reforçada
pode favorecer a diminuição ou a extinção de
respostas a estímulos diferentes do SD.
A variável “intensidade dos estímulos” (SD
Δ
e S ) no treino é também considerada na análise do gradiente de generalização. Por intensidade de estímulos entende-se a quantidade
de luz utilizada, a intensidade do som ou da
estimulação proprioceptiva. Uma outra variável importante na determinação da ocorrência
de generalização é a “dimensão do estímulo”,
que se refere ao tipo de estimulação utilizada,
seja luz, som ou proprioceptiva. A utilização
142
ABREU-RODRIGUES, RIBEIRO & COLS.
de diferentes dimensões de estímulos no treino e no teste pode dificultar a ocorrência de
generalização. Esses resultados são apresentados em estudos sobre a generalização sonora (Littman, 1949), visual (Brown, 1942),
tátil (Grant e Dittmer, 1940) e temporal (Rosenbaum, 1951), como citados na revisão de
Mednick e Freedman (1960). Entretanto uma
análise funcional, e não apenas dos aspectos
físicos dos estímulos, é necessária ao se considerar a discriminação e a generalização operantes. Uma maior discriminabilidade entre SD
e SΔ pode diminuir a taxa de respostas na presença de SΔ no teste de generalização (Pierrel
e Sherman, 1962). A discriminabilidade é a
sensibilidade às diferenças entre os estímulos,
e essa sensibilidade pode ser alterada pelas
relações funcionais, pelas contingências que
envolvem estímulos físicos (Honig e Urcuioli,
1981). Assim, a situação experimental inclui
mais variáveis a serem analisadas, além dos
estímulos físicos apresentados (Keller e Schoenfeld, 1950/1968).
Considerando-se as características dos sujeitos, a variável “motivação” pode ser entendida, por exemplo, a partir da privação, de
modo que um organismo com um alto nível de
privação de alimento terá maior probabilidade de generalizar sua resposta a outros estímulos diferentes daqueles estímulos do treino
(Yamaguchi, 1952, como citado em Mednick e
Freedman, 1960). Aspectos como a idade do
sujeito, suas condições de saúde e sua história
de reforçamento individual também interferem
na generalização e constituem a variável diferenças individuais. Crianças mais jovens e indivíduos com dano cerebral apresentam um grau
maior de generalização em testes quando comparados a crianças mais velhas e indivíduos sem
dano cerebral. A história de reforçamento interfere no grau de generalização obtido após
um treino. A quantidade de generalização aumenta com a ampliação do número de tentativas e com a utilização de diferentes estímulos
durante o treino. Por outro lado, a quantidade
de generalização diminui com o aumento da
exposição a apenas um estímulo sinalizando
reforço.
Em 1966, Terrace descreveu a operação
de controle de estímulos como explicação para
o processo de generalização e propôs a utilização dessa operação, em substituição aos conceitos de generalização e discriminação, para
descrever situações em que respostas a estímulos similares ao estímulo treinado ocorrem.
Para Terrace, gradientes de generalização que
apresentam um formato de curva mais baixa
demonstram um controle de estímulos mais
pobre do que aqueles que apresentam um pico
na posição do estímulo treinado, com a resposta decaindo à medida que os estímulos-teste afastam-se do estímulo treinado. Para ele, o
reforçamento diferencial, envolvendo SD e SΔ, é
uma condição necessária para o estabelecimento de controle de estímulos (cf. Catania, 1998/
1999; Keller e Schoenfeld, 1950/1968).
Entretanto o controle de estímulos não
pode ser considerado explicação do fenômeno
de generalização. O termo é descritivo, não tem
propriedades teóricas e refere-se a uma relação observada entre um conjunto de valores
de estímulos e um conjunto de valores de respostas. Portanto, um gradiente de generalização é uma medida do controle de estímulos
(Honig e Urcuioli, 1981). Guttman (1963,
como citado em Honig e Urcuioli, 1981) adicionou ao estímulo físico, os valores da variável independente, o estímulo funcional, ou seja,
as contingências de reforçamento passadas e
presentes ao explicar a sensibilidade do comportamento. Ademais, os estímulos podem
competir com outras fontes de controle e a
“discriminabilidade desses estímulos com relação aos demais pode não ter uma simples
correspondência com a escala física definida”.
(Honig e Urcuioli, 1981, p. 408; ver também
Keller e Schoenfeld, 1950/1968).
Millenson (1967/1975) apontou para o
envolvimento da similaridade de estímulos no
fenômeno de generalização e considerou que
quanto mais uma situação de treino se parecer
com a situação na qual o comportamento será
emitido posteriormente, mais efetivo será o
treino. A ocasião em que uma resposta operante
é reforçada e fortalecida torna-se um parâmetro
importante no controle da emissão da resposta em condições de estímulo que não aquelas
em que o reforçamento aconteceu. Apesar de
o termo similaridade de estímulos aparecer
pela primeira vez com Millenson (1967/1975),
ANÁLISE DO COMPORTAMENTO
outros pesquisadores referiram-se também às
semelhanças ou propriedades comuns entre os
estímulos das situações de treino e de teste
(Skinner, 1938, 1953/1998; Keller e Schoenfeld,
1950/1968; Pierrel, 1958; Pierrel e Sherman,
1962; Terrace, 1966). Segundo Pierrel (1958),
o fenômeno da generalização é observável no
ambiente natural, no qual o organismo responde de maneira estável e consistente à estimulação que é similar, mas não idêntica à estimulação anterior. Esse fenômeno estaria relacionado com os processos de formação de conceito e de transferência de treino.
Assim como em 1953, em 1974/1999,
Skinner apresentou novamente o termo generalização como um responder reforçado em determinada ocasião, que tem maior probabilidade de ocorrer em situações semelhantes. Essa
resposta pode ocorrer em ocasiões que compartilhem apenas algumas das mesmas propriedades da situação original. Se uma resposta é
reforçada na presença de um estímulo, e alguma
propriedade desse estímulo é variada, o respondr
em uma outra situação dependerá da diferença
existente entre o estímulo original e o novo
(Catania, 1998/1999; Keller e Schoenfeld,
1950/1968; Skinner, 1953/1998, 1974/1999).
Portanto, para esses autores, a generalização é
definida pela dispersão do efeito do reforço na
presença de um estímulo para outros estímulos, não-correlacionados com o reforço. Para
falar de generalização ou discriminação, é necessário falar da operação subjacente a esses
fenômenos.
Alessi (1987) considerou generalização
um termo vago e propôs a utilização de categorias mais específicas. Entre elas, a generalização de estímulos e de respostas, a equivalência de estímulos, a generalidade das conseqüências e de repertórios mínimos de respostas recombinativas importantes para o ensino
da generalização e para a explicação de padrões
de repertórios recombinativos gerados. Alessi
enfatizou uma contribuição potencialmente
efetiva da análise do comportamento para a
educação: ensinar com um mínimo de instrução e um máximo de aprendizagem produzida
pela recombinação de repertórios gerativos. Reforços condicionados generalizados são conseqüências fundamentais com uma ampla gene-
143
ralidade de aplicação, isto é, funcionam independentemente da pessoa, da situação ou da
operação estabelecedora. O comportamento é
reforçado na situação análoga, de treino, e no
ambiente natural, o que amplia a generalidade dos comportamentos em uma variedade de
situações e aumenta as oportunidades de
aprendizagem. A autora enfatiza o uso de repertórios mínimos recombináveis para transformar repertórios existentes em novos. Essa
abordagem pode ser chamada de recombinativa
porque gera um repertório novo depois de ensinar um número mínimo de relações estímulo-resposta. Para Alessi, a generalidade de aplicação das unidades estímulo-resposta recombinativas ensinadas ocorre quando a aprendizagem é verificada com tarefas ou com estímulos novos, ausentes durante o treino.
Os termos generalização e generalidade
têm sido utilizados de forma permutável, gerando confusão e dificultando a especificação
das condições necessárias para a obtenção de
generalização (Fox e McEvoy, 1993). Ao tentar distinguir esses termos, Edelstein (1989)
mostrou que a generalidade refere-se à validade externa, à universalidade ou à replicabilidade de dados ou de suas interpretações. É
possível examinar a generalidade de um teste
de generalização em duas situações e entre
sujeitos, o que é diferente de avaliar o grau de
generalização obtido após um treino. Para esse
autor, uma definição útil do termo generalização é “emissão de comportamentos treinados
em situações fora do treino”. Para promover a
generalização consistente de um comportamento adaptativo, é necessário focalizar a generalização de estímulos como um fenômeno
legítimo de estudo, passível de definição e de
medida. Em situações em que se deve discriminar entre vários estímulos para sobreviver,
a ausência de generalização é adaptativa; por
outro lado, a generalização de estímulos garante estabilidade e consistência ao comportamento.
O estudo da formação de classes de estímulos e de respostas possibilita a identificação
de variáveis envolvidas no fenômeno da generalização. As variáveis que contribuem para a
formação de classes funcionais e de classes de
equivalência são importantes para a generali-
144
ABREU-RODRIGUES, RIBEIRO & COLS.
zação. Se as classes de equivalência são, de alguma maneira, diferentes de outras classes funcionais, torna-se uma questão a ser resolvida
(Zentall e Smeets, 1996). As propriedades
definidoras das classes de equivalência são a
reflexividade, a simetria e a transitividade. Essas propriedades têm sido verificadas entre os
membros de uma classe por meio de procedimentos de discriminação condicional (ver Capítulo 14 para informações detalhadas sobre
equivalência de estímulos). Uma classe funcional contém membros funcionalmente equivalentes, ou seja, que alcançam conseqüências
comuns, mas não necessariamente possuem as
propriedades verificadas que definem as relações de equivalência (Dougher e Markhan,
1996; Pilgrim e Galizio, 1996; Sidman, 1994).
As classes funcionais são formadas por estímulos que podem ser diferentes fisicamente, mas
que compartilham funções e controlam respostas comuns. Esses estímulos, por sua vez, podem ser testados, por meio de arranjos de discriminação condicional, para verificação da
formação de classes de equivalência (Donahoe
e Palmer, 1994).
Zentall (1996) retomou a discussão da
similaridade. As classes de estímulos e de respostas podem ser formadas com base na similaridade ou na não-similaridade. Quando nenhuma característica comum pode ser identificada entre os estímulos, a única característica
consistente compartilhada pelos membros da
classe são as contingências comuns das quais
os estímulos participam. Entretanto, mesmo em
situações nas quais os membros de uma classe
compartilham propriedades físicas, classes funcionais também podem surgir, não por causa
dos efeitos diretos dessas propriedades compartilhadas, mas porque todos os membros da
classe estão necessariamente envolvidos em
contingências comuns. A sobrevivência de um
organismo em um ambiente imprevisível pode
depender de sua habilidade em generalizar
experiências para classes de estímulos que não
apresentem similaridade entre os membros,
mas cujos membros estejam agrupados devido
ao seu efeito ou à sua função. O grau de similaridade dos itens em uma categoria afeta a
probabilidade da resposta aos itens novos.
Quando os estímulos usados no treino apre-
sentam uma grande variação na aparência, o
grau de categorização acurada dos estímulos
novos é diretamente proporcional ao número
de estímulos usados no treino (Wasserman e
Bhatt, 1992). Isso porque a probabilidade de
um estímulo novo se assemelhar, de alguma
forma, aos muitos estímulos treinados tornase maior. Assim, um processo adicional para
promover a categorização baseia-se em respostas e em conseqüências comuns associadas a
estímulos perceptivelmente diferentes.
Outros constructos têm sido acrescentados ao conceito de generalização. A possibilidade de estímulos muito diferentes produzirem o mesmo comportamento, ainda que um
ou mais estímulos não tenham sido diretamente associados ao reforçamento, foi chamada
por Urcuioli (1996) de equivalência adquirida. Segundo Hull (1939), estímulos perceptivelmente diferentes podem controlar o mesmo comportamento porque produzem alguma reação comum responsável pela mediação
da generalização de desempenhos subseqüentes. Urcuioli acredita que a generalização mediada por reações comuns produz equivalências adquiridas e constitui o processo pelo qual
estímulos diferentes podem ocasionar a emissão do mesmo comportamento. Esse fenômeno explicaria o aparecimento de novos comportamentos em situações em que nunca tenham sido diretamente reforçados. Embora a
generalização de estímulos primária, baseada
na similaridade física entre os estímulos, pareça prontamente explicar a transferência de
controle entre estímulos explicitamente treinados e estímulos-teste, outras condições que
não envolvem similaridade física entre os estímulos, mas sim reações comuns provocadas
por eles, mostram que a explicação da manutenção do comportamento diante de estímulos novos pela generalização primária pode
não ser suficiente.
Finalmente, ao considerar um paralelo
entre as pesquisas sobre generalização de estímulos que utilizam infra-humanos e humanos,
observa-se que a similaridade entre estímulos
é um dos parâmetros investigados (Zentall e
Smeets, 1996). Para Stokes e Osnes (1989), a
generalização de estímulos ou indução de estímulos ocorre quando uma resposta é reforça-
ANÁLISE DO COMPORTAMENTO
da na presença de uma classe de estímulos, e
estímulos similares àqueles usados no treino
aumentam a probabilidade de emissão da resposta treinada. Nesse sentido, a emissão do
comportamento é induzida pelas condições de
estímulos semelhantes. Além disso, quando um
operante é reforçado, ocorre um aumento na
freqüência de outros comportamentos, sem que
eles tenham sido diretamente reforçados, o que
se denomina generalização de respostas, indução
de respostas, ou simplesmente indução e indica
o fortalecimento do comportamento (Keller e
Schoenfeld, 1950/1968). No procedimento de
modelagem, a generalização ou a indução de
respostas torna possível que o animal emita a
resposta-alvo (Catania, 1998/1999).
Entretanto a utilização do termo indução
no contexto do fenômeno de generalização
pode gerar confusões com a discussão do comportamento induzido por esquemas de reforçamento. Quando se considera o controle exercido pelos esquemas de reforçamento sobre o
comportamento operante, observa-se que outros padrões de comportamento podem ocorrer em conjunto às respostas operantes governadas pelo esquema (Falk, 1971; Gimenes,
1985). Esses padrões de comportamentos, diferentes da resposta diretamente relacionada
à obtenção de reforço, são os chamados de comportamentos adjuntivos ou induzidos pelo esquema. Uma variável fundamental para a produção de comportamentos induzidos pelo esquema é a relação temporal a partir da qual
eventos ambientais são apresentados aos organismos. Em geral, esquemas de apresentação de reforço, de tempo fixo (FT) e tempo
variável (VT) e esquemas de reforçamento de
intervalo fixo (FI) e variável (VI) são utilizados nos estudos sobre comportamentos induzidos. No comportamento adjuntivo, é o esquema de liberação do reforço que induz comportamentos diferentes; na generalização de respostas, é o reforço que induz respostas similares; e, na generalização de estímulos são os
estímulos similares àquele condicionado durante o treino que induzem a resposta treinada
(L. S. Gimenes, comunicação pessoal, 10 de
fevereiro de 2003) (ver Capítulo 6 para informações mais detalhadas sobre comportamento adjuntivo).
145
A contextualização do
conceito de generalização
A análise de algumas das definições propostas para o termo generalização, das explicações para o fenômeno, dos procedimentos
utilizados para investigá-lo nas pesquisas básica e aplicada mostra a amplitude de utilização do conceito com diferentes significados, o
que dificulta a compreensão do fenômeno e
justifica uma análise conceitual. Segundo
Harzem e Miles (1978), uma análise conceitual
busca a lógica do conceito, seus limites e as
situações nas quais seu uso é adequado. Uma
análise do termo generalização exige, portanto, uma verificação sobre as circunstâncias em
que ele aparece nos campos teórico e empírico
da análise do comportamento e com quais objetivos vem sendo utilizado.
A definição da generalização de estímulos como uma resposta treinada em certas condições que ocorre, também, em condições similares conduz a uma dificuldade conceitual,
quando o conceito é usado para explicar grande parte dos comportamentos emitidos sob
novas condições de estímulo. Segundo Keller
e Schoenfeld (1950/1968) e Pierrel (1958), a
generalização refere-se à estabilidade do responder diante de estimulação similar, mas não
idêntica à anterior. Visto que no ambiente natural nenhuma situação é exatamente igual a
uma anterior, todas as respostas a estímulos
similares seriam atribuídas à generalização de
estímulos (Mednick e Freedman, 1960). A utilização do conceito desse modo faz com que
grande parte das respostas de um organismo
sejam exemplos do fenômeno, e o conceito,
então, se esvazia. Em psicologia, esse problema tem sido observado com alguns conceitos,
tais como motivação e personalidade. É necessário especificar as variáveis ou os constructos
fundamentais envolvidos no conceito, o que lhe
confere clareza, completude e utilidade. Portanto, a alusão ao parâmetro similaridade entre os estímulos das situações de treino e de
teste no conceito de generalização de estímulos não é suficiente para explicar o fenômeno.
É necessária a especificação das dimensões dos
estímulos e das características dos contextos
de treino e de teste. A programação do treino
146
ABREU-RODRIGUES, RIBEIRO & COLS.
discriminativo, do tipo de estímulo, do número de sessões de treino e de teste, da presença
de extinção no teste, do tipo de reforço e de
instruções utilizadas no treino são aspectos
metodológicos que complementarão a análise
e a correta aplicação do conceito de generalização de estímulos. Além disso, uma clara definição das variáveis dependente e independente é fundamental para a análise funcional, o
que contribuirá para a validade interna e externa e possibilitará a história replicativa dentro da ciência psicológica.
Essas considerações também se aplicam
aos casos de ausência de similaridade entre os
estímulos utilizados nas situações de treino e
de teste, quando uma resposta similar à do treino é emitida diante de estímulos não-similares. Um exemplo da inadequação do uso do
conceito desse modo é encontrado no distúrbio da linguagem chamado afasia. Nesse distúrbio, causado por lesões no sistema nervoso
em regiões específicas do córtex cerebral associadas ao controle da fala, o indivíduo emite
uma mesma resposta diante de diferentes estímulos e situações. Assim, diante de uma caneta ou de uma maçã, o sujeito poderia dizer bola.
Nesse caso, uma mesma resposta ocorre diante de vários estímulos. Entretanto o conceito
de generalização de estímulos não se aplica a
esse caso, devido ao envolvimento de uma lesão que parece controlar respostas verbais e
respostas não-verbais de forma diferente. Isto
é, embora uma mesma resposta verbal seja
emitida diante da caneta, da maçã e de outros
estímulos, as respostas não-verbais são diferentes e apropriadas aos respectivos estímulos.
Contudo não se pode descartar a possibilidade
de o indivíduo emitir respostas verbais e nãoverbais consistentes, caso os contextos de treino e de teste tivessem algumas características
específicas que permitissem a esse indivíduo
responder. Assim, as inconsistências entre as
respostas citadas poderiam ser explicadas por
aspectos biológicos e ambientais, ao considerar que procedimentos apropriados podem ocasionar ou facilitar a emissão de respostas.
Além das possíveis inadequações do uso
do termo generalização citadas anteriormente,
observa-se que esse constructo relaciona-se
com outros fenômenos dentro da análise do
comportamento, como a ressurgência, a insensibilidade comportamental à contingência e a
história de reforçamento, podendo ser confundido com eles. Os estudos sobre ressurgência
referem-se a um comportamento (I) que foi
treinado em uma condição A e que passou por
um procedimento de extinção. O mesmo organismo é então treinado em uma situação B a
emitir outro comportamento (II) e também é
exposto à condição de extinção. O fenômeno
da ressurgência refere-se ao fato de o comportamento (I) voltar a ocorrer quando o comportamento (II) está em extinção. A confusão
com o fenômeno da generalização acontece
quando o comportamento (I) acontece em uma
situação diferente daquela em que foi inicialmente treinado. O fenômeno da insensibilidade comportamental à contingência também pode
ser confundido com a generalização. Diz-se que
existe insensibilidade comportamental quando um organismo continua emitindo um mesmo padrão de respostas mesmo que haja mudança nas contingências em vigor, isto é, a contingência é modificada e a mesma resposta treinada anteriormente em outras condições é
emitida na nova condição.
O conceito de história de reforçamento
também pode compartilhar aspectos comuns
com a generalização. Isto é, se um comportamento que aconteceu no passado, sob determinadas condições, pode influenciar a maneira como o comportamento acontece em uma
nova situação, e se a mesma resposta é emitida no presente em condições diferentes do
passado, isso seria um exemplo de generalização. Stokes e Baer (1977) e Chandler, Lubeck
e Fowler (1992) sugeriram que a análise da
generalização fosse realizada com treinos e
testes repetidos, com a manipulação de variáveis que podem afetar a generalização. No entanto é preciso considerar o efeito da história
de exposição a treinos e a testes sucessivos,
que altera a forma do gradiente de generalização e o grau de transferência dos comportamentos treinados para novas situações. Notase a importância da história de reforçamento
diferencial das respostas dos sujeitos quando
se observa o gradiente de generalização após
o treino discriminativo e após o treino na presença de um único estímulo. O reforçamento
ANÁLISE DO COMPORTAMENTO
diferencial na presença de SD e de SΔ parece
gerar gradientes subseqüentes mais pontiagudos, com o pico localizado nos valores próximos a SD (ver Capítulo 3 para informações mais
detalhadas sobre história de reforçamento).
Assim, não há problema em identificar e
reconhecer o fenômeno da generalização dentro dos estudos voltados para outros fenômenos ou conceitos. O problema estaria em tentar explicá-los por meio da generalização, inutilizando as propriedades desses conceitos para
a compreensão do comportamento. A ressurgência, a insensibilidade à contingência e o
efeito de história são fenômenos que podem
envolver o conceito de generalização, mas não
são permutáveis. Novamente, é necessário recorrer à contextualização do uso do conceito
de generalização de estímulos.
Portanto, a generalização é um termo técnico de fundamental importância para a teoria da aprendizagem. Segundo um paradigma
operante, a generalização de estímulos referese à emissão de um comportamento treinado
em situações em que não houve treino (p. ex.:
Catania, 1998/1999; Edelstein, 1989; Keller e
Schoenfeld, 1950/1968; Skinner, 1938; 1953/
1998; 1974/1999; Terrace, 1966). O termo é
usado com um sentido de transferência de uma
resposta treinada em uma situação para uma
nova situação, e a extensão dessa transferência dependerá da semelhança entre a situação
original e a nova (cf. Catania 1998/1999;
Pierrel e Sherman, 1962). As operações de controle de estímulos e de reforçamento diferencial são subjacentes ao processo de generalização e participam da descrição das situações
em que respostas a estímulos similares ao estímulo originalmente treinado ocorrem (Catania
1998/1999; Keller e Schoenfeld, 1950/1968;
Terrace, 1966). Skinner (1953/1998; 1974/
1999), Mednick e Freedman (1960), Cross e
Lane (1962), Terrace (1966) e Catania (1998/
1999) utilizaram o conceito de generalização,
referindo-se ao efeito do treino discriminativo
em uma situação de estímulo sobre outras situações semelhantes. A similaridade entre os
estímulos utilizados no treino e no teste é um
parâmetro citado em muitos estudos sobre a
generalização de estímulos (p. ex.: Keller e
Schoenfeld, 1950/1968; Pierrel, 1958; Roberts,
147
1996; Skinner, 1938; Stokes e Osnes, 1989;
Urcuioli, 1996; Wacker et al., 1989; Weatherly,
Miller e McDonald, 1999).
As condições de treino, como o esquema
de reforçamento ou o tipo de reforço empregado (p. ex.: Grusec, 1968; Hearst, Koresko e
Poppen, 1964; Honig, 1966; Slivka e Honig,
1964; Winograd, 1965), a dimensão e a quantidade de estímulos envolvidos (p. ex.: Mednick
e Freedman, 1960), o tempo de exposição ao
treino discriminativo (p. ex.: Chandler et al.,
1992; Farthing e Hearst, 1968; Mednick e
Freedman, 1960; Sherman e Pierrel, 1961) e
as taxas de respostas (p. ex.: Hanson e
Guttman, 1961; Migler e Millenson, 1969;
Yarczower, Dickson, e Gollub, 1966) são algumas variáveis potencialmente importantes na
determinação da forma do gradiente de generalização obtido. Além das condições de treino, as condições utilizadas para testar a ocorrência de generalização também interferem na
obtenção de generalização. A quantidade de
testes sucessivos (Pierrel, 1958) e o tipo de
teste empregado, por exemplo, sem a programação de extinção (Risley, 1964), influenciam
os resultados alcançados quanto à generalização. Portanto, são muitas as variáveis que devem ser consideradas nas situações de treino e
de teste para a compreensão do fenômeno da
generalização de estímulos.
ESTRATÉGIAS TECNOLÓGICAS
Kendall (1981) observou uma tendência
crescente de estudos voltados para a obtenção
de generalização e de validade externa, no contexto de intervenção e de tratamento. No entanto os estudos que utilizavam o termo generalização, em geral não descreviam os procedimentos utilizados para a promoção da generalização dos comportamentos treinados. A lacuna na descrição das variáveis importantes
para a ocorrência da generalização e da metodologia para a avaliação do fenômeno reduz
a validade externa desses estudos e compromete a replicabilidade dos dados. A crítica de
Kendall a esses estudos sobre generalização é
que, em sua maioria, eles apresentam o processo de generalização como uma meta a ser
148
ABREU-RODRIGUES, RIBEIRO & COLS.
alcançada que, no entanto, não recebe atenção específica na pesquisa, nem possui tipos
de intervenção próprios para a sua avaliação.
Para Stokes e Baer (1977), o fenômeno
da generalização nas pesquisas com humanos
deve ser visto como influenciado por determinadas variáveis, e não como conseqüência natural de uma intervenção comportamental.
Esses autores destacaram a necessidade de
manipulações específicas no treino que possam
favorecer a ocorrência de generalização, aspecto discutido também nos estudos apresentados anteriormente, que abordam diferentes
parâmetros do treino e do teste de generalização. Esses autores enfatizaram que a generalização refere-se não a um processo, mas a um
procedimento, a uma classe de respostas que
sofre efeito do meio e pode ser conseqüenciada,
ensinada e instruída. Novamente, surge a discussão do fenômeno de generalização como um
processo ou como um procedimento. Stokes e
Baer concluem afirmando a possibilidade de
reforçamento de uma classe de respostas generalizadas. A referência ao reforçamento conduz à discussão de Catania (1975), quando
apresenta a definição do conceito de reforçamento a partir de um procedimento, assim
como de um processo.
Stokes e Baer (1977) sugeriram alguns
procedimentos para a promoção da generalização:
a) modificar seqüencialmente as condições – após o treino, a generalização
é avaliada e, se ausente ou deficiente,
um novo treino é realizado nas situações em que não houve generalização;
b) introduzir condições naturais – escolher comportamentos e formas de intervenção que sejam semelhantes às
condições naturais de reforçamento às
quais o indivíduo é exposto;
c) treinar um número suficiente de exemplares – treinar com diferentes exemplares de tarefas, experimentadores,
pares (p. ex.: outras crianças no contexto experimental), comportamentos
ou ambientes, e avaliar a generalização;
d) treinar livremente – treinar com um
controle relativamente menor sobre os
estímulos apresentados e as respostas
exigidas; isto é, utilizar uma maior variedade de condições que poderiam
fazer parte do treino, em oposição a
uma condição única mais restritiva
quanto à unidade de resposta e sua
conseqüência;
e) usar contingências indiscrimináveis –
por exemplo, esquemas de reforçamento intermitentes variáveis;
f) programar estímulos comuns – utilizar durante o treino componentes comuns ao teste de generalização;
g) mediar a generalização – estabelecer,
como parte do treino, uma resposta
que pode ser utilizada em outras situações, como a auto-instrução e o autoregistro;
h) treinar a generalização – considerar a
generalização como uma classe de respostas que sofre efeito do meio, assim
como os demais operantes, e que pode
ser ensinada, ou seja, instruída ou
conseqüenciada.
Stokes e Osnes (1989) descreveram estratégias de promoção de generalização, baseados nas sugestões de Stokes e Baer (1977),
as quais distribuíram em três categorias:
a) explorar contingências funcionais;
b) treinar de maneira diversificada;
c) incorporar mediadores funcionais.
A primeira inclui contatar e catalogar conseqüências naturais, modificar conseqüências
mal-adaptadas e reforçar ocorrências de generalização. A segunda inclui o uso de exemplares de estímulos e de respostas suficientes para
a promoção de generalização e de estímulos
antecedentes e conseqüentes menos discrimináveis. Finalmente, a terceira categoria inclui
a introdução de estímulos físicos e sociais comuns, salientes, encobertos e verbais automediados (Osnes e Lieblein, 2002). Stokes e Osnes
(1989), assim como Stokes e Baer (1977), focalizaram a necessidade de desenvolver estra-
ANÁLISE DO COMPORTAMENTO
tégias de promoção da generalização e observaram que a investigação empírica das variáveis que controlam a ocorrência da generalização é de fundamental importância para a
compreensão do fenômeno e para a validação
social dos resultados.
Stokes (1992) apresentou duas perspectivas ao considerar o fenômeno da generalização, a topografia e a função do comportamento. De um ponto de vista topográfico, generalização seria a extensão dos efeitos de uma intervenção, isto é, a extensão da emissão de
comportamentos-alvo modificados durante o
treino a outras situações. A perspectiva funcional implica a observação das contingências nas
quais os comportamentos-alvo são obtidos com
eficiência e das interações do organismo com
o ambiente que afetam os seus desempenhos.
Em uma abordagem funcional, a avaliação das
variáveis relacionadas à ocorrência da generalização é fundamental para a obtenção dos efeitos desejados. Portanto, a descrição da topografia e da função dos comportamentos generalizados contribui para a análise dos princípios e das tecnologias efetivas de generalização.
A aplicação de estratégias
de promoção de generalização
A partir do estudo de Guttman e Kalish
(1956), a generalização de estímulos tem sido
investigada por meio da mensuração precisa
de diversas dimensões de estímulo, descrevendo relações funcionais envolvidas na determinação da forma dos gradientes de generalização de estímulos. Nos contextos de pesquisa
aplicada com humanos e de intervenção, a generalização é resultado de intervenções que
geram efeitos além das mudanças-alvo. A generalização é resultado de um procedimento
que permite que uma classe de respostas, modificada em um ambiente, na presença de determinada condição de estímulos, ocorra também em outras condições de estímulos, na presença de outras pessoas, em outros ambientes
e momentos. Assim, é relevante a análise de
como mudanças generalizadas e mantidas ao
longo do tempo pós-tratamento são alcançadas
149
e de como as variáveis que as produzem podem ser funcionalmente relacionadas à mudança comportamental (Stokes e Osnes, 1989).
As estratégias de programação da generalização, sugeridas por Stokes e Baer (1977)
e Stokes e Osnes (1989), foram investigadas a
partir do estudo de comportamentos sociais.
Ao analisar a programação de estímulos comuns em situações de treino e de teste, Wacker
e colaboradores (1989) observaram que o treino com pares entre adolescentes diagnosticados com retardo mental mostrou-se eficiente
para a promoção de generalização do comportamento de treinar colegas em diferentes tarefas. Um resultado similar foi obtido por Hughes
e colaboradores (1995), que investigaram o
efeito de duas variáveis discutidas por Stokes
e Baer (1977): o número suficiente de exemplares e a mediação de generalização. As participantes mostravam, inicialmente, uma baixa
freqüência de interação social. O treino aconteceu em ambientes freqüentados pelas participantes em que elas interagiram com 10 estudantes voluntários, que atuavam como professores de habilidades de conversação. Esses 10
professores foram distribuídos entre as 4 participantes, de forma que 2 delas foram treinadas com 4 professores, 1 com 5 e outra com 6.
Além disso, outros 38 estudantes concordaram
em servir de pares para conversação durante
as sessões de generalização. Assim, a cada sessão de generalização, 4, 5 ou 6 novos pares de
conversação foram inseridos. A classe de comportamentos de conversar foi treinada por meio
do procedimento de modelagem. A auto-instrução era apresentada em um guia com quatro comportamentos a serem seguidos: identificar o problema (eu quero falar), estabelecer
a resposta (eu preciso olhar e falar), auto-avaliação (eu fiz isso, eu falei) e auto-reforçamento
(eu fiz um bom trabalho). Os resultados mostraram um aumento na classe de comportamentos de conversar em ambientes treinados e nãotreinados. Observou-se também a generalização do uso da auto-instrução com diferentes
pares em outros ambientes. As participantes
avaliaram ter maior facilidade em suas
interações sociais e julgaram-se mais falantes.
150
ABREU-RODRIGUES, RIBEIRO & COLS.
Os familiares relataram que elas apresentaram
também maior assertividade e confiança.
Ducharme e Holborn (1997) utilizaram
um procedimento de programação de generalização para comportamentos sociais com
crianças pré-escolares com danos auditivos. A
partir de um procedimento de treino que incluía instrução, modelação, prompting, reforçamento e pares habilidosos socialmente, os
autores utilizaram uma combinação de estratégias de programação de generalização. Avaliações repetidas da generalização foram feitas após o treino e foi adicionado o treino com
diferentes professores, pares, atividades e ambientes, com o cuidado de aproximar a situação de treino das condições naturais de reforçamento a que o indivíduo era exposto. Com a
introdução do treino, ocorreram mudanças
imediatas nas interações sociais, que aumentaram de freqüência e foram observadas com
diferentes experimentadores, pares e professores em atividades e em ambientes diferentes. Os autores concluíram que o pacote de treino contendo estratégias de promoção de generalização foi efetivo em promover a mudança comportamental generalizada.
Chandler e colaboradores (1992) revisaram estudos sobre a generalização de comportamentos sociais de crianças pré-escolares. Esses autores identificaram algumas dimensões
da generalização freqüentemente investigadas,
tais como entre situações ou ambientes, entre
pares ou outras pessoas, entre tarefas e, também, no transcorrer do tempo. Foram analisados 51 estudos realizados em um período de
15 anos (de 1976 a 1990). Ao longo desses
anos, notou-se um número crescente de estudos que registraram a ocorrência da generalização. No entanto não se pode dizer se realmente há um maior esforço em produzi-la ou
se os artigos com sucesso na produção da
generalização tendem a ser publicados com
maior facilidade.
Nessa revisão, Chandler e colaboradores
(1992) apresentaram dois fatores que influenciam o sucesso da promoção da generalização:
as características metodológicas e as características tecnológicas. Trata-se, no primeiro caso,
do número de participantes, das dimensões da
generalização e da duração da intervenção; no
segundo, da determinação dos comportamentos-alvo e das estratégias utilizadas para a modificação do comportamento e para a promoção da generalização. Quanto às características metodológicas, os autores encontraram
que, nos estudos que obtiveram sucesso na promoção da generalização, foi utilizada uma
média de seis participantes. As dimensões mais
freqüentemente citadas entre os estudos foram
a manutenção, isto é, a generalização ao longo
do tempo, a generalização entre situações ou
ambientes e entre pares, experimentadores e
professores. Os estudos que apresentaram sucesso na promoção da generalização tinham
um tratamento com uma duração média de 33
sessões, de 21 min cada. O maior número de
sessões parece favorecer uma história de desempenho suficiente para garantir que o comportamento seja emitido e reforçado em situações naturais.
Quanto às características tecnológicas do
treino, os estudos de maior sucesso na promoção da generalização usaram mais freqüentemente os seguintes comportamentos-alvo:
iniciação de uma conversação com pares, conversação e interação recíproca. No entanto o
tipo de comportamento-alvo não foi determinante para o sucesso na promoção da generalização. As estratégias de mudança mais utilizadas foram reforçamento positivo, instruções
e prompting. A maioria dos estudos bem-sucedidos combinou estratégias, sendo a combinação prompting-reforçamento a mais citada.
Nela, os participantes recebem um sinal ou uma
dica para a emissão do comportamento que,
quando ocorre, é reforçado. As estratégias voltadas para a promoção de generalização mais
utilizadas nos estudos de maior sucesso foram
a seleção de comportamentos-alvo que atingissem critérios para reforçamento no ambiente
natural, o treino livre e o uso de contingências
indiscriminadas. Os autores sugeriram que as
relações entre as variáveis derivadas dessa revisão fossem submetidas a verificações empíricas.
Osnes e Lieblein (2002) observaram que
todos os artigos de revisão sobre o fenômeno
da generalização publicados no período entre
1990 e 2002, em quatro importantes periódicos voltados para a análise do comportamento
(Journal of Applied Behavior Analysis, Behavior
ANÁLISE DO COMPORTAMENTO
Modification, Journal of Positive Behavior
Interventions e The Behavior Analyst Today),
focalizam algum tipo de comportamento social. A generalização tem sido especialmente
estudada nessa área com crianças, porém existe
uma lacuna entre produzir interações sociais
funcionais e obter a generalização desses padrões de interação. Osnes e Lieblein observaram que a generalização apresentada nesses
estudos não permite a determinação das condições necessárias para sua obtenção. Grande
parte dos estudos introduz manipulações de diferentes variáveis potencialmente importantes
para a obtenção de generalização e o pacote
de tratamento dificulta a especificação dos efeitos de cada uma das variáveis presentes no delineamento experimental.
O FENÔMENO DA GENERALIZAÇÃO
NO CONTEXTO CLÍNICO
O contexto clínico é constituído por algumas características que envolvem um número
ainda maior de variáveis a serem investigadas
no estudo da generalização do que aquelas envolvidas em estudos desenvolvidos em contextos com maiores níveis de controle. A presença
de contingências simultâneas a um tratamento
torna a análise complexa, ao acrescentar um
número significativo de variáveis. No laboratório animal, é possível uma separação clara
entre as situações de treino, em que determinadas contingências estão em vigor, e as situações de teste, usualmente caracterizadas por
um procedimento de extinção, no qual se apresenta ao sujeito um conjunto maior de estímulos, formado por aqueles utilizados durante o
treino e por suas variações. Entretanto, no contexto clínico, uma criança é exposta a um determinado tratamento e, simultaneamente, a
contingências presentes fora da situação clínica, as quais poderão apresentar ora um esquema intermitente de punição, ora extinção para
comportamentos-alvo que fazem parte do tratamento. Não há, portanto, separação temporal entre treino e teste, o que é claramente estabelecido no laboratório animal. É possível
argumentar que o teste, no contexto clínico,
ocorreria após a suspensão do tratamento. Po-
151
rém essa afirmação pode estar servindo mais
como controle para o comportamento verbal
do terapeuta, enquanto o comportamento da
criança está sob controle de outras contingências, ou seja, da ocorrência simultânea de treino e testes.
As publicações recentes, voltadas para a
promoção da generalização no contexto de intervenção, citadas anteriormente no estudo do
comportamento social, assim como a Psicoterapia Analítico-Funcional (Kohlenberg e Tsai,
1991), destacam a importância da utilização
de estímulos no setting terapêutico que façam
parte do ambiente natural do cliente. Ao analisar as contingências de reforçamento existentes no cotidiano de um cliente, é possível considerar a existência de esquemas similares aos
esquemas múltiplos de reforçamento, os quais
podem contribuir para a compreensão da generalização dos resultados clínicos.
O esquema múltiplo de reforçamento tem
sido considerado útil por permitir a análise dos
efeitos de diferentes manipulações dentro de
uma mesma sessão experimental em um tempo relativamente curto de exposição. Estudos
desenvolvidos nas áreas de farmacologia comportamental, toxicologia, assim como alguns
estudos sobre o processo de generalização destacam a utilidade do esquema múltiplo de
reforçamento (p. ex.: Barrett, 1984; Blackman
e Pellon, 1993; Cross e Lane, 1962; Vasconcelos, 1999; Yarczower et al., 1966). A interação
entre os componentes do esquema oferece uma
rica oportunidade de análise dos dados obtidos de diferentes manipulações. No treino
discriminativo, por exemplo, diferentes estímulos poderão sinalizar diferentes conseqüências para as respostas.
No decorrer de uma intervenção clínica,
é possível observar um esquema similar ao esquema múltiplo de reforçamento, com os componentes de reforçamento contínuo (CRF) na
presença do terapeuta, e procedimento de
extinção (EXT), na presença de outras pessoas.
Entretanto, a duração dos componentes não é
simétrica. O primeiro componente, o CRF, pode
ter a duração de 50 min (período de tempo de
uma sessão terapêutica), enquanto o segundo,
a extinção, pode ter uma duração aproximada
de 12 h no dia da sessão de tratamento (perío-
152
ABREU-RODRIGUES, RIBEIRO & COLS.
do de tempo que uma criança pode estar
interagindo com seus primeiros educadores,
pais ou professores). Nos demais dias da semana, quando não há sessão terapêutica, a criança pode estar sendo exposta a um esquema
simples de reforçamento intermitente com
reforçamento negativo ou, ainda, a esquemas
de punição ou a procedimentos de extinção. É
possível também a identificação de esquemas
complexos de reforçamento formado pelos esquemas descritos anteriormente. É comum observar uma baixa freqüência de reforçamento
positivo e eventos aversivos contingentes, de
forma não-sistemática, aos comportamentos
clinicamente relevantes da criança em seu
ambiente natural.
A inconsistência ou a não-sistematicidade dos esquemas de reforçamento fora da
sessão terapêutica pode dificultar a ocorrência da generalização de estímulos. Baixas taxas de generalização podem também ser
registradas nos casos em que se observam
contingências antagônicas entre os settings
terapêutico e natural, envolvendo, por exemplo, esquemas mult CRF EXT ou mult CRF
Punição. Em outras palavras, quanto maior
for a diferença entre as contingências de treino e de teste, isto é, entre as sessões terapêuticas, os procedimentos de intervenção
implementados ou as contingências programadas pelo terapeuta e as contingências presentes no ambiente natural, seja em família
ou na escola, menor será a possibilidade de
extensão do repertório treinado para situações extraconsultório. Portanto, uma avaliação constante das contingências presentes no
dia-a-dia da criança, certamente contribuirá
para a efetividade do tratamento e para a promoção de generalização. Essa estratégia tem
sido também apontada como fundamental em
atividades de pesquisa: “Contingências sociais
extra-experimentais raramente recebem atenção explícita nos relatos de pesquisa com sujeitos humanos”. (Pilgrim, 1998, p. 25).
Um problema comumente citado na clínica infantil poderia ilustrar a discussão sobre
a generalização de estímulos. É possível dizer
que o zeitgeist, a partir da década de 1990 na
clínica infantil, é o diagnóstico do Transtorno
de Déficit de Atenção/Hiperatividade (TDAH),
amplamente aplicado por pais e professores a
partir de critérios intuitivos. Entretanto a utilização de critérios clínicos por profissionais
especializados também apresenta problemas.
Critérios clínicos têm sido utilizados de maneira inadequada ou, ainda, quando utilizados
adequadamente, apresentam riscos de interpretação de falsos positivos, devido aos pontos de subjetividade na classificação do transtorno dentro de um continuum de normalidade. O TDAH é definido a partir dos critérios
apresentados no Manual Diagnóstico e Estatístico de Transtornos Mentais (DSM-IV) e é
considerado uma condição crônica (American
Psychiatric Association, 1994). Uma variada
etiologia tem sido apresentada para esse transtorno, com especial destaque para fatores neurológicos e genéticos, enquanto fatores ambientais e sociais não são considerados causais
(Barkley, 1998). Crianças com diagnóstico de
TDAH apresentam dificuldades de generalização de comportamentos sociais funcionais adquiridos no contexto de tratamento para outros contextos, após a suspensão de uma intervenção (Barkley, 1998).
A análise das contingências a que essas
crianças são expostas evidencia um contexto
familiar, em geral, com mães mais diretivas,
negativas, menos responsivas e que apresentam uma baixa freqüência de reforçamento
positivo para os comportamentos das crianças.
Problemas de interação na escola também são
observados nessas crianças, havendo rejeição
dos pares devido às suas dificuldades de comunicação (Barkley, 1998). O exemplo de
crianças com diagnóstico de TDAH ilustra a inconsistência de conseqüências apresentadas
para comportamentos no ambiente natural. As
contingências extraconsultório mostram variabilidade e não-sistematicidade. Um segundo aspecto importante é a diferença significativa
entre as conseqüências apresentadas para comportamentos-alvo no consultório e no ambiente natural. Um esquema similar a um mult CRF
Punição ou mult CRF EXT, nos quais os componentes são formados pela interação com o
terapeuta na clínica e com outras pessoas no
ambiente natural, respectivamente, pode ser
observado.
ANÁLISE DO COMPORTAMENTO
Portanto, resultados positivos do tratamento, incluindo a generalização de estímulos voltada para comportamentos sociais funcionais em diferentes contextos, podem ser
maximizados pela utilização de uma abordagem funcional do problema. A atribuição de
um diagnóstico de um transtorno crônico, sem
cura, pode ter sérias implicações na atuação
dos educadores. Explicações biológicas podem
passar a substituir explicações comportamentais, o que, por sua vez, não contribui para uma
visão dinâmica e questionadora de práticas
educativas realmente efetivas para uma determinada criança. As explicações biológicas podem complementar, porém não substituem as
explicações comportamentais (Cavalcante e
Tourinho, 1998; Vasconcelos, 2001, 2002). Na
abordagem analítico-comportamental, limites
biológicos não podem ser considerados sinônimos de limites comportamentais (Roche e
Barnes, 1997).
Finalmente, dois conceitos adicionais podem ser úteis para a promoção da generalização dos efeitos positivos de uma intervenção:
a integridade do tratamento e a satisfação do
consumidor. A integridade do tratamento refere-se à precisão e à consistência da implementação de uma variável independente, conforme o planejado. A integridade de uma intervenção possibilita a obtenção de validade interna e de validade externa. Trata-se, no primeiro caso, da atribuição dos resultados obtidos às manipulações de variáveis implementadas pelo terapeuta; no segundo, trata-se da
força de uma técnica, alcançada por uma história replicativa que evidencia a generalidade
de uma relação funcional (Gresham, Gansle e
Noell, 1993). Portanto, é fundamental a apresentação, nos estudos, de definições claras e
completas, tanto do comportamento-alvo, a
variável dependente, quanto das variáveis
manipuladas, as variáveis independentes.
Diferentes estimativas da integridade do
tratamento são sugeridas por meio de avaliações constantes (Gresham et al., 1993). O
terapeuta analítico-comportamental utiliza registros sistemáticos dos comportamentos-alvo
e das variáveis independentes no decorrer de
todo o processo terapêutico. Essas avaliações
repetidas conferem a essa forma de interven-
153
ção clínica uma característica de autocorreção,
isto é, a possibilidade de o terapeuta confirmar hipóteses junto ao cliente (relações entre
o comportamento e eventos ambientais que
parecem existir diante do relato verbal do cliente, por exemplo) e alterar parâmetros de sua
intervenção programada. Portanto, não são
apenas avaliações de sessões isoladas de linha
de base ou de tratamento. Entretanto revisões
de estudos nessa área evidenciam a necessidade de maiores investimentos em pesquisas voltadas para as medidas utilizadas (Gresham et
al., 1993; Peterson, Homer e Wonderlich,
1982). Todas as áreas de intervenção na psicologia podem beneficiar-se da apresentação de
altos índices de integridade do tratamento, e
as dificuldades de generalização de comportamentos sociais funcionais para outros ambientes, após a retirada dos tratamentos, poderão
ser mais sistematicamente analisadas a partir
de altos índices de integridade dos tratamentos utilizados.
Os resultados de uma intervenção clínica, incluindo a promoção da generalização,
estão relacionados também a uma outra variável, a satisfação do consumidor, a qual tem sido
apresentada, na clínica analítico-comportamental infantil, com diferentes conceitos:
validade social (p. ex.: Gresham e Lambros,
1997), validade habilitativa (Hawkins, 1991)
e a partir de classificações das mudanças de
comportamento como proximais, intermediárias e distais (Fawcett, 1991). Essas classificações referem-se a resultados de uma intervenção, isto é, a mudanças positivas, respectivamente, nos comportamentos-alvo, nos comportamentos colaterais e em ambos os comportamentos, a longo prazo. Há necessidade de
maiores investimentos nos campos conceitual
e empírico nessa área de estudo. Segundo
Gresham e Lambros (1997), os instrumentos
de avaliação do comportamento do consumidor precisam de aprimoramento (o Capítulo
16 apresenta uma análise do comportamento
do consumidor).
A validade social refere-se à significância
social dos objetivos da intervenção, à aceitabilidade dos procedimentos e à importância social dos efeitos produzidos pelo tratamento.
154
ABREU-RODRIGUES, RIBEIRO & COLS.
Assim, ela abrange todas as fases do processo
terapêutico:
a) a fase inicial, fundamental para todo
o processo, na qual será definido o problema;
b) a fase intermediária de seleção, junto
ao cliente, das estratégias ou procedimentos a serem implementados, assim
como a implementação do tratamento;
c) a fase final, com os resultados obtidos.
A integridade da implementação de uma
intervenção, isto é, a aplicação efetiva dos procedimentos pelo cliente, pode indicar a aceitabilidade dos procedimentos. Assim, a insatisfação de pais e de professores com os procedimentos de tratamento pode conduzir a intervenções de menor qualidade (Gresham e
Lambros, 1997), o que, por sua vez, interferirá nos resultados de generalização alcançados.
O modelo de análise do comportamento
do consumidor elaborado por Foxall (2000)
apresenta dois tipos de reforçamento: utilitário e informacional, os quais são fundamentais para a compreensão das diferentes classes de comportamento do consumidor. O reforçamento utilitário relaciona-se aos resultados ou benefícios obtidos no tratamento, e
o reforçamento informacional ao feedback positivo de outras pessoas. O modelo da satisfação do consumidor apresentado por Foxall
pode contribuir para avanços na análise desse aspecto na clínica psicológica infantil, na
qual os clientes são a criança e seu(s) responsável(eis). Assim, pelo menos duas fontes de
investigação devem ser consideradas, a mãe
ou o pai, e a criança. A definição dos participantes do acompanhamento terapêutico dependerá de especificidades do problema-alvo
e do grupo familiar.
É historicamente recente a visão da criança
como um indivíduo pleno de direitos (Mendez e
Costa, 1994), e a terapia comportamental infantil, orientada pela filosofia do behaviorismo
radical, traz inovações importantes, como a
participação efetiva da criança (Conte e Regra,
2000). É adotada uma abordagem dinâmica,
histórica dos processos comportamentais, os
quais são multideterminados por fontes de con-
trole filogenéticas, ontogenéticas e culturais.
Essa abordagem funcional é contrária à uma
visão de unilateralidade causal dos comportamentos de uma criança, considerando-se apenas a influência do ambiente sobre ela. A abordagem analítico-comportamental é relacional,
o que significa dizer que o terapeuta está considerando as influências recíprocas entre o ambiente e a criança. Não são apenas os educadores que alteram os comportamentos da criança, ela também contribui de forma dinâmica no contexto em que interage. Pesquisas ilustram a contribuição efetiva da criança para a
sobrevivência de sua família em grandes centros urbanos (p. ex.: Gomes, 1992).
Portanto, a avaliação da satisfação do consumidor poderá conter análises sobre:
a) a extensão dos efeitos terapêuticos
para outras áreas na vida do cliente
ou as mudanças em uma classe de respostas que influenciam positivamente outras classes (validade habilitativa);
b) os reforços utilitários;
c) os reforços informacionais.
Os resultados de um tratamento serão definidos pelos custos e benefícios obtidos tanto
pelos adultos diretamente envolvidos como
pela criança.
A clínica psicológica analítico-comportamental infantil proporciona ganhos ao adulto,
responsável pela criança, diretamente envolvido no processo terapêutico. Ela promove o
autoconhecimento dos pais no decorrer da
análise dos comportamentos emitidos por uma
criança (Rocha e Brandão, 1997). A utilização
da análise funcional por todos os envolvidos,
ao longo do processo terapêutico; as discussões dos direitos das crianças, de estratégias
educativas, de suas possibilidades de aprendizagem, da importância de uma rotina de acompanhamento dos comportamentos de uma criança, da expressão de amor incondicional pelos pais (isto é, os comportamentos da criança
podem ser aprovados ou desaprovados, o que
é diferente de condicionar o amor dos pais a
esses comportamentos, contribuindo, assim,
para uma baixa auto-estima da criança) são
ANÁLISE DO COMPORTAMENTO
exemplos de ocasiões em que o terapeuta tem
a oportunidade de modelar comportamentos
funcionais e de rever conceitos que podem estar levando a insensibilidade dos educadores
a reais conquistas ou comportamentos da criança. Assim, os benefícios têm sido registrados
tanto para as crianças como para os adultos
diretamente envolvidos, o que fortalece a interpretação da satisfação do consumidor a partir da criança e do adulto responsável.
Dessa forma, a análise da satisfação do
consumidor, envolvendo os objetivos, os procedimentos e os resultados de uma intervenção clínica, é necessária para todos os envolvidos no processo terapêutico para a obtenção
de altos índices de integridade do tratamento
(Vasconcelos, no prelo). Um pai ou um professor que não tenha compreendido ou valorizado alguns procedimentos propostos em um tratamento poderá não implementá-los ou fazêlo de maneira inconsistente, contruibuindo,
assim, para a obtenção de resultados negativos de uma intervenção. A satisfação do consumidor e a integridade do tratamento são, portanto, dois aspectos que contribuem para a promoção da generalização dos resultados de um
tratamento no contexto clínico.
CONCLUSÃO
A promoção da generalização deve constituir um dos objetivos dos analistas do comportamento no contexto de intervenção. A
abordagem funcional no estudo da generalização destaca a importância de trabalhos empíricos voltados para a análise de variáveis que
controlam a ocorrência desse fenômeno. Um
aspecto fundamental é a utilização de termos
precisos, com descrições completas das intervenções implementadas. Revisões recentes sobre o tema generalização de estímulos mostram
que, em geral, as pesquisas focalizam algum
tipo de comportamento social sem, contudo,
apresentarem uma análise conceitual ou metodológica do tema (Osnes e Lieblein, 2002). A
utilização do termo generalização de estímulos
deve, portanto, incluir as variáveis potencialmente relevantes, presentes tanto no ambiente clínico como no ambiente natural. Defini-
155
ções claras e completas dos procedimentos de
intervenção de ambas as variáveis, dependente e independente, contribuem para o desenvolvimento de estudos sistemáticos no contexto de intervenção.
Os procedimentos de intervenção propostos por analistas do comportamento serão cada
vez mais reconhecidos ao promoverem efetivamente a generalização de estímulos (Osnes e
Lieblein, 2002). Não se pode apenas esperar
que esse resultado ocorra, naturalmente, ao
final do tratamento (Stokes e Baer, 1977;
Stokes e Osnes, 1989). A otimização da generalização ocorre com a seleção de estímulos
que estarão presentes durante todo o tratamento. Segundo Stokes e Baer (1977) e Stokes e
Osnes (1989), é possível programar a generalização por meio de diferentes manipulações:
a) outras crianças, adultos e terapeutas
poderão interagir com a criança-alvo
no ambiente terapêutico;
b) tarefas presentes no dia-a-dia da criança poderão ser selecionadas;
c) diferentes contextos (p. ex.: sessões
fora do ambiente clínico) poderão ser
programadas no decorrer do processo
terapêutico, e esses contextos extraclínica para interação terapeuta-cliente serão selecionados de acordo com
os objetivos do tratamento;
d) utilização de automonitoramento,
com um treino discriminativo voltado
para os próprios comportamentos da
criança, a auto-avalição;
e) a repetição de testes e de treinos até
que a generalização de estímulos seja
observada.
Essas manipulações envolvem algumas
das variáveis que poderão garantir resultados
positivos de generalização de estímulos ao final de um processo terapêutico.
No contexto de intervenção, os estudos
publicados sobre o tema generalização apresentam, em geral, as estratégias tecnológicas de
Stokes e Baer (1977) e de Stokes e Osnes
(1989) e são unânimes ao sugerir estudos sistemáticos da promoção da generalização. Investigações cujos esforços concentram-se no
156
ABREU-RODRIGUES, RIBEIRO & COLS.
controle de variáveis potencialmente envolvidas na ocorrência de generalização devem ser
consideradas como modelos para outras investigações. Um procedimento eficiente na produção de resultados positivos e esperados, mas
que necessita ser utilizado ad infinitum, porque não se conhecem as variáveis responsáveis pela manutenção e pelo espalhamento
desses resultados para outros contextos, pode
dificultar avanços nessa ciência, assim como
sua aceitação (Osnes e Lieblein, 2002).
REFERÊNCIAS BIBLIOGRÁFICAS
Alessi, G. (1987). Generative strategies and teaching
for generalization. The Analysis of Verbal Behavior, 5,
15-27.
American Psychiatric Association (1994). Diagnostic
and statistical manual of mental disorders (4th ed.). Washington, DC: Author.
Barkley, R. A. (1998). Attention-deficit hyperactivity
disorder: A handbook for diagnosis and treatment. New
York: Guilford.
Barrett, J. E. (1984). Behavioural principles in psychopharmacology. Em D. J. Sanger e D. E. Blackman (Eds.),
Aspects of psychopharmacology (p. 21-56). London:
Methuen.
Blackman, D. E.; Pellon, R. (1993). The contributions
of B. F. Skinner to the interdisciplinary science of behavioral pharmacology. British Journal of Psychology, 84,
1-25.
Brown, J. S.; Bilodeau, E. A.; Baron, M. R. (1951).
Bidirectional gradients in the strength of a generalized
voluntary response to stimuli on a visual spatial dimension. Journal of Experimental Psychology, 41, 52-61.
Catania, A. C. (1975). The myth of self-reinforcement.
Behaviorism, 3, 192-199.
Catania, A. C. (1999). Aprendizagem: Comportamento,
linguagem e cognição (D. G. Souza et al. trads.). Porto
Alegre: Artmed (Obra publicada originalmente em
1998).
Cavalcante, S. N.; Tourinho, E. Z. (1998). Classificação e diagnóstico na clínica: Possibilidades de um modelo analítico-comportamental. Psicologia: Teoria e Pesquisa, 14, 139-147.
Chandler, L. K.; Lubeck, R. C.; Fowler, S. A. (1992).
Generalization and maintenance of preschool children’s
social skills: A critical review and analysis. Journal of
Applied Behavior Analysis, 25, 415-428.
Conte, F. C. S.; Regra, J. A. G. (2000). A psicoterapia
comportamental infantil: Novos aspectos. Em E. F. M.
Silvares (Org.), Estudos de caso em psicologia clínica
comportamental infantil: Vol. 1. (p. 79-136). Campinas, SP: Papirus.
Cross, D. V.; Lane, H. L. (1962). On the discriminative
control of concurrent responses: the relations among
response frequency, latency, and topography in auditory
generalization. Journal of the Experimental Analysis of
Behavior, 5, 487-496.
Donahoe, J. W.; Palmer, D. C. (1994). Learning and
complex behavior. Needham Heights, MA: Allyn and
Bacon.
Dougher, M. J.; Markham, M. R. (1996). Stimulus classes and the untrained acquisition of stimulus functions.
Em T. R. Zentall e P. M. Smeets (Eds.), Stimulus class
formation in human and animals (p. 137-152). New
York: Elsevier.
Ducharme, D. E.; Holborn, S. W. (1997). Programming
generalization of social skills in preschool children with
hearing impairments. Journal of Applied Behavior
Analysis, 30, 639-651.
Edelstein, B. A. (1989). Generalization: Terminological,
methodological and conceptual issues. Behavior Therapy, 20, 311-324.
Falk, J. L. (1971). The origin and functions of adjunctive
behavior. Animal Learning and Behavior, 5, 325-335.
Farthing, G. W.; Hearst, E. (1968). Generalization gradients of inhibition after different amounts of training.
Journal of the Experimental Analysis of Behavior, 11,
743-752.
Fawcett, S. (1991). Social validity: A note on methodology.
Journal of Applied Behavior Analysis, 24, 235-239.
Fox, J. J.; McEvoy, M. A. (1993). Assessing and enhancing generalization and social validity of social-skills
interventions with children and adolescents. Behavior
Modification, 17, 339-366.
Foxall, G. R. (2000). Consumer situation: An operant
interpretation. Em J. C. Leslie e D. E. Blackman (Eds.),
Experimental and applied analyses of human behavior
(p. 293-312). Reno, NV: Context Press.
Gimenes, L. S. (1985). Padrões de comportamento induzidos por contingências. Revista de Psicologia, 3, 79-85.
Goldiamond, I. (1976). Alternate sets as a framework
for behavioral formulation and research. Behaviorism,
3, 49-86.
Gomes, J. V. (1992). Família e socialização. Psicologia,
3, 95-106.
Gresham, F. M.; Gansle, K. A.; Noell, G. H. (1993). Treatment integrity in applied behavior analysis with
children. Journal of Applied Behavior Analysis, 26, 257263.
Gresham, F. M.; Lambros, K. M. (1997). Behavioral and
functional assessment. Em T. S. Watson e F. M. Gresham
(Eds.), Handbook of child behavior therapy (p. 3-22).
New York: Plenum.
Grusec, T. (1968). The peak shift in stimulus generalization: Equivalent effects of errors and noncontingent shock. Journal of the Experimental Analysis of
Behavior, 11, 239-249.
Guttman, N.; Kalish, H. I. (1956). Discriminability and
stimulus generalization. Journal of Experimental
Psychology, 51, 79-88.
ANÁLISE DO COMPORTAMENTO
Hanson, H. M.; Guttman, N. (1961). The use of a
behavioral stimulant in the study of stimulus generalization. Journal of the Experimental Analysis of Behavior,
4, 209-212.
Harzem, P.; Miles, T. R. (1978). Conceptual issues in
operant behavior. New York: Wiley.
Hawkins, R. (1991). Is social validity what we are
interested in? Argument for a functional approach.
Journal of Applied Behavior Analysis, 24, 205-213.
Hearst, E.; Koresko, M. B.; Poppen, R. (1964). Stimulus
generalization and the response-reinforcement contingency. Journal of the Experimental Analysis of Behavior,
7, 369-380.
Honig, W. K. (1966). The role of discrimination training
in the generalization of punishment. Journal of the Experimental Analysis of Behavior, 9, 377-384.
Honig, W. K.; Urcuioli, P. J. (1981). The legacy of
Guttman and Kalish (1956): 25 years of research on
stimulus generalization. Journal of the Experimental
Analysis of Behavior, 3, 405-445.
Hughes, C.; Harmer, M. L.; Killian, D. J.; Niarhos, F.
(1995). The effects of multiple-exemplar self-instructional training on high school students’ generalized
conversational interactions. Journal of Applied Behavior
Analysis, 28, 201-218.
Hull, C. L. (1939). The problem of stimulus equivalence
in behavior theory. Psychological Review, 46, 9-30.
Keller, F. S.; Schoenfeld, W. N. (1968). Princípios de
psicologia (C. M. Bori e R. Azzi, trads.). São Paulo:
Herder (Obra publicada originalmente em 1950).
Kendall, P. C. (1981). Assessing generalization and the
single-subject strategies. Behavior Modification, 5, 307319.
Klein, M.; Rilling, M. (1974). Generalization of freeoperant avoidance behavior in pigeons. Journal of the
Experimental Analysis of Behavior, 21, 75-88.
Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic
psychotherapy. New York: Plenum.
Lashley, K. S.; Wade, M. (1946). The pavlovian theory
of generalization. Psychological Review, 53, 72-87.
Mazur, J. E. (1998). Learning and Behavior. New Jersey:
Prentice Hall.
Mednick, S. A.; Freedman, J. L. (1960). Stimulus generalization. Psychological Bulletin, 57, 169-200.
Mendez, E. G.; Costa, A. C. G. (1994). Das necessidades
aos direitos. São Paulo: Malheiros.
Migler, B.; Millenson, J. R. (1969). Analysis of response
rates during stimulus generalization. Journal of the Experimental Analysis of Behavior, 12, 81-87.
Millenson, J. R. (1975). Princípios de análise do comportamento (A. A. Souza; D. Rezende, trads.). Brasília:
Coordenada (Obra publicada originalmente em 1967).
Osnes, P. G.; Lieblein, T. (2002). An explicit technology of
generalization. The Behavior Analyst Today, 3, 364-374.
Peterson, L.; Homer, A.; Wonderlich, S. (1982). The
integrity of independent variables in behavior analysis.
Journal of Applied Behavior Analysis, 15, 477-492.
157
Pierrel, R. (1958). A generalization gradient for
auditory intensity in the rat. Journal of the Experimental Analysis of Behavior, 1, 303-313.
Pierrel, R.; Sherman, J. G. (1962). Generalization and
discrimination as a function of the SD-SΔ intensity difference. Journal of the Experimental Analysis of Behavior,
5, 67-71.
Pilgrim, C. (1998). The human subject. Em K. A. Lattal
e M. Perone (Eds.), Handbook of research methods in
human operant behavior (p. 15-44). New York: Plenum.
Pilgrim, C.; Galizio, M. (1996). Stimulus equivalence:
A class of correlations, or a correlation of classes? Em
T. R. Zentall; P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 173-195). New York:
Elsevier.
Razran, G. (1949). Stimulus generalization of conditioned responses. Psychological Bulletin, 46, 337-365.
Risley, T. (1964). Generalization gradients following
two-response discrimination training. Journal of the Experimental Analysis of Behavior, 7, 199-204.
Roberts, W. A. (1996). Stimulus generalization and
hierarchical structure in categorization by animals. Em
T. R. Zentall; P. M. Smeets (Eds.), Stimulus class
formation in human and animals (p. 35-54). Amsterdam: Elsevier.
Rocha, M. M.; Brandão, M. Z. S. (1997). A importância
do autoconhecimento dos pais na análise e modificação
de suas interações com os filhos. Em M. Delitti (Org.),
Sobre comportamento e cognição: Vol. 2. A prática da
análise do comportamento e da terapia cognitivocomportamental (p. 137-146). Santo André, SP: ARBytes.
Roche, B.; Barnes, D. (1997). The behavior of organisms? The Psychological Record, 47, 597-618.
Sherman, J. G.; Pierrel, R. (1961). Generalization of
auditory intensity as a function of amount of discrimination training. Journal of the Experimental Analysis
of Behavior, 4, 237-241.
Sidman, M. (1994). Equivalence relations and behavior.
A research story. Boston, MA: Authors Cooperative.
Skinner, B. F. (1938). The behavior of organisms. New
York: D. Appleton-Century.
Skinner, B. F. (1999). Sobre o behaviorismo (M. P.
Villalobos, trad.). São Paulo: Cultrix (Obra publicada
originalmente em 1974).
Skinner, B. F. (1998). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins
Fontes (Obra publicada originalmente em 1953).
Slivka, R. M.; Honig, W. K. (1964). Stimulus generalization and inhibitory control. The stimulus generalization of punishment. Journal of the Experimental
Analysis of Behavior, 7, 165.
Stokes, T. F. (1992). Discrimination and generalization.
Journal of Applied Behavior Analysis, 25, 429-432.
Stokes, T. F.; Baer, D. M. (1977). An implicit technology
of generalization. Journal of Applied Behavior Analysis,
10, 349-367.
Stokes, T. F.; Osnes, P. G. (1989). An operant pursuit of
generalization. Behavior Therapy, 20, 337-355.
158
ABREU-RODRIGUES, RIBEIRO & COLS.
Terrace, H. S. (1966). Stimulus control. Em W. K. Honig
(Ed.), Operant behavior: Areas of research and applications (p. 271-344). New Jersey: Prentice-Hall.
Urcuioli, P. J. (1996). Acquired equivalences and
mediated generalization in pigeon’s matching-tosample. Em T. R. Zentall e P. M. Smeets (Eds.), Stimulus
class formation in human and animals (p. 55-70).
Amsterdam: Elsevier.
Vasconcelos, L. A. (1999). Radiação ionizante: Efeitos
sobre a aquisição e o desempenho do comportamento
operante. Tese de Doutorado não publicada, Universidade de Brasília, Brasília, DF.
Vasconcelos, L. A. (2001). Terapia analítico-comportamental infantil: Alguns pontos para reflexão. Em H. J.
Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz
(Orgs.), Sobre comportamento e cognição: Vol 7. Expondo a variabilidade (p. 340-350). Santo André, SP:
Esetec.
Vasconcelos, L. A. (2002). Análise comportamental do
transtorno de déficit de atenção e hiperatividade: Implicações para avaliação e tratamento. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.),
Sobre comportamento e cognição: Vol. 10. Contribuições
para a construção da teoria do comportamento (p. 144154). Santo André, SP: Esetec.
Vasconcelos, L. A. (no prelo). Integridade do tratamento
e satisfação do consumidor na clínica analítico-com-
portamental infantil. Em M. Z. S. Brandão e F. C. S.
Conte (Orgs.), Sobre comportamento e cognição.
Wacker, D. P.; Berg, W. K.; Choisser, L.; Smith, J. (1989).
Evaluation of the generalized effects of a peer-training
procedure with moderately retarded adolescents.
Journal of Applied Behavior Analysis, 22, 261-273.
Wasserman, E. A.; Bhatt, R. S. (1992). Conceptualization of natural and artificial stimuli by pigeons. Em
W. K. Honig e J. G. Fetterman (Eds.), Cognitive aspects
of stimulus control (p. 203-223). Hillsdale, NJ: Erlbaum.
Weatherly, J. N.; Miller, K.; McDonald, T. W. (1999).
Social influence as stimulus control. Behavior and
Science, 29, 25-45.
Winograd, E. (1965). Maintained generalization testing
of conditioned suppression. Journal of the Experimental Analysis of Behavior, 8, 47-51.
Yarczower, M.; Dickson, J. F.; Gollub, L. R. (1966). Some
effects on generalization gradients of tandem schedules.
Journal of the Experimental Analysis of Behavior, 9, 631639.
Zentall, T. R. (1996). An analysis of stimulus class
formation in animals. Em T. R. Zentall e P. M. Smeets
(Eds.), Stimulus class formation in human and animals
(p. 15-34). Amsterdam: Elsevier.
Zentall, T. R.; Smeets, P. M. (Eds.) (1996). Stimulus
class formation in human and animals. New York:
Elsevier.
ANÁLISE DO COMPORTAMENTO
QUANTIFICAÇÃO DE ESCOLHAS
E PREFERÊNCIAS
159
9
JOÃO CLAUDIO TODOROV
ELENICE S. HANNA
A todo momento tomamos decisões, fazemos escolhas e demonstramos preferências.
Mesmo nos esquemas de reforçamento simples
existem outras respostas possíveis de serem
emitidas, concorrendo com a planejada, e reforços correspondentes (Herrnstein, 1961), que
geralmente não são analisados. Escolher é a
resposta a um entre dois ou mais estímulos
acessíveis e preferir é passar mais tempo respondendo (Skinner, 1950), ou responder mais
a um deles (Hanna, 1991). No entanto, se o
interesse está nas relações organismo-ambiente, uma instância de resposta em si não diz
nada. O fundamental é entender onde e quando escolha e preferência são observadas
(Todorov, 1981).
Os estudos sobre escolha e preferência em
pesquisa básica de análise do comportamento
utilizam contingências nas quais os reforços são
programados como conseqüências de respostas diferentes emitidas em situações diferentes, simultâneas e independentes. Nessas contingências de escolha contínua, denominadas
tecnicamente de esquemas concorrentes, duas
ou mais respostas incompatíveis (devido à impossibilidade de emiti-las simultaneamente)
são mantidas por diferentes esquemas de
reforçamento. Quando os esquemas concorrentes são de intervalos variáveis (conc VI VI), dois
esquemas de reforçamento de intervalo variável correspondem às duas alternativas disponíveis. Portanto, em cada alternativa, as respostas serão reforçadas após diferentes intervalos de tempo decorridos a partir da apresen-
tação do último reforço. O tamanho do esquema VI corresponde à média dos diferentes intervalos utilizados. Os procedimentos de escolha contínua têm sido de grande utilidade para
o avanço na quantificação da lei do efeito, ou
seja, para quantificar os efeitos de reforçamento e punição sobre o comportamento (de
Villiers, 1977).
Quando organismos podem escolher repetidas vezes entre pelo menos duas fontes diferentes de reforços, a proporção de escolha
de uma determinada fonte tende a igualar a
proporção de reforços obtidos daquela fonte,
seja no ambiente natural (Baum, 1974b), seja
em condições experimentais (Baum, 1974a;
1979; Herrnstein, 1961; 1970). Serão apresentados neste capítulo as relações funcionais e
os modelos matemáticos desenvolvidos para
descrever o comportamento de escolha, em
especial o denominado lei da igualação, e também serão discutidas sua generalidade em diferentes contextos e para o comportamento
humano e sua utilidade para análises e situações aplicadas.
LEI DA IGUALAÇÃO
Herrnstein foi o primeiro a investigar a
relação entre a distribuição do comportamento entre alternativas e a distribuição de estímulos reforçadores. No experimento original
(Herrnstein, 1961), alguns pombos foram usados como sujeitos. No procedimento padrão,
160
ABREU-RODRIGUES, RIBEIRO & COLS.
os animais são mantidos a 80% de seu peso,
determinado em condições de abundância de
alimento, têm água à vontade em suas gaiolas-viveiros individuais, mas obtêm alimentação principalmente por meio de seu trabalho
nas sessões experimentais. Uma câmara experimental típica para estudos de condicionamento operante com pombos tem um painel de respostas em uma das paredes, com dois discos
de plástico que podem ser vistos e alcançados
através de orifícios circulares na parede de metal, situados aproximadamente à altura da cabeça do pássaro. Os discos podem ser transiluminados por luzes de diferentes cores por meio
de um projetor controlado por circuitos
eletromecânicos. Bicadas no disco com força
de pelo menos 0,1 N abrem um relé e colocam
em ação outro circuito eletromecânico: as respostas podem ser registradas em contadores,
acionar um registrador cumulativo e, quando
determinado pelo esquema de reforço escolhido pelo experimentador, acionar um comedouro que coloca alimento à disposição do
pombo por um período de tempo que também
depende do esquema escolhido pelo pesquisador. É possível registrar não somente as respostas emitidas em cada alternativa (R1 e R2),
mas também o tempo que o sujeito gasta respondendo em cada disco (T1 e T2). Tipicamente, os pássaros respondem em uma alternativa
por um curto período, mudam para o outro
disco iluminado, respondem por outro curto
período, voltam a mudar de disco, e assim por
diante. Portanto, é possível medir as respostas
de mudança, bem como o número de respostas consecutivas e o tempo gasto em um disco
entre uma e outra resposta de mudança.
Ao formular a Lei da Igualação (matching
law), Herrnstein (1970) propôs que tanto as
medidas de número relativo de respostas quanto de tempo relativo igualam exatamente o número de reforços obtidos em cada alternativa:
C1/(C1 + C2) = R1/(R1 + R2)
(1)
T1/(T1 + T2) = R1/(R1 + R2)
(2)
Nessas equações C, T e R referem-se a medidas de freqüência do comportamento, de
tempo e de suas conseqüências, respectivamen-
te, e os números indicam as fontes alternativas de reforço.
Quando cada bicada do sujeito experimental é seguida pela possibilidade de acesso
ao alimento, a Equação 1 é supérflua, já que a
igualdade entre os termos é determinada pelo
esquema de reforço contínuo. Na Equação 2,
as igualdades entre tempo e resposta podem
não ser verificadas apenas quando o pássaro
se sacia, e a distribuição de tempo entre respostas de mudança diferem da distribuição de
respostas por incluir o tempo gasto em outras
atividades na câmara experimental.
O interesse gerado pelas Equações 1 e 2
decorre de sua aplicação a condições de reforço intermitente, quando o estímulo reforçador
é apresentado apenas eventualmente e de acordo com regras especificadas no esquema de
reforçamento (Ferster e Skinner, 1957). No experimento de Herrnstein (1961), cada disco
de plástico estava associado a um esquema de
reforçamento diferente a intervalos variáveis
(VI), o qual estabelecia que uma resposta seria
reforçada apenas quando passados t segundos,
em média, desde a última apresentação do estímulo reforçador. Os esquemas eram independentes um do outro e simultâneos. Nessas condições, o experimentador controla a freqüência máxima de reforços que podem ser obtidos
por sessão experimental, mas é o comportamento do sujeito que determina, até o limite
da distribuição programada pelo experimentador, qual a proporção de reforços a ser
obtida por meio das respostas em um determinado disco. Se o sujeito responde apenas em
um disco, todas as respostas e todos os reforços estão associados a esse disco, e a Lei da
Igualação é confirmada de maneira óbvia: a
Equação 1 não pode ser negada. Se um esquema programa três vezes mais reforços do que
o outro, e o sujeito distribui igualmente suas
respostas entre as alternativas, a Lei é negada:
a distribuição de respostas não iguala a distribuição de reforços obtidos.
Essa distribuição de 50% das respostas a
cada alternativa independentemente do número de reforços obtidos em cada esquema é mais
freqüente do que o bom senso nos levaria a
prever e ocorre por problemas específicos do
procedimento experimental. Com pombos
ANÁLISE DO COMPORTAMENTO
como sujeitos, por exemplo, antes de começar
um experimento é necessário treinar os pássaros para comer no comedouro e para bicar os
discos, usando alimento como reforço e alguma técnica de modelagem da resposta (Keller
e Schoenfeld, 1950; Skinner, 1953); normalmente, cada bicada é reforçada (esquema
CRF). Na primeira sessão experimental com
esquemas conc VI VI, os pombos tendem a alternar freqüentemente de um disco para o outro
quando as respostas não são reforçadas – a
extinção gera variabilidade no comportamento (Keller e Schoenfeld, 1950). Em vez de desempenhos independentes e concorrentes, é gerada uma cadeia simples: bicada no disco da
esquerda, mudança para o disco da direita, bicada no disco da direita, mudança para o disco da esquerda; a sequência continua até a
apresentação do estímulo reforçador – e a
sequência reforçada tende a ser repetida.
Herrnstein (1961) foi mais além, treinando explicitamente seus pombos na seqüência descrita
antes de iniciar o experimento. Quando uma
cadeia de alternações é estabelecida, os animais simplesmente não discriminam as fontes
alternativas de reforçamento. Ele contornou o
problema criado por si mesmo, programando
um atraso de reforço para respostas de
alternação (COD, do inglês changeover delay)
– nenhuma resposta poderia ser reforçada antes de se passarem 1 s e meio desde a última
resposta de alternação. O COD foi pensado por
Herrnstein como uma penalidade para mudanças de esquema e como uma maneira de separar temporalmente as respostas emitidas em
um esquema dos reforços obtidos em outro
esquema.
Quando um COD de pelo menos 3 s é
usado, ou alguma outra conseqüência de respostas de mudança que impeça a formação
de cadeias simples (cf. Baum, 1982; Boelens
e Kop, 1983; Pliskoff e Fetterman, 1981;
Todorov, 1971b; Todorov, Acuña-Santaella e
Falcón-Sanguinetti, 1982; Todorov e Souza,
1978), a Equação 1 tende a descrever bem a
relação entre comportamento e conseqüências
em esquemas conc VI VI. Entretanto há na literatura uma quantidade razoável de dados
experimentais para os quais a Equação 1 mostrou-se inadequada. Para trabalhar com esses
161
dados, Baum (1974a), estendendo uma proposta anterior (Baum e Rachlin, 1969), propôs a equação:
C1/C2 = k (R1/R2)sR
(3)
ou, na forma logarítmica,
log (C1/C2) = log k + sR log (R1/R2)
(4)
onde o parâmetro k é uma medida de viés, isto
é, uma preferência por uma alternativa causada por variáveis outras que não a freqüência
de reforços (cf. Cunha, 1988; Todorov, 1983;
Todorov e Bigonha, 1982), e o parâmetro sR é
uma medida da sensibilidade do comportamento à distribuição de reforços entre as alternativas
(cf. Hanna, Blackman e Todorov, 1992; Todorov
et al., 1983). No experimento original de
Herrnstein (1961), por exemplo, tanto k quanto sR são aproximadamente 1,0, e a Equação 3
é reduzida à Equação 1. Por sua utilidade no
estudo de desempenhos concorrentes nos mais
diferentes procedimentos, a Equação 3 passou
a ser conhecida como a Equação da Lei Generalizada de Igualação – Generalized Matching Law
(Baum, 1974a; 1979).
As Equações 3 e 4 têm-se mostrado extremamente úteis quando aplicadas a dados obtidos de várias espécies animais, incluindo o
homem; como pombos (Herrnstein, 1961,
1970), ratos (Todorov et al., 1982), bovinos
(Matthews e Temple, 1979), seres humanos
(Borges, 2002; Logue et al., 1986). O interesse pelo trabalho de Herrnstein levou a desenvolvimentos teóricos que aproximaram ainda
mais a psicologia experimental e a biologia, no
contexto da teoria da evolução (cf. Logue,
1988). Presume-se que os organismos têm
melhores chances de sobrevivência quando se
comportam de maneira a maximizar, ao longo
de um determinado período de tempo, a obtenção de reforços possíveis em uma dada situação (Rachlin, 1989; Rachlin et al., 1981).
Em determinadas condições experimentais restritivas, os organismos podem não conseguir
maximizar reforços e, ainda assim, igualar a
distribuição de respostas e a distribuição de
reforços obtidos (Herrnstein e Vaughan, 1980).
162
ABREU-RODRIGUES, RIBEIRO & COLS.
Como geralmente a igualação resulta em maximização de reforços, os organismos tendem a
igualar as distribuições de respostas e de reforços obtidos, alternando entre as fontes de
reforço de modo a manter iguais as taxas locais de reforço.
Portanto, a igualação seria um mecanismo simples, selecionado durante a evolução
das espécies, que resulta em maximização de
reforços a longo prazo (cf. Logue, 1988). Animais tenderiam a abandonar uma fonte de reforços sempre que a taxa local de obtenção de
reforços diminuísse em relação a fontes alternativas.
Normatização do procedimento
experimental
Relações funcionais entre comportamento e conseqüência não ocorrem no vácuo. A
igualação entre distribuições de respostas e reforços pode ser observada em condições experimentais adequadas. O conhecimento dessas
características de procedimento evoluiu ao longo da análise experimental do comportamento de escolha (Todorov, 1971a).
Conseqüências da resposta de mudança
Shull e Pliskoff (1967) investigaram o papel crítico exercido pela contingência de atraso de reforço para respostas de mudança (COD)
no desempenho de pombos mantidos por esquemas conc VI VI. A preferência pelo esquema programando maior densidade de reforço
aumenta com aumentos na duração do COD,
mas, a partir de um certo ponto, aumentos no
COD também alteram a distribuição de reforços obtidos, mantendo-se a igualdade entre distribuições de respostas e de reforços obtidos.
Sem COD ou com CODs de curta duração, a
distribuição de respostas tende a subigualar
(undermatch) a distribuição de reforços obtidos. Baum (1974b) e de Villiers (1977) argumentam que isso acontece porque a freqüência de alternância é muito alta, e os dois esquemas não são percebidos como independentes, mas sim como uma única fonte de refor-
ços para um único operante complexo – a cadeia de ir e voltar de uma alternativa para a
outra. Com CODs mais longos (de pelo menos
3 s), por outro lado, os pássaros têm de permanecer por pelo menos 3 s respondendo em
um esquema antes de mudar para outro, possibilitando, assim, o estabelecimento de controle discriminativo por cada esquema do par
concorrente.
Se o papel do COD é apenas o de diminuir a freqüência de respostas de mudança,
outras conseqüências que produzam esse mesmo efeito devem também facilitar o treino de
discriminação entre os dois esquemas. Todorov
(1971b) demonstrou que a punição direta das
respostas de mudança, seja por choques elétricos de curta duração, seja pela imposição de
um timeout (suspensão discriminada da contingência de reforço – Todorov, 1971a), produz os mesmos efeitos que o COD na taxa de
respostas de mudança e na distribuição de respostas e tempo entre os esquemas, sem afetar
a distribuição de reforços obtidos. Todorov e
colaboradores (1982) verificaram que a igualdade entre distribuições de respostas e de reforços pode ocorrer sem COD e sem punição
contingente a respostas de mudança, desde que
o operandum para mudanças seja claramente
diferente daqueles usados para respostas reforçadas de acordo com os esquemas do par
concorrente. Pliskoff, Cicerone e Nelson (1978)
e Pliskoff e Fetterman (1981) usaram um procedimento no qual a mudança de esquemas
ocorria depois de n respostas no disco de mudança (Findley, 1958). Quando a razão fixa
para respostas de mudança é muito alta, pode
ocorrer sobreigualação (overmatching), com a
proporção de respostas no esquema de maior
densidade de reforços maior do que a proporção de reforços obtidos naquele esquema – efeito também verificado com altas intensidades
de punição para respostas de mudança
(Todorov, 1971a; 1971b). Um efeito semelhante foi observado por Baum (1982) e por Boelens
e Kop (1983) quando as respostas em cada
esquema ocorriam em locais espacialmente
mais separados. Em todos esses casos, a manipulação na conseqüência da resposta de mudança provoca alterações no tempo consecutivo de exposição a cada esquema, provavelmen-
ANÁLISE DO COMPORTAMENTO
te melhorando as condições de discriminabilidade (Hanna et al., 1992; Hanna, Todorov e
Paula, 1985), como acontece com esquemas
múltiplos de reforço (Todorov, 1972).
Esse conjunto de estudos foi importante
para resolver uma questão que intrigava muitos pesquisadores (Todorov, 1974; Todorov e
Souza, 1978). Se a igualação resulta de um
processo comportamental que ocorre normalmente no ambiente natural, experimentos que
produzem dados que mostram o expoente da
Equação 3 muito diferente de 1,0 devem ser
vistos como desvios de um desempenho característico. Por outro lado, a Lei de Igualação não
teria nenhum significado especial se a igualdade entre distribuições fosse obtida somente
em condições experimentais muito restritas
(Boelens e Kop, 1983; Pliskoff e Fetterman,
1981). Esses experimentos mostraram, em seu
conjunto, que a igualação pode ser obtida com
ou sem um COD, desde que o procedimento
utilizado resulte em uma separação espacial
e/ou temporal de respostas na presença de um
esquema de reforços obtidos no outro esquema do par concorrente. Apesar de ser quase
um procedimento padrão, o uso do COD acarreta subprodutos indesejáveis quando comparado a outros procedimentos possíveis
(Todorov, 1982; Todorov e Ramirez, 1981).
História experimental dos sujeitos
Uma das vantagens do uso de animais na
psicologia experimental é a possibilidade de
conhecimento e de controle sobre a história
de vida dos sujeitos experimentais. Todorov e
colaboradores (1983) demonstraram que parte da variabilidade encontrada na literatura
sobre o valor do expoente da Equação 3 devese ao uso de animais com experiência anterior
em problemas semelhantes. Em alguns países,
pombos são caros e difíceis de ser encontrados
e costumam ser utilizados como sujeitos em
sucessivos experimentos. Quanto maior a experiência dos pombos com esquemas concorrentes, menor o expoente que mede a sensibilidade do comportamento a mudanças na distribuição de reforços entre os esquemas; ou
seja, o comportamento de escolha dos pássaros
163
torna-se cada vez menos sensível. Mesmo com
animais experimentalmente ingênuos, o efeito da experiência manifesta-se quando o
experimentador programa muitas condições
experimentais. Não há informações sobre um
efeito semelhante em outros animais. Ratos
vivem menos e seres humanos são mais ariscos
(Borges, 2002; Neves, 1989). O experimentador fica satisfeito quando consegue estudar
o mesmo rato durante dois anos e o mesmo
aluno universitário por duas semanas.
Critérios de estabilidade
Em um experimento típico com esquemas
conc VI VI, o mesmo par de esquemas permanece em vigor em sucessivas sessões experimentais diárias até que o desempenho estabilize-se na situação. Quando, por exemplo, o
esquema da esquerda programa três vezes mais
reforços do que o esquema da direita, os sujeitos costumam distribuir as respostas entre os
esquemas no início da primeira sessão experimental. Gradualmente, nas sessões seguintes,
a concentração de respostas no disco da esquerda aumenta. Considera-se que a estabilidade do desempenho foi alcançada quando não
há mais diferença significativa entre as distribuições de respostas em sessões consecutivas.
Não há, entretanto, consenso sobre qual critério de estabilidade deveria ser tomado como
padrão. A variabilidade dos critérios explica
parte da variabilidade encontrada no valor do
expoente da Equação 3. Todorov e colaboradores (1983) demonstraram que o valor do
expoente tende a ser mais próximo de 1,0 quanto maior for o número de sessões por condição
experimental.
Preferência viciada: viés causado
pelo tipo de esquema
Depois do trabalho de Shull e Pliskoff
(1967), as primeiras críticas ao trabalho de
Herrnstein vieram de pesquisadores que investigaram o desempenho concorrente usando
outros esquemas que não os esquemas VI. Com
esquemas concorrentes de razão fixa e intervalo
164
ABREU-RODRIGUES, RIBEIRO & COLS.
variável (conc FR VI), o desempenho característico não pode ser adequadamente descrito pela
Equação 1. É gerado um forte viés na resposta
em favor do esquema FR, o que é compreensível: em esquemas de razão, a freqüência de reforços depende da freqüência de respostas –
quanto mais rápido o animal responde maior
o número de reforços obtidos. Apesar dessa preferência viciada pelo esquema de razão, a sensibilidade do comportamento a mudanças na
razão de reforços obtidos entre os esquemas é
a mesma encontrada em experimentos com
dois esquemas VI (Bacotti, 1977; Cunha, 1988;
Todorov e Hackradt, 1980; 1981; Todorov et
al., 1982).
Características adequadas de procedimento
A relação entre distribuição de respostas
ou de tempo gasto respondendo em esquemas
concorrentes e a distribuição de reforços obtidos nesses esquemas é adequadamente observada quando algumas características essenciais
de procedimento e de análise de dados são seguidas. O procedimento deve ser tal que garanta o estabelecimento de controle de estímulos
de cada esquema do par concorrente sobre a
resposta a ele associada (Baum, 1982; Pliskoff
et al., 1978; Todorov, 1971a; 1971b). A diferença entre os valores da variável independente
em condições experimentais sucessivas deve ser
grande – valores semelhantes levam a dificuldades no estabelecimento do controle discriminativo e podem provocar viés em favor de uma
das alternativas (Todorov, 1982). O critério de
estabilidade deve ser estrito e assegurar suficiente número de sessões por condição experimental (Todorov et al., 1983).
Extensão para outros parâmetros
do estímulo reforçador
Magnitude do estímulo reforçador
A transformação logarítmica da equação
da igualação facilitou o estudo de outros parâmetros do estímulo reforçador. Por exemplo,
Neuringer (1967) havia proposto uma exten-
são da equação original de Herrnstein (1961)
para situações nas quais tanto a freqüência
como a magnitude (duração do acesso ao alimento cada vez que a resposta era reforçada)
dos estímulos reforçadores alternativos variassem. Neuringer propôs uma simples regra multiplicativa para relacionar a distribuição de respostas à distribuição dos efeitos combinados
de freqüência e duração do reforço:
C1/C2 = (R1A1/R2A2)
(5)
onde 5 A é a duração do estímulo reforçador.
Entretanto Schneider (1973) e Todorov
(1973), independentemente, demonstraram
que, em situações de escolha nas quais tanto a
freqüência como a magnitude dos estímulos
reforçadores variam, a freqüência é mais importante do que a magnitude:
Log (C1/C2) = log k + sR log (R1/R2)
+ sA log (A1/A2)
(6)
onde os símbolos são os mesmos das equações
anteriores e sA é o expoente que mede a sensibilidade do comportamento a alterações na
magnitude de reforço, seja em termos de duração de acesso ao alimento para pombos
(Oscós e Todorov, 1978; Todorov, 1973;
Todorov, Hanna e Bittencourt de Sá, 1984), seja
em termos de número de pelotas de alimento
para ratos (Schneider, 1973). Nos experimentos citados, o expoente da Equação 5 para freqüência de reforço (sR) foi próximo de 1,0 e o
expoente para magnitude (sA) ao redor de 0,5.
Atraso de reforço
No ambiente natural, nem sempre a conseqüência de um comportamento é imediata à
emissão da resposta. É comum que um certo
tempo decorra entre a resposta reforçada e a
apresentação do estímulo reforçador (atraso
de reforço). A história da análise experimental
dos efeitos das alterações na duração do atraso de reforço é longa (cf. Azzi et al., 1964).
Chung e Herrnstein (1967) estudaram os efeitos das variações na duração do atraso de re-
ANÁLISE DO COMPORTAMENTO
forço em esquemas conc VI VI e concluíram que
o princípio da igualação aplicava-se também
aos dados de seu experimento:
C1/C2 = [1/(1 + D1)]/[1/(1 + D2)]
165
Rodriguez e Logue (1986) usaram outra
variante ao manipularem os valores de duração
e atraso e de atraso de reforço mantendo constantes e iguais as freqüências de reforços:
(7)
log (C1/C2) = log k + sA log (A1/A2) + sD log (D2/D1) (10)
onde D é a duração do atraso.
Williams e Fantino (1978), entretanto, reanalisaram os dados de Chung e Herrnstein
(1967) usando outra equação:
log (C1/C2) = log k + sD log (D2/D1)
(8)
onde sD é a sensibilidade do comportamento a
variações no atraso de reforço. A reanálise dos
dados mostrou que no experimento de Chung
e Herrnstein (1967) o valor de sD na Equação
8 foi diferente para atrasos curtos e para atrasos mais longos – logo, sD não seria uma constante independente do valor absoluto do atraso de reforço.
Freqüência, magnitude e
atraso do estímulo reforçador
Dificuldades na aplicação do princípio de
igualação para atraso de reforço em esquemas
concorrentes já haviam sido apontadas anteriormente (p. ex.: MacEween, 1972; Squires e
Fantino, 1971). Entretanto Logue e colaboradores (1986) têm publicado dados que mostram a aplicabilidade desse princípio para situações em que freqüência, quantidade (magnitude) e atraso de reforço são sistematicamente variados na seguinte equação:
log (C1/C2) = log k + sR log (R1/R2) + sA log (A1/A2)
+ sD log (D2/D1)
(9)
A Equação 9 é a equação generalizada de
igualação proposta por Baum (1974b) em sua
forma mais ampla. Quando os esquemas alternativos programam reforços de mesma duração e atraso, a Equação 9 é reduzida à Equação 4. Quando apenas os atrasos são iguais, ela
é reduzida à Equação 6. Quando as magnitudes
e freqüências são iguais e os atrasos são diferentes, a Equação 9 é reduzida à Equação 8.
valores de sA e sD ao redor de 0,5 foram obtidos e confirmados em um experimento posterior (Chavarro e Logue, 1988, Experimento 2).
Em suma, a Equação 9 – a equação generalizada de igualação (Baum, 1974b, 1979,
1983) – tem-se mostrado adequada para descrever a relação entre o comportamento de escolha e suas conseqüências. Dados experimentais têm mostrado (p. ex.: Rodriguez e Logue,
1986; Schneider, 1973; Todorov, 1973) que organismos, em situação de escolha, são mais sensíveis a variações na freqüência relativa de reforços do que a variações em magnitude relativa ou atraso relativo – um princípio não previsto por teorias que afirmam que os indivíduos tendem a distribuir suas respostas para
maximizar os reforços disponíveis (p. ex.:
Logue, 1988; Rachlin et al., 1981; Rachlin et
al., 1986).
O PRINCÍPIO DA RELATIVIDADE
NA EQUAÇÃO DA IGUALAÇÃO
Todas as equações apresentadas até agora envolvem relações entre razões. O pressuposto de que ocorre igualdade entre as medidas relativas de comportamento e os
parâmetros do estímulo reforçador até recentemente não foi questionado. Herrnstein
(1970) foi convincente quanto à freqüência
de reforço: valores absolutos seriam irrelevantes. A razão entre respostas iguala a razão
entre reforços para quaisquer valores absolutos desses números.
Literalmente centenas de relatos experimentais têm sido publicados nos últimos 40
anos, todos direta ou indiretamente apoiando
o princípio da relatividade. Recentemente, entretanto, esse princípio tem sido questionado
para valores relativos tanto de freqüência quanto de magnitude e atraso de reforço (Alsop e
166
ABREU-RODRIGUES, RIBEIRO & COLS.
Davison, 1988; Alsop e Elliffe, 1988; Davison,
1988; Davison e Hogsden, 1984; Dunn, 1990;
Logue e Chavarro, 1987). Novos dados foram
apresentados, e experimentos anteriores foram
revistos na defesa da noção de que a sensibilidade do comportamento a parâmetros relativos do estímulo reforçador varia com mudanças nos valores absolutos desses parâmetros.
Logue e Chavarro (1987) estudaram o comportamento de pombos em esquemas concorrentes nos quais os valores relativos de freqüência, de magnitude e de atraso de reforço foram
mantidos constantes, e seus valores absolutos
foram manipulados em três experimentos. Os
autores concluíram que os dados de seus experimentos mostram uma violação do princípio da
relatividade para os três parâmetros do estímulo reforçador. Alsop e Elliffe (1988), Alsop e
Davison (1988), Davison (1988) e Dunn (1990)
afirmaram que seus dados corroboravam as
observações de Logue e Chavarro (1987).
Inúmeros trabalhos mais recentes, contudo, colocam em dúvida as conclusões de
Alsop e Elliffe (1988), de Alsop e Davison
(1988), de Davison (1988), de Dunn (1990) e
de Logue e Chavarro (1987), questionando
seus procedimentos experimentais, reanalisando seus dados e produzindo novos dados
com procedimentos corretos (Todorov, 1991a;
1991b; 1991c; 1991d; 1991e; Todorov, Coelho e Beckert, 1993). Com relação ao atraso
de reforço, por exemplo, Todorov (1991e) argumenta que o problema talvez esteja no viés
do experimentador:
Desde Chung e Herrnstein (1967) a questão
tem sido vista como se envolvesse um
parâmetro do estímulo reforçador. Outra possibilidade envolve uma visão molar da situação de escolha. Organismos podem distribuir
o tempo entre alternativas de acordo com a
distribuição de reforços entre elas, mesmo
quando o experimentador interfere com essa
distribuição ao impor diferentes períodos de
atraso de reforço. Denotando por tl o tempo
livremente gasto respondendo em uma alternativa e tf o tempo imposto pela contingência
de atraso, o tempo total gasto pelo sujeito experimental nessa alternativa (T) será:
Tt = tl + tf
(11)
A relação entre a distribuição do tempo total
e a distribuição de reforços entre as alternativas 1 e 2 seria:
log (Tt1/Tt2) = log k + sR log (R1+R2)
(12)
que é a mesma Equação 2 com uma nova definição de tempo aplicada a esquemas concorrentes encadeados (Todorov, 1991f, p. 310).
No procedimento tradicional de esquemas
concorrentes encadeados (Autor, 1969), no elo
inicial opera um conc VI VI. As respostas em
um dos esquemas são consequenciadas pela
mudança de estímulos (luzes dos discos) que
sinaliza a entrada no elo terminal correspondente, e as respostas no elo terminal são seguidas pelo reforço primário. Uma vez no elo terminal, apenas uma alternativa está disponível,
e o elo de escolha inicial somente é restabelecido após a liberação do reforço. O objetivo
original da utilização do procedimento de esquemas concorrentes encadeados era o de se
estudar o efeito de reforçadores condicionados (Ferster e Skinner, 1957; Kelleher e Gollub,
1962), já que nesse procedimento as escolhas
no elo inicial são seguidas por reforçadores
condicionados (estímulos que sinalizam os elos
terminais). Com a descoberta de relações ordenadas entre a distribuição de respostas no
elo inicial e reforços obtidos no elo terminal
(Autor, 1969), e com o crescente interesse em
avaliar o desconto no valor do reforçamento
produzido pela distância entre a escolha e a
liberação dos reforços primários, o objetivo
inicial foi perdido. Além disso, na forma original de programar concorrentes encadeados, a
distribuição dos reforços condicionados é equivalente à dos reforços primários, o que impede a avaliação dos efeitos independentes de
cada variável. Todorov e colaboradores (2003)
propuseram a retomada da questão do peso
relativo de reforçadores primários e condicionados na determinação do comportamento em
situação de escolha. Para isso, foi adicionada
ao procedimento tradicional de esquemas concorrentes encadeados uma chave de resposta
no elo terminal que possibilitava o retorno ao
elo inicial, suspendendo o elo terminal em vigor. Nesse novo procedimento, a distribuição
ANÁLISE DO COMPORTAMENTO
de reforços primários obtidos no elo terminal
diferencia-se da distribuição de reforços condicionados obtidos no elo inicial quando ocorrem respostas na chave de retorno, permitindo o teste da equação:
log (C1/C2) = log K + sR log (R1/R2) + sr log (r1/r2) (13)
onde r indica o número de reforçadores condicionados e sr a sensibilidade do comportamento à distribuição de reforçadores condicionados. Só é possível uma análise a partir da
Equação 13 se ocorrerem respostas de retorno, tornando as taxas de reforçamento primário e condicionado diferentes. Entretanto,
observou-se uma taxa de respostas de retorno muito próxima a zero para todos os sujeitos e, portanto, um procedimento mais adequado para o estudo de tais relações necessita ser desenvolvido.
IGUALAÇÃO E
COMPORTAMENTO HUMANO
Com o aumento do número de estudos
sobre escolha, cresceu também o interesse pela
avaliação da generalidade do fenômeno para
o comportamento humano (ver revisão de
Bradshaw e Szabadi, 1988; Pierce e Epling,
1983) e das possíveis aplicações em ambiente
natural (p. ex.: McDowell, 1988; Pierce e
Epling, 1995).
Quanto à generalidade do fenômeno para
o comportamento humano em uma situação
experimental, existem discrepâncias na literatura sobre a adequação da lei generalizada da
igualação para descrever a escolha de participantes humanos adultos. Enquanto em alguns
estudos foram relatados resultados semelhantes aos encontrados com outros animais (p. ex.:
Baum, 1975; Bradshaw, Szabadi e Bevan,
1976; 1979; Buskist e Miller, 1981; Conger e
Killeen, 1974; Savastano e Fantino, 1994), em
outros foram encontrados grandes desvios da
igualação (p. ex.: Navarick e Chellsen, 1983;
Oscar-Berman et al., 1980; Pierce, Epling e
Greer, 1981).
Kraft e Baum (2001) demonstraram a generalidade da igualação para o comportamen-
167
to social humano ao estudarem a escolha de
cartões coloridos que davam direito a prêmios
em dinheiro ao grupo. Os autores observaram
que os grupos escolheram os cartões azuis e
vermelhos na mesma razão de pontos que estavam associados aos cartões.
Horne e Lowe (1993; ver também Lowe
e Horne, 1985) questionaram a adequação do
modelo para descrever o comportamento humano, relatando que o desempenho de escolha de muitos participantes dos seis experimentos realizados por eles foi pobremente descrito pela equação de igualação. As variáveis manipuladas nos estudos foram COD, dicas
ordinais relacionadas às freqüências de reforços programadas e/ou instruções que descreviam as relações ordinais entre os estímulos
correlacionados aos esquemas e às freqüências
programadas de reforços. Para metade dos
participantes, a Equação 4 descreveu 80% ou
mais da variação do comportamento de escolha. A ênfase dos autores, entretanto, foi dada
ao desempenho do restante dos participantes
que não confirmaram a relação de igualação e
ao desempenho de dois participantes que se
conheciam e conversaram sobre o experimento, tendo um deles modificado suas escolhas
de uma sessão para a outra após ter sido informado de como o companheiro fazia as suas
escolhas. Horne e Lowe afirmaram que a aquisição do comportamento verbal modifica o controle comportamental, sendo as regras geradas pelos próprios participantes determinantes
do desempenho que muitas vezes difere daquele predito pela igualação (p. ex.: Logue et
al., 1986; Lowe e Horne, 1985). Note que uma
explicação semelhante (utilizando a mediação
verbal) tem sido utilizada pelos mesmos
autores para explicar o fenômeno de equivalência de estímulos, conforme descrito no Capítulo 14.
Preocupados também com as diferenças
entre os resultados de estudos que utilizaram
animais infra-humanos e daqueles que utilizaram humanos, Takahashi e Iwamoto (1986)
avaliaram a influência (a) do uso de instruções sobre a independência dos esquemas concorrentes, (b) da exposição anterior dos participantes a esquemas simples e (c) da utilização de estímulos exteroceptivos diferentes,
168
ABREU-RODRIGUES, RIBEIRO & COLS.
correlacionados a cada componente do par
concorrente sobre a escolha humana. Vinte e
oito participantes foram divididos em 8 grupos, utilizando-se em cada grupo instrução (I),
e/ou exposição anterior a esquemas simples
(E), e/ou estímulos exteroceptivos diferentes
correlacionados a cada esquema do par concorrente (SD). Os oito grupos (Controle, I, E,
SD, IE, ISD, ESD e IESD) foram expostos à fase de
linha de base, à fase experimental (na qual era
inserido o procedimento especial) e, logo após,
retornaram à linha de base. Segundo os autores, apenas o Grupo IESD mostrou variações sistemáticas das razões de escolha com as razões
de reforços e sensibilidade relativamente alta
do comportamento de escolha à distribuição de
reforços (expoente sR da Equação 3) para três
dos quatro participantes na fase experimental.
Como a diferença entre a fase experimental e o
retorno à linha de base para esses participantes
foi apenas a retirada dos estímulos discriminativos correlacionados (já que a instrução e a
experiência anterior não podem ser revertidas)
e como a sensibilidade do comportamento não
se manteve, Takahashi e Iwamoto sugeriram que
estes estímulos são necessários (mas não suficientes) para produzir sensibilidade às manipulações de razões de reforços.
Além das variáveis apontadas por Takahashi
e Iwamoto (1986) como responsáveis pelos resultados discrepantes, outros aspectos metodológicos têm sido considerados. Em geral, os
estudos com humanos realizam poucas sessões
em cada condição experimental e, portanto, os
resultados analisados referem-se a desempenhos em estado de transição. Evidências
empíricas têm demonstrado que a sensibilidade da escolha à distribuição de reforços (Equação 2) aumenta com o aumento no número de
sessões em cada condição (Hanna et al., 1992;
Todorov et al., 1983), sendo a igualação um
modelo descritivo do comportamento em estado estável.
É importante considerar também que os
estudos com humanos adultos geralmente utilizam como conseqüência das escolhas pontos
que são trocados por dinheiro ao final da sessão; em função disso, cabe questionar:
a) o valor reforçador dessa conseqüência para diferentes participantes;
b) a adequação da análise da contingência como esquemas concorrentes
simples.
No primeiro caso, diferentemente da operação de privação que é realizada com animais
para garantir o valor reforçador do alimento
ou da água, com humanos não existe garantia
de que os pontos são os reforçadores para todos os participantes. Esse argumento é reforçado pelo maior número de evidências a favor
da igualação com humanos quando reforçadores incondicionados são utilizados, como,
por exemplo, terminar um som alto (Solnick
et al., 1980). No segundo caso, questiona-se o
fato de se analisar de forma equivalente a contingência que libera reforçadores primários (alimento para pombos) e a que programa reforçadores condicionados de segunda ordem
(pontos), que serão trocados por dinheiro apenas no final da sessão, o qual por sua vez será
trocado por outros reforçadores condicionados
ou primários no ambiente natural. Diversas
evidências empíricas com animais infra-humanos têm mostrado que a Equação 3, desenvolvida para concorrentes simples, não descreve
adequadamente a escolha sob concorrentes
encadeados, devendo ser incluídos no modelo
aspectos adicionais da contingência (compare
as Equações 3 e 13 como exemplo, mas existem diversos modelos matemáticos desenvolvidos para descrever o desempenho em concorrentes encadeados).
O desempenho de escolha de humanos
adultos em situação experimental, em resumo, tem apresentado uma variabilidade intersujeitos em diferentes estudos: existem evidências a favor e contra a generalidade da
igualação para descrever a distribuição de respostas ou do tempo alocado. Conclusões finais são, no entanto, dificultadas pelas diferenças metodológicas geralmente existentes
nos estudos com humanos e entre os estudos
com humanos e outros animais. A discussão
de algumas das importantes variáveis a serem
consideradas foi apresentada e pode explicar
pelo menos parte das discrepâncias encontra-
ANÁLISE DO COMPORTAMENTO
das nos resultados com animais infra-humanos e humanos.
APLICAÇÕES DA RELAÇÃO
DE IGUALAÇÃO
Um dos relatos que confirma a adequação da relação de igualação para descrever o
comportamento humano em um ambiente natural é bastante recente (Symons et al., 2003)
e replica estudos anteriores (p. ex.: Carr e
McDowell, 1980; McDowell, 1981). Esse estudo foi realizado com um homem de 36 anos
com diagnóstico de autismo e retardo mental
profundo, que batia a mão na cabeça ou nas
pernas com força. Os comportamentos de
automutilação e de comunicação apropriada
foram analisados em relação à freqüência de
interações com os profissionais (repreensão,
dica, elogio e contato físico), as quais seguiam
esses comportamentos. A freqüência relativa
de automutilação decresceu com o aumento
da freqüência relativa de reforçamento de comunicações apropriadas, conforme a predição
da relação de igualação.
O comportamento de atletas, quando escolhem entre diferentes tipos de jogadas, é um
contexto interessante para avaliar a relação de
igualação. A predição é de que, por exemplo, a
proporção de arremessos de 3 pontos por jogadores de basquete deve igualar a taxa relativa de cestas de 3 pontos, ou seja, o total de
cestas de 3 pontos dividido pelas cestas de 2 e
3 pontos. Vollmer e Bourret (2000) avaliaram
essa predição da igualação e comprovaram que,
para os 14 jogadores que jogaram mais tempo, a distribuição de arremessos de 2 e 3 pontos na temporada universitária de basquete
igualou às cestas realizadas de 2 e 3 pontos.
A aplicação e a divulgação dos princípios
comportamentais básicos têm enfatizado que,
para aumentar a freqüência de um comportamento desejável, deve-se apresentar uma conseqüência reforçadora e, para diminuir ou para
terminar um comportamento indesejável, a
extinção ou a punição deve ser utilizada. Entretanto a análise comportamental aplicada
pode ampliar as alternativas de intervenção ao
169
considerar os comportamentos e as conseqüências que concorrem com o comportamento-alvo
de um indivíduo. Essa forma de análise entende que o tempo ou o esforço despendido em
alguém ou em alguma situação é determinado
pelas conseqüências dessa escolha em relação
ao contexto de reforçamento total que o indivíduo obtém.
Considerando-se que em um determinado período de tempo um indivíduo pode emitir uma quantidade finita de respostas e que a
distribuição das respostas será proporcional à
distribuição de reforços obtidos nas diversas
alternativas disponíveis, é possível predizer
aumento em um comportamento “desejável”
não só quando os reforços do comportamento
alvo forem aumentados, mas também quando
reforços de comportamentos concorrentes forem reduzidos e uma diminuição em um comportamento “indesejável” não só quando os
reforços do comportamento-alvo forem suspensos, mas também quando reforços de comportamentos concorrentes forem ampliados.
Essas alternativas de intervenção são especialmente interessantes quando as conseqüências
do comportamento-alvo são dificilmente modificadas – terapeuta, pais, professores não têm
controle sobre a sua apresentação –, como no
caso de reforçamento automático. Estendendo-se a igualação para os outros parâmetros
de reforçamento, pode-se ampliar ainda mais
as possibilidades de intervenção para mudanças na magnitude e na imediaticidade relativas do reforçador.
Tomaremos como exemplo uma criança
com dificuldade de concentrar sua atenção em
tarefas escolares e que, muitas vezes, tira notas ruins devido à baixa freqüência de se engajar em tais tarefas. O procedimento mais comum utilizado pela escola é a adição de repreensão pelo professor ao comportamento
indesejado do aluno. De acordo com a análise
baseada na Equação 3, pode-se formular a hipótese de que a distribuição do comportamento do aluno reflete o valor relativo que as tarefas acadêmicas têm para ele. A repreensão da
professora não adiciona reforçamento às tarefas acadêmicas e muito menos reduz os reforçamentos para comportamentos alternativos
170
ABREU-RODRIGUES, RIBEIRO & COLS.
(p. ex.: conversar, brincar), portanto a predição é de que o comportamento do aluno não
se modificará. Suponhamos que a repreensão
seja realmente um estímulo aversivo para a
criança; pode-se, então, pensar que, nesse caso,
o valor reforçador das conseqüências para outras respostas seria reduzido e o aluno passaria a prestar mais atenção. É comum, entretanto, em uma sala de aula com muitos alunos
que o comportamento indesejável seja conseqüenciado pelo professor apenas esporadicamente, e a possibilidade de punição passe a
ser discriminada pela correlação com o olhar
do professor. Na ausência dos estímulos discriminativos para a contingência que inclui
repreensão, nenhuma mudança de comportamento é esperada. Se o professor, por outro
lado, aumentasse o reforçamento para realizar tarefas acadêmicas (p. ex.: adequando a
dificuldade da tarefa às condições da criança,
criando formas para que o sucesso seja
enfatizado, utilizando reforçadores naturais)
ou diminuísse as fontes de reforçamento alternativos (p. ex.: tirando os brinquedos ou os
coleguinhas “reforçadores” do ângulo de visão
da criança), estaria aumentando o valor relativo das conseqüências do comportamento desejável e, portanto, esperar-se-ia um aumento
das respostas nas tarefas acadêmicas. Note que
a análise a partir da noção de igualação implica necessariamente que o valor reforçador das
conseqüências seja definido pelos reforços obtidos e não pelos reforços programados. No
exemplo em questão, portanto, se se trata de
uma criança que não consegue aprender com
a metodologia adotada, seu comportamento dificilmente será bem-sucedido, mesmo que a
professora esteja decidida a, por exemplo, elogiar o empenho dela freqüentemente. Nesse
caso, a mudança inicial dependerá também do
replanejamento das tarefas de forma individualizada. Vários estudos confirmam as predições
de aumento ou de diminuição no comportamento-alvo de estudantes quando a freqüência de reforçamento para algum outro comportamento é modificada na direção oposta (p. ex.:
Ayllon, Layman e Kandel, 1975; Ayllon e
Roberts, 1974; Kirby e Shields, 1972).
Outros exemplos de aplicação em situação natural são apresentados no Capítulo 10
deste livro, que analisa o autocontrole como
um tipo especial de comportamento de escolha. A relevância do tema para a aplicação não
deve ser negligenciada pelo psicólogo que trabalha em contextos diferentes daquele no qual
ocorre o comportamento-alvo do cliente. Se no
consultório clínico a ênfase é dada ao comportamento-alvo, ele certamente saberá muito
pouco sobre o valor relativo do reforçamento,
e sua intervenção será limitada pelo desconhecimento de fatores determinantes. A aplicação
do princípio de igualação a cada caso não é
uma tarefa simples e possui limites metodológicos, conforme alerta Borrero e Vollmer
(2002). Em seção anterior já explicitamos as
condições necessárias para que a igualação
ocorra em situações controladas (p. ex.: contingência para resposta de mudança, conc VI
VI, comportamento estável). Essas condições
devem ser lembradas também em uma análise
funcional de fenômenos que ocorrem em situação natural, pois serão fatores limitantes também para a sua aplicação.
CONCLUSÃO
A Lei da Igualação e seu desenvolvimento contribuíram muito para a formalização de
relações organismo-ambiente na análise do
comportamento. Ao se trabalhar com a noção
de escolha, ampliou-se o foco da análise das
conseqüências de uma resposta para o contexto de reforçamento, que inclui as conseqüências de respostas concorrentes. Com essa mudança, novos fenômenos foram descobertos, e
interpretações diferentes foram desenvolvidas.
A relação de igualação, originalmente descrita
no comportamento de pombos, tem sido generalizada para diferentes espécies, comportamentos e contextos diferentes. Entretanto o
modelo já apresenta várias evidências de desvios (principalmente no comportamento humano) e os dois parâmetros livres da Equação 3
(definidos como constantes empíricas) variam
em função de diversos fatores (p. ex.: história
experimental, número de sessões, tipo de esquema, tamanho do COD, estímulos discriminativos). Isto sugere que o modelo não é completo, apesar de sua utilidade como instrumen-
ANÁLISE DO COMPORTAMENTO
to para analisar e descrever um conjunto de
relações freqüentemente encontradas no laboratório. Em decorrência disso, modelos matemáticos diferentes têm sido propostos (p. ex.:
Killeen, 1982; Killeen e Fantino, 1990), mas
nenhum deles é, ao mesmo tempo, tão simples
e tão geral.
Vários estudos com humanos têm confirmado a possibilidade de aplicação e exemplificado de que forma essa ferramenta de análise pode ser útil em contextos clínicos, esportivos e escolares, com diversos outros ainda necessitando ser explorados. A pesquisa básica
avançou muito nesse assunto nas últimas décadas. A aplicação desse conhecimento é um
acontecimento relativamente recente e com
evidências de sucesso. No Brasil, nossa contribuição tem sido significativa no que se refere à
pesquisa básica, mas estudos sobre a aplicação desse conhecimento ainda são escassos.
REFERÊNCIAS BIBLIOGRÁFICAS
Alsop, B.; Davison, M. (1988). Concurrent-chain performance: Effects of absolute and relative terminal-link
entry frequency. Journal of the Experimental Analysis of
Behavior, 49, 351-365.
Alsop, B.; Elliffe, D. (1988). Concurrent-schedule
performance: Effects of relative and overall reinforcer
rate. Journal of the Experimental Analysis of Behavior,
49, 21-36.
Autor, S. M. (1969). The strength of conditioned reinforcers as a function of frequency and probability of
reinforcement. In D. P. Hendry (Ed.), Conditioned
reinforcement (p. 127-162). Homewood, IL: Dorsey
Press.
Ayllon, T.; Layman, D.; Kandel, H. (1975). A behavioraleducational alternative to drug control of hyperactive
children. Journal of Applied Behavior Analysis, 8, 137146.
Ayllon, T.; Roberts, M. (1974). Eliminating discipline
problems by strengthening academic performance.
Journal of Applied Behavior Analysis, 7, 71-76.
Azzi, R.; Fix, D. S. R.; Keller, F. S.; Rocha e Silva, M. I.
(1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162.
Bacotti, A. V. (1977). Matching under concurrent fixedratio, variable-interval schedules of food presentation.
Journal of the Experimental Analysis of Behavior, 27,
171-182.
Baum, W. M. (1974a). Choice in free-ranging wild
pigeons. Science, 185, 78-79.
171
Baum, W. M. (1974b). On two types of deviation from
the matching law: Bias and undermatching. Journal of
the Experimental Analysis of Behavior, 22, 231-242.
Baum, W. M. (1975). Time allocation in human
vigilance. Journal of the Experimental Analysis of Behavior, 23, 45-53.
Baum, W. M. (1979). Matching, undermatching, and
overmatching in studies of choice. Journal of the Experimental Analysis of Behavior, 32, 269-281.
Baum, W. M. (1982). Choice, changeover and travel.
Journal of the Experimental Analysis of Behavior, 38,
35-49.
Baum, W. M. (1983). Matching, statistics, and common
sense. Journal of the Experimental Analysis of Behavior,
39, 499-501.
Baum, W. M.; Rachlin, H. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior,
12, 861-874.
Boelens, H.; Kop, P. F. M. (1983). Concurrent schedules:
Spatial separation of response alternatives. Journal of
the Experimental Analysis of Behavior, 40, 35-45.
Borges, F. S. (2002). Comportamento de escolha em humanos: Um estudo da diferença entre dizer e fazer. Dissertação de Mestrado não publicada, Universidade
Católica de Goiás, Goiânia, GO.
Borrero, J. C.; Vollmer, T. R. (2002). An application of
the matching law to severe problem behavior. Journal
of Applied Behavior Analysis, 35, 13-27.
Bradshaw, C. M.; Szabadi, E. (1988). Quantitative
analysis of human operant behavior. Em G. Darvey e D.
Cullen (Eds.), Human operant conditioning and behavior
modification (p. 225-259). Chichester, Sussex: Wiley.
Bradshaw, C. M.; Szabadi, E.; Bevan, P. (1976). Behavior
of humans in variable-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior,
26, 135-141.
Bradshaw, C. M.; Szabadi, E.; Bevan, P. (1979). The
effect of punishment on free-operant choice behavior
in humans. Journal of the Experimental Analysis of
Behavior, 31, 71-81.
Buskist, W. F.; Miller, H. L.; Jr. (1981). Concurrent
operant performances in humans: Matching when food
is the reinforcer. Psychological Record, 31, 95-100.
Carr, E. G.; McDowell, J. J. (1980). Social control of
self-injurious behavior of organic etiology. Behavior
Therapy, 11, 402-409.
Chavarro, A.; Logue, A. W. (1988). Sensitivity to amount
and delay of reinforcement: Effects of different types
of concurrent variable-interval schedules. The
Psychological Record, 38, 421-435.
Chung, S. H.; Herrnstein, R. J. (1967). Choice and delay
of reinforcement. Journal of the Experimental Analysis
of Behavior, 10, 67-74.
Conger, R.; Killeen, P. (1974). Use of concurrent operants in small group research: A demonstration. Pacific
Sociological Review, 17, 399-416.
Cunha, R. N. (1988). Análise das equações de Baum e
Davison: Esquemas de tempo e razão. Dissertação de
172
ABREU-RODRIGUES, RIBEIRO & COLS.
Mestrado não publicada, Universidade de Brasília,
Brasília, DF.
Davison, M. (1988). Concurrent schedules: Interaction
of reinforcer frequency and reinforcer duration. Journal
of the Experimental Analysis of Behavior, 49, 339-349.
Davison, M.; Hogsden, I. (1984). Concurrent variableinterval schedule performance: Fixed versus mixed
reinforcer durations. Journal of the Experimental
Analysis of Behavior, 41, 169-182.
de Villiers, P. A. (1977). Choice in concurrent schedules
and a quantitative formulation of the law of effect. Em W.
K. Honig; J. E. R. Staddon (Orgs.), Handbook of operant
behavior (p. 233-287). Englewood Cliffs, NJ: Prentice Hall.
Dunn, R. (1990). Timeout from concurrent schedules.
Journal of the Experimental Analysis of Behavior, 53,
163-174.
Ferster, C. B.; Skinner, B. F. (1957). Schedules of
reinforcement. New York: Appleton-Century-Crofts.
Findley, J. D. (1958). Preference and switching under
concurrent scheduling. Journal of the Experimental
Analysis of Behavior, 1, 123-144.
Hanna, E. S. (1991). Behavior analysis of complex
learning: Some determinants of choice. Tese de Doutorado não publicada, University of Wales, College of
Cardiff, Cardiff, UK.
Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992).
Stimulus effects on concurrent performance in
transition. Journal of the Experimental Analysis of
Behavior, 58, 335-347.
Hanna, E. S.; Todorov, J. C.; Paula, S. M. A. (1985).
Efeito da sinalização dos esquemas na sensibilidade
do desempenho concorrente a variações nas proporções de reforços. Anais da XV Reunião Anual de Psicologia (p. 82). Ribeirão Preto, SP: SPRP.
Herrnstein, R. J. (1961). Relative and absolute strength
of response as a function of frequency of reinforcement.
Journal of the Experimental Analysis of Behavior, 4, 267272.
Herrnstein, R. J. (1970). On the law of effect. Journal
of the Experimental Analysis of Behavior, 13, 243-266.
Herrnstein, R. J.; Vaughan, W. Jr. (1980). Melioration
and behavioral allocation. Em J. E. R. Staddon (Ed.),
Limits to action: The allocation of individual behavior
(p. 143-176). New York: Academic Press.
Horne, P. J.; Lowe, C. F. (1993). Determinants of human
performance on concurrent schedules. Journal of the
Experimental Analysis of Behavior, 59, 29-60.
Kelleher, R. T.; Gollub, L. R. (1962). A review of positive
conditioned reinforcement. Journal of the Experimental Analysis of Behavior, 5, 543-597.
Keller, F. S.; Schoenfeld, W. N. (1950). Principles of
psychology. New York: Appleton-Century-Crofts.
Killeen, P. R. (1982). Incentive theory: II. Models for
choice. Journal of the Experimental Analysis of Behavior,
38, 217-232.
Killeen, P. R.; Fantino, E. (1990). Unification of models
for choice between delayed reinforcers. Journal of the
Experimental Analysis of Behavior, 53, 189-200.
Kirby, F.; Shields, F. (1972). Modification of arithmetic
response rate and attending behavior in a seventh-grade
student. Journal of Applied Behavior Analysis, 5, 79-84.
Kraft, J. R.; Baum, W. M. (2001). Group choice: The
ideal free distribution of human social behavior. Journal
of the Experimental Analysis of Behavior, 76, 21-42.
Logue, A. W. (1988). Research on self-control: An
integrating framework. Behavioral and Brain Sciences,
11, 665-679.
Logue, A. W.; Chavarro, A. (1987). The effect on choice
of absolute and relative values of reinforcer delay,
amount, and frequency. Journal of Experimental
Psychology: Animal Behavior Processes, 13, 280-291.
Logue, A. W.; Peña-Correal, T. E.; Rodriguez, M. L.;
Kabela, E. (1986). Self-control in adult humans:
Variation in positive reinforcer amount and delay.
Journal of the Experimental Analysis of Behavior, 46,
159-173.
Lowe, C. F.; Horne, P. J. (1985). On the generality of
behavioural principles: Human choice and the matching
law. Em C. F. Lowe, M. Richelle, D. E. Blackman e C. M.
Bradshaw (Eds.), Behaviour Analysis and Contemporary
Psychology (p. 97-115). Londres: Erlbaum.
MacEween, D. (1972). The effects of terminal-link
fixed-interval and variable-interval schedules on
responding under concurrent chained schedules.
Journal of the Experimental Analysis of Behavior, 18,
253-261.
Matthews, L. R.; Temple, W. (1979). Concurrent
schedule assessment of food preference in cows. Journal
of the Experimental Analysis of Behavior, 32, 245-254.
McDowell, J. J. (1981). On the validity and utility of
Herrnstein’s hyperbola in applied behavior analysis. Em
C. M. Bradshaw, E. Szabadi e C. F. Lowe (Eds.),
Quantification of steady-state operant behaviour (p. 311324). Amsterdam: Elsevier/North-Holland.
McDowell, J. J. (1988). Matching theory in natural
human environments. The Behavior Analyst, 11, 95-109.
Navarick, D. J.; Chellsen, J. (1983). Matching versus
undermatching in the choice of humans. Behavior
Analysis Letters, 3, 325-335.
Neuringer, A. J. (1967). Effects of reinforcement magnitude on choice and rate of responding. Journal of the
Experimental Analysis of Behavior, 10, 417-424.
Neves, S. M. M. (1989). Comportamento de escolha em
humanos: Influência de diferentes freqüências e magnitudes de reforço. Dissertação de Mestrado não publicada,
Universidade de Brasília, Brasília, DF.
Oscar-Berman, M.; Heyman, G. M.; Bonner, R. T.; Ryder,
J. (1980). Human neuropsychology: Some differences
between Korsakoff and normal operant performance.
Psychological Research, 41, 235-247.
Oscós, A.; Todorov, J. C. (1978). On frequency and magnitude of reinforcement in concurrent schedules. Revista Mexicana de Análisis de La Conducta, 4, 217-221.
Pierce, W. D.; Epling, W. F. (1983). Choice, matching,
and human behavior: A review of the literature. The
Behavior Analyst, 6, 57-76.
ANÁLISE DO COMPORTAMENTO
Pierce, W. D.; Epling, W. F. (1995). The applied importance of research on the matching law. Journal of
Applied Behavior Analysis, 28, 237-241.
Pierce, W. D.; Epling, W. F.; Greer, S. M. (1981). Human
communication and the matching law. Em C. M.
Bradshaw, E. Szabadi e C. F. Lowe (Eds.), Quantification
of steady-state operant behaviour (p. 345-348).
Amsterdam: Elsevier/North Holland Biomedical Press.
Pliskoff, S. S.; Fetterman, J. G. (1981). Undermatching
and overmatching: The fixed-ratio changeover requirement. Journal of the Experimental Analysis of
Behavior, 36, 21-27.
Pliskoff, S. S.; Cicerone, R.; Nelson, T. D. (1978). Local
response-rate constancy on concurrent variable-interval
schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 29, 431-446.
Rachlin, H. (1989). Judgment, decision and choice. New
York: Freeman.
Rachlin, H.; Battalio, R.; Kagel, J. H.; Green, L. (1981).
Maximization theory in behavioral psychology. The
Behavioral and Brain Sciences, 4, 371-417.
Rachlin, H.; Logue, A. W.; Gibbon, J.; Frankel, M.
(1986). Cognition and behavior in studies of choice.
Psychological Review, 93, 33-45.
Rodriguez, M. L.; Logue, A. W. (1986). Independence
of the amount and delay rations in the generalized matching law. Animal Learning and Behavior, 14, 29-37.
Savastano, H. I.; Fantino, E. (1984). Human choice in
concurrent ratio-interval schedules of reinforcement.
Journal of the Experimental Analysis of Behavior, 61,
453-463.
Schneider, J. W. (1973). Reinforcer effectiveness as a
function of reinforcer rate and magnitude: A comparison of concurrent performances. Journal of the Experimental Analysis of Behavior, 20, 461-471.
Shull, R. L.; Pliskoff, S. S. (1967). Changeover delay
and concurrent schedules: Some effects on relative
performance measures. Journal of the Experimental
Analysis of Behavior, 10, 517-527.
Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193-216.
Skinner, B. F. (1953). Science and human behavior. New
York: McMillan.
Solnick, J. V.; Kannenberg, C. H.; Eckerman, D. A.;
Walter, M. B. (1980). An experimental analysis of
impulsivity and impulse control in humans. Learning
and Motivation, 11, 61-77.
Squires, N.; Fantino, E. (1971). A model for choice in
simple concurrent and concurrent-chains schedules.
Journal of the Experimental Analysis of Behavior, 15,
27-38.
Symons, F. J.; Hoch, J.; Dahl, N. A.; McComas, J. J.
(2003). Sequential and matching analyses of selfinjurious behavior: A case of overmatching in the natural environment. Journal of Applied Behavior Analysis,
36, 267-270.
Takahashi, M.; Iwamoto, T. (1986). Human concurrent
performances: The effects of experience, instructions,
173
and schedule-correlated stimuli. Journal of the Experimental Analysis of Behavior, 45, 257-267.
Todorov, J. C. (1971a). Análise experimental do comportamento de escolha: Algumas considerações sobre
método em psicologia. Ciência e Cultura, 23, 585-589.
Todorov, J. C. (1971b). Concurrent performances: Effect
of punishment contingent on the switching response.
Journal of the Experimental Analysis of Behavior, 16,
51-62.
Todorov, J. C. (1972). Component duration and relative
response rates in multiple schedules. Journal of the Experimental Analysis of Behavior, 17, 45-49.
Todorov, J. C. (1973). Interaction of frequency and magnitude of reinforcement on concurrent performances. Journal
of the Experimental Analysis of Behavior, 19, 451-458.
Todorov, J. C. (1974). Desempenhos concorrentes:
Frequência de reforçamento e razão de respostas de
mudança. Anais da IV Reunião Anual de Psicologia (p.
1). Ribeirão Preto, SP: SPRP.
Todorov, J. C. (1982). Matching and bias in concurrent
performances: Effects of asymmetrical changeover delays.
Revista Mexicana de Análisis de La Conducta, 8, 39-45.
Todorov, J. C. (1983). Estados de transição e estados
transitórios. Anais da XIII Reunião Anual de Psicologia,
13, 327-342.
Todorov, J. C. (1991a). Relações quantitativas entre
medidas relativas de respostas e de atraso de reforço.
Resumos de Comunicações Científicas da XXI Reunião
Anual de Psicologia (p. 1). Ribeirão Preto, SP: SBP.
Todorov, J. C. (1991b). O pressuposto da relatividade
na lei generalizada de igualação. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia
(p. 2). Ribeirão Preto, SP: SBP.
Todorov, J. C. (1991c). Efeitos de freqüências absoluta
e relativa de reforços no desempenho concorrente: Uma
re-análise dos dados de Alsop e Elliffe (1988). Resumos de Comunicações Científicas da XXI Reunião Anual
de Psicologia (p. 3). Ribeirão Preto, SP: SBP.
Todorov, J. C. (1991d). Efeitos da freqüência absoluta
de reforços na relação entre preferência e magnitude
relativa de reforços: Uma re-análise de Davison (1988).
Resumos de Comunicações Científicas da XXI Reunião
Anual de Psicologia (p. 4). Ribeirão Preto, SP: SBP.
Todorov, J. C. (1991e). Sobre uma alegada violação do
pressuposto da relatividade quando a magnitude de
reforço varia em esquemas concorrentes. Resumos de
Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 5). Ribeirão Preto, SP: SBP.
Todorov, J. C. (1991f). Trinta anos de matching law:
Evolução na quantificação da lei do efeito. Anais da
XXI Reunião Anual da Sociedade de Psicologia de Ribeirão Preto, 300-314.
Todorov, J. C.; Acuña-Santaella, L. E.; Falcón-Sanguinetti, O. (1982). Concurrent procedures, changeover
delay and the choice behavior of rats. Revista Mexicana
de Análisis de la Conducta, 8, 133-144.
Todorov, J. C.; Bigonha, V. A. (1982, outubro). Esquemas concorrentes: Viés provocado pela qualidade do es-
174
ABREU-RODRIGUES, RIBEIRO & COLS.
quema. Trabalho apresentado na XII Reunião Anual da
Sociedade de Psicologia de Ribeirão Preto, Ribeirão Preto, SP.
Todorov, J. C.; Coelho, C.; Beckert, M. E. (1993). Efeito da freqüência absoluta de reforços em situação de
escolha: Um teste do pressuposto da relatividade na
Lei da Igualação. Psicologia: Teoria e Pesquisa, 9, 227242.
Todorov, J. C.; Hackradt, S. X. (1980). Problemas na
determinação de relações quantitativas em esquemas
concorrentes intervalo variável – razão fixa. Anais da X
Reunião Anual de Psicologia (p. 10). Ribeirão Preto, SP:
SPRP.
Todorov, J. C.; Hackradt, S. (1981). Esquemas concorrentes intervalo variável – razão fixa: Efeitos da qualidade e do intervalo entre reforços. Ciência e Cultura,
33, 812.
Todorov, J. C.; Hanna, E. S.; Bittencourt de Sá, M. C.
N. (1984). Frequency versus magnitude of reinforcement: New data with a different procedure. Journal of
the Experimental Analysis of Behavior, 41, 157-167.
Todorov, J. C.; Hanna, E. S.; Medeiros, C. A.; Coelho,
C.; Seco, D. (2003). Escolha em esquemas concorrentes encadeados: Teste de um novo procedimento. Estudos: Vida e Saúde, Goiania, 30, 1097-1106.
Todorov, J. C.; Oliveira-Castro, J. M.; Hackradt, S. X.
(1982). Relaciones cuantitativas en programas concurrentes intervalo variable – razon fija: Preferencia como
una función de los parametros del programa. Trabalho
apresentado no VI Congresso Mexicano de Análise do
Comportamento, México, DF.
Todorov, J. C.; Oliveira-Castro, J. M.; Hanna, E. S.; Bittencourt de Sá, M. C. N.; Barreto, M. Q. (1983). Choice,
experience, and the generalized matching law. Journal of
the Experimental Analysis of Behavior, 40, 99-111.
Todorov, J. C.; Ramirez, M. A. R. (1981). Delay of
reinforcement for responses which end pauses: Effects
on response rate. Revista Mexicana de Análisis de La
Conducta, 7, 135-139.
Todorov, J. C.; Souza, D. G. (1978). Minimum interchangeover intervals in concurrent schedules. Revista
Mexicana de Análisis de la Conducta, 4, 17-28.
Vollmer, T. R.; Bourret, J. (2000). An application of the
matching law to evaluate the allocation of two- and
three-point shots by college basketball players. Journal
of Applied Behavior Analysis, 33, 137-150.
Williams, B. A.; Fantino, E. (1978). Effects on choice
of reinforcement delay and conditioned reinforcement.
Journal of the Experimental Analysis of Behavior, 29,
77-86.
ANÁLISE DO COMPORTAMENTO
AUTOCONTROLE: UM CASO ESPECIAL
DE COMPORTAMENTO DE ESCOLHA
175
10
ELENICE S. HANNA
MICHELA RODRIGUES RIBEIRO
O termo autocontrole é, muitas vezes, relacionado com traços de personalidade, com
características inatas dos indivíduos ou com
uma força interior que possibilita o controle
de suas próprias ações. Esse uso do conceito
contrasta com o fato de que uma mesma pessoa pode apresentar graus diferentes de autocontrole em situações diferentes e mostrar
graus de autocontrole diferenciado em situações semelhantes, mas em etapas diversas da
sua vida. As crianças geralmente são descritas
como impulsivas. Muitos adultos, mesmo com
vontade, não choram quando sentem desconforto, enquanto as crianças dificilmente ficam
quietas quando se sentem incomodadas com
algo. Quando “agimos com responsabilidade”,
“para ser educado”, “para prevenir doenças”
ou “para ser ecologicamente correto”, em geral, é possível que não estejamos fazendo “aquilo que mais desejaríamos naquele momento”,
e sim pensando ou agindo em função das oportunidades futuras de ações e suas conseqüências. A importância desse fenômeno pela sua
possível relação com a auto-regulação, com a
preservação da espécie e do meio ambiente justificaria quaisquer esforços para explicitar melhor a influência do meio ambiente sobre a
aquisição e a manutenção de formas de agir
que possam ser chamadas de autocontrole
(Hanna e Todorov, 2002).
O estudo do autocontrole na análise experimental do comportamento está inserido
na área de comportamento de escolha, sendo
o estudo de Rachlin e Green (1972) sobre escolha com compromisso (commitment) um
clássico que provavelmente inspirou muitos
outros que o seguiram. Durante as décadas
de 1970 e 1980, o comportamento de escolha e a quantificação da lei do efeito, com
destaque para a relação de igualação (Baum,
1974; Herrnstein, 1970), dominaram o cenário da pesquisa básica. Uma das premissas que
possivelmente explica essa concentração de
esforços é a de que todo comportamento pode
ser visto como um comportamento de escolha, ou que todo comportamento envolve escolha (Herrnstein, 1970; Todorov, 1971). Mesmo em um ambiente bastante simplificado,
como em uma sala experimental, uma pessoa
pode escolher entre pressionar uma tecla, coçar-se, virar-se ou dormir, entre outros. As conseqüências dessas respostas são cruciais para
a determinação de preferências em determinados contextos (Mazur, 1986). Escolhas tais
como pressionar uma tecla com o dedo indicador ou com o dedo médio podem ter conseqüências fugazes ou insignificantes, enquanto escolhas como tomar uma vacina ou prestar um concurso que define uma profissão
podem ter conseqüências importantes e irreversíveis. A premissa de que todo comportamento pode ser analisado como uma escolha
implica, portanto, afirmar que teorias e pesquisas sobre escolha podem ser consideradas
como teorias ou pesquisas sobre o comportamento em geral.
176
ABREU-RODRIGUES, RIBEIRO & COLS.
DEFINIÇÃO DO TEMA
O trabalho de tradução de termos
mentalistas em interações comportamento-ambiente de Skinner incluiu o termo autocontrole.
No livro Ciência e comportamento humano
(Skinner, 1953) um capítulo foi dedicado à
discussão de que “O indivíduo freqüentemente
passa a controlar parte do seu próprio comportamento quando uma resposta tem conseqüências conflitantes – quando leva a ambos
os reforçamentos positivo e negativo” (p. 230).
O “controle do próprio comportamento” ocorre quando um comportamento (autocontrole
ou resposta controladora) tem como conseqüência a modificação de elementos de contingências que determinam comportamentos subseqüentes (resposta controlada). Em geral, chamamos de autocontrole quando a resposta
controladora deliberadamente é emitida para
reduzir impulsos. Nesse caso, é importante considerar a história individual dentro de uma
comunidade que estabelece propriedades
aversivas para o comportamento impulsivo e,
portanto, respostas que reduzem a probabilidade desse comportamento podem ser
fortalecidas.
Apesar da contribuição conceitual de
Skinner para a compreensão do autocontrole
como um fenômeno natural, foi Rachlin (1970)
quem introduziu o autocontrole no programa
de pesquisa dos analistas experimentais do
comportamento. Para Rachlin (p. 185):
Autocontrole é na realidade uma designação
incorreta para qualquer tipo de mudança autoinduzida, pois, embora padrões de comportamento possam vir de dentro de nós mesmos,
no sentido de que eles foram adquiridos antes ou pouco depois do nascimento, sejam
quais forem as causas que fizeram esses padrões aparecerem em um dado momento,
devem vir das interações com o ambiente naquele momento. Dessa forma, autocontrole na
realidade refere-se a certas formas de controle ambiental do comportamento.
Rachlin (1970; ver também Rachlin e
Green, 1972) define o autocontrole como a escolha de uma recompensa maior no futuro con-
tra uma recompensa menor no presente. Na
análise de Rachlin, portanto, o autocontrole
envolve uma situação de escolha na qual as
alternativas de resposta diferem quanto ao atraso e à magnitude do estímulo reforçador, sendo um reforçador maior e mais atrasado e o
outro, menor e imediato (ou menos atrasado).
Talvez a conseqüência mais importante da introdução do termo autocontrole na análise experimental tenha sido a de estabelecer como
foco de pesquisa a escolha em situações de
conflito. Em situações de escolha que diferem
apenas no atraso, observa-se uma preferência
pela alternativa com o menor atraso (p. ex.:
Chung e Herrnstein, 1967). Naquelas que diferem apenas na magnitude do reforço, a preferência pela maior magnitude é observada (p.
ex.: Catania, 1963). Quando as alternativas
de esquemas concorrentes ou concorrentes encadeados combinam o maior reforçador com
o maior atraso e o menor reforçador com o
menor atraso, mesmo predições qualitativas
não podem ser feitas. A situação é conflituosa
no sentido de que cada uma das alternativas
apresentadas para o sujeito possui características que seriam favorecidas em termos comportamentais se, em um dado momento, apenas
uma variável tivesse sendo manipulada
(Hanna, 1991).
O atraso de reforçamento foi definido por
Neuringer (1969) como o intervalo de tempo
entre a resposta e o reforçamento para aquela
resposta. Gentry e Marr (1980) sugeriram que
o atraso de reforçamento deveria ser definido
como um esquema de tempo fixo (FT) em vez
de um parâmetro do reforçamento, analisando
a contingência não mais como esquemas concorrentes simples, mas como esquemas concorrentes encadeados. Modelos de desempenhos
sob esquemas concorrentes encadeados fornecem uma descrição melhor para os efeitos de
contingências que incluem esses períodos do que
modelos para esquemas concorrentes sem atraso. Na realidade, atraso de reforçamento tem sido
usado como um termo genérico que descreve
vários procedimentos que introduzem um período de tempo entre a resposta requerida e a
ocorrência de reforçamento (Sizemore e Lattal,
1978). Como resultado disso, nos procedimen-
ANÁLISE DO COMPORTAMENTO
tos de escolha com atraso é difícil traçar uma
linha entre esquemas concorrentes e concorrentes encadeados (Hanna, 1991).
A segunda variável presente no paradigma do autocontrole é a magnitude de reforçamento. Magnitude de reforçamento é um termo
que se refere a vários parâmetros do reforçamento: pesos ou tamanhos, número de unidades de pesos ou tamanhos iguais, duração de
exposição, tempo de acesso ou concentração
de um nutriente solúvel (Guttman, 1953). No
caso de sujeitos humanos, a magnitude pode
estar relacionada também ao número de pontos recebidos, às fichas, à quantidade de dinheiro ou ao tempo de acesso a um jogo ou
vídeo (p. ex.: Darcheville, Rivière e Wearden,
1993; Millar e Navarick, 1984). A equivalência funcional desses diferentes aspectos de
reforçamento tem sido questionada (Bonem e
Crossman, 1988), e estudos adicionais são necessários para se chegar a uma conclusão sobre as evidências empíricas contraditórias.
Embora a proposta inicial de Rachlin
(1970) faça referência ao atraso e à magnitude de reforçamento, situações de conflito não
são restritas a essas variáveis, e contingências
semelhantes podem ser estudadas, covariandose inversamente quaisquer dois parâmetros de
reforçamento com efeitos semelhantes sobre a
escolha. Algumas situações desse tipo já foram
investigadas, como probabilidade e magnitude, custo de resposta e magnitude, entre outros (p. ex.: Cole, 1990; Downey e Vuchinich,
1990; Grossbard e Mazur, 1986; Rachlin,
Castrogiovanni e Cross, 1987).
CONTRIBUIÇÕES DA PESQUISA BÁSICA
O paradigma proposto por Rachlin (1970)
trata o autocontrole como formas de comportamento sujeitas a influências ambientais, permitindo, assim, o estudo experimental desse
fenômeno. Entre as variáveis que têm sido
investigadas estão os parâmetros de reforçamento (atraso, probabilidade, freqüência, qualidade e magnitude), a privação, a economia
alimentar e os aspectos de procedimento (forma de programar o esquema concorrente, es-
177
tímulos discriminativos e esvanecimento, para
citar alguns). Ainda utilizando o atraso do
reforçamento como base do autocontrole, o
modelo de Mischel de atraso de gratificação
(Mischel, Shoda e Rodriguez, 1989) tem mostrado uma correlação positiva entre atraso de
gratificação e desempenho escolar, inteligência e habilidades sociais. No procedimento utilizado por Mischel e colaboradores, os participantes deviam escolher entre recompensas
maiores e menores em situações reais ou hipotéticas. O participante permanecia em uma
sala e era instruído a escolher entre esperar
pelo retorno do experimentador para receber
a recompensa maior ou chamá-lo para receber a recompensa menor. Os efeitos de outras
variáveis como ausência ou presença da recompensa no momento da escolha (p. ex.:
Mischel e Ebbesen, 1970; Mischel, Ebbesen e
Zeiss, 1972), tipo de instrução (p. ex.: Mischel
et al., 1989) também foram analisados em relação ao desempenho na tarefa de atraso de
gratificação.
Entre os vários achados relatados na literatura, aqueles gerados por manipulações nos
valores relativos e absolutos dos atrasos de
reforçamento e pelo procedimento de esvanecimento do atraso são os mais robustos e já
foram objeto de replicações. Esses e outros resultados serão detalhados a seguir.
No estudo clássico de Rachlin e Green
(1972), foi utilizada a contingência, apresentada na Figura 10.1, com pombos, chamada
de escolha com compromisso. No elo inicial
do procedimento (esquemas concorrentes encadeados), foram programadas duas alternativas de respostas (chaves A e B), cada uma
levando a um elo terminal diferente. Respostas em A produziam eventualmente as condições de estímulo para R1 e R2, enquanto respostas em B produziam apenas as condições
de estímulo para R1. A emissão de R2 era seguida imediatamente por uma pequena quantidade de alimento, e a emissão de R1 era seguida por uma quantidade maior de alimento
após um atraso, caracterizando a alternativa
de autocontrole.
No estudo de Rachlin e Green (1972), alguns pombos foram expostos a esquemas
178
ABREU-RODRIGUES, RIBEIRO & COLS.
FIGURA 10.1 Diagrama da contingência de comprometimento utilizada por Rachlin e Green (1972).
concorrentes com um único esquema de razão fixa (FR) 25 operando no elo inicial, ou
seja, entradas no elo terminal ocorriam após a
vigésima quinta resposta independentemente
de qual chave havia sido bicada nas 24 respostas anteriores. Se a 25a resposta ocorresse na
chave B, no elo terminal sinalizado pela iluminação de uma das chaves de resposta, determinada randomicamente em cada tentativa,
era requerida uma única resposta nessa chave,
seguida por 4 s de blackout e, então, por 4 s de
acesso ao alimento (elo de compromisso com
a alternativa de autocontrole). Se a vigésima
quinta resposta ocorresse na chave A, no elo
terminal sinalizado pela iluminação das duas
chaves (elo de escolha), as aves podiam escolher entre 4 s de alimento atrasado por 4 s e 2 s
de alimento apresentado imediatamente após
a resposta seguidos por 6 s de blackout (período para igualar a freqüência de reforços programada para o elo de compromisso). Entre o
elo inicial e os elos terminais foi programado
um período (T) de blackout, o qual foi variado
ao longo do experimento. Para T menor do que
4 s, os pombos quase que exclusivamente responderam na chave que levava ao elo terminal
com escolha e, então, respondiam na alternativa com o reforçamento imediato. Entretanto, com valores de T maiores do que 4 s, a preferência pelo elo de compromisso desenvolveuse para três dos cinco pombos (inversão da preferência) e dois mostraram uma distribuição
do responder entre as duas alternativas. Portanto, as escolhas relativas do elo de compromisso aumentaram conforme o aumento do
valor de T.
A generalidade do modelo foi confirmada por estudos posteriores que relataram resultados semelhantes: Ainslie (1974), com um
procedimento de comprometimento diferente,
no qual os operantes eram bicar ou não bicar;
Ainslie e Herrnstein (1981) e Green e colaboradores (1981), com procedimentos de tentativas discretas, e Deluty (1981), com ratos e
reforçamento negativo (ver também Logan,
1965; Fantino, 1966). Entretanto, quando os
pombos podiam mudar sua escolha durante o
atraso longo da alternativa de autocontrole,
Logue e Peña-Correal (1984) observaram um
aumento no número de reforços imediatos obtidos (ver também Green e Rachlin, 1996;
Siegel e Rachlin, 1995).
ANÁLISE DO COMPORTAMENTO
De acordo com os resultados ora mencionados, a alternativa com o reforço maior e atrasado no elo terminal com escolha é sistematicamente excluída. Diversos estudos posteriores, com manipulações semelhantes dos valores relativos do atraso, utilizaram uma situação única de escolha, como a apresentada no
elo de escolha da Figura 10.1 (p. ex.: Green e
Snyderman, 1980; Logue e Peña-Correal, 1984;
Logue et al., 1986; Ribeiro, 1999; Ribeiro e
Hanna, 2000; Snyderman, 1983). Ao utilizar
essa contingência de escolha simples, autocontrole refere-se a cada escolha pelo reforçamento maior atrasado ou à preferência por
essa alternativa em escolhas repetidas. Com a
adição de valores iguais aos atrasos de reforçamento das duas alternativas de resposta, observou-se também um aumento nas escolhas
de autocontrole e inversão na preferência, replicando os resultados produzidos pelo aumento de T em Rachlin e Green (1972), sem utilizar a alternativa de compromisso.
Além do efeito dos valores relativos do
atraso de reforçamento descrito antes, observou-se também que aumentos nos valores absolutos dos atrasos, com a manutenção dos
valores relativos, diminuem as escolhas relativas pela alternativa de autocontrole (Green e
Snyderman, 1980; Ribeiro e Hanna, 2000;
Snyderman, 1983), embora esse efeito possa
ser minimizado, limitando-se à amplitude de
179
variação dos valores absolutos dos parâmetros
de reforçamento (Logue, 1988).
As primeiras tentativas de formalizar os
efeitos dos valores relativos do reforçamento
sobre o autocontrole (Ainslie, 1975; Rachlin,
1970) usaram gradientes de atraso hipotéticos, na forma de hipérbole, para ilustrar o fenômeno de inversão de preferência. A Figura
10.2 ilustra o modelo Rachlin-Ainslie, no qual
se assume que cada uma das magnitudes de
reforço gera um gradiente de valor de reforçamento que diminui com a distância temporal do estímulo reforçador. Na Figura 10.2, o
reforçador menor gera o gradiente Gm, e o
reforçador maior gera o gradiente GM. Y, I e X
representam três momentos diferentes em que
escolhas podem ocorrer com distância temporal diferente dos reforçadores, mantendo-se
constantes as magnitudes dos reforçadores e a
distância entre eles. O ponto onde os dois gradientes se cruzam (ponto de indiferença) ocorre no tempo I, quando os valores das alternativas são iguais e a predição é de que as escolhas dos sujeitos se distribuem de forma eqüitativa entre elas. Em qualquer ponto à esquerda de I (p. ex.: Ponto X), o valor do reforçamento da alternativa de autocontrole é maior
do que o da alternativa de impulsividade e,
portanto, o modelo prediz preferência para o
reforçador maior e mais atrasado. Em qualquer
ponto à direita do Ponto I (p. ex.: Ponto Y), o
FIGURA 10.2 Gradientes hipotéticos de atraso para o estímulo reforçador de maior magnitude (GM) e
para o de menor magnitude (Gm), de acordo com o modelo de Ainslie-Rachlin.
180
ABREU-RODRIGUES, RIBEIRO & COLS.
gradiente da alternativa de autocontrole é mais
baixo do que o gerado pela alternativa com o
estímulo reforçador menor e, portanto, os organismos mudariam a preferência para a alternativa de impulsividade.
O modelo pode ser exemplificado em uma
situação de escolha, na qual Dona Maria deve
decidir entre fazer uma poupança para comprar um carro ou manter gastos comprando
roupas e guloseimas toda semana. O atraso
para comprar o carro gera um gradiente semelhante ao representado pela curva GM, enquanto as miudezas que podem ser compradas imediatamente são representadas pela curva Gm.
Quando a escolha da Dona Maria é realizada
no ponto de ônibus e distante do momento de
ir ao shopping, por exemplo, o mais provável é
que ela decida por passar no banco para investir o dinheiro para comprar o carro (Ponto X).
Por outro lado, se já estiver no shopping ou no
supermercado, Dona Maria tenderia a gastar
seu dinheiro em supérfluos (Ponto Y).
O modelo também prediz pontos de indiferença diferentes com mudanças na distância
temporal entre os dois reforçadores (imagine
um dos gradientes sendo deslocado para a esquerda ou para a direita) ou com mudanças
nos valores reais dos reforçadores (imagine um
dos gradientes sendo deslocado para cima ou
para baixo). Note, entretanto, que o formato
das curvas que descrevem o declínio do valor
do reforçamento como função do atraso (p. ex.:
curvas mais agudas ou mais achatadas) é
crucial para a precisão de qualquer predição e
que tal formato pode variar mesmo com mudanças nas técnicas usadas para medir a relação entre escolha e valor do reforçamento
(Ainslie, 1975). A complexidade do fenômeno
parece ser uma das razões pelas quais modelos quantitativos de escolha no paradigma de
autocontrole têm falhado para descrever com
precisão os achados empíricos disponíveis.
Um outro fator que pode aumentar escolhas de autocontrole refere-se a atividades
desenvolvidas durante o período de espera
(Mischel et al., 1972; Patterson e Mischel,
1975). Mischel e colaboradores (1972) observaram que as crianças esperavam mais pelo
reforçamento de maior magnitude quando ti-
nham a possibilidade de brincar durante o período de espera. Esses resultados foram replicados com pombos por Grosch e Neuringer
(1981), ao adicionarem à situação de escolha
uma alternativa de resposta que vigorava durante o atraso. A inclusão desses outros reforçadores durante o período de espera aumenta o
valor relativo da alternativa de autocontrole
possivelmente porque esses reforços se somam
aos relacionados ao comportamento de autocontrole ou porque podem ter a função de reduzir o desconto que o atraso produziria se a
alternativa adicional não estivesse presente.
Um conjunto adicional de evidências
empíricas sobre determinantes do autocontrole
refere-se aos efeitos de história de reforçamento e ao papel dos estímulos discriminativos.
Em estudos de autocontrole, diferenças individuais são encontradas nos resultados e quando condições de replicação são programadas,
o desempenho prévio não é obtido. Conforme
aponta Logue (1988), a variabilidade individual tem sido um problema para estudos quantitativos sobre autocontrole no laboratório,
sugerindo que talvez a experiência passada seja
responsável por parte dessa variabilidade. Alguns estudos já começaram a identificar as
condições sob as quais a experiência anterior
afeta a escolha no paradigma de autocontrole.
A exposição a um procedimento de esvanecimento aditivo, no qual a diferença entre os
atrasos de reforçamento das alternativas é
introduzida gradualmente, favorece a preferência pela alternativa de autocontrole. Esse efeito de experiência ou de treino prévio foi primeiro demonstrado com pombos por Mazur e
Logue (1978). Esse estudo comparou o desempenho de um Grupo Controle ao do Grupo
Experimental. O Grupo Controle foi exposto à
contingência de escolha no paradigma de
autocontrole. O Grupo Experimental, inicialmente, escolheu entre alternativas diferindo na
magnitude dos reforços que eram igualmente
atrasados. O atraso para o estímulo reforçador
menor foi gradualmente diminuído ao longo
de um grande número de tentativas (cerca de
11 mil). Os sujeitos do Grupo Experimental escolheram a alternativa de autocontrole significativamente mais vezes do que os sujeitos do
ANÁLISE DO COMPORTAMENTO
Grupo Controle. Esses resultados foram replicados posteriormente por Logue e colaboradores (1984; ver também Logue e Mazur, 1981;
Logue et al., 1987) em um estudo paramétrico
com pombos e por Schweitzer e Sulzer-Azaroff
(1988) com crianças.
O efeito de experiência prévia sobre a escolha no paradigma de autocontrole foi confirmado por outros estudos (Eisenberger e
Adornetto, 1986; Eisenberger e Masterson,
1987; Eisenberger, Masterson, e Lowman,
1982). Eisenberger e colaboradores concluíram
que a exposição prévia a atrasos de reforçamento longos ou a tarefas que requerem muito esforço aumenta a tendência dos sujeitos
(ratos ou crianças) ao autocontrole. Os efeitos
generalizados de experiência prévia, encontrados pelo grupo de Eisenberger, colocam em
dúvida a importância da manutenção dos estímulos discriminativos presentes na situação de
treino para que um efeito robusto seja observado, já que, em seus estudos, o ambiente experimental durante o treino era diferente daquele onde o autocontrole era avaliado. Hanna
(1991), por outro lado, observou que o efeito
de história de reforçamento prévio foi observado apenas quando as condições de estímulos de treinos específicos eram mantidas no
teste de autocontrole.
Os experimentos conduzidos por Hanna
(1991) utilizaram esquemas múltiplos durante a condição de treino, com componentes que
diferiam no valor da magnitude e/ou do atraso de reforçamento. Em parte desses experimentos, as condições de estímulo de cada componente foram mantidas durante todas as sessões de treino, enquanto em outra parte as condições de estímulo dos dois componentes eram
invertidas a cada sessão. Condições de teste
em situação de autocontrole mostraram que a
exposição aos treinos com estímulos discriminativos sistematicamente variados (e, portanto, irrelevantes) não alteraram o comportamento de escolha. O treino em esquemas
múltiplos com estímulos discriminativos fixos,
sinalizando atrasos diferentes, diminuiu temporariamente as escolhas na alternativa de
autocontrole. Esse efeito de diminuição do número de escolhas que implica menor espera
181
pelo reforçador foi, no entanto, temporário,
retornando o comportamento a níveis anteriores ao do treino, com a exposição continuada
à situação de escolha.
Em resumo, experiências com aumentos
graduais do atraso de reforçamento e em condições com alto custo de resposta parecem aumentar as escolhas pela alternativa de autocontrole. Os efeitos dessas histórias de reforçamento, entretanto, não têm sido facilmente
replicados e requerem estudos adicionais para
ser possível identificar em que condições eles
são observados. Apesar disso, os procedimentos de esvanecimento têm-se mostrado úteis
quando aplicados a problemas de comportamento, como será descrito na próxima seção.
PESQUISA APLICADA E
ESPECULAÇÕES SOBRE A APLICAÇÃO
Os estudos sobre autocontrole em contextos de pesquisa aplicada são realizados, em
geral, com participantes que apresentam problemas de comportamento graves, autistas e
com crianças com Transtorno de Déficit de
Atenção/Hiperatividade. A seleção desses participantes, que apresentam freqüentemente repentes de agressividade e comportamentos
mantidos por reforçamento imediato, pode
contribuir para o desenvolvimento de programas educacionais que aumentem a qualidade
de vida desses indivíduos. No caso específico
de crianças com diagnóstico de hiperatividade,
o conhecimento sobre esse tema é especialmente relevante, dado que um dos problemas presentes nesse transtorno é a diminuição da capacidade do controle de impulsos (Barkley,
1997; 2002), ou seja, a dificuldade em se
engajar ou finalizar tarefas que requerem um
período de espera relativamente longo.
Os procedimentos de pesquisa na análise
comportamental aplicada têm sido compostos
de respostas e de reforços bastante diversificados. O indivíduo deve escolher entre alternativas com maior e menor atraso e esperar
por reforços consumatórios (batata frita, pipoca, refrigerante, balas, biscoitos, etc.), sociais
(atenção, elogios, etc.) ou outros (brinquedos,
182
ABREU-RODRIGUES, RIBEIRO & COLS.
jogos, etc.). Entre os comportamentos medidos estão jogar, realizar atividades diárias incluídas em treino de higiene e cuidados pessoais ou
respostas simples de escolha, como apontar e
identificar. Em alguns estudos, o atraso foi substituído por tarefas com maior ou menor custo
de resposta para dar acesso aos reforços de
magnitude diferentes, como montar um quebra-cabeça (Nogueira, 2001) ou resolver problemas de matemática (Neef, Bicard, e Endo,
2001; Neef e Lutz, 2001).
A seguir serão discutidos alguns estudos
que utilizaram o procedimento de esvanecimento, modificaram algum parâmetro de reforçamento e incluíram uma alternativa de resposta para aumentar as escolhas pela alternativa de autocontrole.
Dixon e colaboradores (1998) comprovaram o efeito do esvanecimento sobre o engajamento de adultos com atraso de desenvolvimento em comportamentos desejáveis (permanecer sentado, diminuir movimentos excessivos com os braços ou manipular adequadamente o material das atividades propostas pelo instrutor). Em uma condição inicial de linha de
base, os participantes preferiram receber imediatamente o reforçador menor a receber o
reforçador maior contingente à emissão de um
comportamento desejável por um determinado tempo (alternativa esta que implicava
atraso do reforçamento). O treino do autocontrole consistiu em, inicialmente, garantir
a escolha do reforçador maior, retirando a
exigência de trabalho e reintroduzindo-a por
períodos progressivamente maiores ao longo
do treino. Quando o participante escolhia
engajar-se no comportamento-alvo pela duração determinada em pelo menos duas de
três sessões, a duração definida como critério
era aumentada na próxima sessão. Se o participante escolhesse a alternativa de impulsividade na primeira sessão com um novo critério, o aumento na duração requerida era
reduzido à metade na sessão seguinte. Os três
participantes mudaram o comportamento exibido na condição de linha de base, mostrando uma preferência pela alternativa de autocontrole ao final do treino.
Mudanças no comportamento de autocontrole de crianças hiperativas, decorrentes
de treino com esvanecimento, foram observadas por Neef e colaboradores (2001). O comportamento de três crianças com Transtorno
de Déficit de Atenção/Hiperatividade em situações de conflito, cujas alternativas diferiam
quanto ao atraso e à taxa ou qualidade de reforçamento foi investigado. Nas condições de
linha de base, a situação de escolha poderia
envolver, por exemplo, dois problemas de matemática, sendo que um deles liberava pontos
em alta taxa (ou maior qualidade), mas com
atraso, e o outro liberava pontos em uma taxa
menor (ou menor qualidade) e imediatamente. O esvanecimento foi programado a partir
do aumento gradual do atraso para a alternativa de maior qualidade de reforço para duas
crianças e para a alternativa de maior taxa de
reforçamento para a terceira criança. A avaliação inicial demonstrou que as crianças preferiram a alternativa associada ao menor atraso. Entretanto o treino de autocontrole com
esvanecimento produziu inversão de preferência para os problemas de matemática que
estavam associados ao maior atraso e à maior
taxa de reforços ou aos reforços de maior
qualidade.
Alguns tratamentos médicos e psicológicos fazem uso de técnicas de esvanecimento.
Os tratamentos de desintoxicação geralmente
utilizam o que chamamos de esvanecimento
subtrativo. O tratamento consiste na retirada
gradual da substância tóxica presente no organismo do indivíduo, seja através da inclusão
de drogas-antídoto ou da administração da
droga utilizada pelo paciente em doses gradualmente menores. Esse é o caso, por exemplo,
de adictos em nicotina, que utilizam adesivos
ou chicletes que contêm nicotina para que o
organismo adapte-se gradualmente com quantidades menores da substância até sua retirada completa.
Antes de optar pelo tratamento, o adicto
de nicotina se vê diante de uma difícil situação
de escolha: fumar e sentir prazer, aliviando
também os efeitos da ausência da substância
no organismo e, em contrapartida, correr o risco de danos à saúde, perder parte do paladar e
olfato, ter pigarro e ser criticado socialmente,
ou não fumar e diminuir os riscos de danos à
saúde, ser aceito socialmente e, no entanto,
ANÁLISE DO COMPORTAMENTO
sentir a síndrome de abstinência e, de uma certa forma, sofrer uma desorganização de seu
repertório comportamental. Este último referese a uma série de comportamentos que estão
relacionados ou encadeados ao comportamento de fumar e que o indivíduo deve deixar de
realizá-los, como tomar café, mascar chicletes,
manter cinzeiros limpos e sair para comprar o
cigarro, entre outros. No momento em que o
indivíduo engaja-se em um tratamento, somente a retirada da nicotina não será suficiente
para o sucesso. Um bom tratamento deve também considerar essa “quebra” no repertório,
permitindo a ocorrência de comportamentos
substitutos ou incompatíveis com o de fumar.
Em terapia sexual, algumas técnicas para
tratamento de vaginismo, por exemplo, incluem exercícios de excitação e de exploração
dos órgãos genitais da mulher pelo parceiro,
de forma que, gradualmente, a mulher consiga obter prazer sem sentir dor. A queixa nesses casos é de que, devido à dor, a mulher opta
por não manter relações sexuais, preferindo,
por exemplo, a masturbação, que pode ser vista como a alternativa de menor magnitude de
reforçamento. Essa situação de conflito envolve estimulação aversiva em vez de atraso de
reforçamento e, portanto, o esvanecimento
(aditivo) é feito com o aumento gradual do estímulo produtor de dor, à medida que a habituação se estabelece. Nesse sentido, o parceiro
pode, em um dos primeiros exercícios, introduzir apenas a ponta do dedo mínimo na vagina até chegar ao ponto de, no decorrer do
tratamento, ter uma relação sexual completa
com penetração.
A possibilidade de combinar o esvanecimento com outras técnicas pode tornar a ocorrência do comportamento de autocontrole mais
provável e mais duradouro. O estudo de Dixon
e Cummings (2001) utilizou o esvanecimento
do atraso combinado à possibilidade de realizar uma tarefa durante o mesmo, com três
crianças autistas. O treino de autocontrole foi
introduzido em uma situação de escolha entre
três alternativas: receber o menor reforço imediatamente; receber o maior reforço atrasado
e esperar durante o atraso; e receber o maior
reforço atrasado, mas ordenar cartões com figuras durante o atraso. Nas alternativas com
183
atraso, houve um aumento gradual do valor
do atraso. Foi observado que o esvanecimento
produziu um aumento da preferência pela alternativa de maior magnitude e a realização
da tarefa durante o atraso diminuiu a ocorrência de comportamentos agressivos, como se
morder e bater em si e nos outros. É interessante observar que o engajamento em uma tarefa permitia não só a diminuição da emissão
de comportamentos indesejáveis, mas também
a obtenção de acesso ao reforço de maior magnitude nessa situação de autocontrole (ver também Binder, Dixon e Ghezzi, 2000). Os resultados desses estudos corroboram achados anteriormente citados (Grosch e Neuringer, 1981;
Mischel et al., 1972) e mostram que a simples
inclusão de uma alternativa de resposta com
reforçamento adicional durante o atraso aumenta a probabilidade de autocontrole. A oportunidade de crianças brincarem com brinquedos ou de pombos bicarem um disco sobressalente durante o atraso reduz o valor relativo
do reforçamento da alternativa imediata e aumenta o da alternativa de autocontrole.
Resultados semelhantes são observados
em programas de reabilitação de criminosos
nos presídios. Os programas geralmente citados como bem-sucedidos incluem atividades
de trabalho e de lazer para os presidiários em
vez de deixá-los ociosos. Nesse sentido, grosso
modo, os presidiários estão diante da seguinte
situação de escolha:
a) esperar o tempo da pena passar;
b) engajar-se em comportamentos que
permitam uma possível fuga (p. ex.:
conseguir armas ou instrumentos para
cavar buracos) e, conseqüentemente,
cometer novos delitos;
c) trabalhar em oficinas ou em atividades promovidas pelo presídio.
Nesta última alternativa, cumprir uma
pena significa não só esperar o tempo passar,
como sentir-se útil, produtivo, aprender uma
profissão e, ainda, realizar uma atividade que
pode ser remunerada e que pode permitir a
diminuição da pena (em alguns casos, três dias
trabalhados reduzem um dia na pena). Para
184
ABREU-RODRIGUES, RIBEIRO & COLS.
qualquer uma das alternativas, o reforço será
a liberdade, isto é, sair da prisão.
Pensando um pouco mais sobre esse tema,
pode-se dizer que muitos comportamentos criminosos poderiam não acontecer se o indivíduo tivesse optado pela alternativa de autocontrole. O que isso quer dizer quando pensamos em crimes? A alternativa de menor magnitude e imediata pode, nesses casos, ser denominada de comportamento criminoso, como
em um momento de discussão, sacar de uma
arma e atirar. Ou ver o filho desobedecer e
espancá-lo. Ou ainda diante de uma mulher
atraente, segurá-la e estuprá-la, dentre outros
tantos casos. Uma análise mais completa de
cada situação pode nos mostrar que sempre
haverá, pelo menos, uma outra alternativa, que
provavelmente oferecerá um reforço maior,
mas que será liberado com atraso ou após uma
resposta de alto custo. Em todos esses casos,
padrões de respostas que mantêm a condição
de liberdade do indivíduo seriam denominados de respostas de autocontrole.
Na literatura de pesquisa com humanos
encontramos poucos estudos que adotam o
modelo de comprometimento proposto por
Rachlin e Green (1972). Solnick e colaboradores (1980, Experimento 3) replicaram o estudo original de comprometimento com adultos
humanos em uma situação de escolha com
estimulação aversiva. Quinze participantes foram expostos a uma situação na qual eles poderiam escolher entre alternativas que lhes permitiam fugir de um som desagradável por um
maior ou menor período de tempo, enquanto
realizavam a tarefa de solucionar problemas
de matemática. A alternativa de comprometimento dava acesso exclusivo ao tempo mais
longo de som desligado. Da mesma forma que
em Rachlin e Green, os resultados desse estudo demonstraram grande variabilidade individual, e apenas metade dos sujeitos escolheu
a alternativa de comprometimento, sendo que
ao não fazer tal escolha, em geral, os participantes preferiram a alternativa de menor
magnitude.
A situação de comprometimento proposta por Rachlin e Green (1972) é facilmente programada em um laboratório de pesquisa animal. Na contingência totalmente programada
pelo experimentador, escolher a alternativa de
comprometimento significa não ter mais a
chance de mudar a escolha ou de ter acesso ao
menor reforço. O ambiente programado pelo
experimentador dá pouca chance para o animal engajar-se em outros comportamentos e
nenhuma chance de ter outras fontes de alimento. Dessa forma, escolher a alternativa de
comprometimento realmente é um compromisso com o maior reforço. Quando pensamos em
situações naturais, especialmente com humanos adultos, esse comprometimento total raramente acontece. Há em geral formas alternativas de conseguir o reforço imediato mesmo depois de assumir o compromisso. Novamente o fumante é um bom exemplo. Ao se
comprometer a parar de fumar não comprando cigarro naquela manhã, ele pede um cigarro a um colega ou mesmo a um desconhecido,
fuma os tocos deixados no cinzeiro no dia anterior ou encontra alguma outra forma criativa para conseguir um cigarro, mesmo que isso
lhe custe a credibilidade com a família e com
os amigos.
Rachlin (1995) afirmou que, no caso de
humanos, o comprometimento muitas vezes
ocorre com a programação de uma punição se
o indivíduo escolher a alternativa de menor reforço. Isto é, o indivíduo escolhe a alternativa
de maior reforço e se, durante o atraso, houver mudança na escolha, ele terá acesso ao
menor reforço seguido por uma punição. Esse
é o caso, por exemplo, do indivíduo que toma
um medicamento que provoca náuseas e vômitos ao ingerir álcool. Um indivíduo que esteja em tratamento para parar de beber compromete-se a não beber, mas se, por acaso, ele
cair em tentação, sofrerá as conseqüências desagradáveis produzidas pelo medicamento. Um
outro exemplo diz respeito à restrição física
promovida pela cirurgia de redução de estômago. Uma pessoa que se submete a tal cirurgia, o faz para comer menos e diminuir o peso.
Essa é uma medida drástica para redução de
peso e é um forte comprometimento. A pessoa, então, ao alimentar-se, deve comer lentamente e em pequenas porções. Comportar-se
de forma diferente, isto é, comer rapidamente
e uma grande quantidade geram punição, pois
a pessoa sente náusea e dores de estômago.
ANÁLISE DO COMPORTAMENTO
Uma grande variedade de situações da
vida diária oferece ao indivíduo a oportunidade de se comprometer com a alternativa de
maior magnitude. Um casal que quer evitar a
gravidez pode utilizar a pílula anticoncepcional ou outros métodos, ou ainda o marido pode
submeter-se a uma vasectomia. O indivíduo
que adere ao tratamento para diabete ou qualquer outra doença crônica está comprometendo-se a se manter saudável e ter acesso a todas
as possibilidades que essa condição lhe traz.
Fugir do tratamento, no caso do diabete, pode
implicar sentir tonturas, mal-estar e outras conseqüências mais graves, como a cegueira ou a
amputação de partes do corpo. Uma outra situação menos drástica, na qual também há
comprometimento, é quando um indivíduo
contrata um personal trainer para fazer ginástica. Essa provavelmente será uma forte garantia de fazer exercícios e manter-se em forma,
pois, além de ser pago, o professor vai até a
casa do aluno e cria contingências para que
este cumpra a tarefa.
No laboratório tomamos o cuidado para
manter constantes os diversos aspectos que não
são as chamadas variáveis independentes (manipuladas pelo experimentador). Entre elas
muitas vezes está a topografia da resposta e a
qualidade dos reforçadores. Essas escolhas simétricas permitem a quantificação das preferências que são estabelecidas pelas contingências. Muitas situações naturais, entretanto, envolvem respostas assimétricas e também reforços diferentes, mais semelhantes ao modelo de
atraso de gratificação de Mischel e colaboradores (Mischel et al., 1972; Mischel et al.,
1989). Dessa forma, o indivíduo que tem o
carro cheio de lixo pode ter como alternativas
jogar o lixo pela janela ou colocá-lo em um
saco e esperar para colocá-lo em uma lixeira.
Uma pessoa em uma conferência pode tapar o
nariz e evitar um ataque de riso ou rir alto e
sentir alívio. Essa diferença não inviabiliza, entretanto, que predições possam ser feitas quando se identifica variáveis funcionalmente semelhantes na situação natural àquelas estudadas no laboratório. Entretanto o controle experimental necessário na pesquisa é incompatível com a reprodução completa da situação
natural em toda a sua complexidade. Dessa
185
forma, a aplicação dos resultados da pesquisa
básica deve ser feita com cautela e intermediada por uma teoria.
CONCLUSÃO
O paradigma de autocontrole baseado na
escolha entre reforços atrasados e de magnitudes diferentes tem se mostrado um modelo
experimental útil para estudar o efeito de diversas variáveis relevantes sobre padrões comportamentais considerados impulsivos ou autocontrolados. Apesar disso, como o próprio
nome sugere, ele é um modelo e, por isso, guarda apenas algumas semelhanças com o fenômeno em situação natural consideradas relevantes. Isso fica evidente quando se compara
o modelo experimental ao modelo conceitual
de autocontrole de Skinner (1953). Em sua proposta, o autor sugere diversas formas de
autocontrole que o modelo de escolha contempla ou pode contemplar, como: o comportamento que produz ou retira os estímulos
discriminativos de respostas impulsivas, como
é o caso da escolha que implica compromisso
na omissão da alternativa de impulsividade e
o comportamento que aumenta ou diminui a
probabilidade de reforços de respostas impulsivas (o procedimento de Rachlin e Green, proposto em 1972, reduz a probabilidade dessa
alternativa a zero quando o elo de compromisso é escolhido). Ao mesmo tempo, o modelo
de escolha parece não ser tão adequado quando a situação envolve a interação entre comportamentos operante e respondente. Skinner
sugere que uma forma de autocontrole seria
fazer algo para reduzir ou aumentar a intensidade de estímulos eliciadores, como quando
tapamos o nariz para não espirrar durante um
concerto de música clássica.
A importância de se estudar experimentalmente fenômenos relevantes para compreender o autocontrole de maneira geral e os possíveis avanços para uma tecnologia comportamental aplicada a diversos comportamentos
de preservação da saúde, meio ambiente, manutenção de equilíbrio social, entre outros, é
certamente incontestável. Ao mudar de uma
concepção que internaliza a causa por meio da
186
ABREU-RODRIGUES, RIBEIRO & COLS.
noção de traço de personalidade ou de um
homúnculo “guiador” para um modelo que
identifica nas contingências de reforçamento
presentes e passadas as explicações do comportamento, estamos acreditando em um futuro no qual os problemas atuais de saúde ou
do meio ambiente poderão ser reduzidos. Para
tanto, ainda é necessário um maior desenvolvimento do conhecimento sobre as variáveis que determinam nossas escolhas e um
grande investimento na aplicação desses conhecimentos.
NOTA DAS AUTORAS
As autoras agradecem a contribuição de
Rodolfo Nunes na confecção da Figura 10.1.
REFERÊNCIAS BIBLIOGRÁFICAS
Ainslie, G. (1974). Impulse control in pigeons. Journal
of the Experimental Analysis of Behavior, 21, 485-489.
Ainslie, G. (1975). Specious reward: A behavioral
theory of impulsiveness and impulse control. Psychological Bulletin, 82, 463-496.
Ainslie, G.; Herrnstein, R. J. (1981). Preference reversal and delayed reinforcement. Animal Learning e Behavior, 9, 476-482.
Barkley, R. A. (1997). ADHD and the nature of selfcontrol. New York: Guilford Press.
Barkley, R. A. (2002). Trantorno de déficit de atenção e
hiperatividade (TDAH): Guia completo e autorizado para os pais, professores e profissionais da saúde (L. S.
Roizman, trad.). Porto Alegre: Artmed (Obra publicada
originalmente em 2000).
Baum, W. M. (1974). On two types of deviation from
matching: Bias and undermatching. Journal of the Experimental Analysis of Behavior, 22, 231-242.
Binder, L. M.; Dixon, M. R.; Ghezzi, P. M. (2000). A
procedure to teach self-control to children with
attention deficit hyperacivity disorder. Journal of
Applied Behavior Analysis, 33, 233-237.
Bonem, M.; Crossman, E. K. (1988). Elucidating the
effects of reinforcement magnitude. Psychological Bulletin, 104, 348-362.
Catania, A. C. (1963). Concurrent performances: A baseline for the study of reinforcement magnitude. Journal of the Experimental Analysis of Behavior, 6, 299-300.
Chung, S.; Herrnstein, R. J. (1967). Choice and delay
of reinforcement. Journal of the Experimental Analysis
of Behavior, 10, 67-74.
Cole, M. R. (1990). Operant hoarding: A new paradigm
for the study of self-control. Journal of the Experimental Analysis of Behavior, 53, 247-261.
Darcheville, J. C.; Rivière, V.; Wearden, J. H. (1993).
Fixed-interval performance and self-control in infants.
Journal of the Experimental Analysis of Behavior, 60,
239-254.
Deluty, M. Z. (1981). Self-control and impulsiveness
involving short-term and long-term punishing events.
In C. M. Bradshaw, E. Szabadi e C. F. Lowe (Eds.), Quantification of steady-state operant behaviour (p. 127-138).
Amsterdam: Elsevier/North Holland Biomedical Press.
Dixon, M. R.; Cummings, A. (2001). Self-control in
children with autism: Response allocation during delays
to reinforcement. Journal of Applied Behavior Analysis,
34, 491-495.
Dixon, M. R.; Hayes, L. J.; Binder, L. M.; Manthey, S.;
Sigman, C.; Zdanowski, D. M. (1998). Using a self-control training procedure to increase appropriate behavior.
Journal of Applied Behavior Analysis, 31, 203-210.
Downey, K. K.; Vuchinich, R. E. (1990, maio). Human
impulsiveness in the laboratory: When not to use computers? Painel apresentado na 16th Annual Convention
of the Association for Behavior Analysis, Nashville,
Tennessee, USA.
Eisenberger, R.; Adornetto, M. (1986). Generalized selfcontrol of delay and effort. Journal of Personality and
Social Psychology, 51, 1020-1031.
Eisenberger, R.; Masterson, F. A. (1987). Effects of prior learning and current motivation on self-control. In
M. L. Commons, J. E. Mazur, J. A. Nevin e H. Rachlin
(Eds.), Quantitative analyses of behavior: Vol. V. The effect
of delay and of intervening events on reinforcement value
(p. 267-282). Hillsdale, N.J: Erlbaum.
Eisenberger, R.; Masterson, F. A.; Lowman, K. (1982).
Effects of previous delay of reward, generalized effort,
and deprivation on impulsiveness. Learning and Motivation, 13, 378-389.
Fantino, E. (1966). Immediate reward followed by
extinction vs. later reward without extinction. Psychonomic Science, 6, 233-234.
Gentry, G. D.; Marr, M. J. (1980). Choice and reinforcement delay. Journal of the Experimental Analysis of
Behavior, 33, 27-37.
Green, L.; Rachlin, H. (1996). Commitment using punishment. Journal of the Experimental Analysis of Behavior, 65, 593-601.
Green, L.; Snyderman, M. (1980). Choice between
rewards differing in amount and delay: Toward a choice
model of self-control. Journal of the Experimental
Analysis of Behavior, 34, 135-147.
Green, L.; Fisher, E. B. Jr.; Perlow, S.; Sherman, L.
(1981). Preference reversal and self-control: Choice as
a function of reward amount and delay. Behaviour
Analysis Letters, 1, 43-51.
Grosch, J.; Neuringer, A. (1981). Self-control in pigeons
under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35, 3-21.
Grossbard, C. L.; Mazur, J. E. (1986). A comparison of
delays and ratio requirements in self-control choice.
Journal of the Experimental Analysis of Behavior, 45,
305-315.
ANÁLISE DO COMPORTAMENTO
Guttman, N. (1953). Operant conditioning, extinction,
and periodic reinforcement in relation to concentration
of sucrose used as reinforcing agent. Journal of Experimental Psychology, 46, 213-224.
Hanna, E. S. (1991). Behaviour analysis of complex
learning: Some determinants of choice. Tese de doutorado não publicada, University of Wales, College of
Cardiff, Cardiff, UK.
Hanna, E. S.; Todorov, J. C. (2002). Modelos de
autocontrole na análise experimental do comportamento: Utilidade e crítica. Psicologia: Teoria e Pesquisa, 18,
337-343.
Herrnstein, R. J. (1970). On the law of effect. Journal
of the Experimental Analysis of Behavior, 13, 243-266.
Logan, F. A. (1965). Decision making by rats: Delay
versus amount of reward. Journal of Comparative and
Physiological Psychology, 52, 1-12.
Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral and Brain Sciences, 11,
665-679.
Logue, A. W.; Mazur, J. E. (1981). Maintenance of selfcontrol acquired through a fading procedure: Followup on Mazur and Logue (1978). Behaviour Analysis
Letters, 1, 131-137.
Logue, A. W.; Peña-Correal, T. E. (1984). Responding
during reinforcement delay in a self-control paradigm.
Journal of the Experimental Analysis of Behavior, 41,
267-277.
Logue, A. W.; Peña-Correal, T. E.; Rodriguez, M. L.;
Kabela, E. (1986). Self-control in adult humans: Variation in positive reinforcer amount and delay. Journal
of the Experimental Analysis of Behavior, 46, 159-173.
Logue, A. W.; Rodriguez, M. L.; Peña-Correal, T. E.;
Mauro, B. C. (1984). Choice in a self-control paradigm:
Quantification of experience-based differences. Journal
of the Experimental Analysis of Behavior, 13, 243-266.
Logue, A. W.; Rodriguez, M. L.; Peña-Correal, T. E.;
Mauro, B. C. (1987). Quantification of individual
differences in self-control. In M. L. Commons, J. E.
Mazur, J. A. Nevin e H. Rachlin (Eds.), Quantitative
analyses of behavior: Vol. V. The effect of delay and of
intervening events on reinforcement value (p. 245-265).
Hillsdale, NJ: Erlbaum.
Mazur, J. E. (1986). Fixed and variable ratios and
delays: Further tests of an equivalence rule. Journal of
Experimental Psychology, 12, 116-124.
Mazur, J. E.; Logue, A. W. (1978). Choice in a “selfcontrol” paradigm: Effects of a fading procedure.
Journal of the Experimental Analysis of Behavior, 30,
11-17.
Millar, A.; Navarick, D. J. (1984). Self-control and choice
in humans: Effects of video game playing as a positive
reinforcer. Learning and Motivation, 15, 203-218.
Mischel, W.; Ebbesen, E. B. (1970). Attention in delay
of gratification. Journal of Personality and Social
Psychology, 16, 329-337.
Mischel, W.; Ebbesen, E. B.; Zeiss, A. (1972). Cognitive
and attentional mechanisms in delay of gratification.
Journal of Personality and Social Psychology, 21, 204-218.
187
Mischel, W.; Shoda, Y.; Rodriguez, M. L. (1989). Delay
of gratification in children. Science, 244, 933-938.
Neef, N. A.; Bicard, D. F.; Endo, S. (2001). Assessment
of impulsivity and the development of self-control in
students with attention deficit hyperactivity disorder.
Journal of Applied Behavior Analysis, 34, 397-408.
Neef, N. A.; Lutz, M. N. (2001). A brief computer-based
assessment of reinforcer dimensions affecting choice.
Journal of Applied Behavior Analysis, 34, 57-60.
Neuringer, A. J. (1969). Delayed reinforcement versus
reinforcement after a fixed interval. Journal of the Experimental Analysis of Behavior, 12, 373-383.
Nogueira, I. S. (2001). Análise do comportamento de
escolha entre tarefas de montagem de quebra-cabeças com
crianças pré-escolares. Dissertação de mestrado não
publicada, Universidade de Brasília, Brasília, DF.
Patterson, C. J.; Mischel, W. (1975). Plans to resist
distraction. Developmental Psychology, 11, 369-378.
Rachlin, H. (1970). Modern behaviorism. San Francisco: Freeman.
Rachlin, H. (1995). Self-control: Beyond commitment.
Behavioral and Brain Sciences, 18, 109-159.
Rachlin, H.; Castrogiovanni, A.; Cross, D. (1987).
Probability and delay in commitment. Journal of the
Experimental Analysis of Behavior, 48, 347-353.
Rachlin, H.; Green, L. (1972). Commitment, choice,
and self-control. Journal of the Experimental Analysis
of Behavior, 17, 15-22.
Ribeiro, M. R. (1999). Autocontrole em sistemas de economia alimentar aberto e fechado. Dissertação de
Mestrado não publicada, Universidade de Brasília,
Brasília, DF.
Ribeiro, M. R.; Hanna, E. S. (2000, maio). Self-control
in open and closed economies. Painel apresentado na
26th Annual Convention of the Association for Behavior
Analysis, Washington, DC, USA.
Schweitzer, J. B.; Sulzer-Azaroff, B. (1988). Selfcontrol: Teaching tolerance for delay in impulsive
children. Journal of the Experimental Analysis of
Behavior, 50, 173-186.
Siegel, E.; Rachlin, H. (1995). Soft commitment: Selfcontrol achieved by response persistence. Journal of
the Experimental Analysis of Behavior, 64, 117-128.
Sizemore, O. J.; Lattal, K. A. (1978). Unsignalled delay
of reinforcement in variable-interval schedules. Journal
of the Experimental Analysis of Behavior, 30, 169-175.
Skinner, B. F. (1953). Science and human behavior. New
York: MacMillan.
Snyderman, M. (1983). Delay and amount of reward
in a concurrent chain. Journal of the Experimental
Analysis of Behavior, 39, 437-447.
Solnick, J. V.; Kannenberg, C. H.; Eckerman, D. A.;
Waller, M. B. (1980). An experimental analysis of
impulsivity and impulse control in humans. Learning
and Motivation, 11, 61-77.
Todorov, J. C. (1971). Análise experimental do comportamento de escolha: Algumas considerações sobre
método em psicologia. Ciência e Cultura, 23, 585-594.
VARIABILIDADE COMPORTAMENTAL
11
JOSELE ABREU-RODRIGUES
O selecionismo é um processo no qual elementos particulares são selecionados a partir
de um conjunto variável de elementos. O modelo selecionista foi adotado por Darwin para
explicar a evolução das espécies, e por Skinner,
para descrever a evolução do comportamento
(Skinner, 1989a, 1989b). Esses dois processos
evolutivos apresentam aspectos similares. Primeiro, em ambos os casos, os mecanismos seletivos residem no ambiente, isto é, pressões
seletivas no ambiente determinam não somente
mudanças morfológicas nos indivíduos ao longo de gerações (contingências de sobrevivência), como também mudanças comportamentais no decorrer da vida de um indivíduo (contingências de reforçamento). Segundo, as contingências seletivas presentes em ambas as situações requerem variabilidade, quer seja em
termos de características morfológicas, quer
seja em termos de características comportamentais. Se a variabilidade é um requisito fundamental da seleção, torna-se, então, crucial
identificar as fontes da variação.
Em sua busca por relações ordenadas entre o comportamento e o ambiente, os pesquisadores têm enfatizado condições de estado estável, tratando a variabilidade como um
aspecto indesejável de seu objeto de estudo
ou como algo a ser controlado experimentalmente (Sidman, 1960). Embora o foco da
pesquisa analítico-comportamental seja a
compreensão de mecanismos seletivos, estudos sobre as condições controladoras da variabilidade comportamental também têm sido
realizados, principalmente nos últimos 15
anos. Essas pesquisas têm demonstrado que a
variabilidade comportamental pode ser mais
do que o resultado de um controle experimental fraco. Ou seja, a literatura tem indicado
que o nível de variação observado muda conforme as exigências das contingências de
reforçamento: quando os reforços são contingentes à variabilidade, os organismos variam
seu comportamento; quando os reforços são
contingentes à estereotipia, os organismos
repetem seu comportamento (p. ex.: Page e
Neuringer, 1985).
Neste capítulo será oferecido um panorama da literatura sobre a variabilidade
comportamental, sendo enfatizados aspectos
tais como a definição do conceito, os achados
da pesquisa básica e aplicada, bem como serão apontadas algumas contribuições dessas
pesquisas para o fenômeno da criatividade.
DEFINIÇÃO
Em uma análise do conceito de variabilidade comportamental, Hunziker e Moreno
(2000) apontam que o critério básico para a
ocorrência de variação é a existência de diferenças ou de mudanças entre unidades comportamentais de um universo determinado. As
unidades seriam cada uma das instâncias do
comportamento, e o universo seria o conjunto
dessas unidades. A definição do que seria unidade e do que seria universo é arbitrária, pois
depende de decisões do experimentador. Em
um estudo que investiga a variabilidade dos
190
ABREU-RODRIGUES, RIBEIRO & COLS.
desenhos de uma criança, por exemplo, a unidade poderia ser cada desenho feito, e o universo, todos os desenhos feitos na sessão ou,
alternativamente, todos os desenhos feitos desde o início do experimento.
Hunziker e Moreno (2000) definem variabilidade como uma propriedade do universo
de comportamentos, ou seja, enquanto força,
duração, latência e topografia são propriedades ou dimensões da unidade comportamental,
a variação é uma propriedade ou dimensão do
universo de unidades comportamentais, comparadas umas com as outras. Sendo assim, a
análise da variabilidade corresponde à comparação de unidades comportamentais com
algum referente; se houver diferença entre a
unidade e o referente em relação à propriedade avaliada, fala-se em variação. Por exemplo,
a propriedade de interesse pode ser o tempo
entre respostas (IRT) e, nesse caso, fala-se em
variação comportamental quando há diferenças entre os IRTs de um determinado universo. Da mesma forma, a propriedade de interesse pode ser a topografia de uma seqüência
de respostas nas teclas esquerda (E) e direita
(D) e, nessas situações, diz-se que há variação
quando o número de respostas E e D e a sua
ordem de ocorrência na seqüência diferem ao
longo das seqüências do universo.
A variabilidade comportamental pode
tanto ser um subproduto de contingências de
reforçamento como produzida diretamente por
tais contingências. No primeiro caso, a variabilidade não é exigida para a liberação do reforço, mas é permitida; no segundo caso, o reforço é contingente à variação. Ambas as situações serão consideradas a seguir.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
No início do condicionamento, o responder tipicamente é variável e ineficiente, mas,
com o treino, aspectos particulares da classe
de respostas tornam-se estereotipados e econômicos (Schwartz, 1980; Skinner, 1938). Essa
organização do comportamento ao longo do
processo seletivo parece sugerir que a estereotipia é um resultado inerente e inevitável
das contingências de reforçamento. Tal conclu-
são é desafiada, entretanto, por estudos que
mostram que a variabilidade é observada mesmo em desempenhos estáveis. Tal variabilidade pode ser um subproduto de variáveis
ambientais (p. ex.: intermitência do reforço e
retirada do reforço) ou um produto direto de
contingências de variação, que serão consideradas a seguir.
Variabilidade induzida
por esquemas de reforçamento
Estudos sobre variabilidade têm enfatizado tanto as propriedades topográficas (p. ex.:
localização da resposta) como as propriedades
quantitativas (p. ex.: duração) da resposta.
Antonitis (1951), por exemplo, ao investigar a
topografia da resposta de focinhar ao longo de
uma faixa horizontal que permitia 50 localizações diferentes da resposta, observou que o treino com reforçamento contínuo (CRF) gerou
estereotipia, e que a extinção subseqüente gerou variabilidade na localização dessa resposta (ver também Stokes, 1995). Margulies
(1961) obteve resultados similares, observando que respostas de pressão à barra de curta
duração predominaram durante o treino com
CRF, enquanto períodos de extinção foram
acompanhados por variação na duração dessa
resposta. Em um estudo mais recente, Morgan
e Lee (1996) expuseram estudantes universitários a diversos esquemas de reforçamento diferencial de taxas baixas (DRL) ao longo de
diferentes condições experimentais e, em seguida, à extinção. Foi observado que a extinção
produziu mudanças freqüentes e abruptas nos
IRTs de pressionar teclas, os quais assumiram
valores não previamente reforçados durante os
esquemas DRL (Lachter e Corey, 1982;
Millenson, Hurwitz e Nixon, 1961; Notterman
e Mintz, 1965; Skinner, 1938; Stebbins e
Reynolds, 1964).
Esses estudos indicam que o reforçamento
contínuo e a ausência de reforçamento exercem efeitos contrários sobre a variabilidade
comportamental e levantam a questão sobre
se o reforçamento intermitente produziria níveis intermediários de variação. Schoenfeld
(1968) argumentou que, em esquemas inter-
ANÁLISE DO COMPORTAMENTO
mitentes, os períodos de extinção após o reforço diminuem a probabilidade da resposta reforçada aos níveis observados para as demais
respostas, aumentando, assim, a quantidade de
respostas sobre as quais o reforço irá operar.
Mudanças no esquema de reforçamento, de
contínuo para intermitente, implicariam decréscimos na taxa de reforços (isto é, aumentos no período médio de extinção) e, conseqüentemente, aumentos correspondentes na
variabilidade da resposta.
Os efeitos do reforçamento intermitente
sobre a variabilidade na topografia da resposta foram examinados por Eckerman e Lanson
(1969). A variável dependente consistiu na localização da resposta de bicar um disco de pombos. No Experimento 2, foram utilizados o esquema CRF e diversos esquemas intermitentes ao longo das condições experimentais: intervalo fixo (FI 15 s) e intervalo randômico (RI
150 s, RI 75 s e RI 30 s). No Experimento 3,
foram utilizados os esquemas CRF seguidos por
um esquema de intervalo variável (VI 3 min).
Conforme proposto por Schoenfeld (1968), os
esquemas intermitentes geraram maior variabilidade na localização da resposta do que o
esquema CRF (ver também Ferraro e Branch,
1968).
Resultados comparáveis foram relatados
com outras espécies, esquemas e dimensões da
resposta. Eckerman e Vreeland (1973), por
exemplo, investigaram o papel da intermitência
do reforço com humanos. Os participantes
eram solicitados a escrever a letra “X” em uma
folha de papel. Após cada resposta, o experimentador fornecia um feedback indicando se a
mesma estava correta ou incorreta. Os feedbacks positivos eram fornecidos de acordo com
os esquemas CRF e razão variável (VR) 3, ou
nunca eram fornecidos (extinção). O esquema
CRF produziu maior variabilidade na localização da resposta do que a extinção, enquanto o
esquema VR gerou níveis intermediários de
variação. Stebbins e Lanson (1962) avaliaram
o efeito da intermitência sobre a latência da
resposta. Ratos foram treinados a manter uma
barra pressionada na presença de uma luz; na
presença de um tom, soltar a barra produzia
reforços de acordo com o esquema CRF, com
diversos esquemas intermitentes ou, então, não
191
produzia reforços. A variabilidade na latência
da resposta de soltar a barra aumentou à medida que a probabilidade do reforço diminuiu
de 100 para 0% (ver também Zimmerman,
1960). Finalmente, McSweeney (1974) investigou a variabilidade da taxa de respostas em
um esquema concorrente VI 1 min VI 4 min ao
longo das sessões experimentais, sendo observada uma relação inversa entre a variação da
resposta e a taxa de reforços.
Apesar dessas evidências, a literatura mostra que esquemas intermitentes nem sempre
produzem maior variabilidade do que o esquema contínuo de reforçamento. Herrnstein
(1961), por exemplo, avaliou a variabilidade
da localização da resposta de bicar um disco
durante os esquemas CRF e VI 3 min. Seus resultados, contrários à proposta de Schoenfeld
(1968), indicaram que o esquema VI produziu
mais estereotipia do que o esquema CRF. O
autor argumentou que esquemas VI assemelham-se a múltiplos recondicionamentos, à
medida que períodos de extinção são repetidamente seguidos pela ocorrência de reforços
e, portanto, uma menor variabilidade deveria
ser observada nesse esquema quando comparado ao esquema CRF.
Boren, Moerschbaecher e Whyte (1978)
observaram que esquemas intermitentes podem produzir níveis altos ou baixos de variabilidade, dependendo das características do esquema. Esses autores treinaram macacos a
pressionar seis barras, sendo o grau de variabilidade indicado pela porcentagem de respostas na barra preferida e pelo número de respostas de mudança. Nos esquemas FR, o nível
de variabilidade foi mais baixo do que aquele
obtido com o esquema CRF e não diferiu nos
diferentes valores utilizados (entre 5 e 300).
Os esquemas FI, por outro lado, produziram
níveis de variabilidade mais altos do que os
esquemas FR e CRF, sendo também observada
uma relação direta entre o nível de variação e
o valor do intervalo (entre 0,5 e 4 min). Uma
vez que os esquemas de razão e de intervalo
apresentaram taxas de reforços comparáveis,
os autores apontaram que a variabilidade não
poderia ser explicada com base na intermitência do reforço. Boren e colaboradores explicaram, então, seus resultados a partir das
192
ABREU-RODRIGUES, RIBEIRO & COLS.
diferenças nas propriedades particulares de
cada esquema. Eles indicaram que, com esquemas FR, respostas de mudança aumentam o
tempo entre reforços e, conseqüentemente,
diminuem a taxa de reforços, enquanto pressionar rápida e exclusivamente apenas uma das
barras permite a maximização dos reforços;
uma resposta reforçada em uma das barras
teria uma alta probabilidade de ser repetida,
produzindo, assim, a estereotipia observada.
Com esquemas FI, no entanto, respostas de
mudança não afetam a taxa de reforços; se o
animal muda de uma barra para outra no decorrer do intervalo, o reforço eventualmente
será contingente a pressionar diferentes barras e, conseqüentemente, ocorrerá variação na
resposta.
Os estudos anteriormente mencionados
avaliaram os efeitos da freqüência do reforço
sobre a variabilidade de dimensões topográficas ou quantitativas de respostas operantes individuais. Outros experimentos, no entanto,
têm analisado a variabilidade de padrões discretos de respostas. O estudo pioneiro foi conduzido por Vogel e Annau (1973), que usaram
uma caixa experimental com uma matriz 4 x 4
de luzes e dois discos de respostas. No início
da sessão, apenas a luz localizada no canto superior esquerdo da matriz estava iluminada.
Pombos foram treinados para moverem essa
luz até o canto inferior direito da matriz. Respostas em um disco moviam a luz para a direita, e respostas no outro disco moviam a luz
para baixo. Dessa forma, três respostas em cada
disco, emitidas em qualquer ordem, produziam um reforço, enquanto mais de três respostas em um dos discos iniciavam um blackout.
Com esse procedimento, o reforço poderia ser
produzido por 20 seqüências diferentes de respostas no disco direito (D) e no esquerdo (E).
Os pombos emitiram seqüências reforçadas em
mais de 80% das tentativas. Também foi observado um decréscimo no número de seqüências diferentes ao longo do treino de modo que
cada pombo eventualmente apresentou uma seqüência dominante (DDDEEE ou EEEDDD).
Schwartz (1980) apontou algumas vantagens no procedimento de Voguel e Annau
(1973): o operante investigado é formado por
respostas individuais e, portanto, facilmente
mensurável, e uma vez que as contingências
não requerem uma única seqüência de respostas, níveis altos de variabilidade podem ocorrer sem haver perda de reforços. Schwartz conduziu um experimento similar ao de Voguel e
Annau. Uma matriz 5 x 5 de luzes foi utilizada
de modo que quatro respostas em cada disco
eram requeridas para a liberação do reforço e
uma quinta resposta em um dos discos terminava a tentativa sem reforço. No Experimento 1, embora a contingência de reforço em vigor permitisse a emissão de 70 seqüências
diferentes, cada pombo desenvolveu uma resposta estereotipada, caracterizada pela ocorrência de uma seqüência dominante (p. ex.:
EEEEDDDD). No Experimento 2, a retirada
do reforço aumentou a variabilidade dos padrões de respostas. Resultados similares foram subseqüentemente obtidos com humanos
(Schwartz, 1982c).
No arranjo experimental usado por Voguel
e Annau (1973) e por Schwartz (1980; 1982c),
a unidade de análise foi a seqüência de respostas, e não as respostas individuais (ver Schwartz,
1982b, para uma demonstração de que seqüências de respostas tornam-se unidades comportamentais funcionais), e as condições programadas incluíam tanto reforçamento contínuo como a ausência de reforçamento. O aumento e o decréscimo na estereotipia comportamental, produzidos por essas condições,
respectivamente, estão em acordo com os resultados obtidos com respostas individuais sob
condições similares (p. ex.: Antonitis, 1951;
Eckerman e Lanson, 1969). Com relação à
intermitência do reforço, Schwartz (1982b)
conduziu um estudo em que seqüências corretas (isto é, seqüências que compreendiam exatamente quatro respostas em cada um dos discos) eram reforçadas de acordo com os esquemas CRF, FI 2 min ou FR 4. O grau de estereotipia produzidos pelos esquemas intermitentes foi comparável àquele gerado por esquemas CRF. Em um estudo subseqüente realizado
com humanos, Schwartz (1982c, Experimentos 1 e 2) também não encontrou níveis mais
altos de variabilidade comportamental sob esquemas intermitentes, tendo os esquemas CRF
e razão randômica (RR) 2 gerado níveis baixos e similares de variação.
ANÁLISE DO COMPORTAMENTO
O papel da intermitência do reforço foi
também investigado por Tatham, Wanchisen e
Hineline (1993), os quais utilizaram o procedimento da matriz com humanos. A unidade
comportamental consistiu em oito respostas de
pressionar um botão, sem o limite de quatro
respostas por operandum. Dessa forma, qualquer combinação de oito respostas (variando
desde oito respostas no botão esquerdo até oito
respostas no botão direito) moveria a luz para
fora da matriz e poderia produzir o reforço de
acordo com esquemas FR e VR com valores entre 1 e 8. Os resultados indicaram que ambos
os esquemas produziram níveis semelhantes de
variabilidade, os quais aumentaram em função dos aumentos nos valores da razão. Tatham
e colaboradores apontaram duas razões para
as discrepâncias entre seus resultados e aqueles obtidos nos estudos de Schwartz (1982b,
1982c). Primeiro, as contingências programadas no estudo deles permitiam a emissão de
oito respostas em cada botão e, portanto, havia 256 seqüências possíveis; o estudo de
Schwartz, por outro lado, exigia quatro respostas por disco, de modo que havia somente 70
seqüências possíveis. Esse limite de quatro respostas pode ter impedido o reforçamento de
seqüências variadas de respostas. Segundo, no
procedimento de Schwartz, a seqüência tinha,
necessariamente, de terminar no canto inferior direito para ser reforçada, o que pode ter
contribuído para a manutenção de um padrão
único de respostas. A matriz de Tatham e colaboradores, no entanto, reforçava seqüências
que terminavam em nove posições diferentes,
encorajando, assim, a emissão de seqüências
variadas.
Esses estudos exemplificam a variabilidade comportamental produzida por esquemas
de reforçamento. Reforçamento contínuo consistentemente diminui a variação na resposta,
enquanto a extinção aumenta essa variação.
Esquemas de reforçamento intermitente, entretanto, produzem resultados inconsistentes.
Algumas vezes a variabilidade é uma função
direta da taxa de reforços; outras vezes, o
reforçamento intermitente produz níveis de variabilidade comparáveis àqueles observados
com o esquema CRF. Diferenças nos procedimentos (p. ex.: dimensão da resposta, caracte-
193
rísticas físicas do ambiente experimental, arranjos dos esquemas, natureza da tarefa) podem explicar parte dessa divergência.
Variabilidade sob controle operante
Os resultados até agora discutidos apresentam duas características principais:
a) diferentes níveis de variabilidade foram produzidos por diferentes esquemas de reforçamento, mais precisamente, por diferentes taxas de reforços;
b) a variabilidade não foi requerida para
o reforçamento, tendo ocorrido como
um subproduto dos esquemas de
reforçamento.
Entretanto, uma vez que há muitos ambientes em que a variabilidade promove a adaptação do organismo às contingências vigentes
(p. ex.: situações de resolução de problemas),
os pesquisadores começaram a indagar se a
variação na resposta poderia ser diretamente
controlada por contingências de reforçamento.
A questão que passou a nortear as pesquisas
pode ser assim resumida: “A variabilidade
comportamental é suscetível ao controle
operante?”. Os estudos a seguir investigaram
tal questão.
Algumas questões metodológicas
Pryor, Haag e O’Reilly (1969) reforçaram
respostas originais de nadar em golfinhos. Os
reforços eram liberados contingentes a qualquer movimento que não era caracteristicamente observado e que não tinha sido previamente reforçado. Uma grande variedade de respostas novas foi emitida, incluindo algumas que
não são observadas comumente em golfinhos.
Em um estudo com ratos, Schoenfeld, Harris e
Farmer (1966) reforçaram respostas de pressionar um painel somente quando a resposta
terminava com um IRT diferente daquele precedente. Dois IRTs sucessivos eram considerados diferentes quando faziam parte de classes
194
ABREU-RODRIGUES, RIBEIRO & COLS.
de intervalos diferentes. O nível de variabilidade observado foi suficiente para atender a
contingência em vigor sendo caracterizado por
alternações regulares entre IRTs longos e curtos. Em um estudo similar, Blough (1966) produziu a variação por meio do reforçamento de
respostas de bicar um disco que terminavam
com os IRTs menos freqüentes. As distribuições
de IRTs obtidas foram semelhantes às distribuições exponenciais que seriam esperadas
com o uso de um gerador randômico de respostas.
Bryant e Church (1974) geraram seqüências imprevisíveis de respostas em ratos. Quando os reforços eram contingentes à alternação
entre dois operanda, a porcentagem de alternação aumentou ao longo das sessões; quando os reforços seguiram a alternação em 50%
das tentativas, os animais desenvolveram preferência por uma das posições; finalmente,
quando 75% das respostas alternadas e 25%
das respostas repetidas eram reforçadas, um
responder aparentemente randômico foi observado. No experimento de Shimp (1967), no
qual os reforços eram contingentes à emissão
da seqüência momentaneamente menos freqüente de quatro respostas, pombos mostraram uma repetição mínima de seqüências anteriormente emitidas. Neuringer (1986) ofereceu uma demonstração de comportamento
randômico com humanos. Estudantes universitários foram solicitados a gerar seqüências de
dois números, tão randomicamente quanto
possível. Todos os participantes apresentaram
seqüências quase randômicas, mas somente
quando recebiam um feedback informando
quão próximas suas seqüências estavam daquelas geradas randomicamente por um computador (ver também Lee, 1996; Neuringer e
Voss, 1993).
Os estudos mencionados nessa seção sugerem que o reforçamento contingente aumenta a variabilidade comportamental. Entretanto, conforme indicado por Schwartz (1980,
1982a, 1982c), as metodologias empregadas
não eliminam a possibilidade da variabilidade
observada ter sido induzida por diversos aspectos da situação experimental (p. ex.: intermitência do reforço) e, portanto, não indicam indubitavelmente que a variabilidade pode
ser diretamente produzida pelo reforço contingente. Em uma série de experimentos,
Schwartz obteve resultados conflitantes com a
noção de controle operante da variação. O procedimento da matriz 5 x 5 foi utilizado para
ensinar pombos a emitirem seqüências variadas de respostas. A exigência de quatro respostas por disco foi mantida com a adição de
uma contingência que estabelecia que a seqüência de oito respostas só seria reforçada
caso diferisse da seqüência imediatamente anterior (critério Lag 1). Embora a contingência
exigisse pouca variabilidade (uma alternação
entre duas seqüências seria suficiente), o número de seqüências diferentes não aumentou
quando comparado com aquele obtido em condições prévias nas quais a variação não era
requerida, mesmo que a repetição de seqüências tenha reduzido a porcentagem de reforços disponíveis para apenas 40% (Schwartz,
1980, Experimento 4, 1982a, Experimento 1).
A partir desses resultados, Schwartz
(1980, 1982a, 1982c) apontou que o reforço
produz, necessariamente, uma estereotipia
comportamental e que, portanto, a variabilidade não pode ser diretamente reforçada. É
possível, entretanto, que a falha em produzir
variação tenha sido decorrente de idiossincrasias do procedimento utilizado, e não de
limitações do controle operante. Page e Neuringer
(1985), por exemplo, argumentaram que a
estereotipia obtida por Schwartz resultou da
limitação de quatro respostas por operandum.
Esses autores mostraram que um computador
programado para gerar randomicamente seqüências de respostas, com a mesma limitação
de quatro respostas por alternativa, produziu
reforços em apenas 29% das tentativas, um
valor menor do que aquele produzido pelos
pombos do estudo de Schwartz (40%).
Ao eliminar a exigência de quatro respostas por operandum, Page e Neuringer (1985)
encontraram evidências de que a variabilidade
poderia ser diretamente controlada pelo reforço. O Experimento 2 utilizou o procedimento
da matriz 5 x 5 para comparar duas contingências de variabilidade. Na condição “variabilidade + limitação”, somente seqüências que continham exatamente quatro respostas em cada
disco eram reforçadas. Na condição variabi-
ANÁLISE DO COMPORTAMENTO
lidade, oito respostas eram exigidas para a liberação do reforço, mas essas respostas podiam
ser distribuídas de qualquer maneira entre os
discos. Em ambas as condições, o critério de
variação Lag 1 estava em vigor. A condição variabilidade + limitação gerou reforços em apenas 42% das tentativas, um resultado que contestou aquele obtido por Schwartz (1980,
1982a). Na condição variabilidade, por outro
lado, 90% das tentativas produziram reforços.
Morris (1987, 1989) argumentou que a
variabilidade observada por Page e Neuringer
(1985) resultou não somente da remoção da
limitação de quatro respostas por operandum,
mas também da redução do controle respondente. Page e Neuringer usaram um procedimento de tentativa discreta no qual cada resposta era seguida por um timeout (luzes do
disco eram apagadas), enquanto Schwartz usou
um procedimento de operante livre no qual os
discos eram continuamente iluminados. Para
investigar o papel do timeout, Morris utilizou
os dois procedimentos para treinar pombos a
emitirem seqüências de quatro respostas em
dois discos (E e D) de acordo com o critério
Lag 2 de variabilidade. O procedimento de
operante livre gerou, quase que exclusivamente, seqüências EEEE ou DDDD, e somente 30%
dos reforços disponíveis foram obtidos. O procedimento de tentativa discreta, por outro lado,
produziu um nível substancial de variabilidade, sendo obtidos mais do que 70% dos reforços disponíveis. Morris sugeriu que a estereotipia observada no procedimento de operante
livre resultou das propriedades eliciadoras condicionadas das luzes dos discos, um efeito que
não ocorre no procedimento de tentativa discreta porque o timeout remove o estímulo
eliciador e, assim, permite que a variação ocorra. Essa sugestão foi investigada em um experimento subseqüente (Morris, 1990), no qual
alguns pombos foram expostos a saciação sob
o procedimento de operante livre. As sessões
de saciação terminavam somente após 60 min
sem emissão de respostas. À medida que a
saciação progredia, foi observado um aumento na porcentagem dos reforços obtidos como
também na porcentagem de respostas de mudanças por oportunidade. Morris concluiu que
o controle operante da variabilidade ocorreu
195
porque a saciação enfraqueceu as propriedades eliciadoras da luz do disco.
Page e Neuringer (1985) forneceram evidências adicionais do controle operante da variabilidade. No Experimento 3, esses autores
investigaram se a variabilidade na resposta seria afetada por manipulações no grau de variação exigido pela contingência de reforço. Alguns pombos foram treinados para bicar dois
discos. A contingência de variação era similar
à do experimento anterior, mas o critério lag
foi gradualmente aumentado, ao longo das condições, de lag 5 (a seqüência tinha de diferir
das cinco seqüências anteriores) até lag 50 (a
seqüência tinha de diferir das 50 previamente
emitidas). Aumentos no critério lag foram
acompanhados por aumentos no grau de variação das seqüências, embora essa variação tenha decrescido quando o critério mudou de Lag
25 para Lag 50 (ver também Morris, 1989;
Schwartz, 1982c, Experimento 6). Entretanto,
uma vez que os acréscimos no critério lag foram acompanhados não somente por aumentos na variabilidade da resposta, mas também
por decréscimos na freqüência de reforços, é
possível que a variação obtida tenha resultado
das alterações na intermitência do reforço e
não do reforçamento diferencial de seqüências
diferentes.
Para contornar esse problema, Page e
Neuringer (1985, Experimento 5) usaram um
procedimento de acoplamento da freqüência
de reforços. Inicialmente, pombos foram expostos a uma condição de variabilidade na
qual estava em vigor o critério Lag 50. Em
seguida, uma condição de acoplamento intrasujeito foi implementada. Nessa condição, o
animal era exposto a uma distribuição de reforços por seqüência, similar àquela ocorrida
na condição Lag 50 com uma única diferença: a variabilidade era permitida, mas não era
exigida para a liberação do reforço. Foram
observados níveis de variabilidade mais altos
na condição Lag 50 do que na condição de
acoplamento. Uma vez que a freqüência e o
tempo entre reforços eram similares nas duas
condições, diferenças no nível de variabilidade não poderiam ser atribuídas à intermitência
do reforço, o que levou os autores a concluírem que os níveis mais altos de variabilidade
196
ABREU-RODRIGUES, RIBEIRO & COLS.
na condição Lag 50 resultou do reforçamento
contingente à variação (ver também Barba e
Hunziker, 2002).
Machado (1989) argumentou que, embora o acoplamento demonstre que o reforçamento contingente afeta a variabilidade comportamental, esse procedimento não isola adequadamente a influência da probabilidade
do reforço. Mudanças no critério de variabilidade produzem mudanças correspondentes na
probabilidade de reforço, de modo que é difícil avaliar se a variação comportamental observada resulta da contingência de variabilidade, da probabilidade do reforço ou da interação dessas duas variáveis. Segundo ele, o
arranjo experimental deveria permitir um controle independente da contingência de variabilidade e da probabilidade do reforço, o que
poderia ser alcançado por meio de esquemas
percentis (Platt, 1973). No esquema percentil
utilizado por Machado, a probabilidade total
do reforço foi controlada, ajustando continuamente o critério de variabilidade de modo
que a probabilidade de uma seqüência atingir o critério foi mantida constante ao longo
da sessão. O critério de variabilidade correspondeu a um ponto percentil derivado da
distribuição do nível de variabilidade que estava sendo obtido no momento. No Experimento 1, o critério de variabilidade (o percentil) foi manipulado, enquanto a probabilidade total do reforço foi mantida constante. Foi
observado que a variação na resposta aumentou diretamente com o critério de variação.
No Experimento 2, a probabilidade total do
reforço foi manipulada, enquanto o critério
de variabilidade foi mantido constante, sendo observado que as mudanças na probabilidade do reforço não foram acompanhadas por
alterações sistemáticas na variação comportamental (Machado, 1992; ver também Barba, 2000, para uma análise comparativa dos
diversos procedimentos utilizados para produzir variabilidade).
A literatura apresenta controvérsias sobre o que é aprendido em contingências de
variação. De acordo com a interpretação molar (p. ex.: Page e Neuringer, 1985), os organismos aprendem a emitir seqüências de res-
postas diferentes daquelas anteriormente
apresentadas. A interpretação molecular (p.
ex.: Machado, 1997), no entanto, defende que
os organismos aprendem a alternar as respostas de uma seqüência entre os operanda disponíveis. Em ambos os casos, o resultado seria um responder variado. Em uma tentativa
de demonstrar que a variabilidade é apenas
um subproduto do reforçamento das alternações, Machado comparou o reforçamento
de seqüências variadas (critério lag-n) com o
reforçamento diferencial da freqüência de
alternações em pombos. Seus resultados foram inconclusivos, uma vez que, embora o
reforçamento das alternações tenha gerado níveis altos de variabilidade, os mesmos foram
inferiores àqueles observados sob o critério
lag. Resultados similares foram obtidos por
Barba e Hunziker (2002) em um estudo com
ratos. Nesse experimento foi observado também que a variabilidade produzida pelo reforçamento diferencial da alternação foi transitória, ou seja, tendeu a diminuir no decorrer das sessões, ao contrário da variabilidade
gerada pelo critério lag, que se manteve alta
e estável durante todo o experimento. Resultados comparáveis foram obtidos por AbreuRodrigues, Hanna, Cruz, Matos e Delabrida
(1997). Esses autores apontaram que, embora drogas amnésticas tenham aumentado o
número de seqüências diferentes sob contingências que exigiam uma resposta estereotipada, nenhum efeito foi observado sobre o
número de alternações por seqüência, sugerindo uma independência funcional entre seqüências diferentes e respostas de alternação
(ver também Machado, 1993). Dessa forma,
esses resultados, em conjunto, indicam que
as respostas de alternação devem ser consideradas na avaliação da variabilidade comportamental, mas não permitem conclusões
definitivas sobre a adequação das propostas
molar e molecular. No máximo, esses dados
sugerem que os dois processos, reforçamento
de seqüências diferentes e de respostas de
alternação, podem coexistir, embora ainda não
esteja claro o grau de dependência (ou de independência) entre eles (Barba e Hunziker,
2002).
ANÁLISE DO COMPORTAMENTO
Controle de estímulos
e resistência à mudança
As propriedades operantes da variabilidade comportamental também têm sido demonstradas por procedimentos que envolvem o controle de estímulos. No estudo de Page e
Neuringer (1985, Experimento 6), pombos foram treinados em um esquema múltiplo com
dois componentes. No componente de variabilidade, sinalizado por uma luz verde, um critério Lag 5 estava em vigor; no componente
de estereotipia, sinalizado por uma luz vermelha, os animais tinham de repetir uma seqüência específica de respostas. Os resultados mostraram uma resposta variada na presença da
luz verde e uma resposta repetitiva na presença da luz vermelha. Inversões nas condições
de estímulo foram acompanhadas por inversões correspondentes na resposta. Em um estudo mais recente, Denney e Neuringer (1998,
Experimento 1) utilizaram um procedimento
diferente para produzir variação. Em um dos
componentes, os reforços dependiam da freqüência de cada seqüência, de modo que as
seqüências mais infreqüentes (e menos recentes) tinham maior probabilidade de serem reforçadas; no outro componente, a freqüência
de reforços era idêntica àquela do componente anterior, mas não havia exigência de variação (as seqüências eram reforçadas apesar de
sua freqüência de emissão). O primeiro componente gerou níveis mais altos de variabilidade do que o segundo, sendo essa diferença
mais pronunciada logo no início de cada componente, antes que as conseqüências da resposta fornecessem informações adicionais sobre a contingência em vigor. Quando os estímulos exteroceptivos foram retirados (Experimento 2), os níveis de variabilidade dos dois
componentes convergiram, um efeito que não
deveria ocorrer caso o próprio reforçamento
estivesse sinalizando os componentes. Esses resultados, portanto, demonstraram que a variabilidade comportamental é sensível ao controle de estímulos.
O controle discriminativo da variabilidade tem sido investigado também em situações
que envolvem a administração de etanol.
197
McElroy e Neuringer (1990) examinaram essa
questão por meio de um delineamento de grupo, enquanto Cohen, Neuringer e Rhodes
(1990) utilizaram um delineamento intra-sujeito. Sob a contingência de variação, alguns
ratos foram treinados a emitir seqüências de
quatro respostas de acordo com um critério Lag
5; sob a contingência de repetição, o reforço
era contingente à emissão de um única seqüência. Em ambos os estudos, a administração de
etanol gerou aumentos na variabilidade durante a contingência de repetição, diminuindo,
assim, a porcentagem de reforços obtidos, mas
não exerceu efeitos sobre o grau de variabilidade durante a contingência de variação (ver
também Crow, 1988).
Em um estudo subseqüente, Neuringer
(1991) examinou se manipulações no tempo
entre as respostas da seqüência (IRT) afetariam a variabilidade comportamental. As contingências de variação e de repetição eram
semelhantes àquelas descritas anteriormente, exceto que diferentes durações de IRT
(entre 0 e 4 s) eram requeridas para o reforçamento. A variabilidade das seqüências
aumentou com os aumentos no IRT em ambas
as contingências, aumentando a porcentagem
de reforços obtidos sob a contingência de variação e diminuindo os reforços sob a contingência de repetição. Neuringer sugeriu que
cada resposta na seqüência provavelmente
exerce um forte controle discriminativo sobre a resposta subseqüente em contingências de repetição, e que tal controle deve ser
fraco, e desnecessário, em contingências de
variação. Quando longos IRTs são exigidos,
o controle discriminativo exercido por respostas anteriores é interrompido, originando uma maior variação na resposta sob a
contingência de repetição. Esse autor também especulou que os efeitos do etanol sobre a variabilidade, obtido por Cohen e colaboradores (1990) e por McElroy e Neuringer
(1990), pode ser resultado de interferências
no controle discriminativo exercido pelas respostas da seqüência de repetição.
Essa sugestão foi investigada por AbreuRodrigues, Hanna e colaboradores (1997). Nesse estudo, ratos receberam injeções de midazo-
198
ABREU-RODRIGUES, RIBEIRO & COLS.
lam e pentilenotetrazol (PTZ), drogas que compartilham com o etanol uma propriedade
farmacológica comum – prejudicam a memória. Os resultados foram similares àqueles
obtidos com o etanol, ou seja, um aumento na
variação durante a contingência de estereotipia
e pouco ou nenhum efeito sob a contingência
de variabilidade. Uma vez que o midazolam, o
PTZ e o etanol produzem efeitos similares (isto
é, aumentam a variação comportamental somente quando a resposta está supostamente
sob o controle das respostas previamente emitidas) e uma vez que essas drogas apresentam
propriedades amnésticas, é viável afirmar que
esses dados apóiam a interpretação de interferência no controle discriminativo (Neuringer,
1991).
Os estudos com drogas (Abreu-Rodrigues,
Hanna et al.,1997; Cohen et al., 1990; McElroy
e Neuringer, 1990), bem como aquele com manipulações no IRT (Neuringer, 1991), parecem
sugerir que a resposta repetitiva é mais sensível a mudanças nas contingências do que a resposta variável. Essa questão foi avaliada sistematicamente por Doughty e Lattal (2001). Um
esquema múltiplo com dois componentes encadeados foi utilizado. Esquemas VI idênticos
operavam no elo inicial de cada componente.
No elo terminal do componente de variação, o
reforço era contingente à emissão de seqüências pouco freqüentes e pouco recentes; no elo
terminal do componente de repetição, uma
única seqüência produzia o reforço. As taxas
de reforços eram similares nos dois elos terminais. Quando alimento livre era liberado no
intervalo entre componentes, foi observado um
decréscimo nas taxas de respostas nos elos iniciais e terminais, tanto do componente de variação quanto do de repetição, mas esse decréscimo foi mais acentuado no segundo. O estudo de Neuringer, Kornell e Olufs (2001) fornece dados similares. A extinção produziu aumentos mais acentuados nos níveis de variabilidade das seqüências previamente mantidas
por contingências de repetição do que de variação, embora não tenha alterado a distribuição
de freqüência das seqüências (a mais freqüente durante o reforçamento continuou sendo a
mais freqüente durante a extinção). Esses resultados, portanto, confirmam aqueles obtidos
anteriormente, ao demonstrarem que a variabilidade operante é mais resistente a mudanças nas contingências do que a repetição operante (ver Capítulo 4 para informações mais
detalhadas sobre resistência a mudanças).
Topografia da resposta
Os efeitos de contingências de reforçamento sobre dimensões comportamentais (p.
ex.: freqüência, probabilidade) são influenciados pela topografia da resposta. Se a variabilidade é suscetível ao reforçamento, então
relações funcionais entre variabilidade e topografia também deveriam ser observadas. Essa
questão foi investigada por Morgan e Neuringer
(1990). Ratos foram treinados a gerar seqüências variáveis em três operanda diferentes –
barra, disco e corrente – em três fases consecutivas. A variabilidade foi reforçada de acordo com o critério Lag 5. Os resultados mostraram que a variação nas seqüências foi afetada
pela topografia da resposta: níveis altos de variabilidade foram observados com a resposta
de pressionar a barra, níveis intermediários
com a resposta de focinhar e níveis baixos com
a resposta de puxar a corrente.
Escolha entre repetição e variação
A variabilidade comportamental também
tem sido investigada no contexto de escolha.
Quando organismos são treinados a escolher
entre alternativas de respostas diferentes (p.
ex.: respostas únicas no disco esquerdo versus
respostas únicas no disco direito), a taxa relativa de respostas em uma alternativa muda diretamente com a taxa relativa de reforços naquela alternativa (Herrnstein, 1970). Se variabilidade é uma propriedade comportamental
controlada por suas conseqüências, então a escolha entre seqüências variadas de respostas
versus seqüências repetidas de respostas deveria ser similarmente influenciada pelas taxas
de reforços para esses dois tipos de seqüências. Essa questão foi investigada por Neuringer
(1992). Pombos foram treinados a variar ou a
repetir seqüências de quatro respostas. Antes
ANÁLISE DO COMPORTAMENTO
da emissão de cada seqüência, o computador
selecionava se a variação ou a repetição seria
reforçada naquela tentativa. Quando a variação era selecionada, o reforço só ocorria se a
seqüência diferisse das três últimas seqüências;
quando a repetição era selecionada, o reforço
só era liberado se a seqüência fosse igual a qualquer uma das três últimas. Caso a seqüência
não atendesse o critério em vigor naquela tentativa, um timeout era iniciado, e a mesma contingência ficava em vigor até a liberação do
reforço. A escolha entre variação e repetição
era reforçada de acordo com diferentes probabilidades (entre 0,0 e 1,0) ao longo das condições. A porcentagem de seqüências que atendiam ao critério de variação aumentou com os
aumentos na probabilidade de reforço para variação, o que foi interpretado por Neuringer
como evidência de que a escolha entre variar e
repetir seqüências de respostas é controlada
pela probabilidade do reforço.
O estudo de Neuringer (1992), no entanto, apresenta problemas no que se refere à
mensuração da preferência. Em seu procedimento, a medida de preferência (razão entre
as porcentagens de seqüências variadas e repetidas) não foi separada dos padrões de respostas produzidos pelo reforçamento direto
dessas seqüências. Isto é, foi afirmado que o
participante preferia variar quando a porcentagem de seqüências variadas era maior do que
a de seqüências repetidas. Mas, uma vez que a
porcentagem de seqüências variadas foi uma
função direta da probabilidade de reforços para
variação, é difícil indicar se a porcentagem mais
alta de seqüências variadas representa acuradamente a escolha pela contingência de variação. Fantino (1977) observou que, em situações como essas, a preferência seria mais adequadamente avaliada por meio de esquemas
concorrentes encadeados nos quais o comportamento de escolha é separado dos padrões de
respostas que são diretamente reforçados (para
descrições de esquemas concorrentes encadeados, consultar Catania, 1984; Mazur, 1991;
para informações mais detalhadas sobre escolha, ver Capítulo 9).
Essa sugestão foi adotada por AbreuRodrigues (1994) em um estudo em que alguns pombos foram expostos a um esquema
199
concorrente encadeado, no qual dois esquemas
VI idênticos operavam nos elos iniciais, enquanto contingências de variação e repetição operavam nos elos terminais, ambas com taxas de
reforços similares. Durante o elo terminal de
variação, a seqüência era reforçada se diferisse de cada uma de n seqüências anteriores;
durante o elo terminal de repetição, o reforço
era contingente à emissão de uma seqüência
específica (EDDD). O critério de variabilidade
foi manipulado no elo terminal de variação de
modo que, para ser reforçada, a seqüência tinha de atender ao critério Lag 1, Lag 5 e Lag
10 ao longo de três condições experimentais.
A contingência de repetição gerou níveis baixos e constantes de variabilidade, enquanto a
contingência de variação produziu níveis de variabilidade que aumentaram com os aumentos no critério lag. A preferência pela contingência de repetição aumentou diretamente com
o critério lag, sugerindo que a escolha entre
repetição e variação pode ser predita e controlada pelo grau de variabilidade comportamental exigido pela contingência de reforço
(ver também Abreu-Rodrigues, Santos e Matos, 2004). Resultados comparáveis foram posteriormente obtidos com humanos (AbreuRodrigues, Bento et al., 1997).
Estereotipia sob contingências de variação
Os estudos de Abreu-Rodrigues (1994),
Abreu-Rodrigues, Bento e colaboradores (1997)
e Abreu-Rodrigues e colaboradores (2004) também apresentaram evidências de que, sob condições de variabilidade, humanos e não-humanos variam somente o mínimo necessário para
atender as exigências da contingência. Por
exemplo, sob o critério Lag 5, embora houvesse 16 seqüências possíveis, os pombos desenvolveram um conjunto estereotipado de seqüências de modo que, ao final do treino, estavam emitindo não mais do que oito seqüências diferentes. Essa estratégia comportamental
foi denominada por Schwartz (1982c) de
“estereotipia de segundo grau” (ver também
Barrett, Deitz, Gaydos e Quinn, 1987; Reilly,
1993). Como explicar a ocorrência de estereotipia sob contingências de variação? Uma pri-
200
ABREU-RODRIGUES, RIBEIRO & COLS.
meira possibilidade é considerar que a estereotipia pode refletir uma resposta eficiente
à medida que o reforço é produzido com um
gasto mínimo de energia. Sob contingências
de variação, a eficiência pode corresponder à
emissão apenas daquelas seqüências que contêm poucas mudanças entre chaves (EEEE em
oposição a EDED). Hunziker, Caramori, da Silva e Barba (1998) apresentam algumas razões
para esse efeito. Primeiro, eles sugerem que a
resposta de alternação pode ser parte da seqüência de respostas de bicar (no caso de pombos). Isto é, seqüências sem respostas de
alternação (p. ex.: DDDD) contêm somente quatro respostas de bicar; seqüências com três respostas de alternação (p. ex.: DEDE), por outro
lado, compreendem sete respostas, quatro respostas de bicar e três respostas de alternação.
Conseqüentemente, seqüências com poucas
alternações seriam mais prováveis porque produzem maior densidade de reforços. Segundo,
Hunziker e colaboradores argumentam que seqüências com menor número de alternações
gastam menos tempo para serem emitidas e,
assim, aumentam a taxa de reforços. Finalmente, esses autores defendem que a posição da resposta de alternação deve ser considerada, uma
vez que as seqüências DEEE e DDDE, ambas com
somente uma alternação, não são similarmente
aprendidas, requerendo a segunda um treino
mais longo (Cohen et al., 1990; Neuringer, 1993;
Reid, 2002).
Uma outra possibilidade é que a estereotipia de segundo grau resulte das propriedades seletivas do reforço, conforme sugerido por
Schwartz (1982a), ou seja, considerando que
o reforçamento produz repetição, não seria surpreendente observar a repetição sob contingências de variação. Entretanto a ocorrência de
repetição irá depender da extensão em que é
permitida pela contingência. Com contingências mais permissivas (p. ex.: Lag 1), as repetições são mais freqüentes; com contingências
mais restritivas (p. ex.: Lag 10), por outro lado,
as repetições implicariam perda de reforços e,
conseqüentemente, são menos freqüentes
(Abreu-Rodrigues, 1994; Abreu-Rodrigues,
Bento et al., 1997; Abreu-Rodrigues et al.,
2004).
Cherot, Jones e Neuringer (1996) também encontraram evidências de que o reforçamento contingente à variabilidade gera estereotipia. Ratos e pombos foram expostos à contingências de variação (critério Lag 3) ou de
repetição (a seqüência tinha de ser igual a uma
das três últimas seqüências). Um esquema FR
4 foi sobreposto a cada uma dessas contingências de modo que o reforço era contingente à
emissão de quatro seqüências corretas (que
atendiam o critério de variação ou de repetição). Foi observado que a proximidade do reforço diminuiu o nível de variabilidade das
seqüências, tornando a resposta menos acurada
sob a contingência de variação (e mais acurada
sob a contingência de repetição), sendo esse
efeito observado tanto com reforços primários
como com secundários. Neuringer (1993) manipulou diretamente o reforçamento simultâneo de variação e de repetição. Após a obtenção de uma linha de base estável sob um critério de variação Lag 5, contingências “sempre”
e “nunca” foram sobrepostas à linha de base
de variação, ou seja, a emissão de uma seqüência particular era sempre seguida pelo reforço,
enquanto a emissão de uma outra seqüência
específica nunca era reforçada, independentemente de essas seqüências atenderem ou não
o critério lag. Durante a linha de base, as duas
seqüências apresentaram freqüências similares;
quando as contingências “sempre” e “nunca”
foram adicionadas, a freqüência da seqüência
“sempre” aumentou substancialmente enquanto a freqüência da seqüência “nunca” diminuiu
(Experimento 1).
O custo envolvido na emissão de uma seqüência também influencia a ocorrência de
estereotipia sob contingências de variação. No
estudo de Neuringer (1993, Experimentos 2 e
3), a freqüência de cada seqüência na linha de
base foi considerada como um indicativo do
grau de dificuldade daquela seqüência. Uma
contingência “sempre” foi sobreposta à contingência de variação de modo que três seqüências (fácil, intermediária e difícil) foram sempre reforçadas em condições sucessivas do experimento. Os resultados mostraram que as
propriedades seletivas do reforço variaram diretamente com o grau de dificuldade da se-
ANÁLISE DO COMPORTAMENTO
qüência: a freqüência da seqüência “fácil” aumentou mais do que a da seqüência “intermediária”, enquanto a freqüência da seqüência
“difícil” permaneceu inalterada. Nos Experimentos 4 e 5, Neuringer demonstrou uma estratégia para aumentar a freqüência da seqüência “difícil”. Nesses experimentos, um esquema VI foi sobreposto à contingência de variação, ou seja, após a passagem de um intervalo variado de tempo, a primeira seqüência que
atendesse o critério de variação era reforçada; a contingência “sempre” continuava em
vigor para a seqüência “difícil”. Ao longo das
sessões, o valor do VI foi alterado de 5 para
500 s. Essa retirada gradual do reforço para
variação, acompanhada pelo reforçamento
contínuo da seqüência “difícil”, produziu aumentos na freqüência dessa seqüência. O autor concluiu que o reforçamento simultâneo
de variação e repetição consiste em uma estratégia eficaz para o treinamento de comportamentos improváveis ou difíceis de serem
aprendidos (ver também Neuringer, Deiss e
Olson, 2000).
História de reforçamento
A literatura apresenta uma série de estudos que apontam efeitos de variáveis históricas sobre a manutenção da variabilidade comportamental. Stokes e Balsam (2001, Experimento 2), por exemplo, expuseram estudantes universitários a uma contingência de variação em três momentos distintos do treino da
resposta de mover uma luz da parte superior
para a parte inferior de uma pirâmide. Para o
Grupo I, um critério Lag 25 de variação foi
implementado no primeiro bloco de 50 tentativas reforçadas; para o Grupo II, no segundo
bloco; e para o Grupo III, no quarto bloco. Nos
outros blocos a variação era permitida, mas não
era exigida para o reforço. O Grupo Controle
não foi exposto ao critério lag. O experimento
foi finalizado após a obtenção de 350 reforços. Observou-se que a introdução do critério
lag aumentou a variação dos “caminhos” empregados para percorrer a pirâmide. No entanto, na ausência do critério lag, a variabilidade
201
na resposta só se manteve para o Grupo II. Esses resultados sugerem que a manutenção da
variabilidade é mais provável quando exigências de variação são implementadas nas fases
iniciais da aprendizagem de uma nova tarefa e
após a aprendizagem de rudimentos da tarefa
(ver também Stokes, Mechner e Balsam, 1999).
Outros estudos, no entanto, mostram que
a manutenção de padrões variáveis pode ocorrer mesmo quando o treino já começa com a
contingência de variação em vigor. No estudo
de Stokes (1999), no qual foi utilizada uma
matriz 6 x 6, estudantes universitários foram
divididos em dois grupos. Para o Grupo I, a
ordem de exposição às condições experimentais foi Lag 25, Lag 10, Lag 2 e ausência de
exigência de variação. O Grupo II foi exposto à
ordem inversa dessas condições. Para os dois
grupos, o nível de variabilidade obtido correspondeu ao nível de variabilidade exigido ao
longo das condições. Entretanto a apresentação do critério mais rigoroso, logo no início do
experimento, gerou uma variação mais acentuada na resposta em todas as condições
investigadas, quando comparada à exposição
inicial com ausência do critério lag. Hunziker
e colaboradores (1998) também obtiveram
efeitos similares. Nesse estudo, ratos respondiam em duas chaves de acordo com um esquema FR 4 (reforços eram independentes da
variação). Quando essa condição era precedida por uma condição com o critério lag 4 (reforços eram dependentes da variação), foram
obtidos níveis mais altos de variabilidade do
que na ausência dessa experiência prévia (cf.
Saldana e Neuringer, 1998). Nos trabalhos de
Hunziker e colaboradores (1998) e de Stokes
(1999), a condição inicial compreendia ou uma
exigência de variação ou a ausência dessa exigência. No estudo de Stokes e Harrison (2002),
por outro lado, foram comparadas duas condições iniciais que exigiam variação, as quais se
diferenciavam em termos do rigor do critério
de variação. Foi observado que o critério mais
rigoroso gerou níveis mais altos de variabilidade após a retirada da contingência de variação do que o critério menos rigoroso (ver também Abreu-Rodrigues, 1994; Abreu-Rodrigues,
Bento et al., 1997; Abreu-Rodrigues et al.,
202
ABREU-RODRIGUES, RIBEIRO & COLS.
2004). Em resumo, esses trabalhos sugerem
que a manutenção da variabilidade é mais provável quando a exigência de variação ocorre
no início da aprendizagem e, principalmente,
quando níveis altos de variação são prontamente exigidos (consultar o Capítulo 3 para informações detalhadas sobre efeitos da história de
reforçamento).
Controle verbal
Barrett e colaboradores (1987) investigaram a influência de contingências verbais e sociais sobre a variabilidade comportamental.
Nesse estudo, estudantes universitários foram
expostos à tarefa da matriz (5 x 5). Na primeira fase, qualquer seqüência de respostas produzia o reforço. Na segunda fase, os participantes recebiam uma instrução indicando que
o reforço era contingente à emissão de um
padrão variado de seqüências. Um critério Lag
10 estava em vigor nessa fase. A terceira fase
consistiu em um retorno, não-sinalizado, às
condições do início do experimento (Experimento 1) ou à extinção (Experimento 2). Metade dos participantes desempenhou a tarefa
na presença do experimentador, e a outra metade, na ausência do experimentador. Todos os
participantes apresentaram uma resposta estereotipada na primeira fase e, quando a instrução de variabilidade foi apresentada, todos
passaram prontamente a emitir seqüências variadas. Na terceira fase foi observada uma manutenção da variabilidade para os participantes que desempenharam a tarefa com o experimentador, em ambos os experimentos; para
os participantes que desempenharam a tarefa
sozinhos, no entanto, ocorreu um decréscimo
no nível de variação da resposta. Esses resultados indicam que o comportamento de seguir
as instruções manteve-se após a mudança nas
contingências em função do controle social
exercido pelo experimentador.
Em um trabalho subseqüente, Hunzinker
Lee, Ferreira, da Silva e Caramori (2002, Experimento 2) forneceram informações adicionais sobre a sensibilidade da variação comportamental ao controle instrucional. Estudantes
universitários foram divididos em dois grupos.
Um grupo foi exposto a uma contingência de
variação (VAR), na qual o reforço era contingente à emissão de seqüências pouco freqüentes e menos recentes; outro grupo foi exposto
a uma contingência de acoplamento (ACO), na
qual o reforço era liberado para qualquer seqüência, de modo que a freqüência média de
reforços era idêntica àquela da contingência
de variabilidade. Metade dos participantes de
cada grupo recebeu uma instrução que descrevia a contingência de variação (VAR-V e ACOV) e a outra metade, uma instrução que descrevia a contingência de acoplamento (VAR-A
e ACO-A). Dessa forma, para metade dos participantes a instrução era acurada (VAR-V e
ACO-A) e, para a outra metade, inacurada
(VAR-A e ACO-V). Os resultados mostraram que
os participantes expostos à contingência de
variação apresentaram níveis de variabilidade
mais altos (e com menor diversidade entre participantes) que aqueles expostos à contingência de acoplamento, apesar do grau de acurácia
das instruções. Instruções acuradas promoveram uma resposta mais apropriada às contingências em vigor, enquanto instruções inacuradas foram acompanhadas por níveis intermediários de variação. Esses resultados sugerem
que o controle exercido pelas instruções dependeu da extensão em que o comportamento
de seguir essas instruções era reforçado pela
contingência em vigor (ver Capítulo 12 para
informações detalhadas sobre controle instrucional).
CONTRIBUIÇÕES DA
PESQUISA APLICADA
A variabilidade comportamental pode ser
bastante desejável em situações como aquelas
que envolvem resolução de problemas (p. ex.:
aumentar a produtividade de uma empresa),
atividades artísticas (p. ex.: compor uma melodia), atividades esportivas (p. ex.: iludir o
adversário para marcar pontos no jogo), desempenhos acadêmicos (p. ex.: desenvolvimento de projetos de pesquisa), etc. Em outros casos, a variabilidade seria prejudicial ao indivíduo, e o esperado seria um comportamento
preciso, exato, como, por exemplo, ao fazer
ANÁLISE DO COMPORTAMENTO
uma cirurgia com a utilização de raio laser, ao
se apresentar em um teatro com um grupo de
balé, ao trabalhar em uma linha de montagem
(Stokes e Balsam, 2001). Assim, dependendo
das exigências do ambiente, níveis diversos
de variação comportamental tornam-se necessários. Apesar da relevância da variabilidade/
estereotipia comportamental para a adaptação dos indivíduos ao ambiente, a literatura
analítico-comportamental apresenta um número bastante reduzido de estudos no contexto da pesquisa aplicada prioritariamente
interessados nesse tópico. Em alguns desses
estudos, os quais são descritos a seguir, a variabilidade foi induzida por meio de extinção
ou diretamente produzida por meio de
reforçamento explícito.
Duker e van Lent (1991) utilizaram a extinção para aumentar a variabilidade na comunicação gestual de indivíduos portadores de
necessidades especiais. Tem sido observado
que, após serem treinados a usar espontaneamente um vocabulário relativamente amplo de
gestos, esses indivíduos tendem a usar apenas
uma pequena parte desse vocabulário. Durante a linha de base, a emissão de gestos espontâneos foi reforçada pela obtenção do objeto
solicitado. Por exemplo, se o participante fazia
um gesto solicitando um quebra-cabeça, a professora verbalizava “Muito bem, (nome do participante), eu quero o quebra-cabeça” e entregava o objeto. Durante a extinção, as solicitações gestuais mais freqüentes não foram seguidas pelo objeto. Para todos os outros gestos, continuavam em vigor a condições de
reforçamento da linha de base. A extinção produziu um aumento na diversidade de gestos
espontâneos, um efeito que se manteve mesmo após o retorno à linha de base.
Lalli, Zanolli e Wohn (1994) também empregaram a extinção com o objetivo de promover a variação na topografia do comportamento de brincar com brinquedos. Durante a
linha de base, foi observado que os participantes não brincavam com os brinquedos disponíveis (p. ex.: um avião e uma boneca). Na sessão de treino, o experimentador utilizou
modelação e prompts físicos para ensinar uma
topografia de resposta para cada brinquedo (p.
ex.: movimentos horizontais com o avião e ali-
203
mentação da boneca). Em seguida, foram
implementadas sessões de sondagem, durante
as quais as topografias treinadas eram inicialmente reforçadas e, após três reforços, eram
colocadas em extinção. O procedimento de
reforçamento e extinção era repetido para cada
topografia nova (não-treinada) que ocorresse
durante a sessão de sondagem. Essa sessão era
finalizada quando uma nova topografia não era
observada por 60 s. Os resultados mostraram
que a extinção resultou em um aumento substancial no número de topografias diferentes dos
comportamentos de brincar com os brinquedos, um resultado comparável àquele obtido
com animais (p. ex.: Antonitis, 1951; Stokes,
1995).
Uma das primeiras pesquisas aplicadas
em que a variabilidade foi explicitamente reforçada foi realizada por Goetz e Baer (1973).
Considerando que brincar com blocos é comumente considerado como uma atividade pedagógica que contribui para os conceitos de espaço, forma, matemática, equilíbrio, etc., os autores argumentaram que, para atingir tais fins,
era necessário que esse comportamento fosse
emitido de forma variada. O objetivo do estudo, então, consistiu em avaliar uma metodologia para promover a variabilidade no comportamento em questão. Os participantes do
estudo foram crianças que, ao brincarem com
os blocos durante a linha de base, geraram um
número pequeno de formas diferentes. Quando reforços sociais eram fornecidos sempre que
a criança produzia uma forma diferente, ou
seja, uma forma que ainda não tinha aparecido naquela sessão (“Muito bem, isto é diferente!”), aumentava o número de formas diferentes apresentadas. Quando reforços sociais
eram contingentes à apresentação de formas
já observadas naquela sessão (“Muito bem,
você fez um [nome da forma] de novo!”), o
número de formas diferentes por sessão decrescia. Ainda, o número de formas novas, isto
é, formas nunca antes observadas (nas sessões
anteriores), aumentou durante o reforço contingente a formas diferentes, mas não durante
o reforço contingente à repetição de formas.
Os autores concluíram que o procedimento foi
efetivo na produção de variabilidade, mas
apontaram que não era possível atribuir tal efei-
204
ABREU-RODRIGUES, RIBEIRO & COLS.
to exclusivamente ao reforçamento, uma vez
que os reforços verbais incluíam descrições do
desempenho apropriado (diversidade ou similaridade).
Lee, McComas e Jawor (2002) tentaram
reduzir a estereotipia comportamental comumente apresentada por indivíduos autistas por
meio do reforçamento direto da variação. Nesse
estudo, a variável dependente consistiu na
porcentagem de respostas variadas e apropriadas a questões sociais. Para a pergunta “O que
você gosta de fazer?”, a resposta era considerada apropriada quando indicava uma atividade socialmente aceitável (p. ex.: “jogar boliche”). Durante a linha de base, o reforçamento
diferencial de respostas apropriadas não produziu um comportamento verbal variado.
Quando uma contingência Lag 1 (a resposta
só era reforçada quando diferia, no conteúdo,
da última resposta à mesma questão) foi sobreposta ao reforçamento diferencial, ocorreu
um aumento substancial e sistemático na percentagem de respostas variadas e apropriadas,
como também no número acumulado de novas respostas (nunca antes emitidas). A
replicação de ambas as condições produziu resultados similares. Foi observada também a generalização da resposta variada para outros
ambientes e para outras pessoas.
Outra demonstração de que a variabilidade comportamental pode ser promovida em
indivíduos com autismo foi fornecida por Miller
e Neuringer (2000). Nesse estudo, três grupos
de indivíduos (autistas, estudantes universitários e crianças sem diagnóstico de distúrbios
físicos ou psicológicos) foram expostos a uma
tarefa que consistia na emissão de seqüências
de quatro respostas. Na condição de variação,
os reforços eram contingentes à emissão de seqüências pouco freqüentes e recentes; na condição precedente e seguinte, os reforços eram
liberados em uma taxa aproximadamente igual,
mas eram independentes da ocorrência ou não
de variação. Para todos os grupos, a introdução da contingência de variação aumentou o
nível de variabilidade das seqüências que, por
sua vez, manteve-se quando a exigência de variação foi retirada. Os participantes com autismo apresentaram níveis de variação mais
baixos do que os demais participantes em todas as condições. Os autores concluíram que
esses resultados sugerem que a estereotipia
comportamental mostrada por autistas não é
uma característica imutável do repertório desses indivíduos, mas sim o resultado da ausência de contingências de variação efetivas. Esses resultados, em conjunto com aqueles obtidos por Goetz e Baer (1973) e por Lee e colaboradores (2002), estendem para o contexto
aplicado a noção de que a variabilidade pode
ser controlada por reforço contingente.
Miller e Neuringer (2000) apresentaram
algumas vantagens do estabelecimento de
contingências de variação em situações aplicadas. Primeiro, o reforçamento da variabilidade pode aumentar o repertório de respostas e, assim, facilitar o processo seletivo de
comportamentos socialmente mais apropriados. Segundo, o reforçamento direto da variabilidade pode apresentar algumas vantagens
em relação a outras estratégias para promover a variação. A variabilidade gerada pela
extinção é transitória, enquanto a variação
produzida pelo reforçamento direto pode
manter-se por um longo tempo. O reforçamento diferencial de outros comportamentos
(DRO), o reforçamento diferencial de taxas
baixas (DRL) e o reforçamento não-contingente, também utilizados para diminuir estereotipias, podem gerar um comportamento supersticioso, da mesma forma que a extinção,
DRL e reforçamento não-contingente podem
produzir comportamentos agressivos. Ambos
os efeitos não foram relatados até então com
o reforçamento direto da variação.
Em resumo, dada a importância da variabilidade para a evolução do comportamento,
torna-se crítico para os analistas do comportamento determinar a natureza e as fontes da
variação comportamental. Ao fazer isso, os pesquisadores têm indicado que a variabilidade
pode tanto ser um subproduto de contingências de reforçamento (variabilidade induzida
pelo esquema) quanto pode ser produzida e
mantida diretamente por reforçamento contingente (variabilidade operante). Na discussão
a seguir, será apontada brevemente a relevância dos estudos de variabilidade para o fenômeno da criatividade.
ANÁLISE DO COMPORTAMENTO
COMPORTAMENTO CRIATIVO
E LIBERDADE DE ESCOLHA
O que é um comportamento criativo?
Winston e Baker (1985) apontam que o termo criatividade tem sido comumente identificado com diversidade/variabilidade e novidade/originalidade. Esses termos, por sua vez,
podem ser multiplamente definidos. Um livro
técnico, por exemplo, pode conter diversidade em termos da quantidade de tópicos abordados ou da quantidade de análises diferentes apresentadas para um mesmo tópico. Pode
também ser considerado original porque é
diferente de tudo aquilo que o autor fez antes
ou porque apresenta análises nunca antes oferecidas naquela área de conhecimento. Diante disso, qual seria a dimensão relevante para
considerar este livro um exemplo de comportamento criativo? Essa questão, ainda não
resolvida na literatura pertinente, aponta para
o fato de que a definição de criatividade deve
considerar o contexto sociocultural em que o
comportamento ocorre. Assim sendo, todo
trabalho criativo envolve diversidade e originalidade, mas o contrário nem sempre é verdadeiro. Winston e Baker argumentam que,
para um comportamento ser considerado criativo, é necessário também que ele seja apropriado, relevante, útil ou valioso de alguma
forma, dentro de uma certa cultura e em um
determinado momento no tempo. Dessa forma, o livro seria um exemplo de criatividade
quando, além de apresentar algumas das (ou
todas as) características mencionadas, fornecesse uma contribuição efetiva para o desenvolvimento da área de conhecimento. Embora a questão da qualidade seja a característica definidora da atividade criativa e mereça,
por si só, ser alvo de investigações, discussões sobre o contexto sociocultural da
criatividade fogem ao escopo deste capítulo.
O objetivo aqui consiste em mostrar que as
pesquisas sobre variabilidade lidam diretamente com a diversidade e com a originalidade do comportamento e, portanto, contribuem para a compreensão do fenômeno da
criatividade. Assim, o termo comportamento
criativo será empregado com base apenas nesses dois aspectos.
205
Conforme apontado no início deste capítulo, a ação seletiva do ambiente, em um nível
filogenético ou ontogenético, requer a existência de um substrato de variabilidade. O reforçamento, por exemplo, enquanto um processo
seletivo ontogenético, só é possível se houver
variação comportamental. Diante dessa variação, a contingência de reforço seleciona algumas respostas (aquelas que produzem o reforço) em detrimento de outras (aquelas que não
produzem o reforço) e, assim, algumas respostas têm sua probabilidade de ocorrência aumentada. Quando o ambiente muda, de modo
que as respostas predominantes não são mais
efetivas para produzir o reforço, outras respostas, previamente selecionadas em condições
ambientais similares, passam a ser evocadas
pelo ambiente modificado. Estímulos no novo
ambiente que são similares àqueles do ambiente antigo produzem, então, combinações
únicas de respostas. Quanto maior a variedade de respostas disponíveis no repertório
comportamental de um indivíduo, maior o
número de combinações possíveis (isto é, mais
criativo é o comportamento). Essas novas combinações são submetidas a seleções adicionais,
de modo que padrões progressivamente complexos e diversos de comportamento evoluem
(Donahoe e Palmer, 1994; Shahan e Chase,
2002; Skinner, 1989a, 1989b). Dessa forma, a
criatividade não implica que o comportamento ocorre no vácuo. O comportamento criativo
resulta de uma história de seleção.
Uma vez que o comportamento criativo
resulta de uma história de seleção e que o processo seletivo ocorre mais prontamente quando há variação comportamental, parece relevante perguntar como a variabilidade comportamental poderia ser estabelecida. As pesquisas aqui descritas mostram que essa variedade
de respostas pode ser produzida indiretamente por alguns aspectos do ambiente (p. ex.:
extinção), mas também pode ser produzida
diretamente pelo reforço contingente, de modo
que quanto maior o grau de variação exigido,
maior a variação comportamental obtida.
Portanto, se o objetivo é encorajar a criatividade, estabelecer o reforçamento diferencial
da variação é uma alternativa. Ou seja, no decorrer do processo de aprendizagem, o indiví-
206
ABREU-RODRIGUES, RIBEIRO & COLS.
duo deve não somente aprender como fazer
algo, mas também como fazer esse algo de
maneiras diferentes; a diversidade das formas aprendidas dependerá das exigências
estabelecidas pelo ambiente, e, quanto mais
cedo essas exigências forem feitas, mais provável será a manutenção da variabilidade
(Stokes, 2001).
Em uma interessante análise do trabalho
de Monet, Stokes (2001) argumenta que um
processo intenso, prematuro e acelerado de
aquisição juntamente com o reforço social e
com uma auto-imposição contínua de exigências de variação foram responsáveis pelo caráter criativo de seus quadros. Mais especificamente, Stokes coloca que Monet aprendeu logo
cedo a desenhar e a pintar e, em decorrência
dos elogios e da atenção que seus trabalhos
produziram, um alto nível de variação foi selecionado logo no início da aquisição de suas
habilidades artísticas. Uma vez tendo adquirido essas habilidades, a manutenção da variação ocorreu, dentre outros aspectos, em função de critérios rigorosos de variabilidade autoimpostos. A variabilidade resultante era reforçadora à medida que permitia o alcance de
metas, como também era reforçada pelo público, pelos críticos e pelos demais artistas. E,
uma vez que sua obra tinha (e tem) valor cultural, pode ser considerada como um exemplo
de criatividade.
Contextos educacionais, nos quais comportamentos criativos são bastante desejáveis,
podem beneficiar-se amplamente dos achados
da pesquisa básica e aplicada aqui relatados.
Considere um professor de literatura interessado em despertar o interesse por poesia em
seus alunos. Como parte das atividades prescritas por esse professor, os alunos devem ler
poesias e interpretá-las. Os critérios utilizados
para avaliar essas interpretações podem ser
cruciais para o desenvolvimento da criatividade
literária do aluno. Por exemplo, o professor
pode reforçar apenas aquelas interpretações
que coincidem com as suas próprias e, assim,
selecionar uma classe restrita de interpretações,
ou pode reforçar interpretações alternativas,
contribuindo, dessa forma, para o desenvolvimento de um repertório literário diverso e original. Caso essas interpretações alternativas se-
jam ingênuas, errôneas ou incompletas, podese usar o procedimento de modelagem por
aproximações sucessivas para promover interpretações qualitativamente sofisticadas. Os
achados aqui relatados também apontam outros dois aspectos importantes. Primeiro, conforme apontam os estudos de Stokes (1999) e
de Stokes e Balsam (2001), o professor deve
não somente incentivar a apresentação de interpretações alternativas logo no início do curso, como também exigir um nível alto de diversidade e de originalidade, estratégias que
contribuirão para a manutenção do comportamento criativo em situações posteriores (mesmo naquelas situações em que a criatividade
não seja explicitamente exigida). O segundo
aspecto, sugerido pelos estudos de AbreuRodrigues (1994), Abreu-Rodrigues, Bento e
colaboradores (1997) e Abreu-Rodrigues e colaboradores (2003), refere-se ao rigor dos critérios utilizados. Ao estabelecer critérios de
criatividade, o professor deve lembrar que, caso
eles se tornem muito rigorosos e difíceis de ser
alcançados, e caso haja uma alternativa mais
fácil para obter os reforços (p. ex.: o aluno pode
conseguir boas notas caso suas interpretações
sejam corretas, embora não sejam diversas nem
originais), é muito provável que o aluno se esquive da contingência de criatividade. Uma solução seria utilizar o reforço intermitente para
as interpretações repetitivas e, ao mesmo tempo, reforçar continuamente a ocorrência de interpretações diversas e originais, conforme sugere Neuringer (1993).
É importante assinalar que a contribuição da análise do comportamento para a compreensão da atividade criativa não se restringe
aos estudos de variabilidade. Conforme discutido por Balsam, Deich, Ohyama e Stokes
(1998) e por Shahan e Chase (2002), outros
processos comportamentais são igualmente relevantes e devem também ser considerados, tais
como: controle respondente, discriminação, generalização, aprendizagem de conceitos, abstração, equivalência de estímulos, redes
relacionais, controle instrucional, imitação e
modelação.
O controle operante da variabilidade é
relevante também para discussões sobre liberdade de escolha. Para os libertários, o termo
ANÁLISE DO COMPORTAMENTO
liberdade (ou “livre arbítrio”) refere-se à autodeterminação. Os indivíduos são livres à medida que seus comportamentos resultam de decisões tomadas por um agente interno. Para
eles, as demandas externas ameaçariam a liberdade. Os analistas do comportamento, por
outro lado, rejeitam a idéia do homem autônomo e argumentam que o evento controlador
primário das escolhas de um indivíduo reside
no ambiente. É a negligência em identificar as
contingências controladoras que ameaça a liberdade de um indivíduo, não o controle em si
(Skinner, 1971). Quando o controle é desconhecido, o contracontrole torna-se menos provável. Seria possível, então, advogar liberdade
quando um indivíduo não pode alterar as condições de controle relevantes?
Se o conceito de liberdade é identificado
com a possibilidade de contracontrole, disponibilidade de alternativas comportamentais e
comportamento de escolha dependente do ambiente, então a seleção da variabilidade certamente poderia promover a liberdade. Tentativas de libertar o homem do controle são enganosas; o ponto crítico é como libertar o homem de certas formas de controle. O controle
torna-se problemático quando produz vantagens para os agentes controladores, mas não
para o indivíduo controlado, uma situação que
se torna mais aversiva quando somente algumas, ou nenhuma, alternativas de contracontrole estão disponíveis. Conforme argumentado por Abreu-Rodrigues (1994), por meio da
produção de uma história variada de relações
comportamento-ambiente é possível aumentar
a diversidade de estratégias de contracontrole
presentes no repertório de um indivíduo. Quanto maior a diversidade de alternativas, maior
a chance de um contracontrole bem-sucedido.
Conseqüentemente, a liberdade de escolha é
maximizada.
CONCLUSÃO
O comportamento de organismos humanos e não-humanos apresenta, indubitavelmente, variação. Se essa variabilidade é uma
característica intrínseca do comportamento
(Neuringer, 1993) ou se é induzida por deter-
207
minados aspectos do ambiente (Wetherington,
1982), ainda não está claramente definido. Mas
as pesquisas, tanto a básica como a aplicada,
têm demonstrado sistematicamente que a variabilidade pode ser diretamente controlada
por contingências de reforço. Uma vez que o
ambiente é caracteristicamente mutável, a existência de um repertório comportamental variado sugere maiores chances de adaptação.
Assim sendo, a possibilidade de prever e de
controlar a variação comportamental implica
a possibilidade de desenvolvimento de estratégias de intervenção que, ao promover um repertório comportamental diverso, original e
criativo, estariam contribuindo para a ocorrência de processos adaptativos mais efetivos e
eficazes os quais, em última instância, garantiriam a própria sobrevivência da espécie.
REFERÊNCIAS BIBLIOGRÁFICAS
Abreu-Rodrigues, J. (1994). Choosing between varying
and repeating behavior. Does the degree of variability
matter? Tese de Doutorado não publicada, West Virginia
University, Morgantown, WV, USA.
Abreu-Rodrigues, J.; Bento, L.; Matos, R.; Dias, A.;
Viegas, R.; Delabrida, Z.; Santos, C. (maio, 1997).
Choosing to repeat and vary in concurrente-chain
schedules: II. The effects of variability contingencies with
human subjects. Painel apresentado na 23rd Annual
Convention of the Association for Behavior Analysis,
Chicago, IL, USA.
Abreu-Rodrigues, J.; Hanna, E. S.; Cruz, A. P.; Matos,
R.; Delabrida, Z. (maio, 1997). Differential effects of
midazolam on behavioral stereotypy and variability. Painel apresentado na 23rd Annual Convention of the
Association for Behavior Analysis, Chicago, IL, USA.
Abreu-Rodrigues, J.; Lattal, K. A.; Santos, C. V.; Matos,
R. A. (2004). Variation, repetition, and choice. Manuscrito submetido à publicação.
Antonitis, J. J. (1951). Response variability in the white
rat during conditioning, extinction, and reconditioning.
Journal of Experimental Psychology, 42, 273-281.
Balsam, P. D.; Deich, J. D.; Ohyama, T.; Stokes, P. D.
(1998). Origins of new behavior. Em W. T. O’Donohue
(Ed.), Learning and behavior therapy (p. 403-420).
Needham Heights, MA: Allyn e Bacon.
Barba, L. S. (2000). Comportamento aleatório: Algumas considerações. Psicologia: Teoria e Pesquisa, 16,
269-277.
Barba, L. S.; Hunziker, M. H. L. (2002). Variabilidade
comportamental produzida por dois esquemas de
reforçamento. Acta Comportamentalia, 10, 5-12.
Barrett, D. H.; Deitz, S. M.; Gaydos, G. R.; Quinn, P. C.
(1987). The effects of programmed contingencies and
208
ABREU-RODRIGUES, RIBEIRO & COLS.
social conditions on response stereotypy with human
subjects. The Psychological Record, 37, 489-505.
Blough, D. S. (1966). The reinforcement of least-frequent interresponse times. Journal of the Experimental
Analysis of Behavior, 9, 581-591.
Boren, J. J.; Moerschbaecher, J. M.; Whyte, A. A.
(1978). Variability of response location on fixed-ratio
and fixed-interval schedules of reinforcement. Journal
of the Experimental Analysis of Behavior, 30, 63-67.
Bryant, D.; Church, R. (1974). The determinants of
random choice. Animal Learning and Behavior, 2, 245248.
Catania, A. C. (1984). Learning. Englewood Cliffs, NJ:
Prentice Hall.
Cherot, C.; Jones, A.; Neuringer, A. (1996). Reinforced
variability decreases with approaches to reinforcers.
Journal of Experimental Psychology: Animal Behavior
Processes, 22, 497-508.
Cohen, L.; Neuringer, A.; Rhodes, D. (1990). Effects of
ethanol on reinforced variations and repetitions by rats
under a multiple schedule. Journal of the Experimental
Analysis of Behavior, 54, 1-12.
Crow, L. T. (1988). Alcohol effects on variabilitycontingent operant responding in the rat. Bulletin of
the Psychonomic Society, 26, 126-128.
Denney, J.; Neuringer, A. (1998). Behavioral variability
is controlled by discriminative stimuli. Animal Learning
and Behavior, 26, 154-162.
Donahoe, J. W.; Palmer, D. C. (1994). Learning and
complex behavior. Boston: Allyn and Bacon.
Doughty, A. H.; Lattal, K. A. (2001). Resistance to
change of operant variation and repetition. Journal of
the Experimental Analysis of Behavior, 76, 195-215.
Duker, P. C.; van Lent, C. (1991). Inducing variability
in communicative gestures used by severely retarded
individuals. Journal of Applied Behavior Analysis, 24,
379-386.
Eckerman, D. A.; Lanson, R. N. (1969). Variability of
response location for pigeons responding under
continuous reinforcement, intermittent reinforcement,
and extinction. Journal of the Experimental Analysis of
Behavior, 12, 73-80.
Eckerman, D. A.; Vreeland, R. (1973). Response variability for humans receiving continuous, intermittent,
or no positive experimenter feedback. Bulletin of the
Psychonomic Society, 2, 297-299.
Fantino, E. (1977). Conditioned reinforcement: Choice
and information. Em W. K. Honig; J. E. R. Staddon
(Eds.), Handbook of operant behavior (p. 313-339).
Englewood Cliffs, NJ: Prentice-Hall.
Ferraro, D. P.; Branch, K. H. (1968). Variability of response location during regular and partial reinforcement. Psychological Reports, 23, 1023-1031.
Goetz, E. M.; Baer, D. M. (1973). Social control of form
diversity and the emergence of new forms in children’s
blockbuilding. Journal of Applied Behavior Analysis, 6,
209-217.
Herrnstein, R. J. (1961). Stereotypy and intermittent
reinforcement. Science, 133, 2067-2069.
Herrnstein, R. J. (1970). On the law of effect. Journal
of the Experimental Analysis of Behavior, 13, 243-266.
Hunziker, M. H. L.; Caramori, F. C.; da Silva, A. P.; Barba, L. S. (1998). Efeitos da história de reforçamento
sobre a variabilidade comportamental. Psicologia: Teoria e Pesquisa, 14, 149-159.
Hunziker, M. H. L.; Moreno, R. (2000). Análise da noção de variabilidade comportamental. Psicologia: Teoria e Pesquisa, 16, 135-143.
Hunziker, M. H. L.; Lee, V. P. Q.; Ferreira, C. C.; da Silva, A. P.; Caramori, F. C. (2002). Variabilidade comportamental em humanos: Efeitos de regras e contingências. Psicologia: Teoria e Pesquisa, 18, 139-147.
Lachter, G. D.; Corey, J. R. (1982). Variability of the
duration of an operant. Behaviour Analysis Letters, 2,
97-102.
Lalli, J. S.; Zanolli, K.; Wohn, T. (1994). Using extinction
to promote response variability in toy play. Journal of
Applied Behavior Analysis, 27, 735-736.
Lee, V. L. (1996). Variability of human latencies wit,h
and without a criterion for reinforcement. The Psychological Record, 46, 519-538.
Lee, R.; McComas, J. J.; Jawor, J. (2002). The effects
of differential and lag reinforcement schedules on varied responding by individuals with autism. Journal of
Applied Behavior Analysis, 35, 391-402.
Machado, A. (1989). Operant conditioning of behavioral variability using a percentile reinforcement schedule. Journal of the Experimental Analysis of Behavior,
52, 155-166.
Machado, A. (1992). Behavioral variability and frequency-dependency selection. Journal of the Experimental
Analysis of Behavior, 58, 241-263.
Machado, A. (1993). Learning variable and stereotypical sequences of responses: Some data and a new
model. Behavioural Processes, 30, 103-129.
Machado, A. (1997). Increasing the variability of response sequences in pigeons by adjusting the frequency
of switching between two keys. Journal of the Experimental Analysis of Behavior, 68, 1-25.
Margulies, S. (1961). Response duration in operant
level, regular reinforcement, and extinction. Journal
of the Experimental Analysis of Behavior, 4, 317-321.
Mazur, J. E. (1991). Choice. Em I. H. Iversen e K. A.
Lattal (Eds.), Techniques in the behavioral and neural
sciences: Vol. 6. Experimental analysis of behavior (p.
219-250). New York: Elsevier.
McElroy, E.; Neuringer, A. (1990). Effects of alcohol
on reinforced repetitions and reinforced variation in
rats. Psychopharmacology, 102, 49-55.
McSweeney, F. K. (1974). Variability of responding on
a concurrent schedule as a function of body weight.
Journal of the Experimental Analysis of Behavior, 21,
357-360.
Miller, N.; Neuringer, A. (2000). Reinforcing variability
in adolescents with autism. Journal of Applied Behavior
Analysis, 33, 151-165.
Millenson, J. R.; Hurwitz, H. M. B.; Nixon, W. L. B.
(1961). Influence of reinforcement schedules on
ANÁLISE DO COMPORTAMENTO
response duration. Journal of the Experimental Analysis
of Behavior, 4, 243-250.
Morgan, D. L.; Lee, K. (1996). Extinction-induced response variability in humans. The Psychological Record,
46, 145-159.
Morgan, L.; Neuringer, A. (1990). Behavioral variability
as a function of response topography and reinforcement
contingency. Animal Learning and Behavior, 18, 257-263.
Morris, C. J. (1987). The operant conditioning of response variability: Free-operant versus discrete-response
procedures. Journal of the Experimental Analysis of
Behavior, 47, 273-277.
Morris, C. J. (1989). The effects of lag value on the
operant control of response variability under free-operant and discrete-response procedures. The Psychological Record, 39, 263-270.
Morris, C. J. (1990). The effects of satiation on the
operant control of response variability. The Psychological
Record, 40, 105-112.
Neuringer, A. (1986). Can people behave “randomly”?:
The role of feedback. Journal of Experimental Psychology: General, 115, 62-75.
Neuringer, A. (1991). Operant variability and repetition
as functions of interresponse time. Journal of Experimental Psychology: Animal Behavior Processes, 17, 3-12.
Neuringer, A. (1992). Choosing to vary and repeat.
Psychological Science, 3, 246-250.
Neuringer, A. (1993). Reinforced variation and selection. Animal Learning and Behavior, 21, 83-91.
Neuringer, A.; Voss, C. (1993). Approximating chaotic
behavior. Psychological Science, 4, 113-119.
Neuringer, A.; Deiss, C.; Olson, G. (2000). Reinforced
variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111.
Neuringer, A.; Kornell, N.; Olufs, M. (2001). Stability
and variability in extinction. Journal of Experimental
Psychology: Animal Behavior Processes, 27, 79-94.
Notterman, J. M.; Mintz, P. E. (1965). Dynamics of
response. New York: Willey.
Page, S.; Neuringer, A. (1985). Variability is an operant.
Journal of Experimental Psychology: Animal Behavior
Processes, 11, 429-452.
Platt, J. R. (1973). Percentile reinforcement: Paradigms
for experimental analysis of response shaping. Em G.
H. Bower (Ed.), The psychology of learning and
motivation: Vol. 17. Advances in theory and research (p.
271-296). New York: Academic Press.
Pryor, K. W.; Haag, R.; O’Reilly, J. (1969). The creative
porpoise: Training for novel behavior. Journal of the
Experimental Analysis of Behavior, 12, 653-661.
Reid, A. K. (2002). Learning new response sequences.
Behavioural Processes, 32, 147-161.
Reilly, M. P. (1993). The effects of interresponse intervals
on behavioral variability in humans. Dissertação de
Mestrado não publicada, University of North Texas,
Denton, TX, USA.
Saldana, R. L.; Neuringer, A. (1998). Is instrumental
variability abnormally high in children exhibiting ADHD
209
and aggressive behavior? Behavioural Brain Research,
94, 51-59.
Schoenfeld, W. N. (1968). On the difference in resistance to extinction following regular and periodic reinforcement. Journal of the Experimental Analysis of
Behavior, 11, 259-261.
Schoenfeld, W. N.; Harris, A. H.; Farmer, J. (1966). Conditioning response variability. Psychological Reports, 19,
551-557.
Schwartz, B. (1980). Development of complex, stereotyped behavior in pigeons. Journal of the Experimental
Analysis of Behavior, 33, 153-166.
Schwartz, B. (1982a). Failure to produce response variability with reinforcement. Journal of the Experimental Analysis of Behavior, 37, 171-181.
Schwartz, B. (1982b). Interval and ratio reinforcement
of a complex sequential operant in pigeons. Journal of
the Experimental Analysis of Behavior, 37, 349-357.
Schwartz, B. (1982c). Reinforcement-induced behavioral
stereotypy: How not to teach people to discover rules.
Journal of Experimental Psychology: General, 111, 23-59.
Shahan, T. A.; Chase, P. N. (2002). Novelty, stimulus
control, and operant variability. The Behavior Analyst,
25, 175-190.
Shimp, C. P. (1967). Reinforcement of least-frequent
sequences of choices. Journal of the Experimental Analysis of Behavior, 10, 57-65.
Sidman, M. (1960). Tactics of scientific research. New
York: Basic Books.
Skinner, B. F. (1938). The behavior of organisms: An
experimental analysis. New York: Appleton-CenturyCrofts.
Skinner, B. F. (1971). Beyond freedom and dignity. New
York: Alfred A. Knopf.
Skinner, B. F. (1989a). The phylogeny and ontogeny of
behavior. Em A. C. Catania; S. Harnard (Eds.), The
selection of behavior. The operant behaviorism of B. F.
Skinner: Comments and consequences (p. 11-76).
Cambridge: Cambridge University Press.
Skinner, B. F. (1989b). Selection by consequences. Em
A. C. Catania; S. Harnard (Eds.), The selection of behavior. The operant behaviorism of B. F. Skinner: Comments
and consequences (p. 382-461). Cambridge: Cambridge
University Press.
Stebbins, W. C.; Lanson, R. N. (1962). Response latency
as a function of reinforcement schedule. Journal of the
Experimental Analysis of Behavior, 5, 299-304.
Stebbins, W. C.; Reynolds, R. W. (1964). Note on changes in response latency following discrimination training in the monkey. Journal of the Experimental Analysis
of Behavior, 7, 229-231.
Stokes, P. D. (1995). Learned variability. Animal Learning and Behavior, 23, 164-176.
Stokes, P. D. (1999). Learned variability levels: Implications for creativity. Creativity Research Journal, 12,
37-45.
Stokes, P. D. (2001). Variability, constraints, and creativity. American Psychologist, 56, 355-359.
210
ABREU-RODRIGUES, RIBEIRO & COLS.
Stokes, P. D.; Balsam, P. (2001). An optimal period for
setting sustained variability levels. Psychonomic Bulletin
and Review, 8, 177-184.
Stokes, P. D.; Harrison, H. M. (2002). Constraints have
different concurrent effects and aftereffects on variability. Journal of Experimental Psychology: General, 131,
552-566.
Stokes, P. D.; Mechner, F.; Balsam, P. D. (1999). Effects
of different acquisition procedures on response variability. Animal Learning and Behavior, 27, 28-41.
Tatham, T. A.; Wanchisen, B. A.; Hineline, P. N. (1993).
Effects of fixed and variable ratios on human behavioral
variability. Journal of the Experimental Analysis of Behavior, 59, 349-359.
Vogel, R.; Annau, Z. (1973). An operant discrimination
task allowing variability of reinforced response patterning. Journal of the Experimental Analysis of Behavior,
20, 1-6.
Wetherington, C. L. (1982). Is adjunctive behavior a
third class of behavior? Neuroscience and Biobehavioral
Reviews, 6, 329-350.
Winston, A. S.; Baker, J. E. (1985). Behavior analysis
studies of creativity: A critical review. The Behavior Analyst, 8, 191-205.
Zimmerman, D. W. (1960). Intermittent reinforcement
of discriminatively controlled responses and runs of responses. Journal of the Experimental Analysis of Behavior,
3, 83-91.
ANÁLISE DO COMPORTAMENTO
REGRAS E AUTO-REGRAS
NO LABORATÓRIO E NA CLÍNICA
211
12
SONIA BEATRIZ MEYER
Uma das grandes contribuições de
Skinner (J. Michael, comunicação pessoal, 3
de abril de 1978) foi a distinção entre comportamentos modelados por contingências e
comportamentos governados por regras ou,
conforme Catania (1998/1999), comportamentos governados verbalmente. O comportamento modelado por contingências é aquele
modelado e mantido diretamente por conseqüências relativamente imediatas. Já o comportamento governado por regras depende do
comportamento verbal de outra pessoa (o falante), ou seja, está sob controle de antecedentes verbais que descrevem contingências (Baum,
1994/1999).
Skinner (1974/1982) definiu como regra
o estímulo discriminativo verbal que descreve
uma contingência. O enunciado de regras tem
a vantagem de poder substituir o procedimento de modelagem de uma resposta em seres
humanos. Mas há diferenças importantes entre o comportamento governado por regras e
o modelado por contingências. Skinner (1974/
1982, p. 109-111) descreveu essas diferenças
em seu livro Sobre o Behaviorismo:
• Quanto à velocidade de aprendizagem, regras podem ser aprendidas
mais rapidamente do que o comportamento modelado pelas contingências descritas pelas regras.
• As regras tornam mais fácil o aproveitamento de semelhanças entre contingências, enquanto o processo de
•
•
•
•
generalização pode prover uma resposta fraca.
As regras têm valor quando as contingências são complexas, pouco claras ou
quando não são muito efetivas, enquanto o comportamento modelado por contingências demanda maior tempo de
aprendizagem, podendo nem mesmo
ser aprendido sob tais contingências.
Por meio das regras – da gramática e
do dicionário – é possível aprender um
novo idioma quando o indivíduo não
foi exposto a uma comunidade verbal
adequada, necessária para modelar a
fala correta.
A pessoa que segue instruções acata
conselhos, atende advertências ou obedece a regras ou a leis, não se comporta da mesma maneira como aquela que
foi exposta diretamente às contingências, porque a descrição de contingências nunca é completa ou exata (usualmente ela é simplificada para poder ser
ensinada e compreendida mais facilmente), e as contingências que sustentam o comportamento descrito raramente se mantêm de forma perfeita.
Os sentimentos associados ao comportamento governado por regras também são diferentes dos sentimentos associados ao comportamento modelado por contingências (mas os sentimentos não explicam as diferenças
entre esses comportamentos). Há di-
212
ABREU-RODRIGUES, RIBEIRO & COLS.
versas ocasiões em que o sentimento
associado ao seguimento de regras é
apenas o de medo de punição, enquanto aquele associado ao comportamento modelado pelas contingências consiste em alegria e em entusiasmo.
• O controle exercido por orientações,
conselhos, regras e leis é evidente, não
é sutil; já o controle por contingências é bem menos evidente. Nesta última forma de controle é comum que
a comunidade considere que o indivíduo tenha maior contribuição pessoal
e mérito interno. Fazer o bem porque
recebe o reforço social por ter feito o
bem é considerado mais virtuoso do
que fazer o bem porque a lei assim o
determina. Já o indivíduo que realiza
uma obra planejada pode sofrer das
reservas associadas aos comportamentos emitidos de forma calculada.
Skinner (1974/1982) analisou diversas
formas de regras: a ordem descreve um ato e
implica uma conseqüência aversiva; no aviso,
as conseqüências aversivas não são organizadas pela pessoa que o emitiu; um conselho especifica um comportamento e implica conseqüências positivamente reforçadoras que não
foram ideadas pelo conselheiro. Orientações englobam ordens, avisos e conselhos, sendo sua
descrição abrangente: orientações descrevem
o comportamento a ser executado e expõem
ou implicam conseqüências.
Depois de Skinner ter feito a distinção entre comportamento governado por regras e
comportamento modelado por contingências,
Hayes, em conjunto com outros pesquisadores
(p. ex.: Hayes e Ju, 1998; Hayes, Zettle e
Rosenfarb, 1989), fez uma nova distinção entre tipos de comportamentos governados por
regras, destacando-se: aquiescência (em inglês
pliance) e rastreamento (em inglês tracking).
Um comportamento aquiescente seria aquele
que essencialmente depende de contingências
sociais (o reforço é contingente diretamente
ao comportamento de fazer o que a regra diz);
um comportamento de rastreamento depende
essencialmente da correspondência entre a regra e os eventos ambientais. Uma norma, uma
lei ou um costume controlam comportamentos de aquiescer; uma instrução ou uma descrição de um trajeto controlam comportamentos de rastrear. Ou seja, as conseqüências que
mantêm o comportamento governado por regras são de dois tipos: a obediência à regra
(aquiescência) é mantida por contingências
sociais; a execução do comportamento especificado pela regra (rastreamento) é, em geral,
um desempenho motor modelado por contingências naturais (Matos, 2001).
Os seres humanos seguem não apenas as
regras apresentadas por outros, como também
formulam e seguem suas próprias regras. Quando estas são formuladas ou reformuladas pelo
indivíduo cujo comportamento passam a controlar, dizemos que são auto-regras. Nesse caso,
uma parte do repertório do indivíduo afeta outra parte deste repertório. As auto-regras podem ser explicitadas publicamente, ou podem
ocorrer de forma encoberta quando o indivíduo pensa (Jonas, 1997).
A distinção proposta por Skinner, entre
o comportamento modelado por contingências e o governado por regras, foi submetida a
estudos experimentais, e o corpo de conhecimentos resultante tem implicações diretas
para trabalhos aplicados. O objetivo deste capítulo é verificar quais as contribuições da
pesquisa básica e de que forma esse conhecimento teórico-experimental pode contribuir
para uma das áreas de aplicação da psicologia, a clínica, além de analisar algumas contribuições da pesquisa clínica a respeito do uso
de regras, de conselhos e de intervenções chamadas diretivas, incluindo os problemas de
adesão ao tratamento e a chamada resistência em psicoterapia, assim como analisar qual
processo de mudança – por regras ou por modelagem pelas contingências – é responsável
pelas mudanças clínicas.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
Para que um psicólogo clínico mantenhase a par tanto de pesquisas desenvolvidas em
clínica quanto de pesquisa básica, é extremamente útil a tarefa realizada por colegas pesquisadores de prover à comunidade artigos de
ANÁLISE DO COMPORTAMENTO
revisão de literatura. Nesse sentido, vários artigos foram escritos para a comunidade de
analistas do comportamento brasileiros nos
atuais 10 livros da coleção Sobre Comportamento e Cognição, baseados nas apresentações feitas nas Reuniões Anuais da Associação Brasileira de Psicoterapia e Medicina Comportamental (ABPMC) (p. ex.: Albuquerque, 2001;
Banaco, 1997; de Rose, 1997; Guedes, 1997;
Jonas, 1997; Sanabio e Abreu-Rodrigues,
2002), na Revista Brasileira de Terapia Comportamental e Cognitiva (p. ex.: Matos, 2001;
Simonassi, 1999) e em capítulos de outros livros (p. ex.: Abreu-Rodrigues e Sanabio, no
prelo). As contribuições da pesquisa básica descritas a seguir foram baseadas nos artigos de
revisão feitos por Abreu-Rodrigues e Sanabio
(no prelo) e por Matos (2001).
Na literatura de controle por regras, o termo instrução tem sido freqüentemente empregado como sinônimo de regra ou indicando
maior especificidade (Abreu-Rodrigues e
Sanabio, no prelo). Neste texto, seu uso não
será diferenciado.
Pesquisas básicas têm confirmado que regras facilitam a aquisição de novos comportamentos, principalmente quando as contingências são complexas, imprecisas ou aversivas.
Entretanto um dos resultados mais salientes
dessas pesquisas tem sido a constatação de que
as regras podem produzir uma redução na sensibilidade comportamental às contingências
(Madden, Chase e Joyce, 1998, citados em
Abreu-Rodrigues e Sanabio, no prelo). O comportamento sensível seria aquele que muda sistematicamente diante de mudanças nas contingências de reforço. Assim, quando as contingências mudam e o comportamento não se
altera, diz-se que o comportamento é insensível às contingências. Tal fenômeno foi observado em investigações sobre controle instrucional. Nesse tipo de investigação, criam-se
situações experimentais em que as instruções
para o desempenho podem ser coincidentes ou
discrepantes com os esquemas de reforçamento
em vigor. Tipicamente, quando há discrepância,
os participantes apresentam desempenhos em
acordo com as instruções recebidas e insensíveis aos esquemas de reforçamento (AbreuRodrigues e Sanabio, no prelo).
213
A redução na sensibilidade às contingências, entretanto, não pode ser considerada uma
característica inerente ao controle instrucional,
já que tal redução foi modulada por diversos
aspectos, conforme indicado nos estudos experimentais revistos por Abreu-Rodrigues e
Sanabio (no prelo). Um desses aspectos é a
extensão com que os comportamentos gerados
pela instrução entram em contato com a discrepância entre instrução e contingência atual.
As autoras descreveram um experimento realizado por Galizio (1979) em que havia uma
condição segundo a qual seguir as instruções
não permitiria contato com a discrepância instruções-contingência, e uma outra condição
segundo a qual esse contato ocorreria. A conclusão desse autor foi de que o contato com a
discrepância instrução-esquema é necessário
para a redução/eliminação do controle instrucional (ou aumento na sensibilidade comportamental), e não apenas a existência de tal
discrepância. Outros estudos constataram o
mesmo fenômeno (Buskist e Miller, 1986;
Hayes et al., 1986, Experimento 1, citados em
Abreu-Rodrigues e Sanabio, no prelo).
Um segundo aspecto considerado por
Abreu-Rodrigues e Sanabio (no prelo) ao analisarem a insensibilidade às contingências no
comportamento governado por regras, foi o
conteúdo das instruções. Vários estudos foram
citados (Danforth et al., 1990; Dixon e Hayes,
1998; Otto, Torgrud e Holborn, 1999; Raia et
al., 2000; Wulfert, et al., 1994), nos quais,
quando as instruções especificavam com exatidão a tarefa, ocorreram respostas estereotipadas e insensibilidade comportamental. Já as
instruções vagas favoreceram o desenvolvimento de controle pelas contingências.
A variabilidade comportamental é um outro aspecto que afeta a sensibilidade às contingências. No estudo de LeFrancois, Chase e
Joyce (1988), descrito por Abreu-Rodrigues e
Sanabio (no prelo), os participantes que foram
expostos a apenas uma instrução e um esquema de reforçamento ficaram sob controle
instrucional, enquanto aqueles que receberam
várias instruções e vários esquemas de reforçamento apresentaram sensibilidade a mudanças nas contingências. A diferença foi discutida em termos da presença de alternativas
214
ABREU-RODRIGUES, RIBEIRO & COLS.
comportamentais promovidas pela exposição
à instrução e a esquemas variados, o que favoreceria a sensibilidade às novas contingências.
A densidade de reforços contingentes ao
comportamento instruído também afeta a sensibilidade à mudança. No estudo de Newman,
Buffington e Hemmes (1995, citado por AbreuRodrigues e Sanabio, no prelo), observou-se
um controle instrucional quando o comportamento de seguir instruções sempre produzia
reforços, tendo tal controle diminuído quando
esse comportamento era reforçado apenas parcialmente e sido eliminado quando não havia
reforços programados para seguir instruções.
Esse resultado pode ser uma evidência adicional de que comportamento de seguir instruções é um operante mantido apenas quando
reforçado.
A história de reforçamento do comportamento de seguir instruções foi apontada
como outra variável de controle da sensibilidade às contingências. No estudo de Martinez
e Ribes (1996), descrito por Abreu-Rodrigues
e Sanabio (no prelo), os participantes foram
submetidos a uma condição experimental de
seguimento de instrução falsa (que não descreviam acuradamente a relação resposta-conseqüência). Aqueles que haviam passado anteriormente pela condição de seguimento de
instrução verdadeira seguiram muito mais as
instruções falsas do que aqueles que não tiveram essa história prévia.
A persistência do controle instrucional em
situações em que o comportamento de seguir
instruções ocorre mesmo quando há discrepância entre a instrução e a relação respostaconseqüência, e mesmo quando há contato com
tal discrepância, tem sido atribuída à história
de reforços sociais para correspondência entre
instrução e comportamento (Hayes et al., 1986,
citados em Abreu-Rodrigues e Sanabio, no
prelo).
Uma descrição não-experimental dos efeitos da história de vida foi apresentada por Matos (2001): quando uma pessoa é “deixada à
vontade” ou é criada mais livremente “para se
defender por si mesma”, ela desenvolve estratégias para discriminar mais rapidamente as
contingências importantes para sua sobrevivência e, também, para discriminar mudanças nes-
sas contingências. Uma pessoa a quem sempre
foi dito o que fazer, a quem não foi dada a
chance de entrar em contato com as contingências naturais, senão com suas descrições,
torna-se especialmente dependente de contingências sociais, de regras sobre como agir. Se
um indivíduo obedece sempre a instruções, as
contingências naturais nunca terão oportunidade de atuar sobre seu comportamento. Se
ele obedece a instruções, conseqüências agradáveis (sociais e naturais) podem ocorrer, e
conseqüências aversivas são evitadas; se as
desobedece, conseqüências aversivas ocorrem,
contribuindo para aumentar o controle pela
regra.
A sensibilidade poderia ser, ainda, influenciada pelo grau de discriminabilidade das
contingências em vigor. No estudo realizado em
1995, por Newman e colaboradores, citado por
Abreu-Rodrigues e Sanabio (no prelo), os esquemas de reforçamento intermitente geraram
insensibilidade, ao passo que o esquema de
reforçamento contínuo produziu um desempenho sensível, havendo relação direta entre seguir instruções e densidade de reforços. Esse
resultado poderia ser explicado pelo fato de
que os esquemas intermitentes são mais dificilmente discrimináveis do que os esquemas
contínuos.
Conclusões similares sobre o grau de
discriminabilidade das contingências foram
apresentadas por Matos (2001): quando as regras são ambíguas, mas as contingências são
simples, fáceis de serem discriminadas, as pessoas passam a agir de acordo com tais contingências; mas, se são complexas e o desempenho exigido é elaborado, os indivíduos podem
apresentar um desempenho bastante variável
inicialmente, até ficarem sob controle das contingências em vigor, ou até formularem autoregras a partir de suas experiências passadas
com situações semelhantes.
Estudos sobre controle verbal investigaram não somente os efeitos de estímulos verbais gerados por outra pessoa como também
de estímulos verbais gerados pelo próprio indivíduo sobre seu comportamento não-verbal,
ou seja, têm sido estudados os efeitos de autoinstruções. Uma das formas de estudá-las é
verificar se há correspondência entre os com-
ANÁLISE DO COMPORTAMENTO
portamentos verbais e os não-verbais da mesma pessoa. Para conduzir tais estudos, os participantes são expostos a um determinado esquema de reforçamento e, durante ou após a
sessão experimental, são questionados acerca
de seus desempenhos não-verbais. Quando
ocorre a correspondência entre o relato e o
desempenho não-verbal, é comum a conclusão (apesar de questionável) de que o desempenho do participante estava sob o controle
de auto-instruções formuladas durante o experimento (Abreu-Rodrigues e Sanabio, no
prelo).
Catania, Matthews e Shimoff (1982) estudaram os efeitos de relatos verbais modelados e instruídos sobre a resposta não-verbal.
Os participantes deveriam trabalhar em um
esquema múltiplo de razão (na chave da esquerda) e de intervalo (na chave da direita).
Periodicamente deveriam completar a frase: “o
modo de ganhar pontos na chave da esquerda/direita é ...”. No Grupo Instrução, os participantes recebiam dicas sobre o que escrever;
no Grupo Modelagem, os participantes recebiam pontos pelas descrições. Quando os relatos
foram modelados, houve uma correspondência entre os comportamentos de relatar e de
pressionar a chave, mesmo na presença de discrepância entre os relatos e as contingências
não-verbais programadas. Mas quando os relatos eram instruídos, seu controle foi inconsistente sobre o comportamento de pressionar
a chave. Os autores concluíram que é mais
provável que o comportamento verbal controle comportamentos não-verbais quando o primeiro é modelado (e não-instruído).
Alguns estudos têm demonstrado que o
controle verbal, tal como o observado no estudo de Catania e colaboradores (1982), só ocorre quando as contingências não-verbais em vigor não estão exercendo um controle discriminativo. Nos estudos em que havia contingências não-verbais consistentes e previsíveis, o
comportamento verbal e o não-verbal foram
controlados por suas respectivas contingências
(Cerutti, 1991; Torgrud e Holborn, 1990, citados por Abreu-Rodrigues e Sanabio, no prelo).
Já quando as contingências não-verbais programadas eram aleatórias e/ou incontroláveis,
os relatos influenciaram o desempenho não-
215
verbal (Cerutti, 1991, citado por AbreuRodrigues e Sanabio, no prelo).
A correspondência entre o dizer e o fazer
também é influenciada por sua história de
reforçamento. Após uma história de reforçamento de correspondência entre os comportamentos verbal e não-verbal, se um determinado tipo de relato é reforçado, a ação correspondente é observada; no caso de uma história de reforçamento de ausência de correspondência, o reforçamento de um relato pode não
ser acompanhado de uma ação correspondente (Amorim, 2001, citado em Abreu-Rodrigues
e Sanabio, no prelo).
Uma comparação entre instruções, auto-instruções e ausência de instruções foi
efetuada no estudo de Rosenfarb e colaboradores (1992), relatado por Abreu-Rodrigues e
Sanabio (no prelo). Nesse estudo, três grupos
foram formados: no Grupo Auto-Instruções, os
participantes eram solicitados a relatarem a
melhor forma de obter reforços; no Grupo Instruções Externas, eram apresentados os relatos gerados pelo primeiro grupo; e no Grupo
Sem Instruções, os participantes nem foram
solicitados a emitir relatos, nem recebiam relatos externos. Ao final da fase de aquisição,
os Grupos Auto-Instruções e Instruções Externas apresentaram desempenhos mais apropriados aos esquemas em vigor do que o Grupo
Sem Instruções; mas após uma fase de extinção, o Grupo Sem Instrução apresentou maior
redução de respostas do que os outros dois grupos. As conclusões a que os autores chegaram
foram de que:
a) auto-instruções e instruções externas
facilitam o controle exercido por contingências complexas;
b) instruções e auto-instruções retardam
o processo de extinção, ou seja, reduzem a sensibilidade à mudança;
c) a formulação de instruções não é uma
condição necessária para que as contingências exerçam o controle sobre o
comportamento.
Quanto à comparação entre instruções e
auto-instruções, a conclusão foi de que seus
efeitos são funcionalmente equivalentes, sen-
216
ABREU-RODRIGUES, RIBEIRO & COLS.
do ambas mantidas por reforçamento da comunidade verbal.
É importante considerar que quando há
correspondência entre auto-relato e desempenho não-verbal é difícil afirmar se o desempenho não-verbal está sendo controlado pelo relato ou se as mesmas contingências controlam
tanto a ação quanto a descrição da ação, sem
que o relato participe da determinação da ação.
É necessário cautela ao interpretar relações
entre eventos privados e públicos. Algumas
relações são possíveis (Abreu-Rodrigues e
Sanabio, 2001): a) um evento ambiental observável produz o comportamento privado
(neste caso, a auto-regra) e este, por meio de
suas funções de estímulo, influencia o comportamento público (neste caso, o desempenho
não-verbal); b) o comportamento público é
afetado diretamente pelo evento ambiental,
mas também é influenciado pelo comportamento privado produzido pelo mesmo evento
ambiental; e c) o evento ambiental gera tanto
o comportamento privado quanto o comportamento público, mas não há relação entre esses dois comportamentos.
Uma outra consideração a ser levada em
conta é a de que os relatos podem não ser tatos puros (Skinner, 1957), ou seja, serem determinados não apenas pelos estímulos que
descrevem, mas também por outras variáveis
ambientais. O relato de encobertos pode ser,
por exemplo, uma forma de exprimir um sentimento, ou de se esquivar de um tema, ou mesmo uma forma de agredir o interlocutor ou de
testar seu nível de aceitação ou de empatia
(Delitti e Meyer, 1995). Conforme indicado por
Abreu-Rodrigues e Sanabio (no prelo), as pesquisas têm indicado que vários fatores podem
exercer influência sobre os auto-relatos: o
limite de tempo para a resposta de escolha
(Critchfield e Perone, 1990), o número de estímulos-modelo (Critchfield e Perone, 1993),
o número de estímulos de comparação
(Critchfield, 1993) e uma história de punição
(Sanabio, 2000).
Uma análise das contribuições da pesquisa básica indica que a insensibilidade às contingências de reforçamento não é efeito inevitável do seguimento de regras. Devem ser levados em consideração a densidade de refor-
ços, o grau de contato com a discrepância entre
instruções e contingências e o grau de discriminabilidade da contingência em vigor; a história de vida do indivíduo e o grau de variabilidade comportamental; o tipo de regra – se é
modelada ou instruída e se descreve desempenho específico ou se é vaga.
REGRAS E PSICOTERAPIA
Na maioria das terapias em consultório
com adultos, o terapeuta não tem controle direto sobre as contingências em vigor fora da
sessão terapêutica, sendo a intervenção baseada em “conversas”. É, porém, essa conversa durante a sessão que ajuda o cliente a lidar com
problemas enfrentados fora dali, no dia a dia
(Kohlenberg, Tsai e Dougher, 1993). O entendimento dos processos de mudança contemplados em terapia pode ser auxiliado pelo conceito de controle por regras.
No livro Recent Issues in the Analysis of
Behavior (Questões Recentes na Análise
Comportamental), Skinner (1989) afirmou que
terapeutas comportamentais, em vez de organizarem novas contingências de reforçamento
– tal como pode ser feito na escola, no lar, no
local de trabalho ou no hospital –, fornecem
conselhos na forma de ordens ou de descrição
de contingências, ou seja, emitem regras. Também os terapeutas comportamentais cognitivos
(p. ex.: Beck e Freeman, 1990/1993) descrevem sua própria atuação como diretiva, por
exemplo, ao instruir seus clientes a realizarem
diversas atividades fora do consultório. Matos
(2001) analisou, de maneira similar, que a habilidade de lidar com o comportamento humano verbal é a grande arma dos terapeutas e a
garantia de sucesso de suas práticas. Quando
os terapeutas orientam seus clientes a respeito
de algo, estão, muitas vezes, verbalizando regras, que podem ou não ser seguidas.
Entretanto há debates sobre quais são os
mecanismos responsáveis por mudanças ocorridas em psicoterapias. Pergunta-se se são as
técnicas específicas ou as variáveis da relação
terapêutica que propiciam os efeitos da terapia. Também tem sido questionado se mudanças comportamentais produzidas pela terapia
ANÁLISE DO COMPORTAMENTO
são modeladas por contingências da relação
terapêutica ou se são governadas por novas regras produzidas na terapia (Meyer, 2001;
Meyer e Vermes, 2001).
Atualmente, a importância da relação terapêutica é um consenso para os terapeutas
comportamentais, porém há diferenças quanto ao papel desempenhado por ela (Raue e
Goldfried, 1994). Por um lado, alguns autores
vêem o vínculo terapêutico como um meio para
facilitar outros aspectos importantes do processo de mudança, o que levaria a um maior
engajamento na terapia (Rangé, 1995;
Shinohara, 2000). Por exemplo, para Cahill,
Carrigan e Evans (1998), à medida que a relação se desenvolve e a terapia entra em uma
fase de tratamento mais ativa, uma boa relação terapeuta-cliente torna o terapeuta mais
eficaz, como um estímulo reforçador, e mais
diretivo, o que, por sua vez, permitiria ao
terapeuta ser consideravelmente mais influente
em encorajar o cliente a tentar novas formas
de pensamento e de ação. Por outro lado, há
autores que atribuem ao relacionamento que
ocorre em terapia o principal mecanismo de
mudança do cliente. Para esses terapeutas
comportamentais, a relação terapêutica é uma
oportunidade para o cliente emitir comportamentos que lhe têm trazido problemas e, a
partir da interação com o terapeuta, aprender
formas mais efetivas de respostas, ou seja, o
comportamento seria mais modelado pelas
contingências da relação terapêutica do que
governado por novas regras (Follette, Naugle,
e Callaghan, 1996; Kohlenberg e Tsai, 1991/
2001; Rosenfarb, 1992).
Processos psicoterápicos aparentemente
podem promover mudanças, quer por meio da
alteração do controle por regras, quer da modelagem na relação terapêutica. O mais provável é que os dois tipos de procedimentos estejam envolvidos nos processos de mudança,
em proporções diferentes, conforme o terapeuta e o cliente. A pesquisa de Zamignani
(2001) fornece apoio à noção de que terapeutas
comportamentais podem usar, para promover
mudanças, tanto procedimentos de modelagem
por conseqüências (reforçamento diferencial),
como controle por regras (sugestão de alternativas de resposta para solução de problemas,
217
proposta de atividade incompatível com a resposta-queixa, recomendação de exposição e/
ou prevenção de respostas, ensino de procedimentos, solicitação de coleta de dados ou recomendação para o cliente alterar pensamentos ou sentimentos). Foram comparados os desempenhos verbais de dois terapeutas analistas do comportamento atendendo um cliente
com, e um sem, o diagnóstico de Transtorno
Obsessivo-Compulsivo (TOC). Constatou-se
que um dos terapeutas apresentou um percentual elevado de verbalizações de aprovação
para ambos os clientes, apresentando verbalizações de aconselhamento praticamente só
com o cliente com TOC, o qual tinha dificuldade em iniciar respostas de forma espontânea.
Já o outro terapeuta apresentou predominantemente verbalizações de aconselhamento e de
explicação com ambos os clientes.
O uso da orientação, como uma das formas de produzir mudanças por regras, pode
ter vários determinantes: a abordagem teórica
comportamental, que tem produzido intervenções bem-sucedidas com o uso de procedimentos padronizados envolvendo orientação; o
cliente, que por vezes solicita conselhos; a experiência clínica, durante a qual pode ter havido reforço diferencial do emprego de estratégias diretivas; a história de vida pessoal, que
poderia ter modelado, por exemplo, um estilo
de interação pessoal mais controlador (Meyer
e Donadone, 2002). Dois grandes grupos de
variáveis serão analisados a seguir: a abordagem teórica e história de vida do cliente.
Abordagem teórica
Ao descrever diversas modalidades de terapia, autores como Frank e Frank (1993) e
Garfield (1995) afirmam que as terapias
comportamentais e cognitivas são diretivas e
que nelas o terapeuta prescreve um programa
terapêutico que compreende procedimentos específicos, guiando e encorajando os esforços
do cliente nas sessões de tratamento e na vida
diária. Por exemplo, terapeutas comportamentais podem dar instruções ao cliente de como
relaxar, dar exercícios para serem praticados
em casa, instruí-lo em como visualizar expe-
218
ABREU-RODRIGUES, RIBEIRO & COLS.
riências particulares e ajudá-lo a construir uma
hierarquia de situações temidas.
O estudo de Ablon e Jones (2002) fornece alguns dados empíricos para essa concepção. Os autores utilizaram um instrumento de cem itens e analisaram o processo de
interação terapeuta-cliente em 58 sessões de
terapia cognitivo-comportamental para indivíduos deprimidos. Segundo eles, alguns dos
itens mais característicos dessa forma de terapia (e que se relacionam ao controle por
regras) foram: discussão freqüente sobre atividades e tarefas específicas para o cliente
tentar fora da sessão, explicações e conselhos
explícitos. Foi verificado que os clientes
freqüentemente concordavam e aceitavam as
colocações do terapeuta, não iniciavam muitos tópicos de conversa em sessão, além de
cumprirem as solicitações feitas. A melhora
foi associada, entre outros fatores, à obediência, à admiração ou à aprovação apresentada
pelos clientes em relação a seus terapeutas,
desejo de maior proximidade e aceitação de
suas intervenções sem ambivalência ou suspeita. É possível inferir que os procedimentos
adotados funcionaram como regras e que seus
efeitos foram obtidos por meio do reforçamento social fornecido pelo terapeuta. Esse
efeito seria uma forma de mais comportamento aquiescente e não de rastreamento (Hayes
e Ju, 1998), ou seja, mais controlado por aprovação social do terapeuta do que pelas contingências naturais (fora da sessão) do comportamento instruído.
Já terapias psicodinâmicas consideram
que dar sugestões não seria uma atuação
psicoterapêutica evocativa ou que propicie
descobertas, objetivos que seriam alcançados
por meio da auto-exploração e da busca de
soluções pelo próprio cliente, estratégias que
consideram mais intensas e desejáveis
(Garfield, 1995). Corey (1983) afirmou ser
freqüente haver clientes que, quando estão
passando por um sofrimento, chegam à sessão de terapia buscando ou até exigindo um
conselho inteligente para tomar uma decisão
ou que o terapeuta resolva um problema por
eles. Esse autor diz, no entanto, que a terapia
não deve ser confundida com o ato de dar informação, orientação ou conselho. A tarefa do
terapeuta consistiria em ajudar o cliente a
descobrir suas próprias soluções e encontrar
seu caminho, mas sem dizer como deveria
fazê-lo. Miranda e Miranda (1993) descreveram a tarefa de orientar como o ato de avaliar com o cliente as alternativas de ações possíveis e facilitar a escolha de uma delas. À
medida que o terapeuta atende, responde, personaliza e orienta, o cliente começa a se comportar de modo a promover sua própria mudança. Isso quer dizer que, explorada sua situação insatisfatória e compreendidas as várias peças dessa situação, o cliente muitas vezes elabora sozinho seu plano de ação, sem
ajuda direta do terapeuta.
Mas mesmo terapeutas não-comportamentais (Corey, 1983; Miranda e Miranda,
1993) consideram que há casos em que a orientação direta do terapeuta mostra-se necessária, por exemplo, quando o cliente não tem
domínio da área, quando se encontra claramente em perigo de se prejudicar (como na ameaça de suicídio) ou de prejudicar outros, ou
quando se vê por certo tempo incapacitado para
fazer opções. Ainda assim, eles consideram que
a decisão final sempre é do cliente.
As afirmações de que o terapeuta comporta-se de forma a fazer com que o cliente
encontre novas formas de ação “sem ajuda direta” (Garfield, 1995; Corey, 1983; Miranda e
Miranda,1993) sugerem que a intervenção terapêutica baseia-se na modelagem direta do
comportamento verbal, incluindo a modelagem
de auto-regras (ver o Capítulo 13 para informações mais específicas sobre essa questão).
Esse procedimento estaria em acordo com a
sugestão de Catania (1998/1999) de que a
mudança do comportamento verbal do indivíduo pode facilitar a mudança do comportamento não-verbal correspondente. Nessa forma de
intervenção, o terapeuta modelaria o comportamento verbal do cliente em vez de instruí-lo
diretamente. Com relação à análise de qual
processo de mudança, de regras ou de modelagem pelas contingências é responsável pelas
mudanças clínicas, não se deve perder de vista
que mesmo que o processo descrito seja o de
modelagem de auto-regras (modelagem dentro da sessão terapêutica), ainda assim a mudança produzida pela psicoterapia na vida di-
ANÁLISE DO COMPORTAMENTO
ária do cliente seria obtida primordialmente
pela introdução ou pela alteração de regras,
quer formuladas pelo terapeuta, quer pelo
cliente.
219
que não o instruído e a importância ou magnitude da conseqüência prevista na regra. Ao
contrário do aquiescer, o rastrear praticamente dispensa a figura do agente social (Matos,
2001).
História de vida do cliente
Problemas na formulação de auto-regras
Para Hayes, Kohlenberg e Melancon
(1989), muitas desordens clínicas envolvem
problemas no controle verbal, como os quatro
a seguir:
a) problemas do cliente na formulação
de auto-regras;
b) probelmas nas regras aprendidas;
c) problemas no não-seguimento de regras;
d) problemas no seguimento excessivo de
regras.
Para entender os problemas no seguimento de regras é necessário analisar os controles
envolvidos no aquiescer e no rastrear. Pelo menos cinco variáveis ou circunstâncias modulam
o comportamento controlado por regras do tipo
aquiescer de acordo com Zettle e Hayes (1982,
citado em Matos, 2001):
a) a habilidade ou a capacidade do agente social de monitorar o comportamento de seguir a regra;
b) a habilidade ou a capacidade do agente social de realmente poder cumprir
com as conseqüências previstas;
c) a importância das conseqüências previstas ou a magnitude do reforço;
d) a história de confiabilidade do agente
social;
e) a importância das conseqüências previstas para outros comportamentos
que não seja o de seguir a regra.
Já a regra tipo rastreamento é afetada
por variáveis que influenciam a concordância
da regra aos eventos (p. ex.: sua clareza, sua
precisão, o fato de a regra ser completa ou
incompleta), por variáveis que afetam a importância dessa concordância, das conseqüências existentes para outros comportamentos
Formular auto-regras é um repertório importante, especialmente nos casos em que o
comportamento gerador de problemas está sob
um maior controle das contingências diretas e
imediatas, como ocorre na impulsividade.
Quando o repertório de seguimento de regras
de uma pessoa não está bem desenvolvido, ela
pode ser rotulada tanto como impulsiva quanto como preguiçosa, anti-social ou imoral
(Hayes e Ju, 1998). De acordo com esses autores, as auto-regras introduzem novas formas
de regulação social, propiciando maior resistência à extinção ou a conseqüências imediatas, e estas são características similares às do
seguimento de regras enunciadas por outros.
Desordens na formulação de auto-regras
podem ocorrer pelo menos de duas maneiras
básicas: a pessoa pode falhar na formulação
de regras, quando seria vantajoso fazê-lo e a
pessoa pode formular regras, mas o faz de maneira imprecisa ou não-realista. De acordo com
Hayes e Ju (1998), a estratégia terapêutica
mais acertada nesses casos pode ser a de ensinar a formulação de regras apropriada, ou seja,
ensinar o cliente a colocar seu comportamento verbal sob controle direto dos eventos
vivenciados e de suas conseqüências naturais.
Problemas nas regras formuladas pelo grupo
Muitas das regras que guiam nosso comportamento são aprendidas de outras pessoas.
Problemas podem ocorrer nas práticas de formulação de regras da comunidade verbal em
geral. Culturas particulares e subculturas podem falhar no desenvolvimento de regras adequadas ou podem desenvolver regras imprecisas. Por exemplo, uma subcultura religiosa
pode desenvolver regras verbais sobre cura pela
fé que proíba seus adeptos de procurarem aju-
220
ABREU-RODRIGUES, RIBEIRO & COLS.
da médica para doenças que ameacem suas vidas. Similarmente, uma cultura pode deixar de
dar qualquer orientação verbal sobre tópicos
importantes de saúde (Hayes et al., 1989).
Nessas situações, o terapeuta pode tanto procurar na cultura em questão uma melhor formulação de regras como colocar o comportamento do cliente em contato direto com as
contingências naturais.
Falha em seguir regras
Formular regras vantajosas não é suficiente. É preciso também aprender a entendê-las e
a segui-las. Sem um repertório de ambos os
aspectos do seguimento de regras, padrões
desordenados de comportamento são prováveis. Em certas circunstâncias é desejável que
as regras compitam efetivamente com os efeitos destrutivos de algumas formas de controle
imediato por contingências. Por exemplo, a
regra “Não às drogas!” tem a intenção de estabelecer uma insensibilidade comportamental
a determinadas contingências diretas. Entretanto, mesmo que um adolescente saiba que
tomar drogas que viciam pode levá-lo a problemas extremamente indesejáveis, as contingências sociais imediatas (p. ex.: aceitação do
grupo de amigos) e os efeitos imediatos da
própria droga podem conduzi-lo a um padrão
de vício. Sem um padrão suficientemente forte de seguimento de regras, é mais provável
que a pessoa tenha seu comportamento controlado pelas contingências imediatas, mesmo
o resultado sendo destrutivo (Hayes et al.,
1989).
Algumas das técnicas usadas com pessoas com transtornos de caráter ou impulsivas
podem ser entendidas como uma tentativa de
estabelecer um maior grau de seguimento de
regras. Por exemplo, programas de tratamento em grupo para drogados são organizados
em torno de regras de conduta claramente
especificadas. A obediência às regras é promovida por meio de encontros em grupo, que
enfocam o sucesso e as infrações dos membros
do grupo. Esse controle social intenso pode ser
entendido como uma tentativa de estabelecer
aquiescência em relação às regras do progra-
ma. Contingências sociais fortes e consistentes são dadas para o seguimento de ordens,
possivelmente com a esperança de que surja
um maior grau de insensibilidade a conseqüências indesejáveis e imediatas (Hayes et al.,
1989). A adesão às regras também é freqüentemente conseguida com procedimentos similares em programas para emagrecimento, como
o dos Vigilantes do Peso, e nos grupos anônimos, como o dos Alcoólatras Anônimos.
Uma falha importante de seguimento de
regras, que afeta o resultado de psicoterapias,
é a chamada resistência do cliente. Alguns indivíduos que procuram ajuda profissional das
mais diversas formas de psicoterapia rejeitam
as orientações dadas por seus terapeutas. Esses clientes têm sido designados por terapeutas
como opositores, reacionários, não-cumpridores, intratáveis, não-motivados, resistentes.
O comportamento resistente e o colaborador
podem ter vários determinantes. Um deles é a
diretividade do terapeuta (incluindo conselhos,
perguntas, interpretações, apoio). Beutler, Moleiro e Talebi (2002) realizaram uma revisão
de 20 estudos que verificavam os efeitos diferenciais da diretividade do terapeuta, tendo em
vista a resistência dos clientes. Foi constatado
que 80% desses estudos demonstraram que as
intervenções diretivas funcionaram melhor
entre os clientes com baixo nível de resistência, enquanto as intervenções não-diretivas
funcionaram melhor entre os clientes com
graus mais altos de resistência, sugerindo que
os efeitos da resistência podem ser circundados pelo uso de intervenções não-diretivas e
autodirecionadas.
As pesquisas que indicam uma forte correlação entre a resistência do cliente e um resultado negativo da terapia e/ou abandono
desta e entre a resistência do cliente e comportamentos diretivos do terapeuta (Ablon e
Jones, 2002; Beutler, Moleiro e Talebi, 2002;
Bischoff e Tracey, 1995) sugerem que o uso
de estratégias diretivas, tal como a orientação,
não deveria estar vinculado apenas à linha
teórica e à preferência do terapeuta, a história de seguimento de regras e instruções do
cliente deve ser levada em consideração. Por
exemplo, para clientes com uma história de
dificuldades de seguimento de regras não se-
ANÁLISE DO COMPORTAMENTO
ria recomendado o uso de procedimentos
muito estruturados.
Outras considerações sobre a resistência
do cliente a mudanças foram feitas por Guilhardi
(2002) e sobre o manejo da resistência sob o
enfoque analítico-comportamental por Cautilli
e Connor (2000). Para esses autores, a resistência pode ser entendida e, portanto, trabalhada por meio de análise funcional. A resistência pode ser produzida por cinco problemas
(Cautilli e Connor, 2000):
1. falta de motivação, ou seja, reforçamento insuficiente para executar
a tarefa ou punição por executá-la,
ou existência de demasiados obstáculos;
2. tempo insuficiente para praticar a
habilidade antes de usá-la;
3. necessidade de mais ajuda para
implementar a habilidade nas condições existentes;
4. a habilidade é uma exigência inédita, que a pessoa não precisou fazer
antes;
5. a habilidade é complexa demais.
Falhas no seguimento de regras têm sido
também estudadas sob o tópico de adesão a
tratamentos. Problemas de adesão ou de aderência têm sido uma preocupação de profissionais da saúde e de relevantes pesquisas.
Malerbi (2000), ao analisar a questão da adesão aos tratamentos médicos, afirmou que o
nível de adesão não aumentou muito durante
os mais de 20 anos de estudos sobre o problema. A pesquisadora verificou, em levantamento bibliográfico, que o fator mais importante
que afeta a adesão é a complexidade do tratamento, ou seja, quanto mais complexo o tratamento, menor a adesão.
Seguimento excessivo de regras
Quando a formulação e/ou seguimento
de regras é muito forte, o comportamento pode
ser descrito como obsessivo, ansioso, dependente, insensível ou rígido. Nesses casos, o
ensino de formulação de regras ou o aumento
221
da insensibilidade às contingências diretas podem piorar o problema. Diminuir ou evitar o
controle por regras seria a estratégia recomendada (Hayes e Ju, 1998). De fato, uma importante função da terapia tem sido a diminuição
do controle exercido pelas regras, ou seja, do
controle exercido pela aprovação social e o
aumento correspondente do controle das contingências naturais e “genuínas”. O comportamento governado por regras nunca apreende
de forma completa as sutilezas do comportamento controlado diretamente pela experiência. Dirigir um carro após a leitura de um livro
a esse respeito não equivale a dirigir após haver dirigido por muitos meses. Interagir com
membros do sexo oposto após receber algumas dicas de amigos não é o mesmo que a
interação de um indivíduo socialmente experiente.
Para diminuir o controle pelas regras, entretanto, não basta ter suficiente experiência.
Algumas regras podem ser apoiadas de maneira generalizada pela comunidade verbal de tal
forma que a experiência direta pode não sobrepujar os efeitos da regra. Há casos, de acordo com a pesquisa básica, nos quais o uso prévio da regra pode interferir no controle de experiências diretas de tal forma que os benefícios da experiência direta subseqüente são atenuados. Nesses casos, pode ser importante considerar o alerta dado por Matos (2001): se um
comportamento foi instalado e está sendo mantido por conseqüências sociais, mesmo existindo conseqüências naturais colaterais, não será
suficiente o terapeuta trabalhar com conseqüências naturais ao tentar eliminar um comportamento controlado por regras. Se for desejável modificar ou afetar um comportamento controlado por regras, pode ser preciso
mudar a regra.
Quando o controle por regras é indesejável, dois cursos terapêuticos parecem disponíveis: evitar controle verbal ou alterá-lo a
fim de diminuir os efeitos de produção de insensibilidade. A terapia de aceitação e compromisso (ACT), proposta por Hayes, Strosahl
e Wilson (1999), e a psicoterapia analítica funcional (FAP), proposta por Kohlenberg e Tsai
(1991/2001), exemplificam essas estratégias
terapêuticas. De acordo com as bases teóricas
222
ABREU-RODRIGUES, RIBEIRO & COLS.
da ACT (Hayes et al., 1999), quando determinadas regras tornam o comportamento do indivíduo insensível às contingências naturais,
elas podem adquirir uma autonomia funcional e podem tornar-se a causa presumida do
comportamento problemático, de forma que a
tentativa de eliminar essa causa por meio de
outras regras pode piorar o problema. A ACT,
então, atuaria para alterar o contexto em que
as regras são formuladas, e não as regras em si
(Hayes e Ju, 1998). Já na FAP, o terapeuta
prioriza a modelagem direta dos comportamentos clinicamente relevantes que ocorrem na sessão. As reações genuínas do terapeuta ao comportamento do cliente reforçam, provavelmente, de maneira natural, melhoras à medida que
elas ocorrem na sessão terapêutica. Por exemplo, em vez de instruir o cliente que procurou
ajuda por problemas de intimidade em relacionamentos a realizar exercícios de comunicação
com seu companheiro, o terapeuta pode reforçar melhoras nas respostas de retraimento que
ocorrem na própria relação com o terapeuta
(Kohlenberg e Tsai, 1991/2001). O único tipo
de regra que é formalmente estimulado é o
rastreamento, de modo que tanto o cliente
quanto o terapeuta são encorajados a descrever verbalmente as contingências envolvidas
em experiências vividas (Hayes et al., 1989).
INVESTIGAÇÕES RECENTES
E POSSIBILIDADES FUTURAS
Apesar de terem sido detectadas diferenças de atuação do terapeuta em terapias de
diferentes abordagens (p. ex.: Garfield, 1995),
é possível que existam práticas comuns a uma
cultura terapêutica que surgem da solução de
problemas clínicos. As pesquisas deveriam procurar responder se os terapeutas comportamentais (tanto os denominados analíticocomportamentais quanto os cognitivo-comportamentais) utilizam a formulação de novas regras como mecanismo básico de mudança e se
há diferenças quando estas são enunciadas pelo
terapeuta ou pelo cliente (auto-regras), assim
como se regras e auto-regras são realmente
menos utilizadas por terapeutas de outras abordagens teóricas.
Tais pesquisas já foram iniciadas. Meyer
e Donadone (2002) estudaram o emprego da
orientação por terapeutas comportamentais. O
objetivo da pesquisa foi verificar se os terapeutas comportamentais experientes (isto é, os
que já tiveram seus comportamentos terapêuticos modelados e não apenas instruídos por
seus professores e supervisores) utilizam a estratégia de orientar seus clientes, qual a freqüência do uso desta estratégia e quais as formas dessas orientações. O estudo foi descritivo, procurando controlar parcialmente as variáveis “influência das características do cliente” ao solicitar três clientes para cada
terapeuta, a “influência das características do
terapeuta” ao selecionar três terapeutas da
mesma abordagem teórica e a “influência das
sessões” ao pedir três sessões por cliente. O
número de clientes por terapeuta e de sessões
por cliente foi diferente do planejado, mas permitiu a análise de tendências.
Nesse estudo, a orientação foi entendida
como uma descrição do comportamento a ser
executado pelo cliente fora das sessões de terapia, com indicação explícita ou implícita das
conseqüências desta ação. As seguintes subcategorias foram selecionadas para análise.
Primeiro, orientação para a ação, isto é, orientações que indicavam diretamente de que forma o cliente deveria comportar-se no cotidiano. Segundo, a orientação para a reflexão, ou
seja, indicações mais indiretas, aconselhando
o cliente a refletir sobre determinado tema. E,
terceiro, prescrição de tarefas, indicando tarefas terapêuticas para casa como parte de um
procedimento estruturado. Pretendeu-se verificar ainda se, quando orientava, o terapeuta
estava especificando o comportamento a ser
emitido ou se dava orientações genéricas, uma
vez que a literatura tem mostrado que principalmente a primeira destas formas pode produzir o efeito de “insensibilidade às contingências naturais” (p. ex.: Hayes e Ju, 1998).
Os terapeutas variaram o número total
de falas e o número de falas com orientação
por sessão com todos os clientes. A flutuação
de falas dos terapeutas não pareceu ser controlada por diferenças entre clientes, já que
houve variações entre sessões de um mesmo
cliente para todos os terapeutas. Para os três
ANÁLISE DO COMPORTAMENTO
terapeutas foi baixa a proporção de falas com
orientação, indicando não ser esta uma estratégia muito usada por nenhum dos terapeutas
comportamentais experientes. Observaram-se
também grandes flutuações entre sessões e
entre clientes de cada terapeuta quanto ao
número de falas contendo orientação, não sendo estas, portanto, variáveis de controle relevantes. Quando os terapeutas usavam orientações, estas tendiam a ser específicas e poucas
vezes genéricas. Quando orientou, o primeiro
terapeuta indicou ações específicas a serem
realizadas por seus clientes no cotidiano, na
maioria das vezes; já o segundo terapeuta prescreveu tarefas, enquanto o terceiro terapeuta
indicou tanto ações quanto reflexões para seus
clientes. A prescrição de tarefas, tipo de orientação que mais se esperaria de terapeutas comportamentais, de acordo com a literatura, não
ocorreu em todas as sessões, tampouco foi apresentada a todos os clientes. Apesar de o número de dados não ter sido suficiente para generalizações, aparentemente o comportamento
de orientar não foi modelado pelos clientes
destes terapeutas experientes. Mais pesquisas
poderiam ser conduzidas para verificar a validade das conclusões.
Em continuação a essa investigação,
Donadone (2002) elaborou um projeto de pesquisa no qual parte do procedimento do estudo anterior será replicado, mas que contará
também com a análise de auto-orientações, entendidas como uma descrição do comportamento, feita pelo cliente, a ser executado por
ele mesmo fora da sessão, com descrição explícita ou implícita das conseqüências de suas
ações. O estudo pretende comparar o emprego de orientações e o uso de estratégias para
produzir auto-orientações, tanto por terapeutas
comportamentais experientes quanto por terapeutas com pouca experiência.
O interesse em estudar o uso de orientação por terapeutas iniciantes surgiu a partir
de uma comparação não planejada: o treino
em categorizar, realizado no estudo anterior,
foi feito com transcrições de sessões de terapeutas em início de carreira, nas quais havia
uma freqüência bem mais alta de orientações
do que a encontrada com os terapeutas experientes. A diferença poderia ser explicada pe-
223
las afirmações de Banaco (1993), de Ferrari
(1996) e de Alvarez (1999), de que terapeutas
experientes encontram-se mais sob controle das
contingências das sessões, enquanto terapeutas
pouco experientes ficam mais sob controle de
instruções, tendo dificuldades em discriminar
contingências da relação terapêutica durante
as sessões. O uso de orientação por terapeutas
pouco experientes poderia estar relacionado ao
seguimento de regras sobre “como proceder em
terapia” e à ansiedade em produzir mudanças
rápidas. Já os terapeutas experientes podem
ter tido uma história de punição por parte de
seus clientes quando usaram orientação, ou pelo menos foram reforçados diferencialmente ao
utilizarem outras estratégias: pode ser difícil
ser empático e orientar ao mesmo tempo.
Pesquisas deveriam ser conduzidas para
comparar o processo de manutenção das mudanças obtidas quando comportamentos foram
instalados por procedimentos diferentes. Contingências naturais do comportamento instruído passam a modelar sua forma de emissão?
Esse comportamento se extingue na ausência
de reforçamento social?
Uma outra questão a ser investigada refere-se ao efeito, na clínica, do emprego de
orientações genéricas e específicas tanto com
relação à insensibilidade às contingências naturais do comportamento (ou, em outras palavras, ao controle social ou ao controle direto
pelas contingências) quanto ao seu seguimento ou não. É importante, também, procurar
responder a questionamentos sobre que processos comportamentais são responsáveis pelas mudanças obtidas por meio da psicoterapia:
alteração do controle por regras, modelagem
na relação terapêutica, ambas, e, em caso positivo, em que proporção? E os resultados obtidos diferem em sua manutenção e generalização? Certamente, a cada pesquisa realizada,
novas perguntas surgirão.
CONCLUSÃO
As razões do desenvolvimento do controle por regras relacionam-se com o fato de que
os homens podem, utilizando descrições verbais, induzir uns aos outros – ou a si mesmos –
224
ABREU-RODRIGUES, RIBEIRO & COLS.
a se comportarem de modo efetivo sem que
haja necessidade de exposição, geralmente longa, às conseqüências descritas. Essa característica do comportamento governado por regras
parece especialmente necessária quando as
conseqüências produzidas pelo comportamento são muito atrasadas ou escassas, tornandose, portanto, ineficazes na modificação de comportamentos; ou ainda quando os comportamentos que seriam modelados pelas contingências em vigor são indesejáveis. As vantagens
do controle por regras são justamente sua eficácia – rapidez com que se instala – e sua força
(Skinner, 1974/1982). A desvantagem de seguir regras é evidenciada quando as contingências mudam e as regras não. Pode ocorrer a
insensibilidade às contingências, ou seja, a nãoalteração do desempenho e a continuidade de
emissão da resposta anteriormente necessária
a sua produção.
A terapia comportamental tem tido amplos reconhecimento e aceitação, especialmente com casos difíceis de transtornos psiquiátricos. Uma das vantagens apontadas é a rapidez
com que os resultados são obtidos. E a rapidez
da aprendizagem é uma das vantagens dos
comportamentos governados por regras. É possível que o sucesso dos procedimentos usados
nesses casos se devam, em parte, a essa vantagem do controle por regras.
Outra forma de trabalho de terapeutas é
o favorecimento do autoconhecimento de seus
clientes, ou seja, a promoção da identificação
e da descrição das prováveis contingências que
controlam os comportamentos atuais e as que
foram responsáveis por sua instalação no passado. As descrições de contingências, como vimos, são regras se elas controlarem o comportamento subseqüente. Assim, um comportamento modelado por contingências pode passar a
ser, em parte, controlado por sua descrição,
uma vez que a regra produzida pode facilitar o
desempenho (Skinner, 1974/1982). Entretanto o mero fato de descrever as contingências
não significa que estas necessariamente passem a participar do controle do comportamento descrito. Comportamentos não precisam de
descrição para mudar. É possível, por exemplo, solucionar problemas sem a prévia descrição das contingências em vigor (Simonassi,
1999). Kohlenberg e Tsai (1991/2001) também analisaram a questão da influência do
comportamento verbal sobre o não-verbal, ao
falar dos papéis que os pensamentos podem
ter, considerando essa influência uma relação
entre respostas e não uma relação de causalidade, uma vez que na abordagem analíticocomportamental a explicação do comportamento é encontrada no ambiente. Esses autores definiram pensamento como tato (descrições) e mando (solicitações) a si mesmo e afirmaram que os três papéis dos pensamentos são:
influenciar comportamentos subseqüentes; não
influenciar comportamentos subseqüentes;
contribuir para aumentar a força de um comportamento subseqüente modelado por contingências. O grau de controle exercido pelo pensamento sobre problemas clínicos estaria em
um continuum. Abreu-Rodrigues e Sanabio
(2001) também descreveram sete possíveis relações entre eventos privados e públicos, estando três delas descritas na discussão sobre
correspondência entre auto-relato e desempenho não-verbal, no tópico “Contribuições da
pesquisa básica” deste capítulo (p.212).
Essas análises têm implicações para o tratamento, o qual deve ser diferente de acordo
com o tipo de controle. Quando o pensamento
ou o evento privado tem influência no problema do cliente, o procedimento indicado pode
ser o de mudança dos pensamentos, ou seja, o
procedimento é aplicado a um elo da cadeia
comportamental, no qual são observadas mudanças. O terapeuta pode apresentar argumentos lógicos, questionamento das evidências e
apresentação de instruções para mudança de
crenças. No caso de o pensamento ou o evento
privado não influenciar o comportamento subseqüente, o tratamento deve ser direcionado
para mudar diretamente as ações do indivíduo
que estão lhe causando problemas. Nessa situação, o terapeuta cria condições de expor o comportamento do cliente a reforçamento positivo na sessão de terapia e no ambiente natural,
que poderia modelar e manter novos comportamentos (Kohlenberg e Tsai, 1991/2001).
Alguns cuidados devem ser tomados ao
empregar o conceito de governo por regras para
explicar fenômenos que ocorrem na clínica.
Não se deve confundir crenças, conceito usado
ANÁLISE DO COMPORTAMENTO
pelos terapeutas comportamentais cognitivos,
com regras, apesar de existirem algumas semelhanças. Afirmar que um cliente possui uma
crença, muitas vezes irracional, e que ela é responsável por comportamentos que causam problemas é usualmente uma afirmação sobre a
probabilidade de comportamento (e não sobre o controle do comportamento por um estímulo discriminativo verbal que descreve uma
contingência) e está baseada na observação de
instâncias ou de relatos passados do comportamento (Costa, 2002). O termo “regra” é por
vezes usado de maneira similar, isto é, indicando probabilidade de comportamentos,
como nos alertou Baum (1994/1999), ao afirmar que não é correto afirmar que uma pessoa
está seguindo uma regra quando se percebe
algum tipo de regularidade no comportamento dela, prática comum entre alguns analistas
clínicos do comportamento. Por exemplo, um
terapeuta pode ter identificado em cliente um
comportamento inadequado em relação à aproximação de mulheres e também uma história
de punição para essa classe de ações. Não seria correto concluir que essa história levou-o
ao desenvolvimento da regra “se eu for falar
com alguma moça, vai dar tudo errado”, que
teria, então, passado a controlar seu comportamento de esquiva social. Não há necessidade de supor que uma regra esteja controlando
o comportamento: identificar contingências
que atuaram na história de vida provavelmente é suficiente para entender a função deste
comportamento.
Uma outra consideração diz respeito ao
problema que pode ocorrer ao se desenvolver
uma avaliação funcional, de se atribuir a regras aprendidas ou a auto-regras o controle dos
comportamentos que fizeram um indivíduo
buscar ajuda psicológica. Por serem, pelo menos na maioria das vezes, comportamentos instalados há bastante tempo, certamente eles
estão sendo mantidos por contingências. É
possível que as contingências que mantenham
o comportamento problemático sejam sociais,
e que estejam mantendo comportamentos de
seguimento de regras, mesmo que tais regras
estejam em desacordo com as contingências diretas do comportamento especificado pela regra. Não se pode, contudo, dizer que se trata
225
de comportamento governado por regra, pois,
segundo Albuquerque (2001, p. 139):
Quando regras são discrepantes das contingências de reforço (isto é, quando a emissão
do comportamento previamente especificado
pela regra produz conseqüências que não
correspondem às conseqüências descritas na
própria regra), pode-se dizer que a emissão
do comportamento previamente especificado
pela regra é controlado pela regra, apenas antes que as conseqüências produzidas por esse
comportamento (isto é, as conseqüências que
contradizem a própria regra) exerçam algum
efeito sobre ele. Depois disso, o comportamento observado passa a ser controlado pelas contingências de reforço.
Novos comportamentos que surgem a partir da relação terapêutica podem, entretanto,
ser governados por regras.
Está implícito nas considerações anteriores o cuidado que se deve ter ao afirmar que
um comportamento é insensível a contingências. A insensibilidade pode ocorrer com relação a algumas conseqüências diretas da ação
instruída, mas não se pode dizer que o comportamento de seguir regras não é mantido por
contingências (sociais).
REFERÊNCIAS BIBLIOGRÁFICAS
Ablon, J. S.; Jones, E. E. (2002). Psychotherapy process
in the NIMH collaborative study of depression. Manuscrito não publicado.
Abreu-Rodrigues, J.; Sanabio, E. T. (2001). Eventos privados em uma psicoterapia externalista: Causa, efeito
ou nenhuma das alternativas? Em H. J. Guilhardi, M.
B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre
comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 206-216). Santo André, SP: ESETec.
Abreu-Rodrigues, J.; Sanabio, E. T. (no prelo). Instruções e auto-instruções: Contribuições da pesquisa básica. Em C. N. de Abreu e H. J. Guilhardi (Orgs.), Manual prático de técnicas em psicoterapia comportamental,
cognitiva e construtivista. São Paulo: Editora Roca.
Albuquerque, L. C. (2001). Definições de regras. Em
H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C.
Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7.
Expondo a variabilidade (p. 132-140). Santo André, SP:
ESETec.
Alvarez, L. F. (1999). Condições que facilitam o aprimoramento da prática clínica: Atribuições de psicoterapeutas comportamentais experientes e não experientes. Monografia não-publicada, Curso de Especia-
226
ABREU-RODRIGUES, RIBEIRO & COLS.
lização em Psicologia Clínica, Universidade Estadual
de Londrina, PR.
Banaco, R. A. (1993). O impacto do atendimento sobre
a pessoa do terapeuta. Temas em Psicologia, 2, 71-79.
Banaco, R. A. (1997). Auto-regras e patologia comportamental. Em D. R. Zamignani (Org.), Sobre comportamento e cognição: Vol. 3. A aplicação da análise do comportamento e da terapia cognitivo-comportamental no
hospital geral e nos transtornos psiquiátricos (p. 80-88).
Santo André, SP: ARBytes.
Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura (M. T. A. Silva, M. A. Matos
e G. Y. Tomanari, trads.). Porto Alegre, RS: Artmed (Obra
publicada originalmente em 1994).
Beck, A.; Freeman, A. (1993). Terapia cognitiva dos
transtornos de personalidade (A. E. Fillman, trad.). Porto Alegre: Artes Médicas (Obra publicada originalmente
em 1990).
Beutler, L. E.; Moleiro, C.; Talebi, H. (2002). Resistance
in psychotherapy: What conclusions are supported by
research. JCLP/In Session: Psychotherapy in Practice, 58,
207-217.
Bischoff, M. M.; Tracey, T. J. C. (1995). Client resistance as predicted by therapist behavior: A study of
sequential dependence. Journal of Counseling Psychology, 42, 487-495.
Cahill, S. P.; Carrigan, M. H.; Evans, I. M. (1998). The
relation between behavior theory and behavior therapy:
Challenges and promises. Em J. J. Plaud; G. H. Eifert
(Eds.), From behavior theory to behavior therapy (p. 294319). Boston: Allyn and Bacon.
Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. Souza et al.; trads). Porto Alegre, RS: Artmed (Obra publicada originalmente em 1998).
Catania, A. C.; Matthews, B. A.; Shimoff, E. (1982). Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior, 38, 233-248.
Cautilli, J.; Connor, L. S. (2000). Assisting the client/
consultee to do what is needed: A functional analysis
of resistance and other forms of avoidance. The Behavior
Analyst Today, 1, 37-42.
Corey, G. (1983). Técnicas de aconselhamento e psicoterapia. Rio de Janeiro: Campus.
Costa, N. (2002). Terapia analítico-comportamental: Dos
fundamentos filosóficos à relação com o modelo cognitivista. Santo André, SP: ESETec.
Delitti, M.; Meyer, S. B. (1995). O uso de encobertos
na prática da terapia comportamental. Em B. Rangé
(Org.), Psicoterapia comportamental e cognitiva de transtornos psiquiátricos (p. 269-274). Campinas, SP: Editorial Psy.
de Rose, J. C. C. (1997). O relato verbal segundo a
perspectiva da análise do comportamento: Contribuições conceituais e experimentais. Em R. A. Banaco
(Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do
comportamento e terapia cognitivista (p. 148-164). Santo André, SP: ARBytes.
Donadone, J. C. (2002). O uso da orientação por
terapeutas comportamentais experientes e pouco experientes. Projeto de Dissertação de Mestrado financiado
pela FAPESP.
Ferrari, K. P. A. (1996). Aspectos do comportamento
do terapeuta comportamental iniciante que podem dificultar a prática psicoterápica nessa abordagem. Anais
da V Jornada da clínica de psicologia (p. 85-87). Belo
Horizonte: PUC/Minas.
Follette, W. C.; Naugle, A. E.; Callaghan, G.; M. (1996).
A radical behavioral understanding of the therapeutic
relationship in effecting change. Behavior Therapy, 27,
623-641.
Frank, J. D.; Frank, J. B. (1993). Directive individual
psychotherapies. Em J. D. Frank; J. B. Frank (Eds.),
Persuasion and healing. A comparative study of psychotherapy (p. 212-241). Baltimore: The John Hopkins
University Press.
Garfield, S. L. (1995). Psychotherapy: An eclecticintegrative approach. New York: John Wiley e Sons.
Guedes, M. L. (1997). O comportamento governado
por regras na prática clínica. Em R. A. Banaco (Org.),
Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 138-143). Santo
André, SP: ARBytes.
Guilhardi, H. J. (2002). A resistência do cliente a mudanças. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz,
M. C. Scoz (Orgs.), Sobre comportamento e cognição:
Vol. 9. Contribuições para a construção da teoria do comportamento (p. 133-156). Santo André, SP: ESETec.
Hayes, S. C.; Ju, W. (1998). The applied implications
or rule-governed behavior. Em W. O’Donohue (Ed.),
Learning and behavior therapy (p. 374-391). Boston:
Allyn and Bacon.
Hayes, S. C.; Kohlenberg, B. S.; Melancon, S. M. (1989).
Avoiding and altering rule-control as a strategy of clinical
intervention. Em S. C. Hayes (Ed.), Rule-governed
behavior: Cognition, contingencies, and instructional
control (p. 359-385). New York: Plenum Press.
Hayes, S. C.; Strosahl, K.; Wilson, K. G. (1999).
Acceptance and commitment therapy: An experiential
approach to behavior change. New York: Guilford Press.
Hayes, S. C.; Zettle, R. D.; Rosenfarb, R. (1989). Rulefollowing. Em S. C. Hayes (Ed.), Rule-governed behavior:
Cognition, contingencies, and instructional control (p.
191-220). New York: Plenum Press.
Jonas, A. L. (1997). O que é auto-regra? Em R. A.
Banaco (Org.), Sobre comportamento e cognição: Vol.
1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 144147). Santo André, SP: ARBytes.
Kohlenberg, R. J.; Tsai, M. (2001). Psicoterapia analítica funcional (F. Comte, M. Delliti, M. Z. Brandão, P. R.
Oerdyk, R. R. Kerbauy, R. C. Wielenska, R. A. Banaco;
R. Starling, trads.). Santo André, SP: ESETEc (Obra
publicada originalmente em 1991).
Kohlenberg, R. J.; Tsai, M.; Dougher, M. J. (1993). The
dimensions of clinical behavior analysis. The Behavior
Analyst, 16, 271-282.
ANÁLISE DO COMPORTAMENTO
Malerbi, F. E. K. (2000). Adesão ao tratamento. Em R.
R. Kerbauy (Org.), Sobre comportamento e cognição:
Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 148-155).
Santo André, SP: SET.
Matos, M. A. (2001). Comportamento governado por
regras. Revista Brasileira de Terapia Comportamental e
Cognitiva, III, 51-66.
Meyer, S. B. (2001). A relação terapeuta-cliente é o principal meio de intervenção terapêutica? Em H. J.
Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz
(Orgs.), Sobre comportamento e cognição: Vol. 8. Expondo a variabilidade (p. 95-98). Santo André, SP: ESETec.
Meyer, S. B.; Donadone, J. (2002). O emprego da orientação por terapeutas comportamentais. Revista Brasileira de Terapia Comportamental e Cognitiva, IV, 79-90.
Meyer, S. B.; Vermes, J. S. (2001). Relação terapêutica. Em B. Rangé (Org.), Psicoterapias cognitivo-comportamentais. Um diálogo com a psiquiatria (p. 101110). Porto Alegre, RS: Artmed.
Miranda, C. F.; Miranda, M. L. (1993). Construindo a
relação de ajuda. Belo Horizonte, MG: Crescer.
Rangé, B. (1995). Relação terapêutica. Em B. Rangé
(Org.), Psicoterapia comportamental e cognitiva de transtornos psiquiátricos (p. 43-61). Campinas: Workshopsy.
Raue, P. J.; Goldfried, M. R. (1994). The therapeutic
alliance in cognitive-behavior therapy. Em A. O.
Horvath; L. Greenberg (Orgs.), The working alliance:
Theory, research, and practice (p. 131-152). New York:
John Wiley e Sons.
227
Rosenfarb, I. S. (1992). A behavior analytic interpretation of the therapeutic relationship. The Psychological Record, 42, 341-354.
Sanabio, E.; Abreu-Rodrigues, J. (2002). Regras: Estímulos discriminativos ou estímulos alteradores de função? Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz,
M. C. Scoz (Orgs.), Sobre comportamento e cognição:
Vol. 9. Contribuições para a construção da teoria do comportamento (p. 114-119). Santo André, SP: ESETec.
Shinohara, H. (2000). Relação terapêutica: o que sabemos sobre ela? Em R. R. Kerbauy (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 229-233). Santo André, SP: SET.
Simonassi, L. E. (1999). Cognição: Contato com contingências e regras. Revista Brasileira de Terapia Comportamental e Cognitiva, I, 83-93.
Skinner, B. F. (1957). Verbal behavior. New Jersey:
Prentice-Hall.
Skinner, B. F. (1982). Sobre o behaviorismo (M. P.
Vilalobos, trad.). São Paulo: Cultrix (Obra publicada
originalmente em 1974).
Skinner, B. F. (1989). Recent issues in the analysis of
behavior. Columbus: Merrill Publishing Company.
Zamignani, D. R. (2001). Uma tentativa de caracterização da prática clínica do analista do comportamento no
atendimento de clientes com e sem o diagnóstico de transtorno obsessivo-compulsivo. Dissertação de Mestrado
não-publicada, Pontifícia Universidade Católica de São
Paulo, São Paulo.
CORRESPONDÊNCIA VERBAL/NÃO-VERBAL:
PESQUISA BÁSICA E APLICAÇÕES NA CLÍNICA
13
MARCELO EMÍLIO BECKERT
Questões do cotidiano devem encontrar
respaldo em investigações científicas. Assim
como as razões de o céu ser azul estarem na
física e as da síndrome de Down estarem na
biologia, a psicologia oferece uma contribuição enorme para o melhor entendimento do
homem em interação com seu mundo.
A mentira, a promessa não-cumprida, a
negação, a omissão ou o uso da fala como recurso educacional e terapêutico são temas do
cotidiano cuja compreensão é beneficiada pela
investigação da relação entre o comportamento verbal e o não-verbal. Essa área de investigação tem sido denominada de correspondência verbal/não-verbal, correspondência dizerfazer (ou fazer-dizer) ou apenas correspondência.
A relação entre o que é dito e feito (ou
vice-versa) por uma mesma pessoa já é investigada há algum tempo. La Pierre (1934, citado em Lloyd, 1994) atravessou os Estados Unidos com um casal de chineses, visitando 250
estabelecimentos, entre restaurantes e hotéis.
Posteriormente, enviou um questionário aos
proprietários perguntando sobre a possibilidade de eles hospedarem/servirem um casal de
chineses em suas propriedades. Quase 90% dos
proprietários responderam que não receberiam
o casal, apesar de já o terem feito, dando um
exemplo de falta de correspondência.
O primeiro estudo sobre correspondência na literatura analítico-comportamental foi
realizado por Risley e Hart (1968), publicado
no volume de inauguração do Journal of
Applied Behavior Analysis (JABA). O objetivo
desses autores era mais aplicado do que teórico. Eles queriam desenvolver um procedimento para produzir uma correspondência generalizada entre o dizer e o fazer, de forma que o
fazer pudesse ser modificado apenas pelo reforço do dizer. Os autores, então, alternaram
repetidas vezes os procedimentos de reforço
da verbalização (contingente apenas ao dizer)
e reforço da correspondência (contingente à
correspondência fazer-dizer) com diferentes
comportamentos não-verbais. Como conseqüência desse treino, as crianças apresentaram
uma correspondência generalizada, de modo
que o reforço de determinada verbalização
passou a ser suficiente para aumentar a freqüência do fazer correspondente. Os autores
sugeriram que, em vez de punir o comportamento verbal que não correspondesse ao comportamento não-verbal (ou vice-versa), a sociedade deveria estabelecer contingências de
reforçamento favoráveis ao desenvolvimento
da correspondência.
A partir desse trabalho, surgiu uma nova
linha de pesquisa na análise experimental do
comportamento: a análise operante da correspondência entre comportamentos verbais e
não-verbais. Essa análise levou a uma tecnologia de mudança de comportamento, conhecida por treino de correspondência (TC). O objetivo deste capítulo é a análise de questões
metodológicas e teóricas derivadas de pesquisas básicas sobre correspondência. Serão também discutidas algumas implicações dos achados dessas pesquisas para o contexto aplicado,
com ênfase no contexto clínico.
230
ABREU-RODRIGUES, RIBEIRO & COLS.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
Tipos de Cadeia
A abordagem analítico-comportamental
trata o dizer e o fazer como duas classes de
respostas distintas. O comportamento verbal é
definido como um comportamento operante
desenvolvido e mantido por reforçamento mediado por outra pessoa, o ouvinte (Skinner,
1957/1978). A investigação sobre o comportamento verbal na área analítico-comportamental teve seu grande boom na década de
1980. O aprimoramento metodológico e tecnológico e o surgimento de novas propostas
conceituais contribuíram para isso. Uma conseqüência do maior investimento nessa área
foi o fortalecimento da noção de que, em muitos contextos, o comportamento verbal exerce
uma importante influência sobre o comportamento não-verbal. Ou seja, mudanças no dizer
de um indivíduo podem facilitar a mudança
no fazer. Catania (1998/1999, p. 272), por
exemplo, define a palavra como “um meio de
levar as pessoas a fazerem coisas”. Catania e
colaboradores chegaram a propor a noção, para
muitos controversa, de ser mais fácil mudar o
comportamento humano modelando aquilo
que alguém diz do que modelando diretamente aquilo que alguém faz (Catania, Matthews,
e Shimoff, 1982; Catania, Matthews, e Shimoff,
1990). Nesse contexto, a investigação sobre as
variáveis que justificariam (ou não) uma congruência entre dizer e fazer ganhou força.
Analisando a literatura sobre correspondência, conclui-se que a pesquisa empírica oferece valiosos dados. O desafio é entender a
complexidade que envolve o fenômeno da correspondência e buscar nos dados de pesquisa
subsídios para melhor compreendê-la. Assim
sendo, alguns aspectos da literatura em questão valem ser revisados:
Os estudos sobre correspondência e controle verbal utilizam dois tipos de TC que se
diferenciam em termos da seqüência comportamental treinada. No treino dizer-fazer, o reforço é liberado quando a pessoa verbaliza o
comportamento não-verbal futuro e depois o
emite. Já no treino fazer-dizer, o reforço é liberado quando a pessoa emite um comportamento não-verbal e só depois verbaliza sobre ele.
O estudo de Israel e O”Leary (1973) foi
pioneiro na investigação empírica das possíveis diferenças entre o treino das cadeias dizer-fazer e fazer-dizer. Nesse estudo, o comportamento não-verbal alvo consistiu na escolha de três brinquedos pré-selecionados
pelos experimentadores dentre os 15 brinquedos disponíveis para as crianças. Foram realizados dois experimentos envolvendo três condições experimentais: linha de base, reforço
da verbalização e TC. Durante a condição de
linha de base, o reforço era sempre liberado,
independente da natureza da verbalização e
do(s) brinquedo(s) escolhido(s). Durante a
condição de reforço da verbalização, a liberação do reforço foi contingente ao conteúdo
do dizer relacionado a um dos três brinquedos-alvos (p. ex.: “eu vou brincar com o quebra-cabeça” para o grupo dizer-fazer, ou “eu
brinquei com o quebra-cabeça” para o grupo
fazer-dizer). Durante o treino de correspondência, a liberação do reforço foi contingente
à correspondência entre dizer e fazer (p. ex.:
a criança dizia “eu vou brincar com o quebracabeça” e o escolhia), ou entre fazer e dizer
(p. ex.: a criança brincava com o quebra-cabeça e depois dizia “eu brinquei com o quebra-cabeça”). No Experimento 1, a correspondência dizer-fazer foi treinada antes da correspondência fazer-dizer; no Experimento 2,
ocorreu o inverso.
Os resultados indicaram que o reforço da
verbalização produziu aumentos na freqüência do dizer, mas não foi suficiente para aumentar a freqüência do comportamento nãoverbal correspondente, um efeito só observado com a implementação do TC. Além disso,
enquanto a correspondência dizer-fazer aumentou nos dois experimentos, a correspon-
a) comparação entre os tipos de cadeia
implementados no TC (dizer-fazer, fazer-dizer e dizer-fazer-dizer) e seus diferentes efeitos;
b) aspectos metodológicos, enfatizando
a questão do reforço de verbalização
versus reforço de correspondência;
c) aquisição, generalização e manutenção de comportamentos-alvo.
ANÁLISE DO COMPORTAMENTO
dência fazer-dizer só foi observada no Experimento 1 (depois do treino dizer-fazer). Um
ponto a ser ressaltado nesse trabalho é a
efetividade do TC dizer-fazer na produção de
correspondência, o que tem sido corroborado
por outros autores (p. ex.: Israel, 1973; Karoly
e Dirks, 1977; Paniagua e Baer, 1982).
Apesar de a pesquisa básica ter focalizado mais as seqüências fazer-dizer e dizer-fazer, há inúmeras possibilidades de arranjo das
relações entre comportamento verbal e nãoverbal. Paniagua e Baer (1982) sugeriram que
a correspondência seria mais adequadamente
caracterizada por uma seqüência com os seguintes elos: promessa, comportamento intermediário, cumprimento da promessa e relato
subseqüente sobre o cumprimento da promessa, ou seja, a seqüência dizer-fazer intermediário-fazer-dizer. Os comportamentos intermediários são aqueles que ocorrem entre o dizer
e o fazer e favorecem a emissão do comportamento não-verbal alvo.
Pelo menos em termos teóricos, essa sugestão faz sentido, considerando que, se o estímulo verbal participa do controle do comportamento não-verbal (Catania, 1998/1999;
Deacon e Konarski, 1987; Guevremont, Osnes
e Stokes, 1986a), então, um estímulo verbal
anterior e outro posterior irão fortalecer essa
situação de controle. Vale mencionar que essa
seqüência aproxima-se da rotina típica de atendimento psicoterápico de muitos terapeutas
analítico-comportamentais, conforme apontado por Beckert (2001; 2002a). O cliente, no
final da sessão, descreve comportamentos a
serem emitidos naquela semana, age no contexto fora da sessão e descreve os comportamentos emitidos na sessão seguinte. Ou seja,
o cliente propõe-se a “fazer”, “faz” e depois
relata o que “fez”, em uma seqüência comportamental similar àquela sugerida por Paniagua
e Baer (1982), isto é, dizer-fazer-dizer. Em alguns casos, o terapeuta intervém com “tarefas
para casa” (dica para o primeiro dizer, anterior
ao fazer) e questionamento sobre a semana que
passou (dica para o segundo dizer, posterior).
Uma avaliação empírica dessa proposta
foi realizada por Beckert (2000), que comparou o treino da cadeia dizer-fazer-dizer com
as “tradicionais” cadeias dizer-fazer e fazer-
231
dizer. Treze crianças de 6 a 7 anos foram divididas em três grupos experimentais, de acordo com o TC que iriam receber. O comportamento não-verbal alvo, o mesmo para os três
grupos, consistiu em uma resposta de autocontrole definida segundo o paradigma experimental de Rachlin (1970). De acordo com
essa proposta, o autocontrole pode ser investigado por meio da escolha entre duas alternativas de reforço: um imediato com menor magnitude e outro mais atrasado com maior magnitude. O autocontrole, então, consiste na escolha do reforço mais atrasado com maior
magnitude, enquanto o oposto define a
impulsividade (ver Capítulo 10 para informações detalhadas sobre o autocontrole). No experimento, a apresentação de desenho animado foi utilizada como reforço. Os resultados
apontaram uma similaridade nos TCs dizer-fazer (DF), fazer-dizer (FD) e dizer-fazer-dizer
(DFD) no que se refere à aquisição de autocontrole. Entretanto o treino da seqüência dizer-fazer foi mais efetivo do que os demais na
manutenção desse comportamento, avaliado
com o retorno à linha de base. Um dado interessante foi que os participantes do Grupo Dizer-Fazer-Dizer apresentaram um desempenho
mais semelhante àquele dos participantes do
Grupo Fazer-Dizer do que àquele do Grupo
Dizer-Fazer.
Um ponto a ser considerado na análise
dos resultados do Grupo Dizer-Fazer-Dizer refere-se ao controle de estímulos que prevalece
nessa seqüência. Na seqüência dizer-fazer, o
estímulo discriminativo seria verbal (“dizer”);
na seqüência fazer-dizer, o estímulo discriminativo seria não-verbal (“fazer”). Na seqüência dizer-fazer-dizer, por sua vez, tanto o primeiro dizer quanto o fazer poderiam exercer
um controle discriminativo sobre o comportamento subseqüente. Desse modo, o TC dizerfazer-dizer incluiria dois eventos com probabilidade de desenvolver funções de controle: o
primeiro “dizer” e o “fazer”. Embora as condições de treino permitissem o condicionamento
de ambos os eventos comportamentais, um deles poderia ter-se tornado um estímulo
discriminativo mais efetivo do que o outro, em
função de um fenômeno denominado sombreamento (overshadowing). É possível, portanto,
232
ABREU-RODRIGUES, RIBEIRO & COLS.
que o “fazer” tenha sombreado o primeiro “dizer”, ou seja, que o “fazer” tenha adquirido
funções discriminativas mais efetivas do que o
primeiro “dizer”, principalmente se for considerado que os elos fazer-dizer ocorriam temporalmente mais próximos do reforço do que
os elos dizer-fazer. Se, de fato, as funções
discriminativas do primeiro “dizer” foram atenuadas pelas contingências de treino, seria esperado que a manutenção do comportamento
de autocontrole para o Grupo DFD fosse inferior àquela apresentada pelo Grupo DF e próxima à do Grupo FD, o que foi realmente observado. De qualquer forma, não restam dúvidas de que a correspondência dizer-fazer-dizer é mais complexa do que as outras duas correspondências. Ainda resta saber se ela poderia também ser mais efetiva e sob que condições isso poderia acontecer.
Em suma, a cadeia dizer-fazer é apontada como a mais eficaz na aquisição de correspondência e conseqüente aquisição de comportamentos-alvo. Entretanto a superioridade do TC dizer-fazer depende de certas características da metodologia empregada ou,
mais especificamente, da contingência de reforço estabelecida para cada seqüência, conforme apontado por Paniagua e Baer (1982).
Essas diferentes contingências serão apresentadas a seguir.
Aspectos metodológicos
A metodologia das investigações sobre
correspondência tem compreendido, sistematicamente, três fases: linha de base, reforçamento da verbalização (RV) e reforçamento da
correspondência verbal/não-verbal, o supracitado treino de correspondência (TC). Diferentes procedimentos, contudo, passaram a surgir, tanto na fase RV como na fase TC.
Paniagua (1990), ao revisar os experimentos apresentados na literatura pertinente,
apresentou uma proposta de sistematização da
metodologia para a área, a qual compreendia
dois procedimentos possíveis para a fase RV e
cinco para a fase TC. A principal contribuição
desse trabalho foi a apresentação de uma pro-
posta de terminologia padrão para a área, haja
vista que, até aquela data, cinco diferentes terminologias eram usadas para a fase RV, e mais
de 13 para a fase TC.
Na fase RV, o experimentador pergunta
ao participante o que ele fez (treino fazer-dizer) ou o que irá fazer (treino dizer-fazer). O
participante verbaliza, e o experimentador libera o reforço contingente à verbalização. Em
ambas as seqüências, o reforçamento do dizer
independe da ocorrência do comportamento
não-verbal correspondente. Além disso, o reforço pode ser liberado imediatamente após o
dizer ou depois de um período de tempo.
Na condição de reforço imediato do dizer, em ambas as seqüências, o reforço é apresentado e liberado imediatamente após a verbalização. Esse procedimento foi utilizado nos
estudos de Israel e O”Leary (1973) e de Risley
e Hart (1968), mencionados anteriormente.
Outros exemplos desse procedimento podem
ser encontrados em Baer, Detrich e Weninger
(1988), Guevremont e colaboradores (1986a,
1986b), Israel (1973), Paniagua e Baer (1982),
e Rogers-Warren e Baer (1976).
O reforço atrasado do dizer somente foi
avaliado na seqüência dizer-fazer. Aqui, o participante emite o dizer, o reforço é apresentado, o participante emite o fazer, e só então o
reforço é liberado (independentemente de
ocorrer ou não correspondência). No estudo
de Israel e O’Leary (1973), esse procedimento
foi também utilizado, o mesmo ocorrendo nos
estudos de Israel e Brown (1977) e Karoly e
Dirks (1977). Baer e colaboradores (1984)
compararam os dois tipos de reforço de verbalização (imediato e atrasado), não tendo sido
encontradas diferenças entre esses procedimentos.
A fase RV pode ser programada antes e/
ou depois da fase TC (p. ex.: Israel e Brown,
1977; Guevremont et al., 1986b). Essa última
estratégia (RV após TC) possibilita o teste de
generalização e/ou manutenção da correspondência, já que o reforço volta a ser contingente apenas à verbalização, independentemente
da ocorrência ou não de correspondência. A
ocorrência de correspondência nesta condição
indica manutenção – no caso de emissão do
ANÁLISE DO COMPORTAMENTO
mesmo comportamento não-verbal – ou generalização – no caso de emissão de um comportamento não-verbal diferente daquele treinado no TC. Outras vezes, a condição RV não é
sequer programada (Paniagua e Baer, 1982;
Whitman et al., 1982) e, nesse caso, o experimentador usa prompts1 para promover o “dizer” necessário para a implementação do TC.
Há ainda a possibilidade de prompts serem utilizados mesmo durante a fase RV.
Na fase TC o reforço sempre é contingente à correspondência entre comportamento
verbal e comportamento não-verbal. São cinco os procedimentos usados no TC: reforço da
correspondência fazer-dizer, reforço da correspondência dizer-fazer, reforço iniciado pelo dizer, reforço imediato de comportamento intermediário e reforço iniciado por comportamentos intermediários.
No procedimento mais simples, o experimentador libera o reforço imediatamente após
a ocorrência da correspondência. O reforço da
correspondência fazer-dizer é a única possibilidade para o TC da seqüência comportamento
não-verbal – comportamento verbal (p. ex.: Israel, 1973; Israel e O”Leary, 1973; Paniagua e
Baer, 1982; Ribeiro, 1989; Risley e Hart, 1968;
Rogers-Warren e Baer, 1976). O TC da seqüência comportamento verbal – comportamento
não-verbal, por outro lado, envolve quatro possibilidades. O procedimento mais comumente
utilizado é o reforço da correspondência dizerfazer (Baer et al., 1984; 1988; Deacon e
Konarski, 1987; Guevremont et al., 1986a,
1986b; Whitman et al., 1982).
Há três outras alternativas possíveis para
o TC dizer-fazer. No reforço iniciado pelo dizer,
o reforço é apresentado depois do dizer, mas é
liberado somente após o fazer, isso se o fazer
1O
prompt (comando ou pergunta) é utilizado para
“facilitar” a emissão da resposta verbal requisitada
no TC (Paniagua, 1990). Em muitos experimentos
de TC – de fato, na maioria – o experimentador faz
uso de prompts que sinalizam a resposta verbal que o
sujeito deve apresentar, como, por exemplo, o comando “diga que vai brincar com o dinossauro” ou a pergunta “com qual brinquedo você brincará hoje?” (por
exemplo, Baer et al., 1988; Deacon e Konarski, 1987;
Guevremont et al., 1986a; Karoly e Dirks, 1977).
233
corresponder ao dizer anterior (Israel, 1973;
Israel e O”Leary, 1973; Karoly e Dirks, 1977;
Paniagua e Baer, 1982). Esse procedimento
também é chamado de “reforço de consumação futura”. Com essa metodologia, o participante poderá ter tanto o seu comportamento
verbal reforçado (pela apresentação do reforço) como o comportamento não-verbal (com a
liberação do reforço já apresentado).
Os outros dois procedimentos incluem o
reforçamento de comportamentos intermediários. No reforço imediato de comportamento intermediário, o reforço é liberado imediatamente depois de cada comportamento intermediário, sendo independente da ocorrência ou não do fazer, já que é emitido antes
desse, mas dependente da ocorrência anterior
da verbalização desejada. Não há reforço programado para o comportamento não-verbal
alvo. Desse modo, a correspondência entre o
dizer e os comportamentos intermediários é
enfatizada. Em Paniagua e colaboradores
(1982), o relato das crianças sobre o que iriam
fazer (p. ex.: “vou pintar”) eram seguidos por
alguns comportamentos intermediários p. ex.:
pegar papel, pegar tintas, colocar o papel sobre a mesa), os quais eram imediatamente
reforçados.
O reforço iniciado por comportamentos
intermediários é similar ao procedimento de
reforço iniciado pelo dizer. Aqui, tokens são
fornecidos após cada comportamento intermediário e imediatamente depois da emissão do
último comportamento, podendo ser trocados.
Nesse caso, diferentemente do reforçamento
imediato de comportamento intermediário,
descrito antes, são necessárias duas correspondências para a emissão do reforço: a primeira
se dá entre o dizer e o comportamento intermediário, e a segunda, entre o dizer e o fazer,
considerando a cadeia dizer-comportamento
intermediário-fazer. Esse procedimento foi utilizado por Paniagua e Baer (1982).
A efetividade dos procedimentos de reforço da correspondência fazer-dizer, reforço
da correspondência dizer-fazer, reforço iniciado pelo dizer e reforço iniciado por comportamentos intermediários foi avaliada por Paniagua
e Baer (1982). Os resultados indicaram que o
234
ABREU-RODRIGUES, RIBEIRO & COLS.
reforço da correspondência dizer-fazer foi mais
efetivo do que o reforço da correspondência
fazer-dizer, e que o reforço iniciado pelo dizer
e o reforço iniciado por comportamentos intermediários foram sempre superiores aos outros dois procedimentos, gerando maiores porcentagens de emissão dos comportamentos
não-verbais-alvo.
Em suma, a seqüência fazer-dizer permite apenas um procedimento, tanto na fase RV
como na fase TC. A seqüência dizer-fazer, por
sua vez, permite dois procedimentos na fase
RV e quatro na fase TC, sendo muito mais flexível metodologicamente. Assim, conforme sugeriram Paniagua e Baer (1982), comparações
entre essas seqüências devem levar em consideração as estratégias utilizadas na programação do reforço.
No caso da cadeia dizer-fazer-dizer faltam mais pesquisas. Talvez essa cadeia possa
ser interpretada como uma cadeia dizer-dizer,
com o fazer sendo equivalente ao comportamento intermediário mencionado por Paniagua
e Baer (1982). O reforçamento de comportamentos intermediários parece ser um recurso
relevante para o estabelecimento de correspondência, uma vez considerado que dois dos procedimentos mencionados envolvem esse recurso. Esse aspecto é de especial interesse para os
clínicos, considerando que, via de regra, o processo terapêutico visa à aquisição e à manutenção de comportamentos não-verbais-alvo
(fazer), mas o terapeuta não tem contato direto com o ambiente natural do cliente, onde
esses comportamentos são emitidos. Resta o
contato com o dizer anterior e o posterior, em
uma correspondência dizer-dizer.
Particularidades e diferenças entre as fases RV e TC, no que se refere à aquisição, à
generalização e à manutenção da correspondência e do comportamento não-verbal alvo
serão tratadas a seguir.
Aquisição, generalização e manutenção
O TC é uma estratégia eficaz para aumentar a correspondência e, por conseqüência, a
ocorrência do comportamento não-verbal alvo
(p. ex.: Baer et al., 1988; Beckert, 2000;
Deacon e Konarski, 1987; Guevremont et al.,
1986a; Risley e Hart, 1968; Rogers-Warren e
Baer, 1976).
A aquisição da correspondência pode ser
facilitada por algumas variáveis. Paniagua
(1978) observou que a correspondência dizerfazer era estabelecida mais facilmente quando
comportamentos intermediários eram reforçados (além da correspondência) do que quando apenas a correspondência era reforçada. Os
papéis do feedback de correção do experimentador (p. ex.: Deacon e Konarski, 1987),
do intervalo de tempo entre dizer e fazer, de
viéses e preferências individuais também devem ser considerados (ver Lattal e Doepke,
2001).
A literatura também indica que a fase RV
não é efetiva para produzir correspondência
e, conseqüentemente, fortalecer o comportamento não-verbal (Baer et al., 1984; Baer e
Detrich, 1990; Karoly e Dirks, 1977). Entretanto os dados obtidos por Beckert (2000) indicam o contrário. Nesse estudo, o comportamento não-verbal alvo apresentou aumentos
substanciais com a implementação da fase RV.
A justificativa para essa divergência pode estar mais uma vez em algumas características
metodológicas utilizadas em Beckert (2000),
tais como o uso de apenas duas alternativas
comportamentais, a possível história pré-experimental de reforçamento social da correspondência e a ausência de intervalo temporal entre a verbalização e a oportunidade de emissão do fazer, que ocorriam no mesmo ambiente experimental. Novas pesquisas são necessárias para um melhor entendimento do efeito
dessas variáveis.
A generalização e a manutenção são dois
aspectos importantes na análise da aplicabilidade de qualquer procedimento. No que se
refere ao TC, a generalização ocorre se, após o
treino com alguns comportamentos, o “dizer”
do participante controlar a emissão de comportamentos não-verbais que não foram diretamente treinados. A manutenção do fazer, por
outro lado, será observada se o sujeito continuar a emitir o comportamento não-verbal
mesmo depois do término do reforçamento
contingente à correspondência (Baer et al.,
1984), ou quando não houver oportunidade
ANÁLISE DO COMPORTAMENTO
para verbalização aberta (Karlan e Rusch,
1982). Já a manutenção da correspondência é
observada em uma situação quando não existir reforçamento contingente à congruência
entre dizer e fazer e, mesmo assim, ocorrer correspondência.
Luciano, Herruzo e Barnes-Holmes (2001)
encontraram transferência das funções de estímulo do dizer do contexto de treino para
outros contextos, ou seja, a generalização da
cadeia dizer-fazer com comportamento verbal
simbólico (uso de um adesivo em uma folha
de respostas), que também pode ser considerado comportamento verbal ou “dizer”. Os autores argumentaram que o sucesso na generalização da correspondência pode estar relacionado a algumas variáveis, tais como elementos comuns entre um ambiente e outro, presença ou não de experimentador e/ou prompt,
ou da inclusão da fase RV.
Estudos que avaliaram a manutenção indicaram ser possível manter correspondência
apenas com reforçamento da verbalização
(Baer et al., 1984; Paniagua e Black, 1990;
Ward e Stare, 1990). Outros experimentos usaram com sucesso o reforço atrasado do dizer para
programar a manutenção (p. ex.: Guevremont
et al., 1986b; Whitman et al., 1982). A aplicação intermitente do TC, de forma a dificultar a
discriminação da ocorrência (ou não) do reforço para a correspondência, também foi utilizada com sucesso na promoção da manutenção de correspondência (Baer et al., 1987;
Karlan e Rusch, 1982).
A manutenção do comportamento nãoverbal adquirido no TC, e não da correspondência, foi avaliada por Beckert (2000). Dos
três tipos de TCs implementados, todos apresentaram uma diminuição na freqüência de
emissão do fazer quando o dizer público não
era mais requisitado. O comportamento dos
participantes foi novamente avaliado de 4 a 7
dias depois. Os grupos fazer-dizer e dizer-fazer-dizer mantiveram a freqüência do comportamento-alvo anteriormente observada, enquanto o grupo dizer-fazer apresentou aumentos na freqüência do comportamento-alvo, a
qual foi superior àquela emitida pelos demais
grupos, apesar dos dias transcorridos.
235
QUESTÕES TEÓRICAS
Mas como se dá a influência de uma classe de comportamentos sobre outra? Como o
comportamento verbal de uma pessoa poderá
influenciar a ocorrência de comportamentos
não-verbais? Como o dizer interfere no fazer?
Várias explicações a essas questões têm sido
apresentadas.
A psicologia do desenvolvimento e a psicologia cognitiva citam muito uma obra de
Luria (1961), para quem o comportamento verbal de um indivíduo exerce funções regulatórias que se desenvolvem a partir de eventos
cognitivos e neurológicos. Ou seja, Luria sugere que o comportamento verbal é parte dos
processos mentais das crianças (e dos adultos)
e que essa atividade mental pode controlar respostas motoras. A auto-regulação verbal foi
utilizada, nos primeiros trabalhos da área, para
explicar a correspondência (Israel, 1978; Israel e Brown, 1977; Israel e O”Leary, 1973). A
análise skinneriana, por outro lado, lida com o
comportamento verbal como um comportamento operante, em vez de atividade mental.
O comportamento verbal controlando o comportamento não-verbal não é explicado por seu
caráter verbal (qualquer comportamento pode
gerar estímulos discriminativos que controlam
qualquer outro comportamento), mas sim por
contingências de reforçamento operando na
correspondência entre o que as pessoas dizem
sobre o que fazem e o que elas realmente fazem. Essas contingências podem facilmente
operar na correspondência entre quaisquer tipos de comportamento, não sendo necessário
que nenhum desses comportamentos seja verbal (ver Lattal e Doepke, 2001; Paniagua e Baer,
1988).
Para alguns autores, a correspondência
consiste em um exemplo de controle de estímulos (p. ex.: Guevremont et al., 1986a; Karlan
e Rusch, 1982; Lattal e Doepke, 2001). Independentemente do tipo de cadeia treinada no
TC, o reforço não é apresentado na ausência
de correspondência. Correspondência, então,
pode ser definida como um operante complexo em que elementos múltiplos devem ocorrer
para que o comportamento seja reforçado
(Lattal e Doepke, 2001). Assim sendo, tanto o
236
ABREU-RODRIGUES, RIBEIRO & COLS.
TC dizer-fazer como o TC fazer-dizer permitem que o comportamento antecedente adquira funções discriminativas sobre o comportamento subseqüente. No entanto a avaliação
empírica dessa sugestão esbarra ou em limitações metodológicas, como no controle do fazer por verbalizações encobertas, ou no fato
de os procedimentos incluírem muitas possíveis variáveis de controle, como a utilização
de prompts e de feedbacks do experimentador,
ou do reforço contingente à correspondência,
ou mesmo da interação entre duas ou mais
dessas variáveis.
A explicação por controle de estímulos é
mais comumente encontrada em trabalhos que
avaliaram a cadeia dizer-fazer. A função
controladora do dizer, além de poder ser adquirida por meio de reforçamento diferencial,
também pode ser adquirida a partir da transferência de funções observada entre membros
de uma classe de equivalência (Hayes e Hayes,
1992; Sidman et al., 1989). Trabalhos empíricos têm demonstrado que quando novos estímulos entram em uma classe de equivalência, eles automaticamente adquirem as funções
dos outros membros da classe que já estavam
presentes (Gatch e Osborne, 1989; Hayes,
Kohlenberg e Hayes, 1991; Kohlenberg, Hayes
e Hayes, 1991). Dessa forma, estímulos verbais tornam-se equivalentes aos estímulos ou
eventos não-verbais com os quais se relacionam e, assim, influenciam o comportamento
posterior (Kohlenberg, Tsai e Dougher, 1993),
facilitando a ocorrência de correspondência
dizer-fazer.
Um outro pano de fundo para o entendimento da correspondência é a proposta de análise funcional do comportamento verbal de
Skinner (1957/1978), que distingue tipos diversos de operantes verbais com base nas relações existentes entre o comportamento e seus
antecedentes e conseqüentes. Dentre os operantes verbais, dois são citados na literatura
sobre correspondência – mando e tato –, enriquecendo a análise das relações de controle
presentes na correspondência fazer-dizer (Ribeiro, 1989) e na correspondência dizer-fazer
(Baer e Detrich, 1990). Nesse último estudo,
por exemplo, prevaleceu a tese de que os comportamentos verbal e não-verbal poderiam es-
tar sob o controle de contingências de reforçamento distintas: o dizer estaria sob o controle de contingências de reforçamento negativo (fuga), caracterizando um mando (talvez
prevalecendo a regra “dizer o que o experimentador quer ouvir”, terminando uma possível contingência aversiva). O fazer, por sua vez,
estaria sob o controle de contingências de
reforçamento positivo que exigem correspondência entre o fazer e o dizer (contingência
necessária para a liberação de reforço). Essa
análise é consistente com as sugestões apresentadas por Ribeiro (1989). Os dois trabalhos
complementam-se e fortalecem a proposta de
que a relação entre dizer e fazer pode ser entendida em termos de tatos e de mandos.
Outras explicações foram apresentadas,
sugerindo que a correspondência seja tratada
como uma cadeia de comportamentos que pode
ser reforçada em qualquer ponto (ver Paniagua
e Baer, 1982), como um caso de “dominância
funcional” (ver Peréz, 2000) ou, ainda, como
um exemplo de comportamento governado por
regras (ver Catania et al., 1990; Deacon e
Konarski, 1987; Ward e Stare, 1990), mais especificamente, como aquiescência (Zettle,
1990; ver Capítulo 12 para informações mais
detalhadas sobre controle verbal).
IMPLICAÇÕES PARA A APLICAÇÃO
Talvez a principal contribuição das pesquisas na área de correspondência tenha sido
a demonstração de que o fazer poderá ser mudado sem a necessidade de modificação direta
das contingências que o mantém, sendo suficiente, em alguns casos, aplicar contingências
de reforço ao dizer correspondente, em alguns
momentos anterior e em outros posterior ao
comportamento não-verbal alvo. É importante ressaltar que, apesar de o TC ser eficaz no
aumento de determinados comportamentos
não-verbais-alvo, ele é uma proposta para aumentar a correspondência, e não diretamente
o fazer. Na maioria dos casos, o aumento do
fazer-alvo é conseqüência do aumento da correspondência.
Poucos arranjos de contingência possibilitam tanta flexibilidade de implementação ou
ANÁLISE DO COMPORTAMENTO
aplicabilidade como o TC, sobretudo na escolha do comportamento-alvo. Paniagua (1989)
sugere que o TC pode ser empregado na prevenção e no tratamento da mentira em crianças, já que a metodologia envolvida é adequada ao processo natural de desenvolvimento da
criança. O TC já foi usado em crianças para
aumentar conversas familiares (Jewert e Clark,
1979), interações sociais (Rogers-Warren e
Baer, 1976), uso de brinquedos predeterminados (Baer et al., 1984; 1988; Israel e Brown,
1977), seleção e consumo de alimentos nutritivos (Baer et al., 1987; Baer e Detrich, 1990),
tarefas acadêmicas (Guevremont et al., 1986b;
Merrett e Merrett, 1997) e comportamentos
sociais, criativos e motores (Guevremont, Osnes
e Stokes, 1988). O TC também se mostrou efetivo para controlar e prevenir comportamentos de hiperatividade (Paniagua e Black, 1990)
e comportamentos de indisciplina em sala de
aula (Anderson e Merrett, 1997) e para melhorar qualitativamente a escrita (Hopman e
Glynn, 1989).
Em termos de procedimento, há a possibilidade de o dizer ser emitido por meio do
uso de estímulos visuais e da resposta de apontar. Whitman e colaboradores (1982) utilizaram pistas visuais (fotografias) para melhorar a postura corporal em adultos não-verbais
com retardo, treinando a seqüência “apontarfazer” (conceitualmente ainda dizer-fazer).
Baer e colaboradores (1987), Luciano e colaboradores (2001) e Ribeiro (1989) utilizaram
pistas visuais e obtiveram bons resultados no
aumento de comportamentos-alvo. O público-alvo também é abrangente, com possibilidade do uso de TC tanto com crianças sem
problemas de desenvolvimento como com
crianças com necessidades especiais envolvendo déficits verbais, retardos graves, mutismo
seletivo, pacientes psiquiátricos ou portadores de transtornos de desenvolvimento (para
detalhes ver Karlan e Rusch, 1982; Paniagua,
1982; 1989; Rogers-Warren e Baer, 1976;
Tracey, Briddell e Wilson, 1974). Finalmente,
o TC é uma estratégia bastante simples de ser
implementada por pais e professores, apresentando a grande vantagem de ser uma intervenção não-punitiva.
237
Correspondência e terapia
A interação verbal entre o terapeuta e o
cliente é um fator crítico para a mudança terapêutica (de Rose, 1997; Ferster, 1972; 1979;
Glenn, 1983; Hamilton, 1988; Rosenfarb,
1992). Deve-se ter o cuidado de se lembrar
sempre de que a verbalização do cliente durante a sessão, na interação direta com o
terapeuta, pode estar sob controle de outras
variáveis que não sejam o comportamento nãoverbal fora do consultório. Apenas o reforçamento da verbalização específica do cliente,
antes da oportunidade de emissão do comportamento não-verbal, não aumenta necessariamente a freqüência deste último comportamento. Muitas vezes, essa verbalização consiste em
uma resposta de fuga de uma situação constrangedora, como revelar uma dificuldade que
impeça a emissão do comportamento adequado. Então, nessa situação, o cliente diz “o que
o terapeuta gostaria de ouvir”, recebendo o
reforço social desejado (Ferster, 1972; 1979;
Glenn, 1983; Hamilton, 1988; Kohlenberg e
Tsai, 1991; Rosenfarb, 1992). Essa análise é
consistente com dados apresentados que apontam a fase RV como pouco eficaz no aumento
de correspondência. Assim, cabe ao terapeuta
assumir o desafio de criar contingências de
reforçamento que estabeleçam e que mantenham a correspondência (Beckert, 2001).
Ferster (1979, p. 30) ressaltou esse papel do
terapeuta, afirmando que a correspondência
entre comportamento verbal e eventos externos “pode ser alvo de uma análise comportamental, sendo esta uma das incumbências mais
importantes da terapia”. Outros trabalhos também ofereceram análises de como o reforçamento da correspondência pode afetar a vida
do cliente fora do contexto clínico (Ferster, 1972;
Hamilton, 1988; Hübner, 1999; Kohlenberg et
al., 1993; Wilson e Blackledge, 2000).
O TC parece ser importante para a aquisição de dois repertórios fundamentais para
qualquer cliente: autoconhecimento e autocontrole. Apesar da grande complexidade e
heterogeneidade das demandas apresentadas
em consultório, a maioria dos casos clínicos
requer o investimento no treino de auto-observação, o que pode oferecer melhores con-
238
ABREU-RODRIGUES, RIBEIRO & COLS.
dições para o autoconhecimento, o que facilitaria a aquisição de autocontrole (Beckert,
2002a; ver Capítulo 10 para informações detalhadas sobre autocontrole).
Em linguagem analítico-comportamental,
se o cliente é capaz de dizer o que faz ou o que
fez, identificando e descrevendo as variáveis
das quais seu comportamento é função, estará
apresentando autoconhecimento (Tourinho,
1995) – “fiz X e sei por que fiz X”. O treino da
cadeia fazer-dizer é um treino de auto-tato e,
como tal, poderá servir de instrumento para o
estabelecimento de verbalizações mais fidedignas sobre o comportamento e suas variáveis
de controle (isto é, autoconhecimento).
O treinamento fazer-dizer também poderá ser útil na situação de supervisão clínica.
Ao se estabelecer como audiência não-punitiva, o supervisor poderá prevenir a ocorrência
de verbalizações do supervisionando cuja função seja muito mais a fuga ou a esquiva da
resposta aversiva do supervisor do que o tatear
sobre o que ocorreu na sessão de atendimento. Essa alternativa é válida para minimizar o
risco da modelagem de discriminações errôneas, um trabalho análogo ao TC fazer-dizer
do cliente (Beckert, 2002b).
Já a aquisição de autocontrole encontra
no treino da correspondência dizer-fazer um
possível recurso (Abreu-Rodrigues e Beckert,
no prelo). Esse TC poderá ser implementado
com a expectativa de que o dizer anterior possa exercer um controle discriminativo sobre o
fazer, facilitando a emissão deste. À medida
que o cliente diz que vai fazer, estabelece contingências que tornarão o fazer desejado mais
provável de acontecer e, assim, faz o que disse
que iria fazer, apresentando autocontrole. Um
homem que faz o que prometeu será provavelmente visto pela comunidade verbal como tendo controle sobre a própria vida. A proposta
também se coaduna com a definição skinneriana de autocontrole, já que dizer e fazer são
respostas emitidas pelo próprio cliente – a que
controla e a que é controlada, respectivamente –, sendo que aquela (dizer) poderá afetar
variáveis ambientais de forma a alterar a probabilidade desta (fazer). Ou seja, quando o
próprio cliente diz o que vai fazer, ele estará
“autogerenciando” as contingências que man-
têm o comportamento. Dessa forma, o autoconhecimento relaciona-se à seqüência fazer-dizer, e o autocontrole à seqüência dizer-fazer
(Beckert, 2002b).
O TC também tem sido utilizado como
recurso terapêutico auxiliar no tratamento da
drogadição e na aquisição do comportamento
de leitura. No primeiro caso, a implementação
de um comportamento-alvo concorrente e incompatível com o consumo de Cannabis sativa
(maconha) foi feita com auxílio do TC. Neste
caso, o cliente escolheu a corrida de longa duração como o fazer-alvo (ver Beckert, 2001,
para detalhes). No segundo caso, uma cliente
focalizou a aquisição de uma rotina de leitura
e de estudo como comportamento não-verbalalvo e, com o auxílio do TC, esse padrão
comportamental foi fortalecido (ver AbreuRodrigues e Beckert, no prelo, para detalhes).
Em ambos os casos, a cadeia dizer-fazer-dizer
foi treinada nos moldes sugeridos por Beckert
(2002a).
A seguir, será apresentado um caso clínico
que ilustra o procedimento de TC na terapia.
Caso clínico
O caso aqui apresentado assemelha-se,
em alguns aspectos, ao de Ana (descrito em
Abreu-Rodrigues e Beckert, no prelo). Bob
(nome fictício), 27 anos, funcionário público,
formado em administração, desejava aumentar suas horas de estudo a fim de ter melhores
condições de aprovação em concursos públicos. O cliente relatou muitas dificuldades em
estudar e ausência quase total do repertório
de leitura. Cumpre mencionar que Bob recebeu de Ana a indicação do terapeuta e já chegou ao consultório com a expectativa de uma
intervenção focal. Aqui serão apresentados os
dados colhidos em 25 semanas de terapia em
que o TC dizer-fazer-dizer foi implementado,
ressaltando que o objetivo da terapia não se
restringia apenas a aumentar a freqüência do
comportamento de estudar (apesar da solicitação inicial do cliente). Aspectos como assertividade (sobretudo na relação com amigos e
familiares), planejamento de metas e auto-estima – havia um forte histórico de punição –
ANÁLISE DO COMPORTAMENTO
também foram trabalhados no decorrer do tratamento.
“Estudar” foi definido operacionalmente
como leitura, síntese e/ou elaboração de fichas
do material escolhido previamente. A intervenção objetivava uma melhora tanto quantitativa quanto qualitativa desse comportamento.
A implementação do TC dizer-fazer-dizer
foi realizada conforme a descrição a seguir. Bob
estabelecia na sessão de terapia (que sempre
ocorria às segundas-feiras) a meta da semana
e a registrava em uma folha de controle (“esta
semana estudarei pelo menos X horas”). A linha de base mostrou que Bob estudava entre
4 e 5 h semanais. Portanto, sua primeira meta
semanal ficou em 4 h. A meta foi sendo aumentada gradativamente, sempre pelo próprio cliente. A cada dia, ele deveria escolher o
material a ser trabalhado, registrando o tempo que ficava envolvido nessa atividade. O cronômetro era parado em cada interrupção ou
intervalo. Na sessão seguinte, Bob relatava
como havia sido seu desempenho na semana
anterior, e uma nova meta era estabelecida (ver
Figura 13.1). Ou seja, Bob verbalizava para o
terapeuta o tempo de estudo total que ele atingiria na semana que se iniciava (dizer anterior ao fazer), registrava diariamente seu tempo de estudo, calculava o tempo total da semana e, na sessão seguinte, verbalizava a
quantidade de tempo que, de fato, havia estudado (dizer posterior ao fazer, estabelecendo uma cadeia dizer-fazer-dizer, em caso de
correspondência). Nenhuma punição foi programada, tendo o terapeuta implementado
apenas reforçamento positivo para a corres-
239
pondência. É importante ressaltar que no procedimento padrão de TC, o objetivo é colocar
o fazer sob controle do dizer, sendo a correspondência atingida quando ambos forem semelhantes. No caso em questão, o fazer superior ao verbalizado anteriormente não foi considerado como falta de correspondência, já
que a meta era estabelecida em termos de
“pelo menos tantas horas”. Isso foi feito porque, para o cliente, estudar a mais não era
um problema ou algo indesejável.
A questão da fidedignidade do relato verbal é uma das limitações para o uso do TC para
fins clínicos. Sem acesso ao fazer que ocorre
no ambiente natural do cliente (a não ser pelo
relato do cliente), há o risco de o terapeuta
estar, inadvertidamente, reforçando apenas a
cadeia dizer-dizer. O uso concomitante de outras intervenções terapêuticas dá mais condições de o terapeuta assegurar-se da ocorrência ou não da correspondência. Registros de
emissão do comportamento não-verbal no
ambiente natural permitem a confrontação
com o relato do cliente. Esses registros podem
ser feitos pelo próprio cliente ou até por terceiros, aumentando ainda mais o controle. A
escolha de um co-terapeuta também é uma
prática interessante, principalmente no atendimento de crianças e adolescentes. Enfim, a
associação de quaisquer correlatos públicos
com o treino de correspondência aumenta a
eficácia do tratamento (Beckert, 2001).
A análise visual da Figura 13.1 revela uma
tendência crescente no estabelecimento das
metas, passando de 4 para 20 h semanais no
decorrer das 25 semanas de treino. Na sexta,
FIGURA 13.1 Tempo programado (meta) e tempo de estudo obtido em cada semana de terapia.
240
ABREU-RODRIGUES, RIBEIRO & COLS.
sétima e oitava semanas, as metas não foram
cumpridas, o que alertava para o risco de o
procedimento tornar-se aversivo. Como o cliente poderia determinar a distribuição de suas
horas de estudo semanais, houve, na oitava
semana, 5 min de estudo em um dia e mais de
3 h em outro, sem que a meta fosse atingida.
Uma estratégia auxiliar foi adicionada a partir
da nona semana: Bob iria previamente estabelecer, além da meta semanal, também a diária.
A meta diária era definida também na segunda-feira, tendo por objetivo auxiliá-lo na distribuição da meta semanal no decorrer dos dias
daquela semana, sem que isso acarretasse uma
maior sobrecarga em um determinado dia.
Nem sempre havia um acréscimo no tempo estipulado. Algumas vezes, a meta de uma semana era repetida na seguinte, principalmente quando a meta semanal passada não havia
sido cumprida. Isso ocorreu cinco vezes (semana 12, 14, 16, 18 e 19).
O tempo total dedicado aos estudos
acompanhou a tendência crescente das metas, chegando ao máximo de 21,5 h na semana 23. Férias de duas semanas entre a semana 19 e 20 interferiram nos resultados e fizeram com que a meta da semana 21 fosse mais
baixa. Das 25 semanas avaliadas, Bob apresentou correspondência dizer-fazer-dizer em
15 semanas (60% dos casos): 12 semanas com
rendimento superior ao estabelecido pela
meta e três semanas com desempenho similar à meta.
Nas primeiras quatro semanas foi avaliado apenas o aspecto quantitativo do comportamento-alvo em termos de horas estudadas.
FIGURA 13.2 Auto-avaliação de produtividade.
A avaliação, até aquele momento, feita pelo
próprio cliente, foi satisfatória. A partir da
quinta semana, foi introduzida uma avaliação qualitativa. Bob deveria, no final de cada
dia de estudo, avaliar sua produtividade, considerando o material escolhido para leitura e
o número de horas estudadas, em uma escala
de 0 a 10. A Figura 13.2 apresenta a média
semanal dessa auto-avaliação qualitativa de
produtividade.
Bob optou por atribuir o valor 10 àquela
situação em que o rendimento tivesse ultrapassado sua expectativa. Assim, o esperado
(por ele) seria apresentar uma produtividade
entre os valores 6 e 8. Com um valor mínimo
de 4 (semana 7) e máximo de 10 (semana 21),
sua produtividade média nas 20 semanas foi
de 7.09, considerada “realista e fidedigna” pelo
cliente. Ressalte-se também que a própria avaliação de produtividade apresentou um padrão
crescente da semana 5 à 12, mantendo-se estável em seguida, na faixa entre 7 e 8.
O leitor poderá questionar a porcentagem
média de correspondência de “apenas” 60%
nessas 25 semanas (15 semanas com total de
horas de estudo igual ou superior às metas préestabelecidas). Vale lembrar que o contexto
provê justificativas para a aceitação desse valor como um indicativo de sucesso. O contexto
inclui as contingências passadas e as presentes na vida do cliente, que irão definir se determinado comportamento representa progresso ou não. No caso de Bob, considerando a falta de repertório de leitura e os seus efeitos
(“Não consigo sentar e ler... acho que nunca
vou conseguir isso!”), os resultados ilustrados
ANÁLISE DO COMPORTAMENTO
nas Figuras 13.1 e 13.2 representam grandes
conquistas para ele. Bob nunca teve uma rotina de estudo e, quando tentava estabelecê-la,
ou se frustrava, ou não obtinha um rendimento satisfatório. Com a mudança comportamental (“peguei a ‘manha’ de estudar”, “ninguém acredita quando vê como eu estou estudando” ou “é incrível, mas eu estou começando a gostar desse negócio”), o terapeuta
pode trabalhar várias outras áreas também ligadas à aquisição de respostas mais adaptativas
e funcionais.
A introdução da análise quantitativa e
qualitativa foi considerada válida por dois
motivos: os dados revelavam um aumento na
média semanal de horas de estudo e a análise
da produtividade em termos de valores absolutos e inferidos pelo próprio cliente pôde
ser considerada como um treino fazer-dizer, o
que serviu como implementação dos comportamentos de auto-observação, autodiscriminação (quando foi mais ou menos produtivo)
e de autodescrição (já que tinha que relatar
posteriormente), favorecendo a aquisição de
autoconhecimento. Pode-se também dizer que
o cliente passou a demonstrar maior autocontrole à medida que passou a cumprir as metas
predefinidas, em uma cadeia dizer-fazer.
A fidedignidade do relato do cliente na
sessão é o maior problema para o uso do TC
como instrumento terapêutico. Afinal, o terapeuta não está em contato direto com o ambiente natural em que o comportamento nãoverbal é emitido. Uma alternativa possível que
pode amenizar o risco de verbalizações não-correspondentes é o uso de algumas estratégias
auxiliares a fim de aumentar o controle sobre
esses relatos (isto é, uso de correlatos públicos,
utilização de co-terapeutas, registro de comportamentos públicos feito por terceiros).
CONCLUSÃO
Muitas variáveis ainda precisam ser melhor compreendidas nessa área, o que levanta
a possibilidade (e a necessidade!) de pesquisas futuras. Alguns trabalhos preocuparam-se
com o estudo de outras possíveis cadeias além
da dizer-fazer e fazer-dizer. Isso será sempre
241
bem-vindo porque possibilitará uma melhor
compreensão do papel funcional de cada elo
da cadeia. Investigações adicionais da cadeia
dizer-fazer-dizer, por exemplo, deveriam ser
realizadas tendo em vista seu potencial como
instrumento terapêutico. O contexto educacional é um ambiente bastante rico para a aplicação e, portanto, também há de ser estudada
a possibilidade do uso do TC nesse ambiente.
Lattal e Doepke (2001) ofereceram um
exemplo de como é possível a ampliação dos
recursos metodológicos na análise da cadeia
dizer-fazer com pombos. Esses autores ressaltaram a viabilidade e a importância da pesquisa básica nessa área, recorrendo àquela que
talvez seja a variável metodológica mais polêmica: o uso de sujeitos não-humanos no experimento. Com dados análogos àqueles apresentados nas pesquisas com humanos (superioridade do TC dizer-fazer), esse tipo de avaliação abre espaço para uma expansão nas possibilidades metodológicas.
Nas considerações anteriormente feitas
sobre a área de correspondência, destacam-se
os seguintes aspectos:
• A pesquisa empírica fornece subsídios
indispensáveis para uma melhor compreensão do fenômeno.
• Apesar de serem classes comportamentais distintas, dizer e fazer podem apresentar relação de influência mútua.
• Dizer e fazer já são, por si só, comportamentos complexos. A correspondência, portanto, compreende dois universos multideterminados. Sua investigação não poderá furtar-se à premissa
científica de tentar isolar variáveis relevantes e analisá-las isoladamente ou
em interação com outras variáveis. O
exercício de síntese dessas conclusões
sempre será o desafio do estudioso.
• O TC é uma estratégia eficaz na aquisição de correspondência e pode servir como instrumento para a aquisição de comportamentos não-verbaisalvo.
• A área aplicada encontra no TC uma
importante tecnologia para aquisição
242
ABREU-RODRIGUES, RIBEIRO & COLS.
de comportamentos desejáveis. Cumpre ressaltar a grande plasticidade na
programação do TC: diversas posições
do “elo verbal” na cadeia treinada, reforço ou não de comportamentos intermediários, táticas diversas para facilitar a manutenção, recursos múltiplos para fortalecer o controle generalizado do dizer. Essa flexibilidade
metodológica é de muita importância
no contexto educacional e clínico, no
qual profissionais (ou pais) poderão
inovar e criar contingências que facilitem a emissão de um determinado
comportamento desejado.
• A relação custo-benefício é compensadora porque o profissional (ou pai)
não precisa estar presente na ocasião
para emissão do fazer-alvo.
• O TC não é uma terapia, apesar de ser
um recurso comprovadamente eficaz.
Outras estratégias poderão ser acrescentadas à intervenção, como foi ilustrado no caso apresentado. A flexibilidade e a permeabilidade a essas adaptações são, talvez, a grande vantagem
para seu uso na clínica, não somente
para promover mudanças comportamentais no repertório do cliente, mas
também para facilitar o treinamento e
a supervisão de futuros terapeutas.
REFERÊNCIAS BIBLIOGRÁFICAS
Abreu-Rodrigues, J.; Beckert, M. E. (no prelo). Autocontrole: Pesquisa e aplicação. Em C. N. de Abreu e H.
J. Guilhardi (Orgs.), Manual prático de técnicas em
psicoterapia comportamental, cognitiva e construtivista.
São Paulo: Roca.
Anderson, V.; Merrett, F. (1997). The use of correspondence training in improving the in-class behavior
of very troublesome secondary school children. Educational Psychology, 17, 313-328.
Baer, R. A.; Blount, R. L.; Detrich, R.; Stokes, T. F.
(1987). Using intermittent reinforcement to program
maintenance of verbal-nonverbal correspondence.
Journal of Applied Behavior Analysis, 20, 179-184.
Baer, R. A.; Detrich, R. (1990). Tacting and manding
in correspondence training: Effects of child selection
of verbalization. Journal of the Experimental Analysis
of Behavior, 54, 23-30.
Baer, R. A.; Detrich, R.; Weninger, J. M. (1988). On the
functional role of the verbalization in correspondence
training procedures. Journal of Applied Behavior
Analysis, 21, 345-356.
Baer, R. A.; Willians, J. A.; Osnes, P. G.; Stokes, T. F.
(1984). Delayed reinforcement as an indiscriminable
contingency in verbal-nonverbal correspondence training. Journal of Applied Behavior Analysis, 17, 429-440.
Beckert, M. E. (2000). Reforço de verbalização e treino
de correspondência: Efeitos sobre o comportamento de
autocontrole. Dissertação de mestrado não publicada,
Universidade de Brasília, Brasília, DF.
Beckert, M. E. (2001). A partir da queixa inicial, o que
fazer? Correspondência verbal/não-verbal: Um desafio para o terapeuta. Em H. J. Guilhardi, M. B. B. Madi,
P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 217226). Santo André: ESETec.
Beckert, M. E. (2002a). Correspondência: Quando o
objetivo terapêutico é o “digo o que faço e faço o que
digo”. Em H. J. Guilhardi, M. B. B. Madi, P. P. Queiroz;
M. C. Scoz (Orgs.), Sobre comportamento e cognição:
Vol. 9. Contribuições para a construção da teoria do comportamento (p. 183-194). Santo André: ESETec.
Beckert, M. E. (2002b). Relação supervisor-supervisionando e a formação do terapeuta: Contribuições da
psicoterapia analítica funcional (FAP). Em H. J.
Guilhardi, M. B. B. Madi, P. P. Queiroz; M. C. Scoz
(Orgs.), Sobre comportamento e cognição: Vol. 10. Contribuições para a construção da teoria do comportamento (p. 245-256). Santo André: ESETec.
Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. Souza et al.; trads.). Porto Alegre:
Artes Médicas (Obra publicada originalmente em 1998).
Catania, A. C.; Matthews, B. A.; Shimoff, E. (1982).
Instructed versus shaped human verbal behavior:
Interactions with nonverbal responding. Journal of the
Experimental Analysis of Behavior, 38, 233-248.
Catania, A. C.; Matthews, B. A.; Shimoff, E. (1990).
Properties of rule-governed behavior and their implications. Em D. E. Blackman e H. Lejeune (Orgs.), Behaviour analysis in theory and practice: Contributions and
controversies (p. 215-230). London: LEA Publishers.
Deacon, J. R.; Konarski, E. A. (1987). Correspondence
training: An example of rule-governed behavior? Journal of Applied Behavior Analysis, 20, 391-400.
de Rose, J. C. C. (1997). O relato verbal segundo a perspectiva da análise do comportamento: Contribuições
conceituais e experimentais. Em R. A. Banaco (Org.),
Sobre comportamento e cognição: Vol 1. Aspectos teóricos,
metodológicos e de formação em análise comportamental
e terapia cognitivista (p. 148-163). São Paulo: Arbytes.
Ferster, C. B. (1972). An experimental analysis of clinical
phenomena. The Psychological Record, 22, 1-16.
Ferster, C. B. (1979). A laboratory model of psychotherapy: The boundary between clinical practice and
experimental psychology. Em P. Sjöden, S. Bates e W. S.
Dockens (Orgs.), Trends in behavior therapy (p. 23-38).
New York: Academic Press.
ANÁLISE DO COMPORTAMENTO
Gatch, M. B.; Osborne, J. G. (1989). Transfer of contextual stimulus functions via equivalence class development. Journal of the Experimental Analysis of
Behavior, 51, 369-378.
Glenn, S. (1983). Maladaptive functional relations in
client verbal behavior. The Behavior Analyst, 6, 47-56.
Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1986a).
Preparation for effective self-regulation: The development of generalized verbal control. Journal of Applied
Behavior Analysis, 19, 99-104.
Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1986b).
Programming maintenance after correspondence
training with children. Journal of Applied Behavior
Analysis, 19, 215-219.
Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1988).
The functional role of preschooler’s verbalizations in
the generalization of self-instructional training. Journal
of Applied Behavior Analysis, 21, 45-55.
Hamilton, S. A. (1988). Behavioral formulations of verbal behavior in psychotherapy. Clinical Psychology
Review, 8, 181-193.
Hayes, S. C.; Hayes, L. J. (1992). Verbal relations and
the evolution of behavior analysis. American Psychologist, 47, 1383-1395.
Hayes, S. C.; Kohlenberg, B. K.; Hayes, L. J. (1991).
Transfer of consequential functions through simple and
conditional equivalence classes. Journal of the Experimental Analysis of Behavior, 56, 119-137.
Hopman, N.; Glynn, T. (1989). The effect of correspondence training on the rate of written expression of four
low-achieving boys. Educational Psychology, 9, 197-213.
Hübner, M. M. C. (1999). Conceituação do comportamento verbal e seu papel na terapia. Em R. A. Banaco
(Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do
comportamento e terapia cognitivista (p. 277-281). São
Paulo: Arbytes.
Israel, A. C. (1973). Developing correspondence between
verbal and nonverbal behavior: Switching sequences.
Psychological Reports, 32, 1111-1117.
Israel, A. C. (1978). Some thoughts on correspondence
between saying and doing. Journal of Applied Behavior
Analysis, 11, 271-276.
Israel, A. C.; Brown, M. S. (1977). Correspondence
training, prior verbal training, and control of nonverbal
behavior via control of verbal behavior. Journal of
Applied Behavior Analysis, 10, 333-338.
Israel, A. C.; O”Leary, K. D. (1973). Developing correspondence between children”s words and deeds. Child
Development, 44, 575-581.
Jewert, J.; Clark, H. B. (1979). Teaching preschoolers
to use appropriate dinner time conversation: An analysis of generalization from school to home. Behavior
Therapy, 10, 589-605.
Karlan, G. R.; Rusch, F. R. (1982). Correspondence
between saying and doing: Some thoughts on defining
correspondence and future directions for application.
Journal of Applied Behavior Analysis, 15, 151-162.
243
Karoly, P.; Dirks, M. J. (1977). Developing self-control
in preschool children through correspondence training.
Behavior Therapy, 8, 398-405.
Kohlenberg, B. S.; Hayes, S. C.; Hayes, L. J. (1991).
The transfer of contextual control over equivalence classes through equivalence classes: A possible model of
social stereotyping. Journal of the Experimental Analysis
of Behavior, 56, 505-518.
Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic
psychotherapy: Creating intense and curative therapeutic
relationship. New York: Plenum Press.
Kohlenberg, R. J.; Tsai, M.; Dougher, M. J. (1993). The
dimensions of clinical behavior analysis. The Behavior
Analyst, 16, 271-282.
Lattal, K. A.; Doepke, K. J. (2001). Correspondence as
conditional stimulus control: Insights from experiments
with pigeons. Journal of Applied Behavior Analysis, 34,
127-144.
Lloyd, K. E. (1994). Do as I say, not as I do. The Behavior
Analyst, 17, 131-144.
Luciano, M. C.; Herruzo, J.; Barnes-Holmes, D. (2001).
Generalization of say-do correspondence. The Psychological Record, 51, 111-130.
Luria, A. R. (1961). The role of speech in the regulation
of normal and abnormal behavior. New York: Liveright.
Merrett, J.; Merrett, F. (1997). Correspondence training as a means of improving study skills. Educational
Psychology, 17, 469-482.
Paniagua, F. A. (1978). Efectos de las conductas intermedias sobre la correspondencia entre conducta verbal y no verbal. Em P. Speller (Ed.), Análisis de la conducta (p. 303-321). México: Trillas.
Paniagua, F. A. (1989). Lying by children: Why children
say one thing, do another? Psychological Reports, 64,
971-984.
Paniagua, F. A. (1990). A procedural analysis of correspondence training techniques. The Behavior Analyst,
13, 107-119.
Paniagua, F. A.; Baer, D. M. (1982). The analysis of
correspondence training as a chain reinforceable at any
point. Child Development, 53, 786-798.
Paniagua, F. A.; Baer, D. M. (1988). Luria’s regulatory
concept and its misplacement in verbal-nonverbal correspondence training. Psychological Reports, 62, 371378.
Paniagua, F. A.; Black, S. A. (1990). Management and
prevention of hyperactivity and conduct disorders in 810 year old boys through correspondence training procedures. Child e Family Behavior Therapy, 12, 23-56.
Paniagua, F. A.; Stella, M. S.; Holt, W. J.; Baer, D. M.;
Etzel, B. C. (1982). Training correspondence by reinforcing intermediate and verbal behavior. Child e Family
Behavior Therapy, 4, 127-139.
Peréz, M. E. R. (2000). Efecto del entrenamiento de la
correspondencia decir-hacer, decir-describir y hacerdescribir sobre la adquisición, generalidad y mantenimiento de una tarea de discriminación condicional en
humanos. Acta Comportamentalia, 8, 41-75.
244
ABREU-RODRIGUES, RIBEIRO & COLS.
Rachlin, H.(1970). Modern behaviorism. San Francisco: Freeman.
Ribeiro, A. F. (1989). Correspondence in children’s selfreport: Tacting and manding aspects. Journal of the Experimental Analysis of Behavior, 51, 361-367.
Risley, T. R.; Hart, B. (1968). Developing correspondence between nonverbal and verbal behavior of preschool children. Journal of Applied Behavior Analysis,
11, 267-281.
Rogers-Warren, A.; Baer, D. M. (1976). Correspondence
between saying and doing: Teaching children to share
and praise. Journal of Applied Behavior Analysis, 9, 335354.
Rosenfarb, I. S. (1992). A behavior analytic interpretation of the therapeutic relationship. The Psychological
Record, 42, 341-354.
Sidman, M.; Wynne, C. K.; Maguire, R.; Barnes, T.
(1989). Functional classes and equivalence relations.
Journal of the Experimental Analysis of Behavior, 52,
261-274.
Skinner, B. F. (1978). O comportamento verbal (M. P.
Villalobos, trad.). São Paulo: Cultrix (Obra publicada
originalmente em 1957).
Tourinho, E. Z. (1995). O autoconhecimento na psicologia comportamental de B. F. Skinner. Belém, PA: Editora
Universitária UFPA.
Tracey, D. A.; Briddell, D. W.; Wilson, G. T. (1974). Generalization of verbal conditioning to verbal and nonverbal
behavior: Group therapy with chronic psychiatric patients.
Journal of Applied Behavior Analysis, 7, 391-402.
Ward, W. D.; Stare, S. (1990). The role of subject verbalization in generalized correspondence. Journal of
Applied Behavior Analysis, 23, 129-136.
Whitman, J. A.; Scibak, J. W.; Butler, K. M.; Richter, R.;
Johnson, M. R. (1982). Improving classroom behavior
in mentally retarded children through correspondence
training. Journal of Applied Behavior Analysis, 15, 545564.
Wilson, K. G.; Blackledge, J. T. (2000). Recent developments in the behavioral analysis of language: Making sense of clinical phenomena. Em M. J. Dougher
(Ed.), Clinical Behavior Analysis (p. 27-46). Reno, NV:
Context Press.
Zettle, R. D. (1990). Rule-governed behavior: A radical answer to the cognitive challenge. The Psychological
Record, 40, 41-49.
ANÁLISE DO COMPORTAMENTO
EQUIVALÊNCIA DE ESTÍMULOS:
CONCEITO, IMPLICAÇÕES E
POSSIBILIDADES DE APLICAÇÃO
245
14
ALESSANDRA ROCHA DE ALBUQUERQUE
RAQUEL MARIA DE MELO
O conceito de equivalência de estímulos
tem sido tratado na literatura como um tema
de fundamental relevância, visto que instrumentaliza a análise do comportamento a lidar, de forma objetiva e sistemática, com repertórios comportamentais novos, complexos,
que envolvem comportamentos simbólicos. O
objetivo deste capítulo é definir e caracterizar a equivalência de estímulos, levantando algumas questões controvertidas sobre o tema,
destacando os principais resultados apresentados pelas inúmeras pesquisas básicas sobre
o mesmo, bem como a possibilidade de aplicação desses resultados nos contextos escolar
e clínico.
DEFININDO A EQUIVALÊNCIA
DE ESTÍMULOS
Pode-se afirmar que estímulos são equivalentes quando se tornam intercambiáveis,
substituíveis uns pelos outros no controle do
comportamento, ou seja, quando as funções
adquiridas por um estímulo, no controle de um
comportamento operante, são transferidas para
outro estímulo. Dito de outro modo, para se
falar de equivalência de estímulos, um comportamento operante comum deve ser controlado por estímulos diferentes.
Essa definição de equivalência assemelha
esse processo ao de generalização de estímulos. No entanto ambos são distintos na medida
em que, na generalização, classes de estímulos
que apresentam similaridade física entre si controlam um comportamento comum como, por
exemplo, denominar de azul diferentes matizes dessa cor. Em equivalência de estímulos,
os estímulos que compõem uma classe que controla um comportamento comum apresentam
relações arbitrárias entre si, como, por exemplo, não fumar diante da frase “Proibido Fumar”, da imagem de um cigarro cortado por
um “x” ou mesmo em um ambiente sem ventilação externa (sobre generalização de estímulos, ver Capítulo 8).
As pesquisas sobre equivalência de estímulos (p. ex.: Fields et al., 1991; Jonson e
Sidman, 1993; Sidman e Cresson, 1973), em
geral, envolvem duas etapas fundamentais. Inicialmente, as discriminações condicionais entre
estímulos são treinadas com o uso do procedimento de escolha de acordo com o modelo (do
inglês matching to sample) e, posteriormente,
avalia-se a emergência de novas relações condicionais, sem treino direto, envolvendo os
mesmos estímulos.
No procedimento de escolha de acordo
com o modelo um estímulo, denominado estímulo modelo ou estímulo condicional, é apresentado juntamente com outros estímulos, denominados estímulos de escolha, estímulos
discriminativos ou estímulos de comparação.
Dado A1 como modelo e B1 e B2 como escolhas, a escolha de B1 e não de B2 será considerada correta. Do mesmo modo, dados A2 como
modelo e B1 e B2 como escolhas, somente a
escolha de B2 será considerada correta.
246
ABREU-RODRIGUES, RIBEIRO & COLS.
Deve-se destacar que no procedimento de
escolha de acordo com o modelo, que estabelece discriminações condicionais, contingências
de quatro termos estão em vigor. Estas diferenciam-se das contingências de três termos,
presentes em situações de discriminação simples, na medida em que um quarto elemento
(o estímulo-modelo) estabelece qual contingência de três termos está funcionando. Por
exemplo, tomando-se uma tarefa, comumente
atribuída a crianças em fase escolar, de ligar
conjuntos com diferentes quantidades de elementos a um número (Figura 14.1), a escolha
do conjunto com dois elementos (estímulo de
escolha) na presença do número 2 (estímulomodelo) seria considerada correta, e a escolha
de conjuntos com um ou três elementos, diante do número 2, incorretas. Do mesmo modo,
a escolha do conjunto com um elemento diante do número 1 e a escolha do conjunto com
três elementos diante do número 3 seriam consideradas corretas.
Deste modo, uma contingência de três termos – Conjunto com x elementos (estímulo de
escolha): Escolha de um conjunto (resposta)
→ Reforço social (conseqüência) – está sob controle de um quarto elemento, o algarismo numérico (estímulo-modelo). Ou seja, o número
apresentado como modelo determina qual de
três contingências de três termos está em vigor, e a escolha do conjunto com um, dois ou
três elementos poderá ser correta ou incorreta, dependendo do número apresentado como
modelo. Essa situação, portanto, exemplifica
uma contingência de 4 termos (estímulo-modelo: estímulo de escolha – resposta → conseqüência), que caracteriza situações de discriminação condicional em geral. A Figura 14.2
sistematiza, com base no exemplo apresentado na Figura 14.1, as três contingências de três
termos possíveis nesta situação e a relação de
condicionalidade de cada uma delas com os
estímulos numéricos A1, A2 e A3. As contingências tríplices em negrito são as que produziriam o reforço na presença de cada um dos
estímulos-modelo apresentados.
O uso do termo equivalência de estímulos,
na análise do comportamento, foi inicialmente proposto por Sidman (1971) e, posteriormente, redefinido por Sidman e Tailby (1982)
que, ao utilizá-lo, apropriaram-se do termo
como definido pela matemática, estabelecendo que estímulos podem ser considerados equivalentes quando apresentam três tipos de relações emergentes entre si: relações de reflexividade, simetria e transitividade.
A reflexividade consiste em uma relação
de identidade entre estímulos e pode ser
exemplificada pela emergência das relações
AA,1 BB e CC a partir do treino das discriminações condicionais AB e AC. Considerando estes treinos (AB e AC), a propriedade de simetria é exemplificada pela emergência de relações reversíveis entre os estímulos modelo-escolha; neste caso, as relações BA e CA são simétricas às relações AB e AC treinadas. Finalmente, a transitividade seria exemplificada pela
emergência das relações BC e CB dado o treino AB e AC; ou seja, a emergência de relações
entre estímulos que não foram diretamente
relacionados um ao outro, mas que foram relacionados a um terceiro estímulo comum, caracterizam a transitividade. Dado que a relação transitiva CB consiste na reversão da relação transitiva BC e vice-versa, testes que avaliam a emergência destas relações são denominados de testes combinados de transitividade e
simetria ou testes de equivalência.
Para exemplificar as propriedades que caracterizam a equivalência de estímulos, a Figura 14.3 apresenta uma situação esquemática
que representa dois treinos de escolha de acordo com o modelo e a emergência de três novas
relações entre os estímulos envolvidos nos treinos. Três conjuntos de estímulos estão presentes na figura: o conjunto A, composto por conjuntos de um, dois ou três elementos; o conjunto B, composto pelos algarismos arábicos
1, 2 e 3; e o conjunto C, composto pelos algarismos romanos I, II e III. As linhas contínuas
representam as relações condicionais diretamente treinadas, no caso as relações AB e AC,
1Esta
é uma notação comum nas pesquisas sobre
equivalência de estímulos. Letras maiúsculas representam conjuntos de estímulos, sendo que a primeira
letra refere-se ao conjunto de estímulos utilizado
como modelo e a segunda letra ao conjunto de estímulos utilizado como escolha.
ANÁLISE DO COMPORTAMENTO
B1
B1
A1
B2
1
A2
B2
B1
A3
B2
3
2
B3
247
B3
B3
FIGURA 14.1 Exemplos de três discriminações condicionais corretas envolvidas em uma tarefa de ligar
um número à quantidade correspondente de elementos de um conjunto.
FIGURA 14.2 Especificação das contingências de
três termos definidas por cada um dos estímulos
condicionais A1, A2 e A3.
FIGURA 14.3 Representação esquemática das
relações condicionais treinadas (linhas contínuas) e emergentes (linhas pontilhadas) envolvendo três conjuntos de estímulos: A (conjuntos
de figuras), B (números arábicos) e C (algarismos romanos). Fora do retângulo central, são
reapresentados os conjuntos A, B e C, e são
indicadas relações de identidade entre os elementos de um mesmo conjunto por setas de
duplo sentido.
248
ABREU-RODRIGUES, RIBEIRO & COLS.
e as linhas pontilhadas representam as relações emergentes, simétricas, reflexivas e transitivas, conforme sinalizado na legenda da
figura. As setas são sempre posicionadas no
sentido do estímulo-modelo para o de escolha. A observação das três propriedades, por
sua vez, permitiria afirmar que três classes de
estímulos equivalentes foram formadas a partir dos dois treinos realizados, uma classe
composta pelos algarismos 1, I e o conjunto
de figuras com um único elemento; outra composta pelos algarismos 2, II e o conjunto de
figuras com dois elementos e, a terceira, pelos algarismos 3, III e o conjunto de figuras
com três elementos.
PESQUISA BÁSICA EM
EQUIVALÊNCIA DE ESTÍMULOS
Como citado anteriormente, a primeira
pesquisa sobre equivalência de estímulos foi
desenvolvida por Sidman, em 1971. Nesta, um
adolescente de 17 anos com microencefalia e
sérios déficits de desenvolvimento foi exposto
a um procedimento composto de duas fases de
treino de escolha de acordo com o modelo, nas
quais discriminações condicionais entre palavra ditada-palavra impressa e palavra ditadadesenho foram treinadas. Após os treinos, diferentes testes (nomeação de palavra impressa, pareamento palavra impressa-desenho e
pareamento desenho-palavra impressa) foram
realizados. Os resultados evidenciaram a emergência dos desempenhos testados após os treinos de escolha de acordo com o modelo. Em
uma replicação sistemática desse experimento
(Sidman e Cresson, 1973), realizada com duas
crianças com síndrome de Down, os mesmos
resultados foram obtidos e explicados com base
na transferência das equivalências treinadas
(palavra ditada-desenho e palavra ditada-palavra impressa) para a equivalência palavra impressa-desenho.
No entanto, apenas em 1982, Sidman e
Tailby realizaram uma pesquisa que levou à
noção de equivalência como definida neste capítulo e que estabeleceu uma metodologia de
investigação sobre o fenômeno, a qual envolve a realização de treinos de escolha de acor-
do com o modelo e de testes que avaliam as
três propriedades que caracterizam a equivalência de estímulos. Nesse trabalho, oito crianças, entre 5 e 7 anos de idade, foram expostas a
três treinos de escolha de acordo com os modelos denominados AB, AC e DC, sendo o conjunto A composto de nomes ditados de letras gregas e os conjuntos B, C e D compostos de diferentes letras gregas impressas, cada um contendo três estímulos. Após os treinos, foi avaliada a emergência das relações condicionais DB,
BD, AD, BC, CB (testes combinados de
transitividade e simetria) e CD (teste de simetria), e a nomeação oral das letras gregas componentes dos conjuntos de estímulos B, C e D.
Sidman e Tailby (1982) relataram a emergência de três classes equivalentes, compostas de
quatro estímulos (A1B1C1D1, A2B2C2D2 e
A3B3C3D3), para seis das oito crianças, e a
emergência de três classes equivalentes, compostas de três estímulos (A1B1C1, A2B2C2 e
A3B3C3), para as outras duas crianças, após a
realização dos treinos de discriminação condicional citados.
Desde as pesquisas iniciais de Sidman e
colaboradores, muitos estudos sobre equivalência de estímulos, com diferentes populações,
têm sido realizados. Pesquisas com crianças (p.
ex.: Devany, Hayes e Nelson, 1986; Harrison e
Green, 1990), com adolescentes (p. ex.: Bush,
Sidman e de Rose, 1989; Fields et al., 1990;
Gatch e Osborne, 1989), com adultos normais
(p. ex.: Green, Sigurdardottir e Saunders, 1991;
Imam, 2001; Wulfert e Hayes, 1988) e com portadores de necessidades especiais (p. ex.:
Cowley, Green e Braunling-McMorrow, 1992;
Dube et al., 1989; Melchiori, de Souza e de
Rose, 2000) são encontradas na literatura. A
diversidade de estímulos utilizados nas pesquisas também é grande: gustativos (p. ex.: Hayes,
Tilley e Hayes, 1988), interoceptivos (p. ex.:
DeGrandpre, Bickel e Higgins, 1992), visuais
(p. ex.: Lazar, Davis-Lang e Sanches, 1984; Sidman e Tailby, 1982; Sigurdardottir, Green e
Saunders, 1990), auditivos (p. ex.: Bush et al.,
1989; Green, 1990; Sidman, Willson-Morris e
Kirk, 1986), simples (p. ex.: Sidman e Tailby,
1982) e complexos (p. ex.: Markham e
Dougher, 1993; Stromer, McIlvane e Serna,
1993; Stromer e Stromer, 1990a; Stromer e
ANÁLISE DO COMPORTAMENTO
Stromer, 1990b; Stromer e Stromer, 1992) são
alguns exemplos.
Os resultados apresentados, em geral, assemelham-se aos obtidos por Sidman e colaboradores, ou seja, a emergência de relações
equivalentes entre estímulos ocorre a partir do
treino de discriminações condicionais (p. ex.:
Lynch e Cuvo, 1995; McDonagh, McIlvane e
Stoddard, 1984; Saunders et al., 1988;
Saunders, Wachter e Spradlin, 1988; Sidman,
Kirk e Wilson-Moris, 1985). Algumas pesquisas, no entanto, não evidenciam a formação
de classes equivalentes e apresentam a emergência de relações transitivas sem que relações
simétricas tenham emergido (p. ex.: Sidman,
1992), o que sugere a independência das propriedades definidoras da equivalência. Resultados negativos em equivalência também têm
sido apresentados com participantes com repertório verbal deficiente ou inexistente (p. ex.:
Devany et al., 1986); contudo, esses resultados, muitas vezes são revertidos quando respostas de nomeação oral são treinadas (p. ex.:
Eikeseth e Smith, 1992).
Resultados desta natureza, juntamente
com escassas e controvertidas evidências de
equivalência com animais infra-humanos (p.
ex.: McIntire, Cleary e Thompson, 1987;
Schusterman, Kastak e Reichmuth, 1997) têm
levado alguns autores a defender que a formação de classes equivalentes é dependente da
nomeação dos estímulos. Essa proposição, longe de ser consensual entre os pesquisadores da
área, tem gerado muitas discussões com relação à origem das relações de equivalência. Tais
discussões podem ser agrupadas em duas correntes opostas que têm como principais
representantes Sidman e Lowe. A diferença fundamental entre as explicações de Sidman e Lowe
com relação à origem das relações de equivalência consiste na defesa, baseada em evidências experimentais, de que o comportamento verbal, ou mais especificamente, a nomeação oral
dos estímulos, é ou não necessária para que
ocorra a emergência de equivalência.
Lowe e colaboradores (p. ex.: Dugdale e
Lowe, 1990; Horne e Lowe, 1996) defendem
que a equivalência de estímulos é mediada pela
nomeação e que tal mediação pode se dar de
diferentes maneiras: um nome comum para di-
249
ferentes estímulos os tornaria equivalentes, ou
mesmo nomes diferentes, juntamente com a
formulação de uma regra, poderiam mediar a
emergência de equivalência. Sidman (1990),
por outro lado, defende que:
Nomes comuns podem certamente facilitar a
formação de classes de estímulos equivalentes para humanos, mas se os nomes são necessários para a equivalência ainda não é certo... é razoável suspeitar que não são os nomes comuns que dão origem à equivalência,
mas que a equivalência dá origem aos nomes
comuns (p. 105-106).2
Um questionamento semelhante é apresentado com relação à mediação da equivalência por regras: “‘O que vem primeiro, as regras
ou as relações de equivalência?’ Se as regras
vêm primeiro, devemos então perguntar de
onde elas vêm.” (p. 106).3
Evidências favoráveis e desfavoráveis ao
papel mediador da nomeação na equivalência
de estímulos podem ser apontadas (Dugdale e
Lowe, 1990). Dentre as evidências desfavoráveis encontra-se a emergência de equivalência
mesmo na ausência de nomeações consistentes dos estímulos. Dentre as evidências favoráveis encontram-se a falta de resultados inequívocos de equivalência com sujeitos infra-humanos e a inexistência de equivalência na ausência de nomeação dos estímulos, juntamente com a emergência de equivalência quando
nomeações são ensinadas.
Dugdale e Lowe (1990) criticam as evidências desfavoráveis à necessidade de nomeação para a emergência de relações equivalentes. Tais críticas se baseiam no fato de os experimentos que defendem a independência entre nomeação e equivalência se utilizarem exclusivamente de dados de sondas de nomea-
2Common
names can surely facilitate the formation
of stimulus classes for humans, but whether the names
are necessary for equivalence is not certain ... its
reasonable to suspect not that the common names gave
rise to equivalence, but that equivalence gave rise to
the common names.
3“What comes first, the rules or the equivalence
relations?” If the rules comes first, we must ask where
it came from.
250
ABREU-RODRIGUES, RIBEIRO & COLS.
ção, realizadas ao término dos testes das propriedades da equivalência, sem se preocuparem em registrar nomeações espontâneas que
podem ocorrer durante tais testes. Acredita-se
que esse tipo de avaliação possa levar, equivocadamente, à conclusão de que os participantes não tenham dado nomes aos estímulos que
se tornaram equivalentes, no entanto existem
evidências de nomeação espontânea dos estímulos durante a realização de treinos e testes de
escolha de acordo com o modelo sem que nomeações consistentes dos mesmos tenham ocorrido
ao final dos testes de equivalência, quando sondas foram realizadas (p. ex.: Hird e Lowe, 1985,
citados por Dugdale e Lowe, 1990).
Sidman (1990) não só rejeita que a equivalência de estímulos tem origem na nomeação ou em regras, mas também que a mesma
derive de outros processos básicos. Ele levanta
a possibilidade de que a equivalência seja uma
função fundamental do estímulo, derivada das
contingências de quatro termos presentes em
procedimentos de escolha de acordo com o
modelo e que dão origem a discriminações condicionais, e afirma que (p. 111):
Assim como a função condicionada do
reforçamento aparece no nível da contingência de três termos, relações de equivalência
aparecem no nível da contingência de quatro
termos. E, assim como funções de estímulo de
reforçamento, discriminação, reforçamento
condicionado e discriminação condicional representam rudimentos não-analisáveis na descrição do comportamento, a equivalência poderia ainda representar outro rudimento.4
Tal proposição, no entanto, tem sido vista como precipitada, “cada vez mais estranha
à tradição da análise do comportamento em
geral” (Ribeiro, 1995, p. 63) e tem suscitado
críticas tanto de caráter empírico como de cará4Just
as the conditioned reinforcement function
appears at the level of the three-term contingency,
equivalence relations appear at the level of the fourterm contingency. And, just as the stimulus functions
of reinforcement, discrimination, conditioned
reinforcement and conditional discrimination
represent unanalysable primitives in the description
of behaviour, equivalence may represent yet another
primitive.
ter conceitual (p. ex.: Ribeiro, 1995; Saunders
e Green, 1992). Sidman (1994) defende-se,
dizendo que a pesquisa sobre equivalência de
estímulos, apesar de ter introduzido o uso de
novos termos na análise do comportamento (o
que, em alguns momentos, foi visto como uma
proposta de descartar antigos e consolidados
termos e conceitos) é uma extensão natural da
tradição skinneriana. Para ele:
O objetivo maior do artigo Emergent Verbal
Classes5 foi mostrar que a relação de equivalência, apesar de talvez ser um novo conceito..., era uma ampliação do mesmo tipo de
análise de contingência que deu origem a conceitos relacionais básicos como estímulo, resposta, reforçamento, discriminação, reforçamento condicionado e generalizado e discriminação condicional (p. 324).6
Para finalizar, cabe destacar um outro conjunto de resultados proveniente de pesquisas
básicas sobre equivalência de estímulos. Esses
resultados indicam que novos estímulos podem
ser inseridos em uma classe equivalente a partir do ensino de relações condicionais entre os
novos estímulos e um dos membros da classe
(p. ex.: de Rose et al., 1988; Lazar, 1977). A
possibilidade de que as funções adquiridas por
um dos estímulos da classe de equivalência
transfiram-se para os outros membros, sem treino adicional, sugere uma explicação alternativa para a ocorrência de um mesmo comportamento diante de situações novas. Dougher e
colaboradores (1994), após o ensino de relações condicionais envolvendo quatro conjuntos de estímulos visuais arbitrários (A, B, C e
D), verificaram a emergência de duas classes
5Capítulo
do livro Analysis and integration of behavioral units, editado por T. Thompson e M. D. Zeiler,
publicado em 1986, cujo título completo é Funcional analysis of emergent verbal classes.
6A major aim of the Emergent Verbal Classes paper
was to show that the equivalence relation, while
perhaps a new behavioral concept..., was an outgrowth of the same kind of contingency analysis that
had rise to basic relational concepts like stimulus,
response, reinforcement, discrimination, conditioned and generalized reinforcement, and conditional discrimination.
ANÁLISE DO COMPORTAMENTO
de equivalência com quatro membros cada. A
seguir, foi utilizado um procedimento de condicionamento respondente em que um dos elementos de uma classe foi emparelhado com um
choque elétrico e um membro da outra classe
foi apresentado na ausência do choque. Durante a apresentação dos demais membros das
classes, foi observado que a resposta de
condutividade da pele passou também a ser
eliciada pelos outros membros da classe do
estímulo emparelhado com o choque. Posteriormente, utilizando um procedimento similar,
verificou-se que a função de extinção também
era transferida para os demais membros da
classe quando apenas um de seus elementos
era apresentado em extinção (sem ser seguido
por choque elétrico). Ao analisarem os resultados obtidos, os autores sugeriram que a equivalência de estímulos e a transferência de funções podem ser utilizadas para descrever o processo pelo qual respostas de medo passam a
ocorrer na presença de novos estímulos que
fazem parte de uma mesma classe. Além disso, apontaram a possibilidade de que os estímulos de uma determinada classe perdem as
suas funções de eliciar respostas de medo quando apenas um estímulo é o alvo da intervenção ou tratamento.
A transferência de funções não é, contudo, a única maneira pela qual novos estímulos
podem ser incorporados a uma rede de relações. Novos estímulos podem ser incluídos em
uma classe por generalização, em virtude de
apresentarem similaridade física com os componentes da classe (Fields et al., 1991). Desta
forma, a interação entre a equivalência de estímulos e a generalização pode produzir redes
de relações maiores e mais complexas à medida que novos membros são inseridos a uma
determinada classe de estímulos.
APLICABILIDADE E IMPLICAÇÕES
DO CONCEITO DE EQUIVALÊNCIA
DE ESTÍMULOS
A possibilidade de explicar o comportamento humano simbólico com base no paradigma de equivalência tem levado ao desenvolvimento de uma série de pesquisas que avaliam
251
a formação de classes equivalentes envolvendo comportamentos como ler, escrever, lidar
com números, entre outros. Tais pesquisas têm
gerado tecnologia e resultados passíveis de ser
utilizados de modo eficaz em diferentes contextos. Apresentam-se, a seguir, algumas destas pesquisas e suas possibilidades de aplicação para explicar os repertórios de leitura e
escrita, habilidades matemáticas e comportamentos comuns no contexto clínico.
Leitura, escrita e
equivalência de estímulos
A leitura e a escrita podem ser analisadas
como uma rede de repertórios verbais interligados, os quais podem ser adquiridos mediante
procedimentos de escolha de acordo com o
modelo (de Rose et al., 1989; Sidman, 1971).
De acordo com essa proposta, considera-se que
palavras ditadas, palavras impressas e seus respectivos referentes, por controlarem desempenhos verbais comuns (p. ex.: nomear e/ou escrever), fazem parte de uma classe de estímulos equivalentes, definida pelas propriedades de
reflexividade, simetria e transitividade.
A análise da leitura e da escrita como uma
rede de relações permite a identificação dos
desempenhos verbais já aprendidos e a seleção de uma quantidade mínima de relações que
deverão ser ensinadas, a partir das quais novos desempenhos poderão emergir, caracterizando a presença de um repertório de leitura
e escrita (p. ex.: Sidman, 1971; Sidman e
Cresson, 1973; Sidman e Tailby, 1982). A demonstração de que relações simbólicas são
aprendidas a partir de relações condicionais
apresenta-se também como um modelo
comportamental útil para a obtenção e a descrição da emergência de leitura com compreensão (de Rose, 1993; Hübner-D’Oliveira, 1990;
Sidman, 1994). Além disso, tal concepção de
leitura e escrita possibilita a identificação de
relações que devem ser avaliadas e treinadas
em estágios iniciais de aquisição desses repertórios, que consistem em pré ou co-requisitos
para a aprendizagem dos mesmos e relacionam-se a estes apenas indiretamente (Hanna,
Melo e Albuquerque, 1999; Sidman, 1977).
252
ABREU-RODRIGUES, RIBEIRO & COLS.
A rede de repertórios verbais envolvida
na leitura e na escrita é representada na Figura 14.4, que apresenta uma versão expandida do modelo proposto por Sidman (1971)
para explicar o repertório de leitura. Nessa
figura, são apresentadas diferentes relações
condicionais entre estímulos, entre elas as
relações condicionais que exemplificam as
propriedades da equivalência de estímulos. Os
retângulos representam os estímulos (figuras,
palavras impressas e ditadas), e as elipses, as
respostas (nomear, compor com anagramas e
escrever). A seleção de uma figura correspondente a uma palavra ditada é representada
pela relação AB, a qual é denominada de nomeação receptiva-auditiva de figura. A relação
AC é denominada de leitura receptiva-auditiva e indica a escolha de uma palavra impressa correspondente a uma palavra ditada. As
relações BC e CB indicam, respectivamente, a
escolha de uma palavra impressa correspondente a um desenho e a escolha de um desenho correspondente a uma palavra impressa.
Estas relações evidenciam as propriedades de
transitividade e simetria e exemplificam a leitura com compreensão. A relação CD representa a nomeação oral de palavras (Sidman, 1971)
e corresponde ao que Skinner (1957) denomina de comportamento textual. A relação BD
é denominada de nomeação oral de figura. As
demais relações representam o repertório de
escrita: a relação CE representa o comportamento de escrever na presença de uma palavra impressa, o qual é denominado de cópia
(Skinner, 1957). A relação AE indica a escrita
diante de uma palavra ditada e caracteriza
uma situação de ditado. A relação BE representa a escrita diante de uma figura, o que
também pode ser denominado ditado mudo.
A relação AF representa a construção com
anagramas (partes da palavra, tais como letras ou sílabas) a partir de uma palavra ditada. A relação CF indica a construção com anagramas de uma palavra impressa, e a relação
BF, a construção com anagramas diante de
uma figura.
FIGURA 14.4 Diagrama esquemático da rede de relações condicionais envolvidas nos repertórios de
leitura e escrita (adaptação do diagrama proposto por Stromer, Mackay e Stoddard, 1992).
ANÁLISE DO COMPORTAMENTO
Para que a rede de relações esquematizada na Figura 14.4 represente os repertórios
verbais de um indivíduo alfabetizado, é necessária a inclusão de palavras impressas e ditadas novas e de seus respectivos referentes. A
leitura com compreensão e a escrita apenas de
palavras utilizadas nos procedimentos de ensino não são suficientes para se afirmar que
tais repertórios foram aprendidos de maneira
fluente (de Rose et al., 1989; de Rose, Souza,
Rossito e de Rose, 1992). Nesse sentido, a utilidade do paradigma de equivalência para explicar a aprendizagem de leitura e escrita tem
sido defendida com moderação. Acredita-se
que tal paradigma explique a leitura com compreensão, mas que apresente limitações para
explicar a leitura generalizada. Esta pode ser
explicada por processos complementares ao de
equivalência de estímulos, como o que Skinner
(1957) denominou de controle por unidades
mínimas (Albuquerque, 2001; Albuquerque,
2002; Matos e Hübner-D´Oliveira, 1992; Rocha, 1996).
O primeiro trabalho que evidenciou a
emergência de leitura com compreensão, explicitada por desempenhos de escolha de acordo com o modelo envolvendo desenhos e palavras impressas, bem como por desempenhos
de nomeação oral de palavras impressas, foi
realizado por Sidman (1971). Nele, um adolescente com microencefalia, que já era capaz
de selecionar figuras correspondentes a nomes
ditados (relação AB) e de nomear figuras (relação BD), após ter sido exposto a uma situação de ensino de relações condicionais entre
palavras ditadas e palavras escritas (relação
AC), aprendeu a nomear 20 palavras e, também, a selecionar figuras correspondentes a
palavras impressas e palavras impressas correspondentes a figuras apresentadas como
modelo (relações BC e CB), o que seria um indicador de leitura com compreensão. A emergência desses desempenhos demonstra, portanto, a formação de classes de estímulos equivalentes envolvendo a palavra ditada (A), a figura ou o referente (B) e a palavra impressa (C)
(Sidman, 1994; Sidman e Cresson, 1973;
Sidman e Tailby, 1982).
Esses resultados foram replicados e expandidos por vários outros estudos que, além
253
de evidenciarem a emergência de leitura com
compreensão, estabeleceram a inter-relação
entre esse desempenho verbal e desempenhos
de escrita, não investigados na pesquisa original de Sidman (1971). Alguns desses estudos
mostraram que o ensino do desempenho de
montar palavras a partir de suas letras, ou seja,
a construção com anagramas (relação CF), está
relacionado à emergência de novas relações
condicionais envolvendo as palavras impressas montadas e também à emergência de nomeação das mesmas (p. ex.: Aiello, 1995; de
Rose, de Souza e Hanna, 1996; Mackay, 1985;
Mackay e Sidman, 1984). A demonstração de
que a composição com anagramas está relacionada à emergência da nomeação de palavras
sugere uma inter-relação entre leitura e escrita, embora estes desempenhos possam ser adquiridos independentemente (p. ex.: Lee e
Pegler, 1982; Skinner, 1957).
Utilizando como referência o paradigma
de equivalência de estímulos, de Rose e colaboradores (1996) elaboraram um programa,
para o ensino de leitura, destinado a crianças
com história de fracasso escolar na 1ª série do
ensino fundamental. O programa consistia em
ensinar os desempenhos de escolha de palavras impressas correspondentes a palavras ditadas (relação AC) e a construção com anagramas de palavras impressas apresentadas
como modelo (relação CF). Foram utilizadas
51 palavras dissílabas e trissílabas, classificadas como substantivos concretos, facilmente
representáveis por figuras, e compostas, em sua
maioria, por sílabas do tipo vogal-consoante
(p. ex.: bolo, tomate, apito). Os testes de equivalência mostraram que as crianças aprenderam, sem treino direto, a selecionar palavras
impressas correspondentes a figuras e vice-versa e a ler as palavras impressas. Além disso,
observou-se também a leitura de novas palavras, diferentes das que foram utilizadas nos
treinos, formadas pela recombinação de sílabas ou fonemas das palavras treinadas, o que
evidencia a emergência de um desempenho de
leitura generalizada. Por exemplo, após o treino com as palavras tatu, selo e bolo era solicitada a leitura das palavras lobo e lata. Ao longo do programa, a leitura de palavras novas
aumentou gradualmente para cinco das sete
254
ABREU-RODRIGUES, RIBEIRO & COLS.
crianças. Assim, os autores concluíram que a
exposição a um maior número de palavras de
treino e, conseqüentemente, a uma maior variabilidade de sílabas e fonemas ocupando diferentes posições, produz melhoras na nomeação de palavras novas. Esses desempenhos são
coerentes com a sugestão de Skinner (1957)
de que controle por unidades menores – sílabas, grafemas e fonemas componentes das palavras – pode ser adquirido quando uma unidade maior, ou seja, a palavra como um todo,
é correlacionada com o reforço.
Com base nos resultados acumulados até
o momento, têm-se, portanto, evidências claras e inequívocas da emergência de relações
equivalentes com a formação de classes envolvendo palavras ditadas, palavras impressas e
seus referentes, quando pelo menos dois treinos de discriminação condicional são realizados. Tais evidências apresentam ao menos duas
implicações práticas fundamentais: primeiro,
considerando-se a emergência de leitura com
compreensão demonstrada pelas pesquisas sobre equivalência de estímulos em oposição à
grande proporção de fracasso na aprendizagem
de leitura apresentada, por exemplo, pelas escolas brasileiras7 e norte-americanas,8 acredita-se que a metodologia utilizada nessas pesquisas possa vir a respaldar o desenvolvimento de métodos alternativos de ensino para indivíduos que fracassam com os procedimentos
utilizados tradicionalmente (p. ex.: de Rose et
al., 1996; de Rose et al., 1989; Melchiori, de
Souza e de Rose, 1992; Melchiori et al., 2000).
Uma segunda implicação reside no fato
de que as pesquisas sobre equivalência mos-
7De
acordo com os dados do MEC/INEP (2003),
4,2% da população entre 10 e 14 anos de idade e
13,6% acima dos 14 anos são analfabetos. Apesar
de o tempo médio de permanência dos que ingressam na escola ser superior a 8 anos – tempo suficiente para a conclusão do ensino fundamental – apenas dois terços desses alunos concluem o ensino fundamental.
8Segundo Adams (1996), o nível de leitura dos estudantes norte-americanos está abaixo da média apresentada pelos países industrializados. De cada cinco
adultos, um é analfabeto funcional, e a habilidade de
leitura avançada vem decrescendo ao longo dos anos.
tram que, a partir do ensino direto de poucas
relações condicionais, pode haver a ampliação
de repertórios comportamentais, sem a necessidade de que situações de ensino adicionais
sejam estruturadas. Sendo assim, a emergência de relações condicionais não-treinadas evidencia uma situação econômica para o processo
de ensino, o que poderia, em uma época em
que a rapidez é quase que uma exigência e é
confundida com eficiência, colaborar para o
ensino de repertórios de leitura e escrita com
maior agilidade.
As classes de equivalência que envolvem
palavras ditadas, palavras impressas e seus respectivos referentes têm sido apontadas como
a base para a compreensão de um dos aspectos essenciais da linguagem: o significado (de
Rose, 1993; Sidman, 1990; 1994). De acordo
com o paradigma de equivalência, o significado de uma palavra corresponderia à classe de
estímulos à qual a palavra se tornou equivalente. Essa concepção de significado está relacionada com a noção de que as palavras possuem uma referência simbólica, ou seja, se referem a coisas, a eventos, a ações ou a qualidades (Sidman, 1994). Considerando essa perspectiva, a palavra impressa silêncio, por exemplo, apresenta relação de equivalência com
uma classe de estímulos que inclui vários elementos (p. ex.: palavra ditada, uma representação pictórica, um gesto). Essa classe de estímulos seria, portanto, o seu significado. Dessa
forma, ao entrarmos em uma biblioteca e nos
depararmos com uma placa de silêncio, podemos mudar o toque do celular para o modo
silencioso e conversar apenas sussurrando com
um colega de grupo. Como diferentes estímulos participam dessa classe de equivalência, os
mesmos comportamentos podem ocorrer na
presença de outros estímulos, tais como a solicitação de silêncio por parte de um funcionário da biblioteca (“Silêncio, por favor!”), ou
um gesto.
Essa noção de significado possibilita a
compreensão da linguagem (Sidman, 1990).
Sentenças nunca antes ouvidas podem ser compreendidas, desde que as palavras que as compõem façam parte de classes de equivalência
com objetos, seres ou eventos. Tais classes devem ser anteriormente formadas a partir de
ANÁLISE DO COMPORTAMENTO
uma história de reforçamento no contexto de
discriminações condicionais.
Como apontado anteriormente, em uma
classe de equivalência as funções adquiridas
por um estímulo são transferidas para os outros elementos. Entretanto Sidman (1992) ressalta que as palavras impressas não adquirem
todas as funções dos objetos ou dos eventos
que fazem parte de uma mesma classe. Assim,
uma pessoa não interrompe a leitura oral de
um texto quando lê a palavra silêncio nem tenta beber a palavra impressa água. Isso ocorre
porque a relação de equivalência entre uma
determinada palavra impressa, objetos e ações
está sob o controle contextual, os seja, a classe
de equivalência a que uma determinada palavra pertence irá mudar dependendo do estímulo contextual presente. A biblioteca e o texto definem, portanto, a qual (ou quais) ação
(ou ações) a palavra silêncio é equivalente (p.
ex.: Bush et al., 1989; de Rose, 1993).
Finalmente, pode-se afirmar que o paradigma de equivalência de estímulos e a especificação dos repertórios verbais envolvidos na
leitura e escrita podem ser úteis tanto para o
professor como para outros profissionais
(pedagogo, psicólogo, etc.) que atendem crianças com história de fracasso escolar. A utilização desse paradigma possibilita a caracterização do repertório inicial da criança, a identificação das habilidades que precisam ser ensinadas e a seleção das atividades que podem
ser desenvolvidas para complementar os métodos utilizados em sala de aula (Aiello, 1995;
Melo, Hanna e Jesus, 2002; Stromer, Mackay
e Stoddard, 1992).
Habilidades matemáticas
e equivalência de estímulos
O paradigma de equivalência de estímulos também tem-se mostrado útil para a análise e para o ensino de relações entre conjuntos
de estímulos arbitrários, ou entre estímulos e
respostas, que se constituem em habilidades
básicas para a compreensão de habilidades matemáticas. De maneira similar à descrição das
relações envolvidas na leitura e escrita, previamente apresentada, a aquisição de habilidades
255
matemáticas também pode ser representada
por uma rede de relações condicionais derivada do diagrama original proposto por Sidman
(1971). Entretanto, comparativamente aos estudos sobre leitura e escrita, as investigações
sobre repertórios matemáticos têm sido realizadas em menor proporção na análise do comportamento (p. ex.: Carmo, 2002; Prado, 1995;
Santos, 1996).
Considerando o conceito de número,9 diferentes relações condicionais entre estímulos
e entre estímulos e respostas podem ser identificadas (p. ex.: Prado, 1995; Prado e de Rose,
1999), as quais são representadas no diagrama
apresentado na Figura 14.5. Os retângulos ilustram conjuntos de estímulos (A, B e C), a elipse
representa a resposta de nomear (D), e as setas, que vão sempre do estímulo-modelo para
o de comparação ou resposta, indicam relações
condicionais. A relação AB refere-se à escolha
de um numeral impresso correspondente a um
número ditado. A escolha de um conjunto de
itens contendo a quantidade de elementos correspondente a um número ditado é representada pela relação AC. A relação BC indica a
escolha de um conjunto de itens com a quantidade de elementos especificada pelo numeral
impresso apresentado como modelo. O desempenho simétrico a este, a escolha do numeral
correspondente à quantidade de elementos do
conjunto de itens apresentado como modelo,
é representada pela relação CB. A relação BD
refere-se à nomeação oral de um determinado
numeral impresso. A relação CD representa a
nomeação da quantidade de elementos de um
conjunto de itens. As relações BB e CC indicam a escolha de estímulos idênticos aos estí9De
acordo com a proposta de Keller e Schoenfeld
(1950/1974), conceito é a denominação utilizada
para se referir a um tipo especial de comportamento que envolve generalização intraclasse e discriminação interclasses de estímulos. Dessa forma, seria
mais adequado utilizar o termo comportamento
conceitual numérico. Enquanto o termo conceito está
associado a processos mentais, comportamento
conceitual faz referência às relações de controle de
estímulos, estabelecidas a partir de uma história de
reforçamento. Ao longo do texto, o termo conceito
será utilizado para se referir a um comportamento
específico.
256
ABREU-RODRIGUES, RIBEIRO & COLS.
B
Numeral
impresso
A
D
Nomeação
Número ditado
C
Conjunto
FIGURA 14.5 Diagrama esquemático da rede de relações que compõem o conceito de número (adaptado
do diagrama de Prado, 1995).
mulos-modelo (numeral impresso-numeral impresso e conjuntos de itens-conjuntos de itens)
e são representadas por setas que partem e
retornam ao mesmo retângulo. Outras relações
entre estímulos e desempenhos também podem
fazer parte desta rede que descreve o conceito
de número, tais como ordenar numerais ou
conjuntos de itens em seqüência crescente ou
decrescente e separar a quantidade de itens
de um conjunto correspondente a um numeral
impresso (Carmo, 2000; 2002; Prado, 2002).
Utilizando como referência o paradigma
de rede de relações, Prado (1995) analisou o
conceito de número em crianças de 4 a 8 anos
a partir de desempenhos em diferentes tarefas
de discriminação condicional: nomeação de numerais (de 1 a 9); contagem de conjuntos inteiros; emparelhamento de número ditados
com conjuntos, de conjuntos com números, de
números com conjuntos e de conjuntos com
conjuntos. Os resultados mostraram diferenças quanto ao domínio das relações condicionais que compõem o conceito de número. Por
exemplo, algumas crianças eram capazes de
contar os elementos de um conjunto, mas não
relacionavam a quantidade obtida com o numeral correspondente. A análise do repertório
de cada criança possibilitou a identificação das
habilidades matemáticas já dominadas, de for-
ma integral ou parcial, e das que deveriam ser
ensinadas. Conforme apontado pelo autor, tais
informações podem subsidiar a elaboração de
estratégias de ensino individualizado que visem a facilitar a emergência de novas relações
e ao fortalecimento das que foram parcialmente
aprendidas.
Lynch e Cuvo (1995) avaliaram a eficácia do paradigma de equivalência de estímulos para ensinar relações entre números fracionários (como1/5), decimais (como 0,2) e representações pictográficas a sete estudantes
com idades entre 12 e 13 anos, que apresentavam dificuldade na resolução de problemas
com frações e com números decimais. Foram
ensinadas relações condicionais entre números fracionários impressos e suas representações pictóricas (AB) e entre representações pictóricas de frações e suas correspondentes formas decimais (BC). Os testes de equivalência
mostraram a emergência de relações entre frações e números decimais correspondentes (AC)
e entre números decimais e as respectivas frações (CA). Essa demonstração indicou que cada
fração, número decimal e a sua representação
pictórica formavam uma classe de estímulos
equivalentes. Em um outro estudo desenvolvido com frações (Santos, 1996), foi demonstrado que o paradigma de equivalência de es-
ANÁLISE DO COMPORTAMENTO
tímulos é eficaz para a formação de classes de
frações matematicamente equivalentes (como
1/3 e 3/9), a partir do treino de discriminações condicionais entre representações pictóricas e frações e entre frações e frações. Entretanto, nesse estudo, assim como no de Lynch
e Cuvo (1995), a generalização para novos
elementos das classes formadas mostrou-se limitada e, quando ocorria, a porcentagem de
acerto tendia a ser baixa e variável entre os
participantes.
Considerando-se os poucos estudos já
realizados e previamente descritos, relacionando o desenvolvimento de repertórios matemáticos e equivalência de estímulos, observa-se que esses têm se concentrado em investigar desempenhos que são básicos para a
aprendizagem de conceitos matemáticos mais
complexos e que, em geral, estão associados
com história de fracasso nas primeiras séries
do ensino fundamental. Com base nesses estudos (de forma semelhante às implicações
apontadas na análise dos resultados obtidos
até o momento em pesquisas que relacionam
equivalência de estímulos e aprendizagem de
leitura e escrita), as evidências de formação
de classes equivalentes envolvendo algarismos
numéricos, frações e conjuntos de itens, entre outros, sugerem a possibilidade de análise do repertório individual, a definição e elaboração de procedimentos de ensino de conceitos matemáticos de forma econômica. A
economia citada, no entanto, restringe-se a
uma ampliação da rede de relações envolvendo estímulos presentes durante as situações
de treinos de discriminação condicional e
apontam limitações do paradigma de equivalência para explicar o surgimento de novas
relações de equivalência com estímulos não
utilizados nos treinos de discriminação condicional. Assim sendo, pode-se reafirmar que
a utilidade do paradigma de equivalência para
explicar a aprendizagem de repertórios matemáticos deve ser vista com parcimônia e que
a explicação de repertórios desta natureza, em
níveis básicos e avançados de complexidade,
exige referência a outros processos básicos,
como por exemplo, a discriminação e a generalização.
257
Contribuições da equivalência
de estímulos para a explicação
de repertórios comportamentais
relevantes no contexto clínico
Toda intervenção terapêutica de base analítico-comportamental tem como ponto de partida a realização de uma avaliação detalhada
das relações funcionais que envolvem o comportamento-alvo da intervenção. Analisar funcionalmente um comportamento implica concebê-lo como parte de uma contingência de três
termos, identificando as situações ou estímulos diante dos quais o comportamento ocorre
e as conseqüências que este produz no meio
(no comportamento de outras pessoas ou no
ambiente físico) (Meyer, 1997). Entretanto
tem-se defendido que uma melhor compreensão do processo de aquisição e manutenção de comportamentos de interesse no contexto clínico poderia ser obtida a partir de
análises tanto de contingências de três termos
como também de contingências de quatro termos (de Rose, 1993; DeGrandpre e Bickel, 1993;
Tierney e Bracken, 1998), que descrevem situações de discriminações condicionais e constituem a base da formação de classes de estímulos equivalentes.
Partindo dessa proposição, algumas pesquisas (p. ex.: Barnes et al., 1996; DeGrandpre
et al., 1992) têm investigado a formação de
classes equivalentes envolvendo estímulos e
comportamentos comuns no contexto clínico.
Um exemplo que merece ser citado é o trabalho de DeGrandpre e colaboradores (DeGrandpre
e Bickel, 1993; DeGrandpre et al., 1992), que
utiliza o paradigma de equivalência como referencial para a compreensão da etiologia,
manutenção e tratamento do consumo de drogas e se caracteriza como uma alternativa às
explicações que se fundamentam em modelos
de condicionamento respondente. Esses pesquisadores identificam duas condições determinantes para o desenvolvimento da dependência de drogas: o aumento na quantidade
de estímulos que passam a controlar o consumo de drogas, os quais podem ser de diferentes modalidades – interoceptivos (estímulos resultantes do efeito da droga) e exteroceptivos
(estímulos visuais disponíveis quando o con-
258
ABREU-RODRIGUES, RIBEIRO & COLS.
sumo ocorre) e a diminuição na probabilidade
de ocorrência de comportamentos não-relacionados com a droga na presença dos mesmos
estímulos.
Essa proposição foi testada experimentalmente no estudo realizado por DeGrandpre e
colaboradores (1992) em que quatro participantes adultos foram expostos a treinos de discriminação condicional envolvendo estímulos
de diferentes modalidades: interoceptivos (A1
e A2) e exteroceptivos (B1, B2, C1, C2, D1 e
D2). Inicialmente foi realizado o treino AB,
que ensinou os participantes a responderem
na presença de estímulos visuais diferentes
(B1 e B2) quando estavam sob efeito de uma
droga (cápsulas de Trizolan, A1) ou não (cápsulas de um placebo, A2). Posteriormente,
foram treinadas as relações BC e BD, sendo
que os conjuntos C e D eram compostos, cada
um, por dois estímulos visuais. Foram realizados testes para avaliar a emergência de novas
relações e estes demonstraram a formação de
duas classes de estímulos equivalentes, formadas, respectivamente, pelos estímulos
A1B1C1D1 e A2B2C2D2. Os resultados mostraram que os estímulos interoceptivos resultantes do efeito da droga (A1 e A2) e os estímulos exteroceptivos visuais (estímulos dos
conjuntos B, C e D) passaram a controlar um
mesmo comportamento.
Essas evidências fornecem informações
adicionais para a compreensão do processo de
expansão da classe de estímulos diante da qual
comportamentos relacionados com a dependência de drogas, como usar e procurar por
drogas, ocorrem. A identificação de tal classe
de estímulos pode fundamentar a elaboração
de procedimentos de intervenção que se destinem a priorizar o reforçamento de comportamentos alternativos e não-correlacionados com
a droga em contextos ou em situações-estímulo
que, anteriormente, controlavam o uso e a aquisição de drogas (DeGranpre e Bickel, 1993).
Uma outra contribuição dos estudos sobre a equivalência de estímulos para a área clínica refere-se à investigação de processos
comportamentais relacionados com a aprendizagem do comportamento denominado de
autoconceito. Considerando esse paradigma, o
autoconceito poderia ser descrito por uma rede
de relações condicionais entre estímulos arbitrários, sendo que todos os estímulos estariam
relacionados direta ou indiretamente com o
nome da pessoa ou com palavras de auto-referência (p. ex.: eu e mim). Tais relações seriam
estabelecidas e mantidas a partir de interações
da própria pessoa com a comunidade verbal
(Barnes et al., 1996; Dymond e Barnes, 1994).
Dessa forma, o paradigma de equivalência
apresenta-se como uma alternativa para explicar a aquisição do comportamento de rotular,
ou de categorizar a si mesmo, e a emergência
de outras relações condicionais envolvendo o
nome da pessoa.
No decorrer das interações verbais estabelecidas no contexto escolar, é possível que
autoconceitos acadêmicos desenvolvam-se a
partir da aquisição de relações entre o nome
da criança e as frases avaliativas sobre o seu
desempenho acadêmico (p. ex.: João apresenta dificuldade para aprender). É também possível que outras relações sejam aprendidas, relacionando palavras tais como lento e incapaz
com a frase anterior (p. ex.: A dificuldade para
aprender é comum em pessoas lentas e incapazes). Como resultado, a criança pode passar
a se perceber como lenta e incapaz, mesmo que
em nenhum momento tenha ocorrido o
reforçamento da relação entre o seu nome e as
palavras lento e incapaz (cf. Barnes et al., 1996).
Ao investigar o autoconceito acadêmico a
partir do paradigma de equivalência, Barnes e
colaboradores (1996) ensinaram a dois grupos de crianças (com e sem retardo mental)
duas relações condicionais: entre palavras sem
sentido (CUG, ZID) e rótulos relativos ao desempenho acadêmico (hábil e lento), e entre
palavras sem sentido e nomes de pessoas
(nome do próprio participante e nome fictício).
Posteriormente, foram realizados testes a fim
de verificar se os dois grupos eram capazes de
relacionar os rótulos com os respectivos nomes. As crianças que apresentavam retardo
mental falharam nos testes de equivalência, o
que foi evidenciado pelo maior número de erros nas tentativas em que o desempenho correto consistia em relacionar o próprio nome
com a palavra hábil. Nessas tentativas, as crianças com retardo mental escolhiam, sistematicamente, a palavra lento diante do próprio
ANÁLISE DO COMPORTAMENTO
nome, apresentando um desempenho discriminativo diferente do treinado na pesquisa. Segundo os autores, a ocorrência de seleções do próprio nome na presença da palavra
lento e da palavra lento na presença do próprio nome sugerem que relações de equivalência previamente aprendidas, no ambiente
natural, continuaram exercendo controle sobre o comportamento dessas crianças na situação experimental, apesar de divergirem do
treino das relações condicionais realizado
durante o estudo.
Considerando-se esses resultados juntamente com as evidências de transferência de
funções de estímulos (p. ex.: de Rose et al.,
1988; Lazar, 1977) apresentadas anteriormente, pode-se supor que o ensino de uma relação
entre lento e incompetente poderia ser suficiente
para a palavra incompetente tornar-se também
associada a incapaz, embora tal relação não
tenha sido diretamente ensinada. À medida que
a classe é expandida, novas relações emergem
e, portanto, mais palavras estariam sendo associadas ao nome próprio da pessoa.
Tais considerações sobre a formação e a
expansão de classes de estímulos podem ser
úteis para a compreensão de problemas clínicos assim como para a definição de estratégias
de intervenção. Como apontado por de Rose
(1993, p. 298), os procedimentos terapêuticos
serão efetivos apenas se resultarem na destruição da rede de relações que mantém o problema. Caso algumas relações permaneçam intactas, “as relações isoladas suprimidas através da terapia podem emergir novamente. Isso
pode acontecer, por exemplo, quando o cliente retorna ao ambiente no qual o problema
costumava se manifestar”.
Cabe ainda destacar que os resultados obtidos por Barnes e colaboradores (1996) confirmam as observações de outros estudos (como
os de Pilgrim e Gallizio, 1990; 1995; Watt et
al., 1991), que demonstram que as redes de
equivalências previamente estabelecidas tendem a ser estáveis e resistentes a mudanças.
Tal característica poderia explicar a persistência de problemas clínicos (como uso de drogas, autoconceito negativo, fobias) mesmo após
a realização de procedimentos de intervenção.
No entanto é possível que o ensino de novas e
259
diversificadas relações envolvendo os estímulos que anteriormente estavam associados ao
comportamento-alvo da intervenção terapêutica e estímulos e/ou respostas não-relacionados ao comportamento-problema seja capaz de
alterar redes de relações persistentes que caracterizam problemas clínicos, como a dependência química, alterações emocionais e o
autoconceito.
CONCLUSÃO
A introdução de novos conceitos em qualquer área científica é sempre cercada de controvérsias e especulações, o que implica a necessidade de realização de investigações exaustivas na busca de evidências que os sustentem
ou os refutem. O conceito de equivalência de
estímulos, como um conceito relativamente
novo na análise do comportamento, tem gerado discussões e pesquisas importantes tanto no
âmbito básico quanto no aplicado. Uma das
questões básicas mais discutidas e que ainda
carece de respostas conclusivas refere-se à origem das relações de equivalência e ao papel
da nomeação/regra no estabelecimento de classes equivalentes. Essa discussão tem sido mantida, em grande parte, pela ausência de evidências inequívocas de equivalência com animais infra-humanos, o que aponta para a necessidade de investigações adicionais.
Apesar das controvérsias ainda existentes no que diz respeito ao conceito de equivalência, ou talvez até mesmo em função dessas
controvérsias, muitas pesquisas sobre o tema
têm sido realizadas, e resultados sistemáticos
têm sido produzidos. A metodologia de investigação dessas pesquisas, bem como seus resultados, têm apontado sugestões relevantes
para a condução de novas pesquisas básicas e
aplicadas, para o desenvolvimento de estratégias de ensino de repertórios diversos, em diferentes contextos – educacional e clínico – e
para explicar comportamentos humanos complexos e simbólicos. Tal possibilidade, em especial a de explicar linguagem e significado, é
apontada por Sidman (1994) como seu principal interesse no estudo da equivalência de estímulos. De acordo com o paradigma de equi-
260
ABREU-RODRIGUES, RIBEIRO & COLS.
valência, as palavras possuem uma referência
simbólica, visto que pertencem a uma classe
de estímulos equivalentes composta por seus
referentes.
O paradigma de equivalência, além de
fornecer uma explicação adicional para a compreensão de comportamentos simbólicos, em
especial da linguagem, constitui-se também
como uma alternativa às explicações baseadas
em contingências de três termos e generalização, as quais apresentam claras limitações para
a compreensão da novidade, da produtividade
e da criatividade do comportamento humano
na ausência de estratégias diretas de ensino
(de Rose, 1993). Enquanto a generalização
explica a novidade comportamental diante de
classes de estímulos que apresentam semelhança física entre si, o paradigma de equivalência
vai além e consegue explicar a novidade na
ausência de semelhança física entre os estímulos, ou seja, explica a novidade comportamental diante de classes de estímulos que apresentam relações arbitrárias entre seus elementos (a respeito de comportamentos novos, ver
também o Capítulo 8).
O controle de um comportamento comum
por uma classe arbitrária de estímulos relaciona-se também à aprendizagem de conceitos.
Em análise do comportamento, a aprendizagem de conceitos corresponde à formação de
classes de estímulos. As classes de equivalência
são exemplos de classes de estímulos10 constituídas por elementos que apresentam entre si
relações condicionais que satisfazem as propriedades de reflexividade, simetria e transitividade. Dessa forma, a noção de equivalência
de estímulos contribui para a compreensão do
tema conceitos, tradicionalmente estudado pela
Psicologia Cognitiva, propiciando um referencial conceitual e metodológico adicional para
investigar processos de aquisição de comportamentos conceituais com sujeitos humanos e
10Deve-se
mencionar, entretanto, que não há consenso quanto a categorização das classes de equivalência como um tipo especial de classe funcional ou
uma classe à parte (Catania, 1992; Danahoe e
Palmer, 1994; de Rose, 1993).
infra-humanos (para uma revisão, ver Zentall
e Smeets, 1996).
Com relação às contribuições para a elaboração de estratégias de ensino, a pesquisa
sobre equivalência de estímulos tem levado ao
desenvolvimento de procedimentos de avaliação e à produção de repertórios comportamentais complexos, dentre eles o de leitura,
de escrita e de conceitos matemáticos. A análise de tais repertórios como uma rede de relações caracteriza-se como uma alternativa para
identificar relações condicionais que o aluno
já domina e as que precisam ser ensinadas e/
ou fortalecidas. As redes de relações podem,
portanto, ser utilizadas como um recurso para
a detecção de necessidades individuais de
aprendizagem e para a obtenção de informações com vistas à elaboração e à implementação
de estratégias individualizadas de ensino.
A verificação de que o ensino de algumas,
em geral poucas, relações condicionais produz
a emergência de várias outras, ampliando sobremaneira o repertório do aprendiz, evidencia a possibilidade de utilização de procedimentos derivados dos estudos de equivalência para
o desenvolvimento de tecnologias alternativas
de ensino. Além de propiciar economia no número de desempenhos que deverão ser ensinados, a especificação da rede de relações condicionais que descreve um repertório complexo possibilita a escolha das relações que deverão ser ensinadas, considerando-se as que já
foram aprendidas, o que pode resultar na aceleração do processo de aprendizagem. Outras
características desses procedimentos podem estar associadas com a sua efetividade em comparação com os métodos tradicionais de ensino utilizados durante o processo de alfabetização e de ensino de habilidades matemáticas,
tais como o ensino programado de apenas um
desempenho de cada vez, a elaboração de procedimentos de ensino para atender as necessidades de aprendizagem de cada aluno e a utilização freqüente de reforçadores positivos.
Apesar de os resultados das pesquisas sobre equivalência sugerirem aplicações em diferentes contextos, tal possibilidade não tem
sido efetivamente concretizada. Procedimentos alternativos de ensino de repertórios acadêmicos têm sido elaborados, quase que prio-
ANÁLISE DO COMPORTAMENTO
ritariamente, no nível de pesquisas, sendo que
dessa forma apenas uma pequena porcentagem
de crianças que fracassa nas séries iniciais é
beneficiada por tais métodos de ensino. Além
disso, a divulgação de tal conhecimento, para
professores e em disciplinas de cursos de licenciatura, é muito precária. Sendo assim, faz-se
necessária a realização de investigações sobre
as adaptações dos procedimentos derivados das
pesquisas que obtiveram sucesso no ensino de
repertórios acadêmicos ao contexto de sala de
aula, assim como em relação ao planejamento
e confecção de livros e materiais didáticos.
No contexto clínico, análises funcionais
em termos de contingências de três termos
podem não ser suficientes para explicar a aquisição e a manutenção de determinados comportamentos. A equivalência é uma alternativa para analisar a história de desenvolvimento
e manutenção de certos problemas clínicos, tais
como o uso de drogas, o autoconceito negativo e as fobias. Quando se considera que os diferentes estímulos, diante dos quais os comportamentos-alvo de intervenções terapêuticas
ocorrem, constituem uma classe de equivalência, é possível compreender o controle que eles
exercem sobre o comportamento do cliente. A
análise de classes equivalentes poderia, conseqüentemente, subsidiar a elaboração de estratégias de intervenção para ensinar novas relações condicionais entre os estímulos que compõem a classe relacionada com o comportamento-alvo, o que poderia destituir a rede de
relações condicionais responsável pela manutenção do comportamento em questão.
Os resultados dos estudos sobre equivalência sugerem que análises funcionais de repertórios relevantes no contexto clínico, ou dos
comportamentos em geral, devem levar em
consideração o controle que estímulos condicionais podem exercer sobre o comportamento operante descrito por contingências de três
termos e a possibilidade de que contingências
de quatro termos estejam também sob controle de outros estímulos contextuais. Tais considerações apontam para a necessidade de análises funcionais mais amplas, uma vez que análises precisas não só resultam em melhor compreensão do processo de aquisição e manutenção de um determinado comportamento, como
261
também na possibilidade de intervenções mais
eficazes.
Os trabalhos iniciais de Sidman e colaboradores suscitaram uma multiplicidade de estudos sobre o fenômeno da equivalência de estímulos. As sugestões a respeito do potencial
de aplicação da equivalência de estímulos têm
sido confirmadas, por estudos experimentais,
para a compreensão de temas tradicionalmente investigados pela psicologia cognitiva, tais
como linguagem, significado e conceitos. Os
procedimentos utilizados por tais estudos, bem
como os resultados obtidos, apontam contribuições promissoras para a elaboração de
metodologias de ensino de repertórios complexos e de estratégias de intervenção nos contextos escolar e clínico. Há a necessidade, ainda, de investigações adicionais a respeito de
variáveis de procedimentos de treino que resultem no desenvolvimento de repertórios sob
controle de unidades mínimas e na generalização de desempenhos previamente ensinados,
diante de novos estímulos e em contextos nãoexperimentais. As controvérsias que se mantêm quanto à origem da equivalência de estímulos e o papel da nomeação devem ser consideradas como desafios para a condução de
investigações futuras sobre questões conceituais e metodológicas.
REFERÊNCIAS BIBLIOGRÁFICAS
Adams, M. J. (1996). Beginning to read: Thinking and
learning about print. Cambridge: Bradford.
Aiello, A. L. R. (1995). Efeitos de um procedimento de
resposta construída sobre a rede de relações de equivalência envolvida na leitura e escrita em crianças com história de fracasso escolar. Tese de Doutorado não
publicada, Universidade de São Paulo, São Paulo, SP.
Albuquerque, A. R. (2001). Controle comportamental
por símbolos compostos: Manipulação da similaridade
entre estímulos discriminativos e do número de recombinações treinadas. Tese de Doutorado não publicada,
Universidade de Brasília, Brasília, DF.
Albuquerque, A. R. (2002). Uma análise conceitual de
“leitura com compreensão”: Traçando paralelos entre
a proposta de Sidman e o uso cotidiano do termo. Texto didático (organizado) – Série Psicologia (p. 23-39).
Brasília: Editora Universa.
Barnes, D.; Lawlor, H.; Smeets, P. M.; Roche, B. (1996).
Stimulus equivalence and academic self-concept among
mildly mentally handicapped and nonhandicapped
children. The Psychological Record, 46, 87-107.
262
ABREU-RODRIGUES, RIBEIRO & COLS.
Bush, K. M.; Sidman, M.; de Rose, T. (1989). Contextual control of emergent equivalence relations. Journal
of the Experimental Analysis of Behavior, 51, 29-45.
Carmo, J. S. (2000). O conceito de número como rede
de relações. Em R. R. Kerbauy (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento
clínico (p. 97-113). Santo André: SET.
Carmo, J. S. (2002). Definições operacionais de habilidades matemáticas elementares. Em H. J. Guilhardi,
M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.),
Sobre comportamento e cognição: Vol. 9. Contribuições
para a construção da teoria do comportamento (p. 181191). Santo André: ESETec.
Catania, A. C. (1992). Learning. Englewood Cliffs, NJ:
Prentice Hall.
Cowley, B. J.; Green, G.; Braunling-McMorrow, D.
(1992). Using stimulus equivalence procedures to teach
name-face matching to adults with brain injuries.
Journal of Applied Behavior Analysis, 25, 461-475.
Danahoe, J. W.; Palmer, D. C. (1994). Learning and
complex behavior. Boston: Allyn and Bacon.
de Rose, J. C. (1993). Classes de estímulos: Implicações para uma análise comportamental da cognição.
Psicologia: Teoria e Pesquisa, 9, 283-303.
de Rose, J. C.; de Souza, D. G.; Hanna, E. S. (1996). Teaching reading and spelling: Exclusion and stimulus equivalence. Journal of Applied Behavior Analysis, 29, 451-469.
de Rose, J. C.; McIlvane, W. J.; Dube, W. V.; Galpin, V.
C.; Stoddard, L. T. (1988). Emergent simple discrimination established by indirect relation to differential
consequences. Journal of the Experimental Analysis of
Behavior, 50, 1-20.
de Rose, J. C.; Souza, D. G.; Rossito, A. L.; de Rose, T.
M. S. (1989). Equivalência de estímulos e generalização de leitura após história de fracasso escolar. Psicologia: Teoria e Pesquisa, 5, 325-346.
de Rose, J. C.; Souza, D. G.; Rossito, A. L.; de Rose, T.
M. S. (1992). Stimulus equivalence and generalization
in reading after matching to sample by exclusion. Em
S. C. Hayes e L. J. Hayes (Orgs.), Understanding verbal
relations: The second and third international institutes
on verbal relations (p. 69-82). Reno, NV: Context Press.
DeGrandpre, R. J.; Bickel, W. K. (1993). Stimulus control and drug dependence. The Psychological Record,
43, 651-666.
DeGrandpre, R. J.; Bickel, W. K.; Higgins, S. T. (1992).
Emergent equivalence relations between interoceptive
(drug) and exteroceptive (visual) stimuli. Journal of
the Experimental Analysis of Behavior, 58, 9-18.
Devany, J. M.; Hayes, S. C.; Nelson, R. O. (1986). Equivalence class formation in language-able and languagedisabled children. Journal of the Experimental Analysis
of Behavior, 46, 243-257.
Dougher, M. J.; Augustson, E.; Markham, M. R.; Greenway,
D. E.; Wulfert, E. (1994). The transfer of respondent
eliciting and extinction functions through stimulus
equivalence classes. Journal of the Experimental Analysis
of Behavior, 62, 331-351.
Dube, W. V.; McIlvane, W. J.; Maguire, R. W.; Mackay, H.
A.; Stoddard, L. T. (1989). Stimulus class formation and
stimulus-reinforcer relations. Journal of the Experimental Analysis of Behavior, 51, 65-76.
Dugdale, N.; Lowe, C. F. (1990). Naming and stimulus
equivalence. Em D. E. Blackman e H. Lejeune (Orgs.),
Behavior analysis in theory and practice: Contributions
and controversies (p. 113-137). London, UK: Lawrence
Erlbaum Associates.
Dymond, S.; Barnes, D. (1994). A transfer of self-discrimination response functions through equivalence
relations. Journal of the Experimental Analysis of
Behavior, 62, 251-267.
Eikeseth, S.; Smith, T. (1992). The development of
functional and equivalence classes in high-functioning
autistic children: The role of naming. Journal of the
Experimental Analysis of Behavior, 58, 123-133.
Fields, L.; Adams, B. J.; Verhave, T.; Newman, S. (1990).
The effects of nodality on the formation of equivalence
classes. Journal of the Experimental Analysis of Behavior,
53, 345-358.
Fields, L.; Reeve, K. F.; Adams, B. J.; Verhave, T. (1991).
Stimulus generalization and equivalence classes. A model for natural categories. Journal of the Experimental
Analysis of Behavior, 55, 305-312.
Gatch, M. B.; Osborne, J. G. (1989). Transfer of contextual stimulus function via equivalence class development. Journal of the Experimental Analysis of Behavior, 51, 369-378.
Green, G. (1990). Differences in development of visual and auditory-visual equivalence relation. American
Journal of Mental Retardation, 3, 260-270.
Green, G.; Sigurdardottir, Z. G.; Saunders, R. R. (1991).
The role of instructions in the transfer of ordinal functions through equivalence classes. Journal of the Experimental Analysis of Behavior, 55, 287-304.
Hanna, E. S.; Melo, R. M.; Albuquerque, A. R. (1999).
Desenvolvimento infantil e alfabetização. Em M. G. T.
Paz; A. Tamayo (Orgs.), Escola, saúde e trabalho: Estudos psicológicos (pp.71-100). Brasília: Editora UnB.
Harrison, R. J.; Green, G. (1990). Development of conditional and equivalence relations without differential
consequences. Journal of the Experimental Analysis of
Behavior, 54, 225-237.
Hayes, L. J.; Tilley, K. J.; Hayes, S. C. (1988). Extending
equivalence class membership to gustatory stimuli. The
Psychologial Record, 38, 473-482.
Horne, P. J.; Lowe, C. F. (1996). On the origins of naming
and other symbolic behavior. Journal of the Experimental Analysis of Behavior, 65, 185-241.
Hübner-D’Oliveira, M. M. (1990). Estudos em relações
de equivalência: Uma contribuição do controle por unidades mínimas na aprendizagem de leitura com pré-escolares. Tese de Doutorado não publicada, Universidade de São Paulo, São Paulo, SP.
Imam, A. A. (2001). Speed contingencies, number of
stimulus presentations, and the nodality effect in
equivalence class formation. Journal of the Experimental Analysis of Behavior, 76, 265-288.
ANÁLISE DO COMPORTAMENTO
Jonson, C.; Sidman, M (1993). Conditional discrimination and equivalence relations: Control by negative
stimuli. Journal of the Experimental Analysis of Behavior,
59, 333-347.
Keller, F. S.; Schoenfeld, W. N. (1974). Princípios de
psicologia: Um texto sistemático na ciência do comportamento (C. M. Bori e R. Azzi, trads.). São Paulo: EPU
(Obra publicada originalmente em 1950).
Lazar, R. (1977). Extending sequence-class membership
with matching to sample. Journal of the Experimental
Analysis of Behavior, 27, 381-304.
Lazar, R.; Davis-Lang, D.; Sanches, L. (1984). The formation of visual stimulus equivalences in children. Journal
of the Experimental Analysis of Behavior, 41, 251-260.
Lee, V. L.; Pegler, A. M. (1982). Effects on spelling of
training children to read. Journal of the Experimental
Analysis of Behavior, 37, 311-322.
Lynch, D. C.; Cuvo, A. (1995). Stimulus equivalence
instruction of fraction-decimal relations. Journal of
Applied Behavior Analysis, 28, 115-126.
Mackay, H. A. (1985). Stimulus equivalence in rudimentary reading and spelling. Analysis and Intervention in Developmental Disabilities, 5, 373-387.
Mackay, H. A.; Sidman, M. (1984). Teaching new
behavior via equivalence relations. Em P. H. Brooks, R.
Sperber e C. MacCauley (Orgs.), Learning and cognition
in mentally retarded (p. 493-513). Hillsdale, NJ: Erlbaum.
Markham, M. R.; Dougher, M. J. (1993). Compound
stimuli in emergent stimulus relations: Extending the
scope of stimulus equivalence. Journal of the Experimental Analysis of Behavior, 60, 529-542.
Matos, M. A.; Hübner-D´Oliveira, M. M. (1992). Equivalence relations and reading. Em S. C. Hayes e L. J.
Hayes (Orgs.), Understanding verbal relations: The
second and third international institutes on verbal
relations (p. 83-94). Reno, NV: Context Press.
McDonagh, E. C.; McIlvane, W. J.; Stoddard, L. T. (1984).
Teaching coin equivalences via matching to sample.
Applied Research in Mental Retardation, 5, 177-197.
McIntire, K. D.; Cleary, J.; Thompson, T. (1987). Conditional relations by monkeys: Reflexivity, symmetry,
and transitivity. Journal of the Experimental Analysis of
Behavior, 47, 279-287.
Melchiori, L. E.; de Souza, D. G.; de Rose, J. C. (1992).
Aprendizagem de leitura através de um procedimento de
discriminação sem erros (exclusão): Uma replicação com
pré-escolares. Psicologia: Teoria e Pesquisa, 8, 101-111.
Melchiori, L. E.; de Souza, D, G.; de Rose, J. C. (2000).
Reading, equivalence, and recombination of units: A
replication with students with different learning histories.
Journal of Applied Behavior Analysis, 33, 97-100.
Melo, R. M.; Hanna, E. S.; Jesus, P. S. (2002, setembro). Equivalência de estímulos e estratégias de intervenção para crianças com dificuldades na aquisição de
leitura e escrita. Trabalho apresentado no XI Encontro
da Associação Brasileira de Psicoterapia e Medicina
Comportamental, Londrina, Paraná.
Meyer, S. B. (1997). O conceito de análise funcional.
Em: M. Delitti (Org.), Sobre comportamento e cognição:
263
Vol. 2. A prática da análise do comportamento e da terapia cognitivo-comportamental (p. 31-36). Santo André:
ARBytes.
Ministério da Educação, Instituto Nacional de Estudos
e Pesquisas Educacionais Anísio Teixeira (2003). Mapa
do analfabetismo no Brasil. Disponível na Internet no
endereço http://www.inep.gov.br/estatisticas/analfabetismo/.
Pilgrim, C.; Galizio, M. (1990). Relations between
baseline contingencies and equivalence probe performances. Journal of the Experimental Analysis of Behavior,
54, 213-224.
Pilgrim, C.; Galizio, M. (1995). Reversal of baseline
relations and stimulus equivalence: I. Adults. Journal
of the Experimental Analysis of Behavior, 63, 225-238.
Prado, P. S. T. (1995). O conceito de número: Uma análise com base no paradigma de rede de relações. Dissertação de Mestrado não publicada, Universidade Federal de São Carlos, São Carlos, SP.
Prado, P. S. T. (2002). Pode o paradigma de equivalência
fundamentar uma compreensão comportamental do conceito de número? Em H. J. Guilhardi, M. B. B. P. Madi, P.
P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e
cognição: Vol. 10. Contribuições para a construção da teoria do comportamento (p. 271-280). Santo André: ESETec.
Prado, P. S. T.; de Rose, J. C. (1999). Conceito de número: Uma contribuição da análise comportamental
da cognição. Psicologia: Teoria e Pesquisa, 15, 227-235.
Ribeiro, A. F. (1995). Relações de equivalência: Um
novo princípio? Temas em Psicologia, 3, 59-64.
Rocha, A. M. (1996). Variação da composição dos estímulos treinados e desenvolvimento de controle por unidades textuais mínimas. Dissertação de Mestrado não
publicada, Universidade de Brasília, Brasília, DF.
Santos, A. C. G. (1996). Aprendizagem do conceito de
proporção e o paradigma de equivalência de estímulos.
Dissertação de Mestrado não publicada, Universidade
de Brasília, Brasília, DF.
Saunders, R. R.; Green, G. (1992). The nonequivalence
of behavioral and mathematical equivalence. Journal
of the Experimental Analysis of Behavior, 57, 227-241.
Saunders, R. R.; Saunders, K. J.; Kirby, K. C.; Spradlin,
J. E. (1988). The merger and development of equivalence classes by unreinforced conditional selection
of comparison stimuli. Journal of the Experimental
Analysis of Behavior, 50, 145-162.
Saunders, R. R.; Wachter, K. W. J.; Spradlin, J. E. (1988).
Establishing auditory stimulus control over an eightmember equivalence class via conditional discrimination procedures. Journal of the Experimental Analysis
of Behavior, 49, 95-115.
Schusterman, R. J.; Kastak, D.; Reichmuth, C. J. (1997).
What’s in a name? Equivalence by any other name
would smell as sweet. Journal of the Experimental
Analysis of Behavior, 68, 252-258.
Sidman, M. (1971). Reading and auditory-visual equivalences. Journal of Speech and Hearing Research, 14, 4-13.
Sidman, M. (1977). Teaching some basic prerequisites
for reading. Em P. Mittler (Org.), Research to practice in
264
ABREU-RODRIGUES, RIBEIRO & COLS.
mental retardation: Vol. 2. Education and training (p.
353-360). Baltimore, MD: University Park Press.
Sidman, M. (1990). Equivalence relations: Where do
they come from? Em D. E. Blackman e H. Lejeune
(Orgs.), Behavior analysis in theory and practice:
Contributions and controversies (p. 93-112).). London,
UK: Lawrence Erlbaum Associates.
Sidman, M. (1992). Equivalence relations: Some basic
considerations. Em S. C. Hayes e L. J. Hayes (Orgs.),
Understanding verbal relations: The second and third
international institutes on verbal relations (p. 15-27).
Reno, NV: Context Press.
Sidman, M. (1994). Equivalence relations and behavior:
A research history. Boston, MA: Authors Cooperative.
Sidman, M.; Cresson, O. (1973). Reading and crossmodal transfer of stimulus equivalences in severe retardation. American Journal of Mental Deficiency, 77,
515-523.
Sidman, M.; Kirk, B.; Willson-Morris, M. (1985). Sixmember stimulus classes generated by conditionaldiscrimination procedures. Journal of the Experimental
Analysis of Behavior, 43, 21-42.
Sidman, M.; Tailby, W. (1982). Conditional discrimination vs matching-to-sample: An expansion of the
testing paradigm. Journal of the Experimental Analysis
of Behavior, 37, 5-22.
Sidman, M.; Willson-Morris, M.; Kirk, B. (1986).
Matching-to-sample procedures and the development
of equivalence relations: The role of naming. Analysis
and Intervention in Developmental Disabilities, 6, 1-19.
Sigurdardottir, Z. G.; Green, G.; Saunders, R. R. (1990).
Equivalence classes generated by sequence training.
Journal of the Experimental Analysis of Behavior, 53,
47-63.
Skinner, B. F. (1957). Verbal behavior. Englewood Cliffs,
NJ: Prentice-Hall.
Stromer, R. Mackay, H. A.; Stoddard, L. T. (1992).
Classroom applications of stimulus equivalence technology. Journal of Behavioral Education, 2, 225-256.
Stromer, R.; McIlvane, W. J.; Serna, R. W. (1993).
Complex stimulus control and equivalence. The Psychological Record, 43, 585-598.
Stromer, R.; Stromer, J. B. (1990a). The formation of
arbitrary stimulus classes in matching to complex samples. The Psychological Record, 40, 51-66.
Stromer, R.; Stromer, J. B. (1990b). Matching to complex samples: Further study of arbitrary stimulus classes. The Psychological Record, 40, 505-516.
Stromer, R.; Stromer, J. B. (1992). Formation of arbitrary stimulus classes in matching to complex samples:
Supplementary data. Perceptual and Motor Skills, 75,
505-506.
Tierney, K.; Bracken, M. (1998). Stimulus equivalence
and behavior therapy. Em O’Donohue, W. (Org.), Learning and behavior therapy (p. 392-402). Boston: Allyn
e Bacon.
Watt, A.; Keenan, M.; Barnes, D.; Cairns, E. (1991).
Social categorization and stimulus equivalence. The Psychological Record, 41, 33-50.
Wulfert, E.; Hayes, S. C. (1988). Transfer of a conditional ordering response through conditional equivalence classes. Journal of the Experimental Analysis of
Behavior, 50, 125-144.
Zentall, T. R.; Smeets, P. M. (1996). Stimulus class formation in humans and animals. Amsterdam: Elsevier
Science B. V.
ANÁLISE DO COMPORTAMENTO
COMPORTAMENTO SOCIAL: COOPERAÇÃO,
COMPETIÇÃO E TRABALHO INDIVIDUAL
265
15
ANA KARINA CURADO RANGEL DE-FARIAS
A Psicologia tem sido marcada por uma
divergência de explicações ou de atribuições
de causalidade, divergência esta que pode ser
ilustrada pelos estudos desenvolvidos por psicólogos sociais em comparação com estudos
desenvolvidos por analistas do comportamento. Os estudos realizados na área de Psicologia
Social têm privilegiado abordagens internalistas ou mediacionais, explicando o comportamento de indivíduos em grupo com base
em variáveis intrínsecas aos indivíduos, tais
como variáveis emocionais e/ou intelectuais,
e características de personalidade (Lana,
1994). Essa prática é refletida na definição
comumente apontada para Psicologia Social
(Atkinson et al., 1995, p. 554):
A Psicologia Social é o estudo de como as pessoas percebem, pensam e se sentem sobre seu
mundo social e como interagem e influenciam umas às outras. Como formamos impressões sobre outras pessoas, interpretamos seus
comportamentos ou inferimos seus motivos?
Como nossas crenças e atitudes sociais são formadas e mudadas? O que determina com
quem simpatizamos ou antipatizamos? Como
respondemos a diferentes espécies de influência social? Como os grupos de indivíduos
tomam decisões? Como o preconceito e os
conflitos entre grupos podem ser reduzidos?
Assim, crenças, expectativas e atitudes estariam entre as causas dos comportamentos
publicamente observáveis. A atribuição de causalidade determina o modo pelo qual os cientistas investigarão seu objeto de estudo. Doise
(2002) refere-se a três tipos de pesquisadores
em Psicologia Social: contrucionistas radicais,
analistas do discurso e cognitivistas sociais. Os
dois primeiros demonstram uma clara recusa
à utilização de quantificação e variáveis experimentais. Os cognitivistas sociais, por sua vez,
fazem uso de quantificação e de experimentação, explicando o comportamento com base em
estruturas cognitivas, tais como “esquemas
inferenciais” (Lana, 1994).
Doise (2002), portanto, não engloba os
analistas do comportamento como pesquisadores em Psicologia Social. Isso pode decorrer
de uma crítica freqüente, segundo a qual a Análise Experimental do Comportamento (AEC) explicaria apenas fenômenos simples, não abarcando a complexidade inerente aos fenômenos sociais. Essa complexidade dever-se-ia, em
parte, às características intrínsecas dos objetos
sociais. Entretanto Guerin (1994) aponta que
não há nada de intrinsecamente diferente entre objetos sociais e não-sociais: os primeiros
seriam mais dinâmicos e interativos apenas
devido às contingências ambientais das quais
fazem parte. Desse modo, a abordagem analítico-comportamental explica o comportamento social por meio de uma análise funcional
das contingências de reforçamento e punição
às quais os indivíduos estão expostos. Em outras palavras, a AEC investiga relações organismo-ambiente, incluindo-se aqui não somente os comportamentos individuais aprendidos
por meio de exposição direta às contingências,
instruções verbais ou modelação, mas também
os comportamentos emitidos pelos indivíduos
266
ABREU-RODRIGUES, RIBEIRO & COLS.
em grupo (Costa, 2000; Guerin, 1992; Matos,
1997; Todorov, 1989).
Contingências sociais são caracterizadas
pela dinamicidade e pela flexibilidade tendo
em vista que:
a) as interações sociais são breves;
b) as conseqüências liberadas durante
essas interações mudam freqüentemente (p. ex.: pessoas diferentes conseqüenciarão diferentemente um mesmo comportamento);
c) a mera presença de um novo organismo pode modificá-las;
d) várias contingências estão disponíveis
simultaneamente;
e) são mais freqüentemente de quatro ou
cinco termos (ampliando o nível de
exigência sobre a análise dos estímulos antecedentes ao comportamento).
Portanto, a diferença entre contingências
sociais e não-sociais seria de quantidade ou
complexidade, e não de qualidade. O fato de o
reforço social ser um processo usualmente intermitente e generalizado, o que dificulta sua
observação, não significa que o comportamento
social deva-se a fatores distintos daqueles investigados pelos analistas do comportamento
(Guerin, 1992; Schmitt, 1984).
A Psicologia Social tem enfatizado o estudo do contexto em que o comportamento social ocorre (variáveis antecedentes), denominando-o de variáveis informativas, em detrimento do estudo dos efeitos das conseqüências desse comportamento. Atkinson e colaboradores (1995), por exemplo, afirmam ser necessário entender o poder da situação (antecedente) e a interpretação da situação (variável
cognitiva) para se conhecer os determinantes
do comportamento social. Esse poder da situação e a denominada influência social poderiam
ser entendidos como controle de estímulos e,
desse modo, os métodos de observação e de
análise de dados utilizados por analistas do
comportamento seriam de grande valia ao estudo do comportamento social (Guerin, 1994;
Weatherly, Miller e McDonald, 1999).
Quando psicólogos sociais referem-se às
conseqüências, denominam-nas de influências
normativas, dando um menor valor explicativo
às mesmas. Estudos típicos da Psicologia Social, que consistem em breves episódios de observação e, muitas vezes, utilizam-se de jogos
invariáveis (aqueles que aceitam apenas uma
resposta como correta), não conseguem analisar satisfatoriamente os efeitos que as conseqüências sociais generalizadas (p. ex.:, aprovação e afeto, atenção e contato, crítica e rejeição) têm sobre a probabilidade futura de
emissão dos comportamentos e, por isso,
mascaram o verdadeiro valor explicativo do
ambiente externo (Guerin, 1994; Shaw, 1976).
O que é necessário, segundo Guerin (1992;
1994), é o desenvolvimento de metodologias
que possibilitem uma análise mais exaustiva
das variáveis controladoras do comportamento social, demonstrando o papel das conseqüências ambientais na seleção e na manutenção desses comportamentos (ver também
Vollmer e Hackenberg, 2001). A AEC estaria em
uma posição privilegiada para realizar esse estudo, tendo em vista que seus métodos permitem o reconhecimento e a modificação das conseqüências ambientais.
Este capítulo não tem por objetivo realizar uma análise exaustiva sobre a Psicologia
Social tal como se apresenta atualmente, mas
apresentar uma análise de alguns fenômenos
sociais a partir do modelo analítico-comportamental. Portanto, apresentará a definição
proposta por analistas do comportamento para
o comportamento social, a metodologia utilizada e alguns estudos desenvolvidos na área,
concluindo com uma discussão acerca das vantagens da utilização da Análise Experimental
do Comportamento (tanto em nível filosófico
e teórico quanto no que se refere à realização
de experimentos controlados em laboratório)
para a Psicologia Social.
DEFINIÇÃO DE
COMPORTAMENTO SOCIAL
Os analistas do comportamento apontam
que o contato dos organismos com seu ambiente pode ser estabelecido de forma direta
(quando o organismo atua sobre o ambiente e
obtém conseqüências diretas dessa ação, como,
ANÁLISE DO COMPORTAMENTO
por exemplo, ao se levantar e fechar uma janela) ou por meio de uma mediação realizada
pelo comportamento de outro organismo
(como, por exemplo, quando o indivíduo pede
para que outra pessoa feche a janela e tem
como conseqüência a janela fechada). Essa mediação caracteriza o comportamento como
social (Skinner, 1957/1978; Vargas, 1988). O
comportamento social é, então, definido como
uma situação na qual a emissão e/ou o reforçamento do comportamento de um organismo
depende, ao menos parcialmente, do comportamento de outro(s) organismo(s). O comportamento de um organismo pode, portanto, funcionar como operação estabelecedora, estímulo discriminativo e/ou estímulo reforçador para
o comportamento de outro organismo (Baum,
1994/1999; Buskist e Morgan, 1987; Guerin,
1994; Hake e Vukelich, 1972; Hake, Vukelich
e Olvera, 1975; Keller e Schoenfeld, 1950/
1971; Schmitt, 1984; Skinner, 1953/1989).
Nas interações sociais que objetivam a
execução de tarefas (como a elaboração de um
projeto de pesquisa), diversos tipos de relações
podem ser observados entre os indivíduos participantes, incluindo relações de cooperação e
de competição. Relações cooperativas são caracterizadas por “reforçamento mútuo”, de modo
que todos os indivíduos recebem reforços se o
desempenho do grupo atingir um critério específico. Os reforços podem ser liberados de forma eqüitativa ou não-eqüitativa entre os membros do grupo. Assim, dois professores podem
trabalhar juntos na elaboração de um projeto
de pesquisa, sendo ambos beneficiados (similarmente ou não) caso o projeto seja aprovado
pela agência de fomento. No caso de relações
competitivas, a distribuição de reforços é desigual e excludente, dependendo do desempenho relativo dos indivíduos, isto é, a liberação
de reforços para um indivíduo limita ou mesmo
anula a obtenção de reforços pelos demais indivíduos. Desse modo, os mesmos dois professores podem optar por escreverem um projeto
de pesquisa separadamente, sendo que apenas
um deles receberá o financiamento – aquele
cujo projeto for tido como mais relevante e/ou
tenha sido entregue primeiramente.
Nas contingências descritas, os reforços
são interdependentes, ou seja, os reforços ob-
267
tidos por um indivíduo são, ao menos parcialmente, dependentes do comportamento de
outro indivíduo, no entanto os indivíduos,
muitas vezes, podem optar por um trabalho individual. No exemplo anteriormente utilizado,
cada professor escreveria seu projeto e receberia seu próprio financiamento, independentemente do financiamento para os demais projetos. Nesse caso, há uma independência de respostas e reforços entre os organismos: todos
os organismos que alcancem o critério
preestabelecido para reforçamento terão seus
comportamentos reforçados (Buskist e Morgan,
1987; Hake e Vukelich, 1972, 1973; Schmitt,
1984; 1987; 1998).
Schmitt (1987) e Shimoff e Matthews
(1975) apontam que a escolha entre alternativas de cooperação, competição e trabalho individual é típica em nosso dia-a-dia, ou seja,
um indivíduo muitas vezes pode optar por
realizar uma determinada tarefa de forma dependente ou independente. Cabe, então, ao
analista do comportamento investigar as variáveis ambientais que influenciam essa escolha. Algumas dessas variáveis serão discutidas a seguir.
CONTRIBUIÇÕES DA PESQUISA BÁSICA
Estudos realizados pela AEC têm demonstrado que o comportamento social, assim como
o comportamento individual, é determinado
por variáveis ambientais. Dentre as variáveis
que afetam a escolha entre cooperar, competir
e trabalhar individualmente, pode-se citar a
magnitude do reforço (p. ex.: Mithaug, 1969),
a história de exposição a esquemas de reforçamento (Buskist e Morgan, 1987; Mithaug,
1969), a possibilidade de retirar reforços do
parceiro e/ou o risco de perder os reforços acumulados (Schmitt, 1976; 1984; 1987; Schmitt
e Marwell, 1971a; 1971b; 1972), o sucesso ou
fracasso na competição (Schmitt, 1976; 1987),
o custo da resposta (Hake e Vukelich, 1973;
Hake, Olvera, e Bell, 1975; Olvera e Hake,
1976; Schmitt, 1976), o uso de instruções referentes ao contexto social (Abreu-Rodrigues,
Natalino e Aló, 2002; Buskist et al., 1984; Buskist
e Morgan, 1987; de Farias, 2001; Dougherty e
268
ABREU-RODRIGUES, RIBEIRO & COLS.
Cherek, 1994; Matthews, 1979), e a iniqüidade entre os reforços obtidos pelos participantes
(Abreu-Rodrigues et al., 2002; de-Farias, 2001;
Dougherty e Cherek, 1994; Matthews, 1977;
1979; Schmitt e Marwell, 1972; Schmitt, 1998;
Shimoff e Matthews, 1975; Weingold e Webster,
1964).
A seguir, serão apresentadas algumas investigações sobre os efeitos dessas variáveis de
controle sobre a escolha entre contingências
sociais, com o intuito de ilustrar a determinação ambiental do comportamento social.
Magnitude do reforço
Um dos primeiros estudos sobre escolha
entre contingência de cooperação e contingência individual foi realizado por Mithaug (1969).
Doze crianças, divididas em grupos de três, tinham a tarefa de pressionar as teclas de um
piano, a qual podia ser executada cooperativa
ou individualmente. Na contingência de cooperação, o reforço (pontos) era liberado sempre que uma determinada tecla era pressionada pelos três membros do grupo, com um tempo entre respostas igual ou inferior a meio segundo; na contingência individual, o reforço
poderia ser obtido separadamente por cada
membro da tríade, caso este pressionasse a tecla
correta. Os participantes foram instruídos de
que sua tarefa consistia em acumular pontos,
pressionando qualquer tecla o mais rápido possível e quantas vezes fosse necessário para completar a tentativa.
O Experimento 1 compreendia duas condições, apresentadas de acordo com um delineamento ABA. Na condição A, a magnitude
do reforço era a mesma para as respostas cooperativa e individual (razão 1:1) e, na condição B, era 10 vezes maior para a resposta cooperativa em relação à resposta individual (razão 10:1). Os resultados indicaram preferência pela tarefa individual, apesar das manipulações na magnitude do reforço (ver também
Mithaug e Burgess, 1967; 1968). O Experimento 2 investigou a possibilidade de que uma diferença mais acentuada na magnitude do reforço para cada alternativa e um maior tempo
de exposição a essa diferença contribuíssem
para aumentar a preferência pela cooperação.
Todos os grupos foram inicialmente expostos
à Condição A, em que a magnitude do reforço
para a resposta cooperativa era 100 vezes maior do que para a resposta individual (razão
100:1). Em seguida, os grupos foram expostos
à Condição B, em que as magnitudes eram
iguais (razão 1:1) e, depois, retornaram à Condição A. Os resultados mostraram que, na Condição A, os participantes inicialmente preferiam
a situação individual, mas, com a exposição
prolongada às diferentes magnitudes, mudavam sua preferência para cooperação. Na condição B, a preferência pela contingência individual foi restabelecida, porém, na reapresentação da Condição A, os participantes prontamente passaram a preferir a alternativa de
cooperação.
História de reforçamento
A história de exposição a esquemas de
reforçamento pode ser apontada como outra
variável que afeta o desempenho dos indivíduos, como foi demonstrado nos experimentos subseqüentes desenvolvidos por Mithaug
(1969). O autor efetuou manipulações adicionais na razão da magnitude do reforço para
cooperação em relação ao trabalho individual
(100:1, 50:1, 25:1, 10:1, 5:1, 3:1, 1:1). Essas
razões foram apresentadas, inicialmente, em
ordem decrescente e, em seguida, em ordem
aleatória, ou vice-versa. Os resultados indicaram que a ordem de apresentação das razões
afetou a escolha entre o trabalho cooperativo
e o individual. Quando os participantes foram
expostos à seqüência decrescente de razões,
uma preferência pela tarefa de cooperação foi
observada para todos os valores, com exceção
de 3:1 e 1:1. Quando as razões foram apresentadas randomicamente, resultados diferentes
foram obtidos: se os participantes tinham sido
expostos previamente à seqüência decrescente, a preferência por cooperação, anteriormente
observada, era mantida; mas, se os participantes não tinham experiência prévia com a ordem decrescente de razões, era observada a
preferência pela tarefa individual para todas
as razões utilizadas (mesmo com 100:1). O
ANÁLISE DO COMPORTAMENTO
autor concluiu que o controle discriminativo
exercido por contingências de trabalho cooperativo e individual pode ser estabelecido mais
prontamente quando diferentes razões de reforços são apresentadas em ordem decrescente do que em ordem randômica.
Essa variável também foi investigada com
relação ao comportamento competitivo. No estudo desenvolvido por Buskist e Morgan
(1987), os indivíduos foram expostos a esquemas de intervalo fixo (FI), nos quais o reforço
era contingente à primeira resposta emitida
após a passagem do intervalo. No Experimento 1, dois pares de participantes foram individualmente treinados em três diferentes valores de intervalo (FI 30, 60 e 90 s, sinalizados
por diferentes estímulos luminosos) e, então,
expostos a um esquema FI competitivo, no qual
apenas o primeiro participante a responder ao
final do intervalo recebia o reforço. Os participantes eram informados da mudança na contingência por meio de instruções na tela do
computador. A mudança para o esquema competitivo produziu aumentos na taxa de respostas, apesar da freqüência de reforços.
O objetivo do Experimento 2 (Buskist e
Morgan, 1987) foi o de verificar se a história
de exposição a diferentes esquemas de reforçamento afetaria os resultados obtidos no primeiro experimento. Quatro novos pares de
participantes foram inicialmente treinados em
um esquema FI 30 s não-competitivo, sendo
posteriormente expostos a um esquema FI 30 s
competitivo (quando o aumento na taxa foi
novamente observado). Em seguida, dois pares foram expostos a um esquema de razão fixa
(FR 50) não-competitivo (ou seja, os reforços
seriam liberados independentemente para cada
participante do par após a 50a resposta) e dois
outros pares foram expostos a um esquema de
reforçamento diferencial de taxas baixas (DRL
10 s) não-competitivo (ou seja, os reforços seriam liberados independentemente para cada
participante do par se a resposta ocorresse 10 s
após a emissão da resposta anterior). Por fim,
esses quatro pares retornaram ao esquema FI
30 s competitivo. Os resultados indicaram um
efeito da história de reforçamento em esquemas alternativos: os participantes treinados no
esquema FR apresentaram um aumento na taxa
269
de respostas nas primeiras tentativas da segunda exposição ao esquema competitivo em relação à primeira exposição; já os participantes
treinados no esquema DRL ap