ANÁLISE DO COMPORTAMENTO S616 Análise do comportamento [recurso eletrônico] : pesquisa, teoria e aplicação / Josele Abreu-Rodrigues, Michela Rodrigues Ribeiro (organizadoras). – Dados eletrônicos. – Porto Alegre : Artmed, 2007. Editado também como livro impresso em 2005. ISBN 978-85-363-1102-9 1. Psicologia – Comportamento. I. Abreu-Rodrigues, Josele. II. Ribeiro, Michela Rodrigues. CDU 159.9.019.4 Catalogação na publicação: Juliana Lagôas Coelho – CRB 10/1798 ANÁLISE DO COMPORTAMENTO Pesquisa, Teoria e Aplicação Josele Abreu-Rodrigues Michela Rodrigues Ribeiro Organizadoras Versão impressa desta obra: 2005 2007 © Artmed Editora S.A., 2005 Capa Gustavo Macri Preparação do original Rubia Minozzo Leitura final Maria Lúcia Barbará Supervisão editorial Mônica Ballejo Canto Projeto e editoração Armazém Digital Editoração Eletrônica – Roberto Vieira Reservados todos os direitos de publicação, em língua portuguesa, à ARTMED® EDITORA S.A. Av. Jerônimo de Ornelas, 670 - Santana 90040-340 Porto Alegre RS Fone (51) 3027-7000 Fax (51) 3027-7070 É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios (eletrônico, mecânico, gravação, fotocópia, distribuição na Web e outros), sem permissão expressa da Editora. SÃO PAULO Av. Angélica, 1091 - Higienópolis 01227-100 São Paulo SP Fone (11) 3665-1100 Fax (11) 3667-1333 SAC 0800 703-3444 IMPRESSO NO BRASIL PRINTED IN BRAZIL AUTORES Josele Abreu-Rodrigues (org.) Universidade de Brasília Michela Rodrigues Ribeiro (org.) Universidade Católica de Goiás Universidade de Brasília Instituto de Aplicação e Pesquisa Comportamental Alessandra de Moura Brandão Universidade de Brasília Alessandra Rocha de Albuquerque Universidade Católica de Brasília Ana Karina Curado Rangel de-Farias Universidade Católica de Goiás Instituto de Aplicação e Pesquisa Comportamental Carlos Eduardo Cameschi Universidade de Brasília Cristiano Valério dos Santos Universidade de São Paulo Elenice S. Hanna Universidade de Brasília Elisa Tavares Sanabio-Heck Universidade Católica de Goiás Instituto de Aplicação e Pesquisa Comportamental Geison Isidro-Marinho Centro Universitário de Brasília Instituto São Paulo de Terapia e Análise do Comportamento Gordon R. Foxall Cardiff University vi AUTORES João Claudio Todorov Universidade Católica de Goiás Universidade de Brasília Jorge M. Oliveira-Castro Universidade de Brasília Karina de Guimarães Souto e Motta Instituto São Paulo de Terapia e Análise do Comportamento Kennon A. Lattal West Virginia University Laércia Abreu Vasconcelos Universidade de Brasília Lincoln da Silva Gimenes Universidade de Brasília Marcelo Emílio Beckert Instituto de Educação Superior de Brasília Instituto Brasiliense de Análise do Comportamento Marcelo Frota Benvenuti Pontifícia Universidade Católica de São Paulo Rachel Nunes da Cunha Universidade de Brasília Raquel Maria de Melo Universidade de Brasília Raquel Moreira Aló West Virginia University Centro Universitário de Brasília Sonia Beatriz Meyer Universidade de São Paulo Yvanna Aires Gadelha Centro Universitário de Brasília DEDICATÓRIA Ao querido amigo Marcelo Beckert, que, com sua curiosidade, nos mostrou como é interessante aprender, com sua alegria, nos mostrou como é possível sorrir mesmo nos momentos críticos e, com sua vivacidade, nos mostrou como a vida é curta e deve ser aproveitada. Marcelo, você está presente em nossa vívida história... SUMÁRIO Apresentação .................................................................................................................... 11 1. Ciência, tecnologia e análise do comportamento ....................................................... 15 Kennon A. Lattal 2. Operações estabelecedoras: um conceito de motivação ............................................ 27 Rachel Nunes da Cunha Geison Isidro-Marinho 3. História de reforçamento ............................................................................................. 45 Raquel Moreira Aló 4. Momento comportamental ........................................................................................... 63 Cristiano Valério dos Santos 5. Desamparo aprendido .................................................................................................. 81 Elisa Tavares Sanabio-Heck Karina de Guimarães Souto e Motta 6. Comportamento adjuntivo: da pesquisa à aplicação ................................................. 99 Lincoln da Silva Gimenes Alessandra de Moura Brandão Marcelo Frota Benvenuti 7. Contingências aversivas e comportamento emocional ........................................... 113 Carlos Eduardo Cameschi Josele Abreu-Rodrigues 8. Generalização de estímulos: aspectos conceituais, metodológicos e de intervenção .......................................................... 139 Yvanna Aires Gadelha Laércia Abreu Vasconcelos 10 SUMÁRIO 9. Quantificação de escolhas e preferência .................................................................. 159 João Claudio Todorov Elenice S. Hanna 10. Autocontrole: um caso especial de comportamento de escolha ............................ 175 Elenice S. Hanna Michela Rodrigues Ribeiro 11. Variabilidade comportamental .................................................................................. 189 Josele Abreu-Rodrigues 12. Regras e auto-regras no laboratório e na clínica ..................................................... 211 Sonia Beatriz Meyer 13. Correspondência verbal/não-verbal: pesquisa básica e aplicações na clínica .................................................................... 229 Marcelo Emílio Beckert 14. Equivalência de estímulos: conceito, implicações e possibilidades de aplicação ............................................................... 245 Alessandra Rocha de Albuquerque Raquel Maria de Melo 15. Comportamento social: cooperação, competição e trabalho individual ............................................................................. 265 Ana Karina Curado Rangel de-Farias 16. Análise do comportamento do consumidor ............................................................. 283 Jorge M. Oliveira-Castro Gordon R. Foxall APRESENTAÇÃO A Análise do Comportamento é uma ciência do comportamento fundamentada na filosofia do Behaviorismo Radical e que tem como objeto de estudo a interação do indivíduo com o ambiente. Skinner repetidas vezes afirmou que o comportamento humano é um campo de estudo delicado. Delicado no sentido de que há controvérsia sobre qual seria a melhor forma de estudá-lo. Delicado também no sentido de que é multiplamente determinado e que, portanto, consiste em um evento bastante complexo. Esta obra ilustra ambos os aspectos ao oferecer uma alternativa teórico-conceitual para o estudo do comportamento humano e ao especificar diversas estratégias metodológicas utilizadas na identificação de suas variáveis de controle. Este livro consiste em uma coletânea de textos que apresentam um conhecimento atualizado e empiricamente fundamentado sobre processos comportamentais complexos, bem como as possíveis aplicações desse conhecimento na resolução de problemas práticos. No Capítulo 1, Kennon A. Lattal apresenta uma análise das relações entre ciência básica, ciência aplicada e tecnologia, o que dá suporte para todas as discussões apresentadas nos capítulos posteriores. Para o autor, as pesquisas básica e aplicada em análise do comportamento contribuem para o desenvolvimento de tecnologias que, por sua vez, ao serem implementadas e desenvolvidas, fornecem subsídios para futuras pesquisas. Assim sendo, haveria uma interdependência entre ciência básica e aplicada e tecnologia, tendo em vista que o cresci- mento de um campo depende das conquistas efetuadas no outro campo. Apesar de ser comum a realização de estudos em que a transversalidade de informações entre ciência e tecnologia é descartada, os capítulos deste livro pretendem seguir um caminho contrário e apresentam algumas possíveis inter-relações desses três campos. No Capítulo 2, Rachel Nunes da Cunha e Geison Isidro-Marinho apresentam a abordagem analítico-comportamental do conceito de motivação. A ênfase dos autores recai sobre o conceito de operação estabelecedora (OE) que, na atualidade, consiste em um instrumento conceitual e metodológico para o estudo da motivação em situação experimental e aplicada. Após apresentar uma análise histórica desses conceitos, os autores definem e exemplificam as OEs incondicionadas e condicionadas e apontam as dificuldades metodológicas de se demonstrar empiricamente a diferença entre OE e estímulo discriminativo. São também descritas pesquisas aplicadas, as quais sugerem que o conceito de OE é fundamental para a análise funcional do comportamento e, conseqüentemente, para o planejamento de intervenções efetivas. Ao final do capítulo, os autores discorrem sobre as relações entre OEs e estados emocionais, com ênfase no contexto clínico. O Capítulo 3 aborda os efeitos da história de reforçamento sobre a sensibilidade comportamental a mudanças nas contingências. Inicialmente, Raquel Aló apresenta as diferentes definições do termo história de reforçamento e, em seguida, indica que os efeitos 12 ABREU-RODRIGUES, RIBEIRO & COLS. da história dependem de variáveis tais como o tipo de esquema de reforçamento presente antes da mudança, da similaridade entre os estímulos discriminativos antes e após a mudança, das operações estabelecedoras em vigor, etc. Também são apontadas algumas pesquisas aplicadas que ilustram os efeitos da história sobre o comportamento de estudar e sobre comportamentos agressivos. A autora discute possíveis aplicações dos resultados da pesquisa empírica, enfatizando a relevância das variáveis históricas para o diagnóstico e a intervenção no ambiente clínico. Por fim, a autora analisa os pontos em comum entre os estudos de história de reforçamento e de outras áreas, como aqueles sobre resistência a mudanças, desamparo aprendido e comportamento governado por regras, incentivando a integração dos resultados desses estudos. No Capítulo 4, Cristiano Valério dos Santos discute diversas questões metodológicas presentes nos estudos sobre resistência a mudanças, tanto no que se refere aos procedimentos experimentais utilizados quanto à mensuração da resistência. É apresentada uma distinção entre taxa de respostas e resistência à mudança, as quais seriam determinadas por diferentes processos comportamentais, bem como uma definição do modelo de momento comportamental. Após descrever pesquisas básicas sobre os determinantes (p. ex.: magnitude, atraso, taxa e tipo de reforço) da resistência, o autor estabelece um paralelo entre resistência à mudança e escolha/preferência, controle instrucional e história de reforçamento. Ao final, o autor exemplifica a utilização dos conceitos de momento comportamental e resistência à mudança na solução de problemas aplicados tais como seguimento de instruções, resolução de problemas de matemática, desempenho em jogos esportivos e autocontrole. O Capítulo 5, de Elisa Tavares Sanabio-Heck e Karina de Guimarães Souto e Motta, aborda o fenômeno comportamental conhecido como desamparo aprendido, o qual resulta da exposição a situações de incontrolabilidade, bem como as estratégias metodológicas utilizadas na prevenção e na reversão desse fenômeno. As autoras também fazem uma análise crítica do status causal comumente atribuído ao conceito de expec- tativa pelos pesquisadores dessa área de investigação. Para tanto, analisam estudos de desamparo caracterizados pela presença ou pela ausência de correspondência entre comportamento verbal e não-verbal, apresentando uma interpretação analítico-comportamental das relações verbais presentes nesses estudos. Finalmente, são discutidas algumas estratégias terapêuticas (p. ex.: treino de auto-observação, treino de repertórios não-verbais e modelagem de relatos discriminados) relevantes para a reversão dos efeitos da história de incontrolabilidade. No Capítulo 6, Lincoln da Silva Gimenes, Alessandra de Moura Brandão e Marcelo Frota Benvenuti apresentam a definição de comportamento adjuntivo ou, alternativamente, comportamento induzido por contingências de reforçamento, descrevem alguns tipos desse comportamento e exemplificam a generalidade do fenômeno. Esses autores sugerem que o modelo de comportamento adjuntivo pode ser útil para o entendimento de diversos distúrbios comportamentais, tais como drogadição, obesidade, bulimia, anorexia e síndrome do cólon irritável, entre outros. Além disso, é também ilustrada a possibilidade de controle de estímulos sobre o comportamento adjuntivo. O Capítulo 7, de Carlos Eduardo Cameschi e Josele Abreu-Rodrigues, avalia a pesquisa básica sobre contingências aversivas e seus principais efeitos sobre o comportamento de organismos humanos e não-humanos. Ao analisar a punição e o reforçamento negativo, além de apresentar algumas variáveis determinantes das propriedades aversivas dos eventos ambientais, os autores enfatizam as controvérsias existentes sobre a efetividade da punição, as dificuldades metodológicas encontradas no estudo da resposta de fuga, o procedimento de esquiva de Sidman e o debate entre os adeptos de interpretações molares e moleculares do processo de esquiva. Além disso, os autores discutem a abordagem analítico-comportamental do comportamento emocional. Por último, há uma discussão sobre o uso de controle aversivo em procedimentos terapêuticos diversos, tais como na Terapia Analítica Funcional e na Terapia da Aceitação e do Compromisso. No Capítulo 8, Yvanna Aires Gadelha e Laércia Abreu Vasconcelos apresentam uma ANÁLISE DO COMPORTAMENTO análise teórico-conceitual e metodológica do processo de generalização. Para tanto, as autoras estabelecem diferenças entre pseudogeneralização e generalização verdadeira, generalização e generalidade, classes funcionais e classes de equivalência, generalização de estímulos e de respostas. Este capítulo contém, ainda, uma descrição de estratégias metodológicas para a promoção de generalização (p.ex., mediação da generalização, treinamento direto da generalização) e uma discussão do fenômeno da generalização no contexto clínico. Nessa discussão, as autoras destacam os conceitos de integridade do tratamento e satisfação do consumidor. Na seqüência são apresentados dois capítulos referentes à análise do comportamento de escolha. No Capítulo 9, João Claudio Todorov e Elenice S. Hanna apresentam os estudos de quantificação de escolhas e preferência, indicando modelos matemáticos desenvolvidos para descrever o comportamento de escolha, em especial o modelo conhecido como lei da igualação. Os autores também apontam variáveis que influenciam a igualação entre distribuição de respostas e de reforços, tais como o atraso do reforço para respostas de mudança, a história dos sujeitos experimentais e os tipos de esquemas de reforçamento envolvidos na situação de escolha. Esse capítulo também apresenta a controvérsia sobre o princípio da relatividade, discute a generalidade da lei da igualação para o comportamento de escolha de humanos e discorre sobre possíveis aplicações da relação de igualação para o comportamento de indivíduos autistas, atletas e estudantes. No Capítulo 10, Elenice S. Hanna e Michela Rodrigues Ribeiro avaliam um tipo especial de situação de escolha – a situação de autocontrole. Esse capítulo discute o conceito de autocontrole e impulsividade a partir do paradigma de autocontrole proposto por Rachlin. Dentre as variáveis determinantes do autocontrole, as autoras destacam os parâmetros do reforço (atraso, probabilidade, freqüência e magnitude), atividades desenvolvidas durante o atraso do reforço, a história de reforçamento, os estímulos discriminativos presentes na situação e o custo da resposta. Também é discutido o papel do procedimento de esvanecimento para fortalecer o comportamen- 13 to de autocontrole em contextos aplicados (p. ex., indivíduos com atraso de desenvolvimento, crianças hiperativas, adictos em nicotina, mulheres com vaginismo). Ao final, as autoras discorrem sobre o papel do comprometimento em situações aplicadas de autocontrole. No Capítulo 11, Josele Abreu-Rodrigues discute o fenômeno da variabilidade comportamental. Ao apresentar as contribuições da pesquisa básica e aplicada para a compreensão desse fenômeno, a autora analisa separadamente a variabilidade como um subproduto de variáveis ambientais (p. ex., intermitência do reforço, retirada do reforço) e como um produto direto de contingências de variação. Na discussão do controle operante da variabilidade, a autora discorre sobre tópicos tais como controle de estímulos, resistência à mudança, escolha entre repetição e variação, história de reforçamento e controle verbal. Neste capítulo, a autora também discute a relevância dos estudos sobre variabilidade para a compreensão do comportamento criativo e de questões relacionadas à liberdade de escolha. O livro ainda contém uma análise do comportamento verbal sob três diferentes ângulos. Sonia Beatriz Meyer, no Capítulo 12, discute a utilização de regras e auto-regras no laboratório e na clínica analítico-comportamental. Ao descrever os principais resultados da pesquisa básica sobre o tema, a autora aponta diversas variáveis que afetam a sensibilidade do comportamento verbalmente controlado a mudanças nas contingências, tais como o grau de contato com a nova contingência, o conteúdo da regra, o nível de variabilidade comportamental, a história de reforçamento e o grau de discriminabilidade das contingências em vigor. O capítulo apresenta, em seguida, uma discussão sobre o controle verbal no contexto clínico, na qual a autora avalia a efetividade do uso de regras/instruções e de modelagem na promoção de mudanças comportamentais. Há também uma discussão sobre duas variáveis que influenciam o uso de estratégias diretivas: a abordagem teórica do terapeuta e a história de vida do cliente. Por fim, a autora analisa a relação entre controle verbal e resistência e adesão ao tratamento. 14 ABREU-RODRIGUES, RIBEIRO & COLS. Marcelo Emílio Beckert, no Capítulo 13, apresenta uma descrição e a análise da correspondência entre comportamento verbal e comportamento não-verbal. O autor discute aspectos teóricos e metodológicos derivados da pesquisa sobre correspondência, enfatizando a diversidade metodológica existente na área, a efetividade dos diversos tipos de treino da correspondência (p. ex., fazer-dizer, dizer-fazer, dizer-fazer-dizer) e as variáveis que afetam a aquisição, a generalização e a manutenção da correspondência. O capítulo também apresenta algumas implicações dos resultados da pesquisa básica para contextos aplicados, com ênfase no contexto clínico. Aqui, o autor discorre sobre a relevância do treino da correspondência para a aquisição dos comportamentos de autoconhecimento e de autocontrole. Alessandra Rocha de Albuquerque e Raquel Maria de Melo, no Capítulo 14, discutem a aprendizagem por equivalência de estímulos. As autoras inicialmente apresentam uma diferenciação entre equivalência e generalização e uma caracterização do procedimento comumente utilizado para avaliar equivalência. Ao descrever os resultados da pesquisa básica sobre o tema, as autoras discutem se a nomeação oral dos estímulos é necessária para a emergência de equivalência e sobre a possibilidade de transferência de função entre os membros de uma classe de equivalência. Por fim, as autoras discorrem sobre a aplicabilidade do paradigma de equivalência para o treino de leitura, escrita, habilidades matemáticas e comportamentos clinicamente relevantes (p. ex., consumo de drogas, autoconceito negativo). Finalizando, os dois últimos capítulos abordam temas sociais. No Capitulo 15, Ana Karina Curado Rangel de-Farias avalia a pertinência de uma análise experimental do comportamento social, enfatizando as estratégias metodológicas utilizadas nas investigações dos comportamentos de cooperação, competição e trabalho individual. A autora destaca, dentre as variáveis de controle desses comportamentos, a magnitude dos reforços, a história de reforçamento, o custo da resposta, o conteúdo das instruções e a iniqüidade de reforços entre os participantes da situação social. É também discutida a relevância dos estudos so- bre comportamento social para diversas situações aplicadas, tais como produtividade no trabalho, desempenho acadêmico, participação em cooperativas de trabalho e manutenção de recursos naturais. No Capítulo 16, Jorge M. Oliveira-Castro e Gordon Foxall apontam a relevância da abordagem analítico-comportamental para o estudo do comportamento do consumidor. São apresentados resultados de pesquisas sobre tópicos relacionados ao comportamento do consumidor, como, por exemplo, economia comportamental, escolha e preferência, sistemas de economia de fichas e marketing social. O capítulo também contém uma caracterização dos padrões de escolha do consumidor, bem como uma discussão sobre questões como o cenário de consumo, a história de aprendizagem do consumidor e as conseqüências do consumo. Os autores mostram, ainda, uma proposta de categorização do comportamento do consumidor. Por fim, os autores descrevem o uso de procedimentos respondentes e operantes para investigar o comportamento do consumidor. É com muito entusiasmo que apresentamos este livro, que poderá ser de grande utilidade a alunos de graduação e pós-graduação, tendo em vista que os temas de que trata constituem parte de disciplinas obrigatórias na formação desses alunos. Os profissionais que adotam a abordagem analítico-comportamental, bem como aqueles de áreas afins, que buscam um conhecimento atualizado e fundamentado na pesquisa básica e aplicada sobre processos comportamentais diversos, também se beneficiarão com a leitura deste livro. Além disso, esta obra poderá amenizar as dificuldades dos professores da área em oferecer bibliografia atualizada na língua portuguesa, dificuldade esta que nos têm levado a adotar, nos cursos de graduação, traduções já defasadas ou textos em outros idiomas, o que freqüentemente traz prejuízos ao processo ensino-aprendizagem. Por fim, queremos agradecer a todos os colaboradores pelo esforço em apresentar trabalhos fortemente embasados na literatura científica e em apontar possíveis aplicações dos resultados da pesquisa a contextos diversos. As organizadoras ANÁLISE DO COMPORTAMENTO CIÊNCIA, TECNOLOGIA E ANÁLISE DO COMPORTAMENTO 15 1 KENNON A. LATTAL Os capítulos que compõem este livro oferecem substância para as relações entre os elementos descritos no título deste primeiro capítulo. Os autores descrevem muitos desenvolvimentos na análise experimental de processos básicos de aprendizagem, e muitos deles também discutem as implicações de uma compreensão desses processos básicos para a resolução de problemas do comportamento humano. A interação entre ciência e tecnologia é central para o bem-estar da ciência do comportamento e da tecnologia que envolve intervenções comportamentais planejadas para melhorar problemas de comportamento. Este capítulo examina as origens, os pressupostos e a natureza da interação entre ciência e tecnologia como um prelúdio para as discussões de tais relações, as quais são desenvolvidas para áreas específicas e substantivas da análise do comportamento nos capítulos seguintes. CIÊNCIA BÁSICA, CIÊNCIA APLICADA E TECNOLOGIA Uma definição satisfatória e mutuamente acordada de ciência pode ser tão difícil de se alcançar quanto a de uma série de conceitos em psicologia, mas é necessária uma definição como um ponto de partida. A famosa definição de E. G. Boring de inteligência como “aquilo que os testes de inteligência testam” pode ser refraseada para definir ciência como “aquilo que os cientistas fazem”. A partir disso, Skinner (1953) elaborou a definição de que aquilo que os cientistas fazem envolve um “conjunto de atitudes” caracterizado por “uma disposição para aceitar fatos mesmo quando eles são opostos a desejos” (p. 12). O comportamento de um cientista envolve “uma busca por ordem, por uniformidade, por relações ordenadas entre os eventos na natureza” e, além disso, demonstra “mais e mais relações entre eventos ... mais e mais precisamente” (p.13). Para essa discussão será também útil distinguir a ciência básica da aplicada. Tal distinção pode ser feita comportamentalmente em termos das variáveis que controlam o comportamento do cientista. Na ciência básica o comportamento do cientista, amplamente definido, é controlado pela aquisição de novos conhecimentos e pelo desenvolvimento de teorias. O comportamento do cientista aplicado é similarmente controlado pela aquisição de novos conhecimentos, mas novos conhecimentos à medida que estes se relacionam com o impacto do conhecimento sobre problemas práticos (sociais para alguns, como Baer, Wolf, e Risley, 1968), isto é, faz as coisas funcionarem. Como disse Baer (1991), “algumas disciplinas não se dedicam a fazer alguma coisa funcionar, mas sim a notar regularidade, ordem e predições, enquanto outras dedicam-se a fazer as coisas funcionarem” (p.429). A adição de controle ao repertório do cientista aplicado, por meio do desenvolvimento teórico, obscurece a distinção entre ciência básica e aplicada, mas as variáveis que controlam os dois empreendimentos, aquelas relacionadas com a aquisição de conhecimento versus aquelas relacionadas com 16 ABREU-RODRIGUES, RIBEIRO & COLS. a aquisição de conhecimento controlada por seu impacto em assuntos práticos, ainda distinguem as duas. A tecnologia não é controlada por nenhuma dessas variáveis, mas por seu impacto sobre problemas práticos. O comportamento do tecnicista é aquele de adaptação e de aplicação do que é conhecido a partir das ciências básica e aplicada para resolver problemas práticos da vida cotidiana, sejam eles construir uma ponte melhor, ajudar um adulto que atravessa uma crise pessoal ou melhorar a qualidade de vida de um adolescente gravemente retardado. Assim como a distinção entre ciência básica e aplicada também o é, a distinção entre ciência aplicada e tecnologia é, algumas vezes, obscura (cf. Hawkins e Anderson, 2002; Johnston, 1996). ANÁLISE DO COMPORTAMENTO COMO UMA CIÊNCIA E UMA TECNOLOGIA A ciência da análise do comportamento começou com o trabalho de Skinner na década de 1930 (Skinner, 1956) sobre processos básicos de aprendizagem. Os métodos de Skinner encontraram seu espaço na aplicação, talvez primeiramente na análise experimental dos efeitos de drogas sobre o comportamento (Skinner e Heron, 1937) e depois no desenvolvimento de bombas teleguiadas por pombos para o governo dos Estados Unidos (Skinner, 1960), mas mais importante, por meio do que mais tarde tornou-se a análise comportamental aplicada (ver Ullman e Krasner, 1965, p. 1-63, para uma revisão histórica). Talvez as mais amplas questões nesses desenvolvimentos em análise do comportamento tenham sido aquelas referentes a como a ciência básica, a ciência aplicada e a tecnologia podem e relacionam-se entre si. Essas questões têm resultado em um número de revisões úteis dessas relações. Alguns têm discutido a caracterização da análise comportamental aplicada como uma ciência e uma tecnologia (Hayes, 1978; Epling e Pierce, 1986; Johnston, 1996; Smith, 1992), outros têm considerado a lacuna entre a análise comportamental básica e a aplicada e sugerido maneiras de eliminá-la (Baron e Perone, 1982; Hake, 1982; Epling e Pierce, 1986), e outros ainda têm defendido a necessidade de considerar as três não em termos de hierarquia, mas em termos de suas contribuições independentes para a disciplina (Epling e Pierce, 1986; Hayes, 1978). A ciência da análise do comportamento é controlada por variáveis de pelo menos três fontes: pesquisa empírica passada, teoria e observações correntes do comportamento. Com a pesquisa empírica passada e a teoria, o controle é amplamente verbal, visto que estímulos tanto escritos quanto orais estabelecem ocasiões para novas pesquisas. Observações do comportamento podem ser realizadas tanto no laboratório quanto em cenários “aplicados”, tais como clínico e educacional. Essas observações também incluem o bem conhecido princípio de “serendipidade” (Bachrach, 1960; Skinner, 1956), por meio do qual observações sistemáticas futuras do comportamento são controladas por observações que desviam do esperado, isto é, por contingências mais locais e imediatas em contraste com as contingências de mais longo termo envolvidas no controle da pesquisa pela teoria ou pela experimentação prévia. Um dos objetivos da análise do comportamento como uma ciência é desenvolver princípios comportamentais gerais que podem ser aplicados igualmente a humanos e a não-humanos, tanto em laboratório quanto em ambientes naturais. Hake (1982) propôs que a pesquisa básica sobre comportamento social e verbal com humanos poderia servir como uma ponte entre pesquisa básica com animais não-humanos e a aplicação dos princípios a problemas de comportamento humano, por exemplo, em situações clínicas e educacionais. A importância da pesquisa básica nesses dois tópicos em relação à aplicação é inquestionável porque essas características definem partes importantes do ambiente natural dos humanos. O que é questionável é se elas são uma conexão necessária entre pesquisa básica de laboratório com animais e trabalho aplicado com humanos. Hake definiu essa ponte como a extensão dos princípios comportamentais para novas popu- ANÁLISE DO COMPORTAMENTO lações e novos padrões de comportamento, e, nesse sentido, a pesquisa operante básica sobre comportamento social e verbal em humanos pode ser considerada uma ponte. Essa observação não sugere, entretanto, que a pesquisa operante com humanos seja necessária antes da aplicação dos princípios comportamentais a problemas do cotidiano. A história da análise comportamental aplicada mostra que o desenvolvimento do trabalho aplicado não se deu por tal processo de três fases: da pesquisa operante básica com animais para a pesquisa operante com humanos e para a aplicação. A análise comportamental aplicada desenvolveu-se, pelo menos inicialmente, em função do sucesso da extensão direta dos princípios comportamentais desenvolvidos com animais não-humanos, em função da falta de significativa produção de pesquisa operante básica com humanos. Uma vez que tanto o comportamento social quanto o verbal não são encontrados no laboratório animal, tal pesquisa com humanos parece útil se o interesse é na melhora de problemas comportamentais que envolvem esses dois processos. As mesmas fontes de controle na ciência básica operam na ciência aplicada da análise do comportamento. Embora esta possa estar fundamentada na ciência básica, ela se desenvolve independentemente da ciência básica, uma vez que os problemas estudados por ela são controlados por diferentes características do ambiente. A análise do comportamento funciona como uma tecnologia de duas maneiras diferentes: aplicando princípios estabelecidos por meio das pesquisas básica e aplicada para o melhoramento de problemas de significância social (Baer et al., 1968) e como uma fonte de métodos para tornar “observação e mensuração válidas e confiáveis” (Baer, 1991, cf. Cardwell, 1994, p. 492). É a ênfase na solução de problemas práticos que tem creditado à análise do comportamento, dirigida a humanos, sua reputação positiva. Melhoras na validade e na confiabilidade das observações por meio do desenvolvimento de tecnologias observacionais têm, entretanto, contribuído significativamente para fornecer evidências de que a análise do comportamento, de fato, fun- 17 ciona. Além disso, a aplicação de métodos analítico-comportamentais em áreas diversificadas, como cognição animal e farmacologia comportamental, tem contribuído imensamente para o sucesso dessas disciplinas, pelo avanço da ciência básica associada a cada uma delas. PRAGMATISMO E PRÁTICA A análise de comportamento é definida como uma disciplina pragmática (Moxley, 2001; Baum, 1994), o que significa dizer que tanto a ciência como a tecnologia da análise do comportamento têm como critério de verdade de um conceito a utilidade daquele conceito. Na distinção entre pragmática e prática, Morris (1970) observou que Peirce, quem primeiro descreveu pragmatismo, “preferiu o termo ‘pragmatismo’ ... [porque] pragmatismo não estava preocupado com ‘o prático’, nem mesmo com todos os tipos de ‘prática’, mas com a maneira como o conhecimento humano ... é relacionado a ação ou conduta humana” (p. 910). A distinção entre pragmatismo e prática é importante para discussões das relações entre ciência básica, ciência aplicada e tecnologia porque os dois termos, às vezes, são equiparados, com a implicação resultante de que a meta final da análise do comportamento está em contribuir para a solução de problemas práticos. Por exemplo, Baer e colaboradores (1968) notaram que “behaviorismo e pragmatismo freqüentemente parecem caminhar lado a lado. A pesquisa aplicada é eminentemente pragmática; ela pergunta como conseguir com que um indivíduo faça algo de maneira eficaz” (p. 93). O segundo termo é, então, examinado em relação “ao valor de aplicação” e às metas que são “socialmente importantes” (p. 93). Metas socialmente importantes certamente podem ser tanto pragmáticas como práticas, porém nem todas as metas pragmáticas são práticas. Do ponto de vista da filosofia pragmática, qualquer solução, mesmo aquelas que podem não satisfazer outros critérios, tais como a aceitabilidade social (sem mencionar a relevância), pode ser pragmática na medida em que satisfaça as metas estabelecidas. A pesquisa básica 18 ABREU-RODRIGUES, RIBEIRO & COLS. em análise do comportamento é pragmática sem carregar, com esse rótulo, a necessidade de ser prática. O que significa uma disciplina pragmática? O pragmatismo veio para a psicologia, e então para a análise do comportamento, pelos primeiros trabalhos de James e Dewey que, juntos com Peirce, são considerados os fundadores da escola pragmática da filosofia. James e Dewey rejeitaram a abordagem estruturalista e seu substrato filosófico racionalista, que definiu o início da psicologia como uma disciplina separada da filosofia e da fisiologia. Para esses três fundadores (Morris, 1970, p. 10): A ação humana é um tópico de preocupação central. Esta preocupação, porém, não é com o “movimento” ou a “atividade” como tal, nem com os efeitos de idéias sobre a vida humana, nem com uma teoria completa da natureza humana; é principalmente focalizada (embora não exclusivamente) em um aspecto do comportamento humano: ação inteligente, que seria o comportamento propositivo ou dirigido a metas, influenciado por reflexão. Se o alvo é um assunto teórico ou prático, o critério pragmático de verdade de utilidade é definido em termos das metas que são determinadas conforme for mencionado na citação anterior. Essa operacionalização de utilidade parece, a princípio, estar em conflito com uma ciência do comportamento; o próprio Skinner (1974, p. 55), entretanto, sugeriu que a análise do comportamento é “o próprio campo do propósito e da intenção”. Lattal e Laipple (no prelo) descreveram vários modos em que o critério de verdade de utilidade é incorporado em uma visão behaviorista de mundo. Pode ser, por exemplo, considerada uma instância de correspondência entre dizer e fazer (Ribeiro, 1989) com o estabelecimento da meta e a realização da meta correspondendo a dizer e a fazer. tos antecedentes incluem desenvolvimentos em ciência básica, em ciência aplicada e em tecnologia, e eventos conseqüentes envolvem a “utilidade” ao longo das linhas do critério pragmático de verdade de realização de metas esboçado na seção anterior. A interação entre esses eventos antecedentes e conseqüentes constitui um progresso científico e tecnológico. Moxley (1989) e Neef e Peterson (no prelo) descreveram um modelo interativo, apresentado na Figura 1.1, para enquadrar as relações entre ciência básica, ciência aplicada e tecnologia. As atividades no lado esquerdo da matriz constituem a fonte de informações, isto é, a condição antecedente, e aquela no topo da matriz constituiu o receptor ou o beneficiário das informações. Desse modo, cada atividade influencia as outras. Os próximos três itens consideram as implicações de tal configuração para a ciência e para a tecnologia da análise do comportamento. A ciência da análise do comportamento A independência da ciência básica e da aplicada As interações mais comuns e influentes na ciência da análise do comportamento envolvem ciência básica para ciência básica e ciência aplicada para ciência aplicada. A análise do comportamento foi caracterizada como uma RELAÇÕES ENTRE CIÊNCIA BÁSICA, CIÊNCIA APLICADA E TECNOLOGIA Tanto a ciência como a tecnologia da análise do comportamento são controladas por eventos antecedentes e conseqüentes. Os even- FIGURA 1.1 Uma matriz descrevendo as interações entre ciência básica, ciência aplicada e tecnologia. ANÁLISE DO COMPORTAMENTO ciência histórica, visto que práticas atuais e descobertas são construídas a partir de observações e de experimentações prévias. Este livro ilustra como o conhecimento atual sobre processos e fenômenos comportamentais é o resultado do acúmulo de experimentação, em que novos experimentos são fundamentados em experimentos anteriores. As fontes mais fortes de controle sobre práticas científicas atuais em ciência básica e em ciência aplicada são os experimentos que as precederam em, na maioria das vezes, uma área similar ou relacionada. Pode ser só um leve exagero dizer que muitos, se não a maioria, dos cientistas básicos lêem principalmente o que outros cientistas básicos escrevem. Quer dizer, eles lêem pouco sobre ciência aplicada ou áreas tecnológicas de sua disciplina. O mesmo pode ser dito de cientistas aplicados com respeito à literatura aplicada. Essa afirmativa é sustentada por estudos que mostram que as taxas de citações transversais em artigos de análise do comportamento que aparecem no Journal of the Experimental Analysis of Behavior e no Journal of Applied Behavior Analysis são, realmente, bastante pequenas (Poling, Alling e Fuqua, 1994). Uma implicação dessa infreqüente taxa de citações transversais é que as ciências básicas e as aplicadas da análise de comportamento estão operando de maneira relativamente independentes entre si. Esse achado não é insalubre nem particularmente surpreendente. A independência entre análise do comportamento básica e aplicada, em termos de programas de trabalho de pesquisas e de assuntos conceituais que comandam a atenção, é um sinal saudável de crescimento na disciplina como um todo. Embora a análise do comportamento aplicada derive seus princípios e sua visão de mundo da ciência básica baseada em investigações com humanos e com não-humanos dentro da análise experimental do comportamento, a análise do comportamento aplicada não pode ser estritamente limitada pela ciência básica em termos tanto dos problemas que investiga quanto dos métodos que desenvolve para estudá-los. Ela se fundamenta em alguns dos assuntos e problemas teóricos derivados da análise do comportamento básica, entretanto muitos problemas encontrados na 19 aplicação de princípios do comportamento também devem ser tratados. É improvável que a ciência básica trate esses problemas, colocando, assim, o ônus de investigá-los na análise do comportamento aplicada. A análise do comportamento aplicada não é também limitada pelos métodos da ciência básica. A importância dos planejamentos de reversão na ciência básica é uma parte de quase toda investigação de um processo básico de aprendizagem. O procedimento de linha de base múltipla foi desenvolvido porque as demandas na condução de pesquisa em situações naturais algumas vezes impedem a reversão para a condição de linha de base. Embora aquele planejamento seja um “cavalo de força” da análise do comportamento aplicada, isto raramente, se alguma vez, foi usado em situações de pesquisa básica. Relações interdependentes entre a ciência básica e a aplicada Como já foi sugerido, a análise do comportamento básica se desenvolveu antes da ciência aplicada e, nesse sentido, a última é uma descendente linear da primeira. Desse modo, as ciências básica e aplicada da análise do comportamento compartilham uma linhagem comum que inclui uma visão comum de mundo, uma visão comum das variáveis que determinam o comportamento e os métodos sobrepostos (mas métodos freqüentemente não-idênticos porque os ambientes naturais em que a ciência aplicada muitas vezes ocorre colocam especial demanda sobre os métodos, demandas essas não colocadas sobre pesquisas em situações de laboratório, como notado anteriormente). De forma geral, as ciências básica e aplicada influenciam fortemente uma a outra. Mais especificamente, é muito freqüente o caso em que a pesquisa básica provê o ímpeto para a pesquisa aplicada, e muitos têm discutido que isso deveria ser mais freqüente. Mace (1994), por exemplo, clamou pelo desenvolvimento de pesquisa básica em várias áreas que ele sugeriu como particularmente relevantes para a análise do comportamento aplicada: distribuição de respostas, resistência 20 ABREU-RODRIGUES, RIBEIRO & COLS. à mudança, contracontrole, formação e diferenciação/discriminação de classes de estímulos e de respostas, análise de comportamento de taxa baixa e comportamento governado por regra. Ocasionalmente, a relação inversa também ocorre. Dois exemplos ilustram o movimento de pesquisa aplicada para pesquisa básica. Às vezes, a pesquisa aplicada influencia a pesquisa básica quando uma pesquisa sobre um problema aplicado revela uma anomalia ou um resultado inesperado que não é intuitivo a partir do que é conhecido na ciência básica. Como um exemplo simples, em meu próprio laboratório, há vários estudos aplicados que demonstram que usando dois tipos diferentes de recompensas para a mesma tarefa, brinquedos e M&M (pastilhas de chocolate), por exemplo, ocorre um melhor desempenho do que quando utilizado um ou outro tipo de recompensa individualmente. Não é óbvio por que isso deveria acontecer, e agora estamos estudando o problema, usando ratos como sujeitos e pelotas de comida e leite condensado como reforçadores. Outras vezes, modelos de laboratório, com humanos ou não-humanos, são construídos a partir da ciência básica para estudar fenômenos de interesse para a ciência aplicada sob condições mais controladas, mas mais importante em termos da discussão presente, permitir que o fenômeno aplicado seja mais sistematicamente relacionado aos processos comportamentais básicos. Lattal (2001) tem discutido a natureza da extensão dos princípios de um lado para outro entre a ciência básica e a aplicada dentro da análise do comportamento. As pesquisas básica e aplicada parecem mutuamente importantes uma para a outra como uma fonte de novas idéias e soluções de problemas práticos, mas a dificuldade está em encontrar formas para pesquisadores básicos e aplicados deixarem o que estão fazendo e estudar em alguma outra coisa, presumivelmente por causa das contingências que operam para manter suas atividades presentes. O problema é o controle do comportamento, neste caso, do comportamento científico. Skinner (1956) observou que, quando alguém descobre algo interessante algumas vezes é uma boa estraté- gia deixar o que se está fazendo e estudar a nova descoberta. Se tomado muito literalmente, a ciência nunca progrediria porque novas descobertas definem a atividade. Menos literalmente, Skinner estava sugerindo que seguir os dados de maneira indutiva pode ter resultados recompensadores. Uma maneira de facilitar a exposição do cientista para outro tipo de problema é pedir a ele para relacionar sua própria pesquisa com outras coisas. Como um bom exemplo de como isso poderia ser feito, recentemente o Journal of Applied Behavior Analysis tomou a iniciativa criativa de convidar pesquisadores básicos e aplicados para colaborarem no desenvolvimento de uma revisão de uma área de análise do comportamento básica com um olhar nas aplicações de tais pesquisas (Lattal e Neef, 1996). Desse modo, cientistas com diferentes focos examinam problemas relacionados a sua própria pesquisa, mas em uma outra arena. Ciência e tecnologia Foram sugeridos dois modelos gerais de interações entre as ciências, tanto a básica como a aplicada, e a tecnologia. O mais convencional modelo de progresso da ciência para a aplicação é um modelo linear. Com esse modelo, desenvolvimentos em ciência básica são refinados e tornados relevantes por cientistas aplicados, que, por sua vez, entregam seus produtos para indivíduos qualificados e bem-treinados para empregá-los como uma tecnologia. É o caso do modelo de progressão da física e da química para a engenharia e, então, para a construção ou produção. O segundo modelo é parte do que foi descrito previamente como um modelo interativo em que ciência e tecnologia influenciam-se mutuamente. Ainda existe o movimento da ciência básica e da aplicada para a aplicação, mas os movimentos reversos também são reconhecidos (cf. Cardwell, 1994). O modelo linear tem sido apresentado como uma justificativa para a pesquisa básica, como a fundação da tecnologia moderna. Como tal, às vezes é visto como o modo ideal para maximizar ganhos a partir do conhecimento científico. Segundo esse modelo, a ciência bá- ANÁLISE DO COMPORTAMENTO sica tem fornecido a base necessária para a aplicação tecnológica de tal forma que se torna simplesmente uma questão de adaptar o princípio científico para algum problema prático. Embora isso freqüentemente seja verdade, não é sempre o caso, e contra-exemplos trazem à discussão a generalidade do modelo. Em sua análise de revoluções científicas, Kuhn (1971) notou que a ciência é perita em esconder conflitos, especialmente conflitos teóricos. Sua posição é que a ciência normal eventualmente permite falhas no paradigma sob o qual ela é conduzida. As falhas são escondidas ou ignoradas até que um paradigma novo e melhorado apareça. Então, a história do problema é reescrita de tal maneira que as inconsistências anteriores são encobertas, e a ciência é apresentada como um acúmulo gradual e fluente de conhecimento. Essas mesmas idéias podem ser aplicadas à relação entre ciência e tecnologia. Moxley (1989) ofereceu o exemplo de como o uso de laranjas e limões se desenvolveu em um tratamento para o escorbuto. A descoberta científica dos mecanismos freqüentemente é retratada como a razão para a prática (Skinner, 1987), o que se constitui em um exemplo clássico do modelo linear. Comer frutas como um tratamento para aquele flagelo do serviço naval, o escorbuto, porém, era parte da medicina popular pelo menos por 400 anos antes de ser descoberto que o escorbuto era o resultado de uma falta de vitamina C na dieta. Moxley sugeriu que a tecnologia de comer frutas para prevenir o escorbuto não foi causalmente ligada à descoberta dos mecanismos no final dos anos 1700. Ele notou que (1989, p. 49): A história da cura para o escorbuto não é a história do atraso lento entre uma descoberta científica inicial e sua aplicação prática. Ao invés disso, é a história de quanto tempo pode levar antes que alguma adventícia aplicação prática bem-sucedida possa ser cientificamente explicada. O modelo interativo oferece uma visão relacionada, mas mais completa, da relação entre a ciência e a tecnologia, levando em conta os círculos de retroalimentação entre a tecnologia e as ciências a partir das quais elas se de- 21 senvolvem. Mesmo dentro de um modelo interativo, a tecnologia é mais freqüentemente influenciada pela ciência aplicada porque as aplicações são mais diretas desta para a outra. Em muitos casos, entretanto, a aplicação tecnológica é suficientemente direta, de forma que pesquisa aplicada adicional não é necessária, ou pode ser adiada até que a aplicação direta da pesquisa básica seja tentada. Qual a contribuição da ciência para a tecnologia? A ciência contribuiu mais freqüentemente com as matérias-primas das quais a tecnologia é construída, e esta parte da relação segue o modelo linear de ciência para tecnologia, previamente discutido. As tecnologias da análise do comportamento, por exemplo, foram inicialmente construídas sobre os fundamentos conceituais e experimentais do trabalho de Skinner, como já notado. O modelo linear não dá conta, porém, de todas as instâncias de tecnologia porque algumas tecnologias desenvolvem-se em resposta direta às contingências naturais locais sem que, necessariamente, exista uma ciência básica como pré-requisito. A roda, a escrita e o desenvolvimento do ferro podem ser exemplos de tais respostas diretas. Thomas Edison, o “mago do Parque Menlo” como era chamado, era um dos inventores mais prolíferos e bem-sucedidos entre aqueles reivindicados pelos Estados Unidos, mas ele não tinha nada a ver com a compreensão científica de mecanismos. Seu único interesse era inventar “coisas úteis”. É claro, pode ser argumentado que as matérias-primas das quais ele construiu suas invenções eram, de fato, um produto das ciências do seu tempo. Além disso, o trabalho de Edison, e de outros inventores, poderia ter prosseguido de maneira mais eficaz se tivesse a ciência básica provido uma fundação mais formal. Nikola Tesla, o principal competidor de Edison e de igual inventividade, nascido na Croácia, disse sobre Edison (White, 2002, p. 132): Se ele tivesse de achar uma agulha em um palheiro, ele procederia com a diligência da 22 ABREU-RODRIGUES, RIBEIRO & COLS. abelha para examinar palha após palha até encontrar o objeto de sua procura. Eu fui uma testemunha penosa de tais ações, sabendo que um pouco de teoria e de cálculo teria economizado 90% de seu trabalho. Aqueles que aplicam a tecnologia provavelmente têm uma interação direta, relativamente pequena, tanto com a ciência básica como com a aplicada, mas suas informações sobre os desenvolvimentos nessas áreas e as implicações de tais desenvolvimentos para a prática podem vir daqueles envolvidos tanto em uma como em outra ciência. Tais informações são destiladas para algo facilmente aplicado e apresentadas em foros tais como seminários, documentação escrita e apresentações em conferências. Existe um problema potencial de circularidade no fato de que a tecnologia retroalimenta a ciência básica da qual ela deriva. A circularidade é quebrada em parte porque a tecnologia importada de volta para a ciência é baseada em outras facetas da ciência em questão, ou porque a tecnologia pode ser importada de outra disciplina (isto é, tecnologia computacional no caso da ciência da análise do comportamento). O importante papel da tecnologia em desenvolvimento científico parece ser contrário a um modelo estritamente linear de desenvolvimento científico para aplicação porque ele não permite que a tecnologia retroalimente a ciência e, assim, altere o curso da ciência. A tecnologia pode sustentar-se sozinha? Qual a contribuição da tecnologia para a ciência? A ciência também fornece à tecnologia muitos problemas práticos que ela, a ciência, precisa que sejam resolvidos para os avanços adicionais e, diretamente ao ponto desta subseção, a tecnologia retroalimenta a ciência com muitas das ferramentas que esta precisa desenvolver e que, de outra maneira, não seria possível. O fornecimento dessas ferramentas tem um impacto que vai além do propósito original de seu desenvolvimento. Embora ferramentas sejam criadas em resposta a certas demandas específicas do ambiente, uma vez que uma ferramenta torna-se disponível pode ser disponibilizada para muitos outros usos. Um desses usos é a expansão da ciência básica até mesmo em outras direções daquela permitida pela ferramenta original. Avanços tecnológicos, tal como um novo modo de medir uma resposta difícil ou um novo teste estatístico, desenvolvido para um determinado propósito, podem ter uma larga aplicação para outros problemas da ciência básica e da aplicada. Desse modo, por exemplo, o desenvolvimento de uma tecnologia para a análise funcional de comportamentos-problema de crianças com atraso de desenvolvimento tem provado ser valioso para um amplo espectro de problemas e de ambientes. O bloco restante da matriz na Figura 1.1 é aquele em que tecnologia é tanto a fonte quanto o recipiente, gerando a pergunta no título desta subseção. Somente de modo limitado pode a tecnologia sustentar-se. Algumas vezes, ela fornece soluções locais, circunscritas a problemas que surgem em situações específicas; mas existem pelo menos três problemas com tecnologia alimentando tecnologia, talvez especialmente em psicologia. O primeiro é que na ausência de qualquer avaliação e modificação resultante dessa avaliação, tais intervenções psicológicas tecnologicamente dirigidas tornam-se nada mais do que psicologia popular, um tipo de alquimia psicológica em que cada praticante procura seu próprio caminho de acordo com suas próprias regras, nenhum dos quais necessariamente concordando com as regras dos outros. Como os limões, no caso dos marinheiros britânicos, tais intervenções podem funcionar, mas sua aplicação pode ser limitada e ineficiente sem uma compreensão do mecanismo que uma análise científica permitiria. Tais soluções estritamente tecnológicas freqüentemente levam a abordagens de pacotes para problemas em que várias coisas são tentadas de uma vez e, se efetivo, o pacote permanece o tratamento de escolha, embora só um ou dois elementos possam ser responsáveis pelos efeitos. O segundo problema ANÁLISE DO COMPORTAMENTO é relacionado ao primeiro. Quando um pacote tecnológico não funciona como devia, a menos que os próximos passos sejam articulados, para o técnico não é claro qual a próxima coisa a ser feita. Desse modo, por exemplo, se recompensar algum comportamento alternativo apropriado de um adolescente com atraso de desenvolvimento não aumenta a freqüência daquele comportamento, a solução estritamente técnica de recompensar um comportamento apropriado não sugere qual o próximo passo em direção a aumentar o comportamentoalvo. Em parte, isso é um problema do quão específica a tecnologia é, mas quando aplicações tecnológicas começam a incorporar a noção de teorias ou princípios gerais, a distinção entre tecnologia e ciência é obscurecida. Em parte, porque não se espera que técnicos saibam os princípios científicos subjacentes; a menos que se utilizem métodos precisos para manter a tecnologia como planejada para ser aplicada, a aplicação da tecnologia pode mudar da sua forma pretendida originalmente. Essa mudança tecnológica constitui o terceiro problema da tecnologia servindo tanto como fonte quanto como recipiente. Particularmente em psicologia, em que muito da tecnologia envolve pessoas que se comportam de determinadas maneiras, na ausência das condições originais, o comportamento das pessoas desloca-se de seu treinamento original quando contingências mais locais, nem sempre consistentes com as metas de longo prazo da intervenção, entram em jogo. Pennypacker (1986), por exemplo, descreveu os problemas de transferência de tecnologia com respeito a manter um programa de treinamento para ensinar mulheres a realizar auto-exame de mamas como uma intervenção de prevenção ao câncer. Trazendo, para a análise do comportamento, elementos de outras disciplinas Desde o início, a psicologia, em geral, e a análise de comportamento, em particular, têm utilizado idéias de outras disciplinas. A psicologia propriamente é uma disciplina híbrida, tendo surgido de um “casamento” peculiar entre a filosofia e a fisiologia. Sendo assim, des- 23 de o início a psicologia tem abstraído idéias e tecnologias de outros universos de discurso. Idéias filosóficas, como operacionismo, o pragmatismo, o selecionismo e outras, abundam na teoria analítico-comportamental moderna tanto “básica” como “aplicada”. Muitos dos problemas científicos mais amplos da psicologia desenvolveram-se de antigos problemas tratados por filósofos e fisiologistas. Semelhantemente, pesquisas básicas em análise do comportamento sobre questões como a natureza de reforço e punição (Dinsmoor, 2001), a condição da força da resposta, as variáveis determinantes da escolha e a natureza da equivalência de estímulos (Sidman, 1986) refletem questões antigas tanto da psicologia como de outras disciplinas, como a lógica, a matemática e a fisiologia. Existe uma diferença importante entre a influência de dados de outras disciplinas e a incorporação de outras visões de mundo na metateoria analítico-comportamental. Por exemplo, um assunto um pouco preocupante tem sido a relação entre a análise do comportamento e a fisiologia. Schaal (no prelo) notou um número de benefícios derivados da inclusão de dados fisiológicos na análise do comportamento predominante, mas Reese (1996) sugeriu que a análise do comportamento não tem nenhuma obrigação de fazer tal inclusão. Na verdade, Reese discute que fazê-lo pode obscurecer a distinção entre as duas e custar à análise do comportamento um pouco de sua condição como uma disciplina independente. Trazer a pesquisa e a teoria de outras disciplinas é, porém, tanto inevitável quanto pode ser altamente útil em expandir o âmbito da análise do comportamento. Dependendo de como a mistura é feita, a visão de mundo não precisa ser necessariamente comprometida. Por exemplo, Branch (1984) examinou os modos em que o estudo de ações de drogas poderia expandir o entendimento dos mecanismos tanto das drogas quanto do comportamento. Sua sugestão é que um contribui para o entendimento do outro, uma posição diferente daquela de outros que simplesmente usam os métodos da análise do comportamento como uma tecnologia para estudar a ação de drogas. 24 ABREU-RODRIGUES, RIBEIRO & COLS. Tomar elementos de outras disciplinas não é, claramente, limitado a assuntos conceituais e teóricos. Thompson (1984) notou as estranhas semelhanças entre os métodos da fisiologia experimental descritos no século XIX por Bernard (1865/1957) e os métodos contemporâneos da análise experimental do comportamento. Realmente, um dos mais importantes instrumentos de pesquisa de Skinner, o registro cumulativo, evoluiu do quimógrafo, uma invenção do fisiologista experimental alemão, Karl Ludwig. Skinner reformou o registro cumulativo durante a maior parte de sua carreira de pesquisador, modificando e melhorando as versões antigas até desaparecer, junto com o tambor de memória, na era da mais versátil tecnologia adotada e adaptada, o computador digital. SELECIONISMO, CIÊNCIA E TECNOLOGIA O selecionismo tem sido sugerido como um modelo para evolução orgânica e também para mudanças ontogenéticas e culturais (Skinner, 1981). Reconhecendo a análise de Skinner como um importante componente da cultura humana, ciência e tecnologia estão, desse modo, sujeitas aos mesmos princípios de variação e de seleção que qualquer outra prática cultural. Petroski (1992) ilustrou a aplicação de um modelo selecionista para entender a evolução da tecnologia diária na forma de objetos úteis, como lápis e clipes para papel. Um quadro de referência selecionista começa com a variação, porque sem variação não existe nada a ser selecionado por processos naturais. A variação, desse modo, é um elemento crítico na evolução contínua das práticas culturais de ciência e de tecnologia. Uma vantagem de conceitualizar a relação entre a ciência e a tecnologia em termos do modelo interativo mostrado na Figura 1.1 é que ela representa uma descrição mais ampla das fontes de variação nas relações entre ciência básica, ciência aplicada e tecnologia. Vários autores têm assinalado a falta de comunicação entre as psicologias operante e nãooperante (Krantz, 1971), entre a análise do comportamento básica e a aplicada (Poling et al., 1994) e entre os pesquisadores que trabalham com humanos e os que trabalham comnão-humanos dentro da ciência básica da análise do comportamento (Perone, 1985). Existem razões práticas e científicas razoáveis para tais comunicações restritas, como foi notado anteriormente neste capítulo. Mas, do ponto de vista de um selecionista, um sistema muito fechado é desvantajoso porque limita a matéria-prima sobre a qual a seleção pode agir. Cada uma dessas fontes é uma fonte potencial de variação em idéias para o desenvolvimento de outras que não estão sendo otimizadas. Outras fontes de variação também podem contribuir para a evolução contínua da ciência e da tecnologia da análise do comportamento. As muitas outras áreas de ciência e de tecnologia psicológicas servem para essa função, assim como ocorre com o constante influxo de jovens cientistas e de técnicos em análise do comportamento. Kuhn (1971) notou que as mudanças dentro daquela disciplina freqüentemente são provocadas por uma pessoa nova na disciplina, por uma pessoa jovem ou alguém mais velho, mas com treinamento diferenciado que só agora está entrando na disciplina. Dentro da disciplina, pesquisadores básicos considerando problemas aplicados e pesquisadores aplicados considerando problemas básicos semelhantemente podem introduzir variações saudáveis para as áreas nas quais eles não trabalharam antes. A variação não é menos importante para os diferentes empenhos da análise do comportamento do que é para os pássaros e para as abelhas. CONCLUSÃO Que relações existem entre a ciência básica, a ciência aplicada e a tecnologia da análise do comportamento? A tecnologia depende das ciências básica e aplicada, mas de outra forma também as retroalimenta, provendo muitas das ferramentas para o crescimento e o desenvolvimento futuros. As ciências básica e aplicada da análise do comportamento não podem operar de maneira totalmente independente uma da outra, ANÁLISE DO COMPORTAMENTO pois cada uma é controlada por um conjunto de assuntos e de circunstâncias único em seus ambientes naturais. Elas dependem uma da outra para idéias e como um meio de examinar a confiabilidade, a validade e a generalidade dos processos e dos mecanismos comportamentais que estão sob investigação. Cada uma dessas áreas da análise do comportamento também é enriquecida por pesquisas e informações técnicas de outras áreas da psicologia e também de outras ciências. A interação de todos esses elementos provê fontes ricas de variação das quais o ambiente natural pode selecionar as práticas que definirão a análise do comportamento no futuro. NOTA DO AUTOR Uma versão deste capítulo foi apresentada em um colóquio na Universidade de Brasília, em janeiro de 2003, como parte das comemorações do quadragésimo aniversário do Instituto de Psicologia. Agradeço a Lincoln Gimenes pelos úteis comentários sobre a versão inicial e pela tradução do capítulo para a língua portuguesa. REFERÊNCIAS BIBLIOGRÁFICAS Bachrach, A. J. (1962). Psychological research: An introduction. New York: Random House. Baer, D. M. (1991). Tacting “to a fault”. Journal of Applied Behavior Analysis, 24, 429-431. Baer, D. M.; Wolf, M. M.; Risley, T. R. (1968). Some current dimensions of applied behavior analysis. Journal of Applied Behavior Analysis, 1, 91-97. Baron, A.; Perone, M. (1982). The place of the human subject in the operant laboratory. The Behavior Analyst, 5, 143-158. Baum, W. M. (1994). Understanding behaviorism: Science, behavior, and culture. New York: HarperCollins. Bernard, C. (1957). An introduction to the study of experimental medicine (H. C. Green, Trad.). New York: Dover (Obra original publicada em 1865). Branch, M. (1984). Rate dependency, behavioral mechanisms, and behavioral pharmacology. Journal of the Experimental Analysis of Behavior, 42, 511-522. Cardwell, D. (1994). The Fontana history of technology. London: Fontana. Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock are inherently 25 reinforcing. Journal of the Experimental Analysis of Behavior, 75, 311-333. Epling, W. F.; Pierce, W. D. (1986). The basic importance of applied behavior analysis. The Behavior Analyst, 9, 89-99. Hake, D. F. (1982). The basic-applied continuum and the possible evolution of human operant social and verbal research. The Behavior Analyst, 5, 21-28. Hawkins, R. P.; Anderson, C. L. (2002). On the distinction between science and practice: A reply to Thyer and Adkins. The Behavior Analyst, 25, 115-119. Hayes, S. C. (1978). Theory and technology in behavior analysis. The Behavior Analyst, 1, 25-33. Johnston, J. M. (1996). Distinguishing between applied research and practice. The Behavior Analyst, 19, 35-47. Krantz, D. L. (1971). The separate worlds of operant and non-operant psychology. Journal of Applied Behavior Analysis, 4, 61-70. Kuhn, T. S. (1971). The structure of scientific revolutions. Chicago: University of Chicago Press. Lattal, K. A. (2001). The human side of animal behavior. The Behavior Analyst, 24, 147-161. Lattal, K. A.; Laipple, J. (no prelo). Pragmatism and behavior analysis. Em K. A. Lattal,; P. N. Chase (Eds.), Behavior theory and philosophy. New York: Kluwer/ Plenum. Lattal, K. A.; Neef, N. A. (1996). Recent reinforcement schedule research and applied behavior analysis. Journal of Applied Behavior Analysis, 29, 213-230. Mace, F. C. (1994). Basic research needed for stimulating the development of behavioral technologies. Journal of the Experimental Analysis of Behavior, 61, 529-550. Morris, C. (1970). The pragmatic movement in American philosophy. New York: Braziller. Moxley, R. D. (1989). Some historical relationships between science and technology with implications for behavior analysis. The Behavior Analyst, 12, 45-57. Moxley, R. D. (2001). Sources for Skinner’s pragmatic selectionism in 1945. The Behavior Analyst, 24, 201212. Neef, N. A.; Peterson, S. M. (no prelo). Developmental disabilities: Scientific inquiry and interactions in behavior analysis. Em K. A. Lattal,; P. N. Chase (Eds.), Behavior theory and philosophy. New York: Kluwer/Plenum. Pennypacker, H. (1986). The challenge of technology transfer: Buying in without selling out. The Behavior Analyst, 9, 147-156. Perone, M. (1985). On the impact of human operant research: Asymmetrical patterns of cross-citation between human and nonhuman research. The Behavior Analyst, 8, 185-189. Petroski, H. (1992). The evolution of useful things. New York: Vintage. Poling, A.; Alling, K.; Fuqua, R. W. (1994). Self- and cross-citations in the Journal of Applied Behavior Analysis and the Journal of the Experimental Analysis of Behavior: 1983-1992. Journal of Applied Behavior Analysis, 27, 729-731. 26 ABREU-RODRIGUES, RIBEIRO & COLS. Reese, H. W. (1996). How is physiology relevant to behavior analysis? The Behavior Analyst, 19, 61-70. Ribeiro, A. de F. (1989). Correspondence in children’s self-report: Tacting and manding aspects. Journal of the Experimental Analysis of Behavior, 51, 361-368. Schaal, D. (no prelo). Explanatory reductionism in behavior analysis. Em K. A. Lattal; P. N. Chase (Eds.), Behavior theory and philosophy. New York: Kluwer/ Plenum. Sidman, M. (1986). Functional analysis of emergent verbal classes. Em T. Thompson,; M. D. Zeiler (Eds.), Analysis and integration of behavioral units (p. 213-245). Hillsdale, NJ: Erlbaum. Skinner, B. F. (1953). Science and human behavior. New York: Free Press. Skinner, B. F. (1956). A case history in scientific method. American Psychologist, 11, 221-233. Skinner, B. F. (1960). Pigeons in a pelican. American Psychologist, 15, 28-37. Skinner, B. F. (1974). About behaviorism. New York: Knopf. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. Skinner, B. F. (1987). Upon further reflection. Englewood Cliffs, NJ: Prentice-Hall. Skinner, B. F.; Heron, W. T. (1937). Effects of caffeine and benzedrine upon conditioning and extinction. Psychological Record, 1, 340-346. Smith, L. D. (1992). B. F. Skinner and the technological ideal of science. American Psychologist, 47, 216-223. Thompson, T. (1984). The examining magistrate for nature: A retrospective review of Claude Bernard’s An Introduction to the Study of Experimental Medicine. Journal of the Experimental Analysis of Behavior, 41, 211-216. Ullman, L. P.; Krasner, L. (1965). Case histories in behavior modification. New York: Holt, Rinehart, and Winston. White, M. (2002). Acid tongues and tranquil dreamers. New York: Perennial. ANÁLISE DO COMPORTAMENTO OPERAÇÕES ESTABELECEDORAS: UM CONCEITO DE MOTIVAÇÃO 27 2 RACHEL NUNES DA CUNHA GEISON ISIDRO-MARINHO O emprego do conceito de motivação como termo técnico da psicologia requer precisão seja qual for o referencial teórico e metodológico utilizado, de modo a dirimir a ambigüidade que o termo encerra na linguagem coloquial. Historicamente, as variáveis motivacionais têm sido consideradas como determinantes da ação humana, aspecto que manteve o conceito de motivação como um tópico vigente na psicologia. O que torna esse tema fascinante e desafiador para os psicólogos é compreender a que esse conceito se refere no amplo arcabouço teórico, conceitual e metodológico da psicologia. A questão fundamental está no tratamento e na descrição das variáveis controladoras do comportamento. Análises sobre o papel da motivação na explicação do comportamento têm conduzido a várias concepções teóricas e metodológicas que refletem os esforços da psicologia para elucidar uma pergunta básica: por que os homens comportam-se da maneira como o fazem? O estudo do tópico de motivação nos conduz à discussão sobre a natureza das variáveis motivacionais que têm sido caracterizadas tanto como processos internos quanto como eventos do ambiente externo. Essas diferenças ocorrem porque a psicologia apresenta diversidades na definição de seu objeto de estudo, de sua metodologia e de seus pressupostos epistemológicos. Para os analistas do comportamento, as variáveis motivacionais são variáveis ambientais. Um fator complicador é que “motivação”, como um termo da linguagem coloquial, pode apresentar ambigüidades pelas várias acepções do verbete na língua portuguesa. O dicionário eletrônico do Instituto Antônio Houaiss (2001) da língua portuguesa traz o verbete motivação como um substantivo feminino, e na acepção de “ato ou efeito de motivar”, o verbete é definido em termos jurídico, lingüístico e semiótico e psicológico. Na rubrica da psicologia, apresenta como significado um “conjunto de processos que dão ao comportamento uma intensidade, uma direção determinada e uma forma de desenvolvimento próprias da atividade individual”. Tal definição é apresentada no referido dicionário como: 1. motivação altruísta, aquela “que considera ou favorece o bem-estar de outrem”; 2. motivação de eficácia, aquela relacionada à competência (capacidade). O dicionário indica como sinônimo e variantes a consulta do verbete “causa”. Douglas Mook, em seu livro Motivation – The organization of action (edição de 1987), preocupa-se com a forma como as diferentes abordagens do conceito de motivação têm sido apresentadas. Refere-se, por exemplo, às controvérsias e às questões teóricas que, às vezes, são apresentadas uma em oposição à outra, a exemplo de impulsos versus instintos (padrões-fixos-deação), impulso animal versus teorias cognitivas, pesquisa com humanos versus com organismos não-humanos. Para Mook, esse modo de com- 28 ABREU-RODRIGUES, RIBEIRO & COLS. paração pode levar-nos a negligenciar algumas possibilidades de interface que, por exemplo, as pesquisas com organismos não-humanos e humanos têm, como nos tópicos sobre fome, sede, afeiçoamento ou simpatia e desamparo. Não podemos negar essas divergências e devemos ter o cuidado para não pôr uma teoria contra outra, porque poderemos cometer erros de natureza lógica, epistemológica e conceitual. Talvez o maior equívoco seja perder as possibilidades de interface entre diferentes concepções que podem proporcionar uma visão nova ou um melhoramento – ou maior esclarecimento – do conceito de motivação com todo o rigor que a pesquisa exige para descaracterizar o uso coloquial do termo motivação. O conceito de motivação passou por várias acepções ao longo do tempo – tais como instinto, impulso e a retomada do conceito de instinto pelos etologistas –, mas, sem dúvida alguma o termo impulso foi o que teve maior impacto. Esse impacto é refletido, por exemplo, na postura dos analistas do comportamento ao definir o conceito de motivação sem fazer referência ao termo impulso, de modo a dissipar a base mentalista ou organísmica que o termo recebeu dos behavioristas metodológicos, como, por exemplo, Clark Hull (1884-1952). Quando o conceito de impulso tinha um status fortemente mentalista ou organísmico, Skinner, em seu livro publicado em 1938, The behavior of organisms – An experimental analysis, dedicou dois capítulos a este conceito (Capítulo 9 – “Drive” e Capítulo 10 – “Drive and conditioning: The interactions of two variables”), nos quais fornece uma abordagem essencialmente objetiva sobre o tópico. Segundo Skinner, o problema que temos com o conceito de impulso é a natureza causal de propriedades internas que foi atribuída a essa variável. Skinner (1938, 1953/2000) trata a motivação em termos de operações de privação, saciação e estimulação aversiva, enfatizando essas operações como variáveis ambientais controladoras do comportamento. Skinner (1938, 1953/2000), posteriormente Keller e Schoenfeld (1950/1974), Millenson (1967) e Millenson e Leslie (1979) referem-se ao termo impulso como um evento do meio ambiente, ou seja, como a descrição de uma operação que pode ser executada sobre o organismo (p. ex.: privá-lo de alimento, aumentar a temperatura do ambiente acima das condições adequadas de adaptação e conforto). Verificamos, portanto, que a questão crucial que gera as divergências na definição do termo motivação está na concepção da causalidade do comportamento dos organismos. Skinner (1953/2000, p. 24) abordou os termos causa e efeito em ciência a partir de uma relação funcional, uma causa foi definida como “uma mudança em uma variável independente” e um efeito foi definido como “uma mudança em uma variável dependente”. Dessa forma, para ele, a relação de “causa e efeito” foi transformada em uma relação funcional. Para descrever uma relação funcional entre o organismo e o ambiente, Skinner desenvolveu um instrumento conceitual que se tornou a ferramenta básica do analista do comportamento: as contingências de reforço. Para garantir a especificidade de um termo, na acepção psicológica faz-se necessário um conjunto de ferramentas intelectuais e experimentais, constituído de conceitos básicos e de princípios que norteiem uma análise sistemática e funcional do comportamento. Essa exigência está presente na abordagem analítico-comportamental do conceito de motivação, denominada de Operações Estabelecedoras. OPERAÇÕES ESTABELECEDORAS O termo operações estabelecedoras, como um conceito de motivação, será abordado, considerando os aspectos históricos, metodológicos e teóricos das pesquisas básica e aplicada. Considerações históricas Keller e Schoenfeld (1950/1974) enfatizaram a necessidade de se conceituar a motivação como variáveis ambientais controladoras do comportamento de forma a evitar o conceito de impulso como variável interna, conforme defendido pelos behavioristas metodológicos, e de acordo com o empreendimento científico de Skinner denominado de Análise ANÁLISE DO COMPORTAMENTO Experimental do Comportamento. Keller e Schoenfeld chamavam a atenção dos analistas do comportamento para outros eventos ambientais, além dos eventos reforçadores, ao se fazer uma análise de contingências. O aspecto ressaltado nessa advertência refere-se ao fato de que para um objeto funcionar eficazmente como reforçador, faz-se necessário que um outro evento ambiental estabeleça sua eficácia. Assim, Keller e Schoenfeld introduziram o conceito de operação estabelecedora para identificar esses eventos ambientais e demonstrar sua função motivacional. Ao empregarem o termo operação estabelecedora (primeiro uso do termo) para definir a motivação na abordagem analítico-comportamental, Keller e Schoenfeld (1950/1974) demonstraram que podemos tratar a variável motivacional como uma variável independente, que pode ser manipulada de maneira experimental. Definir motivação como operações estabelecedoras implica poder executar certas operações sobre o organismo (p. ex.: privá-lo de alimento), as quais têm como efeitos uma mudança momentânea da efetividade de um evento como reforçador e uma mudança momentânea da freqüência de qualquer comportamento que tenha sido seguido por esse evento reforçador. Keller e Schoenfeld (1950/1974) preocuparam-se em definir o termo impulso não como estímulo nem como resposta, usando-o como um recurso de linguagem para descrever um conjunto de relações. Por exemplo, impulso não poderia ser confundido com estímulos internos (câimbras estomacais que acompanham a privação de alimento). Esses estímulos são discriminativos para a resposta verbal “tenho fome” (operante verbal – tato). O impulso também não poderia ser confundido com uma resposta produzida pela operação de privação, por exemplo, o comportamento de comprar um lanche. Para Keller e Schoenfeld, o impulso seria mais adequadamente definido como um conjunto de relações entre o organismo e o ambiente – operações estabelecedoras. Ao lidar com o conceito de motivação, Millenson (1967) e Millenson e Leslie (1979) também enfatizaram o papel das variáveis ambientais. Para eles, a motivação correspon- 29 deria a operações de impulso, as quais teriam a função de alterar o valor dos reforçadores. Esses autores classificaram em dois tipos as operações de impulso: “(1) uma [operação] que tem a função de reduzir ou eliminar o valor reforçador (saciação) e (2) outra que trabalha para aumentar o valor dos reforçadores (privação)” (Millenson, 1967, p. 366). Preocupado também com a precisão dos conceitos e com a forma de enunciar relações funcionais que abrangem interações do indivíduo com o ambiente, Michael (1982, 1993) retomou o conceito de operação estabelecedora, proposto por Keller e Schoenfeld (1950/ 1974), para definir motivação na análise do comportamento. Em sua análise, Michael incluiu as variáveis motivacionais aprendidas que não foram explicitamente tratadas por Skinner (1938, 1953/2000), Keller e Schoenfeld (1950/1974), Millenson (1967) e Millenson e Leslie (1979), os quais se limitaram a discutir as variáveis motivacionais filogeneticamente determinadas (da Cunha, 1993). Michael fez uma importante contribuição para a análise do comportamento, ao estabelecer um novo instrumento conceitual e metodológico, caracterizado como operações estabelecedoras aprendidas, com implicações para as pesquisas básica e aplicada (da Cunha, 1993, 1995; Iwata, Smith, e Michael, 2000; Sundberg, 1993). Skinner não utilizou o termo operação estabelecedora para tratar do conceito de motivação, tratando-o em termos de privação/ saciação e estimulação aversiva. Por outro lado, pode-se dizer que Skinner (1938, 1953/2000), Keller e Schoenfeld (1950/1974), Millenson (1967) e Millenson e Leslie (1979) deram o mesmo tratamento para as variáveis motivacionais como controladoras do comportamento, ou seja, as variáveis motivacionais foram tratadas como variáveis ambientais (da Cunha, 1993, 1995, 2000). Definição Michael (1993) define uma operação estabelecedora como uma variável ambiental em função de seus dois principais efeitos, denominados de efeito estabelecedor do reforço 30 ABREU-RODRIGUES, RIBEIRO & COLS. e efeito evocativo. O efeito estabelecedor do reforço é caracterizado pela alteração momentânea da efetividade reforçadora de algum objeto, evento ou estímulo; o efeito evocativo, por sua vez, é caracterizado pela alteração momentânea da freqüência de um tipo de comportamento que tem sido reforçado por aquele objeto, evento ou estímulo. É importante enfatizar que a definição do conceito é feita a partir dos efeitos que a variável motivacional exerce sobre o comportamento do organismo (da Cunha, 1993, 1995, 2002; Keller e Schoenfeld, 1950/1974; Michael, 1993, 2000). Uma operação estabelecedora é um evento ambiental que está correlacionado filogenética e ontogeneticamente com a eficácia do reforço ou da punição e que evoca ou suprime um tipo de comportamento que tenha sido reforçado ou punido por esse evento (privação ou saciação são exemplos de operações estabelecedoras). Skinner (1953/ 2000) cita alguns exemplos de efeitos sobre o comportamento exercidos por essas operações estabelecedoras: (a) restringindo-se a ingestão de água (privação), pode-se aumentar a probabilidade de uma criança beber leite; (b) servindo-se grandes quantidades de pão de boa qualidade antes do jantar (saciação), pode-se diminuir a probabilidade de um cliente reclamar da pequena quantidade de comida servida no jantar. Refinamento do conceito de operações estabelecedoras Michael (1982) tratou o conceito de motivação como estímulo estabelecedor (SE), o qual teria a função de modificar a efetividade de um outro estímulo como reforçador e de evocar um tipo de comportamento que tenha sido reforçado por aquele estímulo. Em 1993, o termo estímulo estabelecedor foi substituído pelo termo operação estabelecedora como uma forma genérica de se referir à variável motivacional. A partir da classificação de dois tipos de operações estabelecedoras e da efetivação de uma taxonomia comportamental, Michael sistematizou o conceito de motivação. As operações estabelecedoras de privação e saciação trabalham em direções opostas. A privação de algum objeto implica um período de tempo de acesso restrito a esse objeto, seja ele alimento, água ou qualquer outra condição de estímulo, como, por exemplo, interações sociais. Entretanto as operações ambientais que trabalham na direção oposta da privação podem variar para um ou outro estímulo e, assim, o termo saciação pode não ser útil. Portanto, Michael (2000) propõe um refinamento conceitual da terminologia motivação, introduzindo o termo operações abolidoras para fazer referência àquelas operações ambientais que suprimem a efetividade de um evento reforçador e a ocorrência de comportamentos que tenham sido reforçados por esse evento reforçador. Classificação Michael (1993) propôs a classificação das operações estabelecedoras em duas categorias: Operações estabelecedoras incondicionadas São de origem filogenética e variam de espécie para espécie. Os efeitos de alteração da eficácia do reforço que esse tipo de operação estabelecedora produz abrangem eventos ou estímulos reforçadores incondicionados, por isso Michael denominou essas operações de operações estabelecedoras incondicionadas. Nascemos com a capacidade de termos nossos comportamentos reforçáveis por alimentos ou pela cessação ou redução de estímulos aversivos, sendo que determinados aspectos do ambiente podem aumentar ou reduzir a eficácia desses reforços. Embora esses reforços sejam incondicionados, o comportamento evocado por uma operação estabelecedora incondicionada (verificado pelo efeito evocativo) é sempre aprendido. Por exemplo, a privação de água torna a água mais efetiva como forma de reforçador para os mamíferos, como resultado dessa operação, sem que haja história de apren- ANÁLISE DO COMPORTAMENTO dizagem. Porém o repertório comportamental para adquirir água é sempre aprendido por esses organismos. A seguir, apresentamos exemplos de operações estabelecedoras incondicionadas e seus respectivos efeitos: 1. Saciação de alimento. Esta operação tem como efeito estabelecedor do reforço a diminuição, momentânea, da eficácia do alimento como reforçador e, como efeito evocativo, a diminuição, momentânea, da freqüência de qualquer tipo de comportamento que tenha sido reforçado por algum alimento. Por exemplo, em uma refeição, comer do prato principal até a saciação pode diminuir a eficácia reforçadora da sobremesa e suprimir a freqüência do comportamento de consumo desta. 2. Privação de alimento. Esta operação tem como efeito estabelecedor do reforço, o aumento momentâneo da eficácia do alimento como evento reforçador, e seu efeito evocativo é demonstrado pelo aumento, também momentâneo, de qualquer tipo de comportamento que tenha sido reforçado por alimento. Privando um indivíduo de alimento, por exemplo, pode-se alterar a eficácia reforçadora do alimento e aumentar a freqüência do comportamento de preparar um lanche. 3. Aumento da temperatura. Esta operação quando está acima do nível normal das condições de adaptação e de conforto tem como efeito estabelecedor do reforço a diminuição do nível da temperatura como um evento reforçador eficaz. O efeito evocativo é verificado pelo aumento momentâneo da freqüência de qualquer comportamento que tenha sido reforçado pela diminuição do nível da temperatura. Um exemplo seria ligar o ventilador em um dia de calor insuportável. 31 4. Diminuição da temperatura. Esta operação quando está abaixo do nível normal das condições de adaptação e de conforto tem como efeito estabelecedor do reforço o aumento do nível da temperatura como um evento reforçador eficaz. O efeito evocativo é verificado pelo aumento momentâneo da freqüência de qualquer comportamento que tenha sido reforçado pelo aumento do nível da temperatura (p. ex.: ligar o ar quente do carro na presença de uma temperatura muito baixa). 5. Estimulação dolorosa. Esta operação tem como efeito estabelecedor do reforço o aumento da eficácia momentânea da cessação ou da remoção do estímulo doloroso, e o efeito evocativo é demonstrado pelo aumento momentâneo de qualquer tipo de comportamento que tenha sido reforçado pela cessação ou pela remoção da estimulação dolorosa (p. ex.: tomar um analgésico em função de uma forte dor de cabeça). Michael (1993) identificou nove tipos de operações estabelecedoras incondicionadas, a saber: estimulação dolorosa; diminuição da temperatura abaixo das condições de adaptação e de conforto, aumento da temperatura acima das condições de adaptação e de conforto; variáveis relacionadas ao reforçamento do comportamento sexual. Os outros cinco tipos de operações estão relacionados às operações de privação e de saciação de água, de alimento, de oxigênio, de atividade e de sono. Operações estabelecedoras condicionadas São de origem ontogenética e, portanto, relacionadas à história de reforçamento de cada organismo. A distinção entre as operações estabelecedoras incondicionadas e as condicionadas é feita com base no efeito estabelecedor do reforço, pois o evento reforçador 32 ABREU-RODRIGUES, RIBEIRO & COLS. pode ser inato ou aprendido. No que concerne às operações estabelecedoras condicionadas, elas têm recebido maior atenção dos pesquisadores na tarefa de demonstração empírica e foram classificadas por Michael (1993) em três tipos: 1. Operação estabelecedora condicionada substituta. Esta operação referese a uma relação simples, envolvendo uma correlação temporal de um evento, previamente neutro, que sistematicamente antecede uma operação estabelecedora incondicionada ou condicionada e, como resultado desse emparelhamento, aquele evento neutro adquire a característica motivacional da operação estabelecedora com a qual fora emparelhado (adquire suas funções evocativas e funções de estabelecimento do valor do reforço). Por exemplo, ao emparelhar uma luz (estímulo neutro para a função motivacional) com a redução de temperatura (operação estabelecedora incondicionada), seria esperado que a luz adquirisse não só as funções respondentes (eliciadoras) ou reforçadoras/punitivas, como também as funções motivacionais da redução da temperatura. A presença dessa luz deveria estabelecer o aumento da temperatura como uma forma eficaz de reforçamento e evocar qualquer tipo de comportamento que tenha sido reforçado pelo aumento da temperatura. 2. Operação estabelecedora condicionada reflexiva. Esta envolve uma relação mais complexa em que um evento ou estímulo sistematicamente precede alguma forma de estimulação aversiva e, se esse estímulo é removido antes da ocorrência da estimulação aversiva, a estimulação aversiva deixa de ocorrer. Os procedimentos de esquiva sinalizada são exemplos desse tipo de operação estabelecedora. De acordo com Michael (1993), o evento ou estímulo sinalizador da esquiva funciona como uma variável motivacional do tipo condicionada reflexiva, e não como um estímulo discriminativo, como enfatiza a literatura sobre esquiva sinalizada (ver o Capítulo 7 para uma discussão detalhada do papel do estímulo sinal na esquiva). A denominação condicionada reflexiva para esse tipo de operação devese ao fato de que o próprio estímulo antecedente motivacional adquire a capacidade de estabelecer sua própria remoção como uma forma efetiva de reforçador condicionado e evoca qualquer tipo de comportamento que tenha produzido a supressão desse estímulo reforçador condicionado. Por exemplo, a luz do painel de um automóvel que indica a quantidade de combustível disponível no tanque possui as propriedades motivacionais de uma operação estabelecedora condicionada reflexiva. Essa luz acesa, aviso de que o combustível está na reserva, estabelece a sua remoção como uma forma de reforço efetivo, pois sua presença esteve pareada com a aversividade de ter o automóvel sem gasolina. Além disso, evoca o comportamento de abastecer o carro, o qual tem sido reforçado pela remoção da luz acesa. 3. Operação estabelecedora condicionada transitiva. Esta operação é a relação mais complexa e foi relacionada por Michael (1993) com o conceito de reforçador condicionado condicional. A efetividade de muitas formas de reforçadores positivos condicionados podem depender de uma condição de estímulo antecedente (operação estabelecedora condicionada transitiva), na qual esses reforçadores positivos condicionados tiveram sua eficácia estabelecida. O estabelecimento da eficácia desses reforçadores depende de uma ANÁLISE DO COMPORTAMENTO história individual do organismo. Por exemplo, um aparelho de telefone público é ocasião para o comportamento de fazer uma ligação telefônica. Porém, em relação ao cartão telefônico, o aparelho funciona como uma operação estabelecedora condicionada transitiva porque estabelece o cartão como uma forma efetiva de reforço e evoca o comportamento de procurá-lo na carteira. A demonstração empírica desse tipo de operação estabelecedora tem recebido atenção de alguns pesquisadores com trabalhos publicados (McPherson e Osborne, 1968; 1988) e de outros pesquisadores com trabalhos não-publicados (McPherson, Trapp e Osborne, 1984; Osborne e Mcpherson, 1986; Alling, 1990; da Cunha, 1993 – estes dois últimos citados em da Cunha, 1995). Essas demonstrações empíricas têm utilizado pombos como sujeitos experimentais e têm, de certa forma, demonstrado, com algum sucesso, o desenvolvimento de procedimentos experimentais para investigar operações estabelecedoras condicionadas transitivas como uma variável ambiental e uma variável motivacional controladora do comportamento. Nesses procedimentos têm sido difícil distinguir a função motivacional de um evento ambiental (a suposta operação estabelecedora condicionada transitiva) de sua função discriminativa, caracterizando assim, como aspecto fundamental dessa linha de pesquisa, o desenvolvimento de procedimentos que nos permitam demostrar empiricamente essa distinção. Surge, assim, uma nova área de investigação na análise experimental do comportamento que possibilita aos analistas do comportamento estudar a motivação como uma variável independente e não apenas contextual (da Cunha, 1993; 1995; 33 2000; Iwata, Smith e Michael, 2000; Sundberg, 1993). Relação entre os conceitos de operação estabelecedora (OE) e de estímulo discriminativo (SD) Os conceitos de operação estabelecedora e de estímulo discriminativo estão relacionados, pois ambos são eventos antecedentes ao comportamento e têm, de forma diferenciada, implicações com a conseqüência. A análise funcional do comportamento tem sido, geralmente, realizada com ênfase no SD e, conseqüentemente, a unidade de análise utilizada tem sido a contingência de três termos. Para se fazer uma análise funcional mais adequada do comportamento, considerando as funções motivacionais e discriminativas dos estímulos antecedentes, faz-se necessário incluir a OE como um quarto elemento da contingência. A inclusão de mais um termo na relação de contingência implica a necessidade de distinção das funções discriminativa e motivacional do estímulo antecedente. Nesse sentido, o conceito de SD é fundamental para a compreensão e para a demonstração empírica do conceito de OE. Os estímulos discriminativos são, em geral, denominados como sinais ou pistas para uma determinada ação, à medida que sinalizam as ocasiões em que as respostas terão certas conseqüências e, portanto, ocasionam comportamento. O conceito de SD tem sido correlacionado às condições antecedentes que são ocasião para a resposta levando-se em consideração apenas a condição em que uma dada resposta será reforçada. Michael (1982), entretanto, retoma o conceito de SD enfatizando as suas duas condições de estímulo: uma condição de estímulo SD, em que, dada a efetividade de um evento como reforçador, a ocorrência de um determinado comportamento será seguida pelo reforço; e uma condição de estímulo SΔ, em que, dada a efetividade daquele evento reforçador, a ocorrência desse mesmo comportamento não será reforçada. Isto é, o conceito de SD envolve uma história específica de treino discriminativo com duas condições de estímulos antecedentes relacionadas à dis- 34 ABREU-RODRIGUES, RIBEIRO & COLS. ponibilidade diferencial de reforçamento (Michael, 1993). Como resultado do treino discriminativo, o SD evoca um dado comportamento com uma história de reforçamento diante desse estímulo, enquanto o SΔ não evoca o mesmo comportamento. Em resumo, o SD apresenta uma função evocativa sobre o comportamento devido a uma história de correlação temporal com o reforço. Em uma dada situação experimental, por exemplo, a função evocativa do SD pode ser claramente observada. Em uma caixa operante, equipada com uma barra, um bebedouro e uma lâmpada localizada acima da barra, um rato privado de água é submetido ao treino discriminativo. Quando a lâmpada acima da barra está acesa (presença de luz), as respostas de pressão à barra são seguidas por água como reforço. Por outro lado, quando a lâmpada está apagada (ausência de luz), nenhuma conseqüência é dada ao mesmo comportamento do animal. Após algumas exposições a essas condições, o rato exibe o comportamento de pressão à barra apenas na presença da luz. Diante da luz como condição de estímulo SD, o comportamento de pressão à barra é reforçado e, portanto, quando a luz está presente o comportamento é evocado. Diante da ausência de luz (condição de estímulo SΔ), o comportamento de pressão à barra não é exibido, pois não há uma história de reforçamento por água nessa condição. O conceito de OE, no entanto, está relacionado à efetividade do evento reforçador. Para Michael (1993), a OE como condição de estímulo antecedente altera momentaneamente a efetividade de um reforço e evoca comportamentos relacionados historicamente com esse reforço. A privação de água, por exemplo, altera a efetividade reforçadora da água, e qualquer comportamento que a produza é fortalecido. Na situação experimental anteriormente citada, a privação alterou o valor da água como reforço, que ao seguir o comportamento de pressão à barra passou a selecioná-lo. Por outro lado, além de estabelecer o valor do reforço, a OE evoca o comportamento de pressão à barra, pois há uma relação histórica entre aquele comportamento e o reforço, cuja efetividade é estabelecida pela privação. Semelhantemente ao SD, a OE possui a função evocativa do comportamento, que, por vezes, é confundida com a função evocativa do SD. O que diferencia as referidas condições de estímulo antecedente é a função estabelecedora do reforço, a qual é apresentada somente pela OE. Essa função é imprescindível para que, em um treino discriminativo, o SD adquira a função evocativa. No exemplo anterior, o controle discriminativo só foi possível porque havia um reforço efetivo – água – e assim o comportamento de discriminar entre a ausência e a presença de luz foi observado. Nesse sentido, pode-se verificar que a OE aumentou a efetividade evocativa do SD, o que, para Michael (1993), seria um terceiro efeito da OE. A privação como OE tem uma função motivacional, e a presença da luz (SD) tem uma função discriminativa. Em situações laboratoriais, a clareza na distinção da OE e do SD requer mais estudos empíricos. Em situações aplicadas, essa distinção é obscurecida, algumas vezes, por variáveis como, por exemplo, a história de vida particular do organismo. Considerar a história do organismo é considerar as relações das quais resultam as operações estabelecedoras condicionadas (OEC). Diante dessas condições, a distinção de uma OEC e um SD pode tornar-se difícil. No seguinte contexto aplicado, por exemplo, qual seria a função antecedente de um pneu furado de um automóvel para o comportamento de trocá-lo ou de procurar por uma borracharia? Em um primeiro momento, podese considerar essa condição de estímulo como sendo SD, pois é a ocasião para trocar o pneu pelo estepe. Entretanto o pneu furado altera a efetividade reforçadora do estepe e de todos os objetos (ferramentas) relacionados com a ação de trocar o pneu, bem como de qualquer placa de sinalização que indique a presença de borracharia – função motivacional. Nesse caso, o pneu furado funciona como uma operação estabelecedora condicionada transitiva que estabelece o valor reforçador condicionado de alguns estímulos. A consideração precipitada apenas da função evocativa do pneu furado implicaria o equívoco de deixar de lado a função motivacional que essa condição de estímulo ANÁLISE DO COMPORTAMENTO tem sobre a definição de certos objetos como reforçadores. Outro exemplo a ser considerado na distinção da OE e do SD consiste nos procedimentos de esquiva sinalizada. Um rato na caixa experimental recebe choques (Ss aversivos) em um intervalo de tempo variável de um minuto (VT 1 min). Antes da apresentação de cada choque, um som é apresentado. Ao pressionar a barra, o animal interrompe a apresentação do som e do choque. No entanto, se a pressão à barra ocorrer na presença do som apenas, essa resposta pode prevenir a apresentação do estímulo aversivo (choque). Nesse procedimento, o som e o choque são considerados operações estabelecedoras reflexivas condicionada e incondicionada, respectivamente, e não estímulos discriminativos (Michael, 1993). O som, ao ser apresentado junto com o choque, adquire as funções necessárias para que sua presença evoque respostas de evitação. Para ser considerado um SD, a situação experimental deveria possuir uma condição de estímulo análoga à condição SΔ. Na presença do som, a resposta de esquiva é evocada, pois há uma conseqüência reforçadora imediata – a eliminação do som. Supondo um paralelo com a situação de SΔ, a ausência do som impossibilita o reforçamento negativo por sua própria remoção – “a efetividade do reforçador negativo depende diretamente da presença do estímulo aversivo condicionado” (Miguel, 2000, p. 262), ou seja, depende da presença do som. O mesmo ocorre na situação de fuga do choque em que o reforçador negativo só se torna efetivo quando o choque está presente. Na ausência do estímulo aversivo (suposto SΔ), não há reforço negativo, portanto não há reforço efetivo. Nesse sentido, o choque não é um SD. Tanto o som quanto o choque estabelecem sua própria remoção como formas de reforço efetivo e evocam comportamentos que tenham uma relação histórica com esses reforços e, assim sendo, devem ser identificados como OEs. Paralelamente à situação experimental, no contexto aplicado, a distinção entre SD e OE em situações de esquiva também é possível. Nos Transtornos de Ansiedade, como o Transtorno Obsessivo-Compulsivo (TOC), por 35 exemplo, observa-se uma pessoa emitir inúmeras vezes uma série de comportamentos com função de esquiva, como lavar as mãos, o verificar o fechamento do registro do botijão de gás e conferir o fechamento de portas e de janelas. As condições dos estímulos antecedentes a esses comportamentos (p. ex.: mãos sujas ou algum tempo sem contato com água e sabão, registro de gás aberto, portas e janelas abertas ou destrancadas ou qualquer outra condição relacionada ao comportamento obsessivo) não são SD para as respostas ditas compulsivas. Essas condições de estímulo são operações estabelecedoras condicionadas reflexivas que estabelecem a efetividade reforçadora das conseqüências do comportamento compulsivo, semelhantemente à presença do som ou do choque, nas condições laboratoriais. Nesse caso, supor uma situação análoga à condição de SΔ é tão inviável quanto na situação experimental anteriormente descrita. Em resumo, o SD apresenta uma função, a função evocativa do comportamento ou discriminativa – na presença do estímulo discriminativo há o aumento na probabilidade de ocorrência do comportamento por causa de uma história de correlação entre a condição de SD e o reforçamento, e entre a condição de SΔ e o não-reforçamento. Por outro lado, conforme indicado por Michael (1993), a OE apresenta quatro diferentes efeitos comuns relacionados à função motivacional. São eles: 1. Efeito estabelecedor do reforço: uma OE aumenta momentaneamente a efetividade reforçadora/punidora de um estímulo. A privação de água torna a água um evento reforçador eficaz. 2. Efeito evocativo/supressivo direto da OE sobre o comportamento: evocação/supressão imediata da OE sobre os comportamentos que tenham uma relação histórica com o reforçador/punidor cuja efetividade fora alterada em (1). A privação de água evoca o comportamento de pressão à barra que tem sido historicamente reforçado por água. 36 ABREU-RODRIGUES, RIBEIRO & COLS. 3. Efeito da OE sobre a efetividade evocativa/supressiva do SD: aumento na efetividade evocativa/supressiva dos estímulos discriminativos correlacionados com o reforçador/ punidor em (1). No treino discriminativo, a privação de água aumenta a efetividade evocativa da luz como SD, pois a luz tem uma correlação com a água. 4. Efeito da OE sobre o reforçamento/ punição condicionado: aumento da efetividade reforçadora/punidora de reforçadores/punidores condicionados cuja efetividade depende de (1). Na seguinte cadeia comportamental – um som – puxar a corrente → luz → pressionar a barra → água–, o som aumenta a efetividade da luz como reforço condicionado, que tem uma relação histórica com água (reforçador incondicionado) e o som também evoca o comportamento de puxar a corrente, devido a relação dessa resposta com um reforço efetivo (luz). Contribuições da pesquisa básica Da Cunha (1993) identificou e classificou os primeiros procedimentos experimentais para investigar os efeitos de operações estabelecedoras, realizados no laboratório animal, enfatizando as operações estabelecedoras condicionadas transitivas. Entre eles temos os apresentados a seguir. Procedimento de três discos McPherson e Osborne (1986, 1988) utilizaram um procedimento de tentativa discreta com três discos de respostas para pombos. Ao início de cada tentativa, o disco da direita era iluminado. A primeira resposta nesse disco tinha como conseqüência a iluminação do disco central. Uma vez iluminado o disco central, bicadas no disco da direita não tinham conseqüências. O disco da esquerda era iluminado em função de um esquema VT. Quando o disco da esquerda estava iluminado, uma resposta no disco central era reforçada por alimento. Respostas adicionais de bicar o disco central não tinham conseqüências programadas. O término de cada tentativa ocorria com o acesso ao alimento, que era seguido por um intervalo entre tentativas (ITI). Durante o ITI, todos os discos permaneciam escuros. O reforço para a resposta de bicar o disco da direita foi a iluminação do disco central (um reforço condicionado, estabelecido por sua relação com o alimento). O estímulo antecedente à resposta de bicar o disco da direita foi a iluminação do disco da esquerda (suposta OEC transitiva). Quando o disco da esquerda não estava iluminado, bicar o disco da direita não estabelecia o valor da iluminação do disco central como reforçador. De acordo com a concepção teórica de Michael (1982, 1993), a iluminação do disco da esquerda deveria funcionar como uma OEC transitiva, por estabelecer a iluminação do disco central com uma forma efetiva de reforçador condicionado (efeito estabelecedor do reforço) e evocar a resposta de bicar o disco da direita (efeito evocativo). A efetividade reforçadora do disco central estava condicionada à iluminação do disco da esquerda. Um efeito eficaz da operação estabelecedora deveria produzir um desempenho que consistia em esperar a iluminação do disco da esquerda, então, bicar o disco da direita, cuja conseqüência imediata era a iluminação do disco central e, finalmente, bicar o disco central, que resultava em alimento. McPherson e Osborne (1986) verificaram que o controle não foi evidente depois de 60 ou mais sessões. Apenas um entre quatro pombos demonstrou o desempenho previsto. No segundo estudo (McPherson e Osborne, 1988) alterou-se o tempo de iluminação dos discos do centro e da esquerda, visando a um maior controle dos estímulos antecedentes. Quando o disco da esquerda era iluminado, em média 12 s depois da iluminação do disco central, o controle pela OEC (iluminação do disco da esquerda) sobre a resposta no disco da direita foi, em geral, muito fraco. Os experimentos de McPherson e Osborne (1986, 1988) trouxeram contribuições para o início das pesquisas experimentais sobre o con- ANÁLISE DO COMPORTAMENTO ceito de operações estabelecedoras, pois foram analisadas as dificuldades que o procedimento de três chaves apresentava. Entre essas dificuldades, há a possibilidade de que as contingências nos três discos permitam uma interpretação de automodelagem de alguns aspectos do desempenho, porque as respostas de bicar os discos da direita e do centro foram automodeladas e, uma vez que esses discos foram iluminados, assim permaneciam até o término da tentativa. Outro fator que talvez tenha dificultado a demonstração empírica dos efeitos da OE foi o fato de a iluminação do disco central (reforço condicionado para a resposta do disco da direita) permanecer até a obtenção do alimento. Essa situação poderia reduzir o contato com tentativas sem uso do disco central quando o disco da esquerda estava escuro. Se a iluminação do disco central fosse estabelecida em alguns segundos, seria possível um maior controle da função motivacional do disco da esquerda. Essa característica do procedimento também fez com que a suposta OEC funcionasse como um estímulo discriminativo para bicar o disco central quando o mesmo estava iluminado antes da condição de OEC. Procedimento de pedal-e-disco Alling (1990) utilizou um procedimento com topografias de respostas diferentes. A resposta de pressionar um pedal produzia um reforço condicionado, e a resposta de bicar um disco produzia um reforço incondicionado. Esse procedimento consistia em uma cadeia de duas respostas: a resposta de pressionar o pedal produzia a mudança da cor da luz acima do pedal – de branca para vermelha – (reforço condicionado), e a resposta de bicar o disco produzia 3 s de ração para pombos (reforço incondicionado). Uma única resposta no pedal tinha como conseqüência a apresentação do reforço condicionado por 5 s (luz do pedal). Uma única resposta no disco da esquerda, na presença da luz vermelha (luz do pedal), produzia alimento por 5 s, dependendo da condição da iluminação da câmara experimental que deveria funcionar como a suposta OEC transitiva para a resposta de pressionar o 37 pedal. A luz da câmara apagada foi definida como ausência da OE. Quatro pombos foram distribuídos em dois grupos a fim de balancear as condições experimentais: para o Grupo 1, a presença de luz ambiente funcionava como presença da OEC, e sua ausência funcionava como ausência da OEC; para o Grupo 2, as condições experimentais foram invertidas. Cada tentativa experimental começava com a condição de não-OEC, sendo a condição de OEC gerada com base em um esquema de VT 60 s. Quando a condição de OEC começava, ela permanecia em efeito até a obtenção de alimento. O desempenho esperado era não pressionar o pedal até que a condição de OEC (luz ambiente acesa ou apagada, dependendo do grupo) estivesse presente, então, a resposta no pedal produziria a mudança de cor da luz do pedal de branca para vermelha e, se em 5 s o pombo bicasse o disco da esquerda, essa resposta seria seguida por 3 s de acesso ao alimento. Todos os quatro pombos desenvolveram o desempenho previsto (em 90% ou mais das tentativas verificou-se que a resposta no pedal ocorria na presença da suposta condição de OEC). Na segunda fase – o teste – removeu-se a conseqüência para a resposta no pedal, de modo que a luz branca estava sempre presente (luz do pedal). Como resultado dessa mudança, esperava-se que ocorresse a quebra na cadeia comportamental, o que não foi observado. A luz da câmara experimental pode ter funcionado como um estímulo discriminativo e não como uma OEC para a resposta no pedal. Supõe-se que a cadeia de duas respostas tenha funcionado como um único bloco de resposta, pois um esquema de razão fixa (FR 1) controlava a resposta de pressionar o pedal e, provavelmente, a resposta no disco estivesse mais sob o controle da luz da câmara experimental do que da luz produzida pela resposta no pedal. Outro aspecto que pode ter contribuído para esse resultado foi o uso de dois estímulos visuais, pois a condição de iluminação (luz/escuro) poderia criar condições de estímulos diferentes quando a luz do pedal estivesse branca ou vermelha. Por exemplo, a luz vermelha acima do pedal poderia ser caracterizada como uma condição de estímulo 38 ABREU-RODRIGUES, RIBEIRO & COLS. diferente se a câmara operante estivesse iluminada ou escura. A terceira fase consistiu em retomar as condições experimentais da primeira fase para se verificar a recuperação da resposta sob as duas condições experimentais. Como resultados dessa fase, os quatro pombos retomaram a resposta no pedal na presença da OEC em 90% ou mais das tentativas. Para dar continuidade aos estudos experimentais de OECs transitivas, da Cunha (1993) utilizou um esquema de razão variável (VR 6) para controlar a resposta de pressionar o pedal que produzia a mudança da luz do pedal (de branca para vermelha) por 5 s. Um estímulo auditivo funcionava como a suposta OEC (um som tipo bip), cuja apresentação foi controlada por um esquema de tempo randômico (RT 1 min). Quatro pombos foram distribuídos em dois grupos: para um grupo, a presença do som era a suposta OEC e, para o outro, sua ausência era a suposta OEC; seus opostos estabeleciam a condição de não-OEC. A medida comportamental dos estudos anteriores foi o percentual de tentativas sem erro (McPherson e Osborne, 1986, 1988; Alling, 1990). Da Cunha (1993) verificou que a taxa de respostas era uma medida mais sensível do que a percentagem de tentativas sem erro ao introduzir um esquema de reforçamento intermitente para a resposta de pressionar o pedal. Para todos os sujeitos, verificou-se nitidamente que a taxa de respostas de pressão ao pedal na condição de OEC foi maior do que na condição de não-OEC. A taxa de respostas de pressão ao pedal na presença da suposta OEC variou de 24 a 27 resp/min, enquanto a taxa de respostas de pressão ao pedal na ausência da suposta OEC variou de 2 a 8 resp/ min, considerando os dados dos quatro sujeitos. A segunda fase teve como objetivo testar o controle da suposta variável motivacional, removendo o evento reforçador condicionado da resposta de pressão ao pedal (luz vermelha do pedal). Esperava-se uma deterioração da cadeia comportamental durante a fase de teste, sendo esse resultado observado apenas para dois dos quatro pombos. Os demais sujeitos desenvolveram um padrão de pressionar o pedal várias vezes e, então, bicar o disco. A terceira fase do procedimento consistia na reto- mada da Fase 1. Algumas falhas nesse procedimento também foram observadas; por exemplo, não havia uma contingência punitiva para as respostas de mudança do pedal para o disco. Verificou-se que os dois sujeitos que mantiveram a resposta no pedal depois da remoção do reforçador condicionado tiveram, acidentalmente, as respostas de mudança reforçadas. Observou-se, também, que o decréscimo da taxa de respostas na condição de não-OEC poderia ter sido mascarado pelo efeito da extinção presente nessa mesma condição. Esses estudos contribuíram com sugestões para refinamentos de delineamentos experimentais e têm reafirmado a importância da distinção dos controles discriminativo e motivacional dos estímulos antecedentes para se demonstrar com clareza os efeitos de uma operação estabelecedora. Contribuições da pesquisa aplicada Segundo Sundberg (1993), o conceito de OE é útil e relevante para a análise funcional do comportamento, permitindo que a intervenção dos analistas do comportamento seja mais efetiva. A OE exerce um importante papel na relação de contingência, uma vez que estabelece a efetividade da conseqüência. É sabido dos analistas do comportamento que a relação de contingência (antecedente – comportamento – conseqüência) é fortalecida quando uma conseqüência reforçadora efetiva é apresentada ao comportamento. A efetividade dessa conseqüência é alterada pela OE que estabelece o valor do reforço e evoca comportamentos relacionados historicamente com esse reforço. As conseqüências terão efeitos sobre o comportamento somente se forem efetivas como reforçadores ou punidores, cabendo à OE estabelecer essa efetividade; portanto, é de fundamental importância considerar a inclusão da OE como mais um elemento da relação de contingência. Como veremos, a pesquisa aplicada tem muito a dizer sobre a relevância do conceito. Na tentativa de explicar tanto a ocorrência de comportamentos quanto a efetividade das conseqüências que os mantém, analistas do comportamento vêm, cada vez mais, incluin- ANÁLISE DO COMPORTAMENTO do o conceito de OE na unidade de análise funcional. Um exemplo disso é a publicação de um volume do Journal of Applied Behavior Analysis (JABA) inteiramente dedicado a discussões sobre operações estabelecedoras na análise aplicada do comportamento (JABA, 2000, 33 [4]). Para estimular pesquisas sobre o tema, Iwata e colaboradores (2000) sugerem três grandes temas de pesquisa para a avaliação das influências da OE sobre o comportamento em contextos aplicados: a) demonstrações gerais das influências da OE sobre o comportamento; b) uso da manipulação da OE para clarificar os resultados de avaliações comportamentais; c) tentativa de melhorar o repertório comportamental do sujeito pela incorporação de manipulações da OE como componente do tratamento. Friman (2000) apresenta uma demonstração de que objetos chamados de transacionais – objetos que facilitam a transição de crianças jovens de uma fase de dependência para autonomia – podem ocasionar comportamentos que sugerem a participação de uma OE. O autor observou uma criança com o comportamento de chupar o dedo, sob duas condições: em uma condição, a criança estava no berço sozinha (ausência de estimulação social) e, na outra, ela estava no colo de um adulto (presença de estimulação social). Nessas condições, o comportamento de chupar o dedo foi observado em sessões de linha de base (ausência de um pedaço de pano) e sessões de teste (presença de um pedaço de pano). Os resultados mostraram que o comportamento de chupar o dedo na presença do pedaço de pano ocorria mais freqüentemente quando a criança estava no berço do que quando estava no colo. Durante a linha de base, nas duas condições de estimulação a percentagem de intervalos de chupar o dedo foi zero. A presença do pedaço de pano pode ter funcionado como uma OE para o comportamento de chupar o dedo, uma vez que esse objeto poderia ter alterado a efetividade reforçadora da conseqüência des- 39 se comportamento. Friman discute que a efetividade reforçadora dessa conseqüência possa ter ocorrido em função de uma OEC (pedaço pano), pois o processo pelo qual o objeto altera a efetividade reforçadora de chupar o dedo, mesmo sendo desconhecido, parece ser aprendido. McCommas, Hoch, Paone e El-Roy (2000) indicaram que exigências ambientais poderiam funcionar como operações estabelecedoras que evocavam comportamentos agressivos, autolesivos e perturbadores, reforçados negativamente, em crianças com diagnóstico de deficiências intelectuais. Essas exigências envolviam a realização de tarefas acadêmicas difíceis, repetitivas ou em uma seqüência determinada por um adulto. A manipulação experimental consistiu na presença e na ausência da suposta OE com três crianças. A primeira criança, que apresentava dificuldade em operações matemáticas, foi exposta às seguintes condições: a) disponibilidade de uma folha de papel com as contas a serem realizadas; b) disponibilidade de uma folha de papel com as contas, incluindo um ábaco e uma calculadora. A segunda criança foi exposta a estas condições: a) realização de tarefas repetitivas; b) realização de tarefas não-repetitivas. A terceira criança foi exposta às seguintes condições: a) escolha por um adulto da seqüência de tarefas acadêmicas; b) escolha pela criança da seqüência de tarefas. Os resultados mostraram que a maneira como as tarefas acadêmicas foram exigidas funcionou como operação estabelecedora. Diante da segunda condição, os comportamentos-problema não foram observados, sendo essa condição favorável à emissão de comportamentos acadêmicos mais adequados. 40 ABREU-RODRIGUES, RIBEIRO & COLS. A intervenção do analista do comportamento com o objetivo de reduzir a ocorrência de comportamentos inadequados mantidos por reforçamento negativo torna-se efetiva quando o conceito de operação estabelecedora é utilizado. Smith e Iwata (1997) discutiriam que comportamentos estereotipados e autolesivos são padrões comportamentais que podem ser controlados pela remoção de exigências sociais. A exigência social funciona como uma operação estabelecedora que determina sua própria remoção como uma forma efetiva de reforço (OEC reflexiva). A dificuldade de uma tarefa, a complexidade do comportamento exigido para essa tarefa e a imprevisibilidade de eventos ambientais são exemplos de exigências sociais. Uma primeira estratégia para a redução de comportamentos estereotipados e autolesivos evocados nessas situações seria a mudança das exigências ambientais para condições de menor aversividade (apresentação de tarefas mais simples, por exemplo). Uma segunda estratégia seria o uso do esquema de reforço diferencial de outros comportamentos (DRO). O terapeuta pode reforçar os comportamentos mais adequados e submeter os comportamentos estereotipados e autolesivos à extinção. Por exemplo, permitir a fuga de uma exigência social diante de uma solicitação verbal e não diante de um comportamento autolesivo. Uma terceira estratégia seria utilizar esquemas de reforçamento independente da resposta (p. ex.: os estudos de Durand e Crimmins, 1988; McGill, 1999). Durand e Crimmins (1988) e McGill (1999) sugerem que comportamentos-problema mantidos por atenção, em geral são apresentados em ambientes caracterizados pela escassez de contato social. A carência produzida por um ambiente com essa natureza pode ser considerada uma operação estabelecedora que torna a atenção um reforço efetivo. Se, no passado, a autolesão e a agressão foram reforçadas pela atenção social, obviamente a privação de atenção evocará o comportamento tido como problema. Entretanto, se a carência de contato social (operação estabelecedora) for substituída por uma condição de maior acesso ao reforçamento social, pela liberação de aten- ção em esquemas de tempo fixo (FT), os comportamentos autolesivos e agressivos podem diminuir de freqüência. Essa diminuição na freqüência comportamental ocorre devido à diminuição da efetividade da atenção como reforço, o que corresponde a uma operação abolidora. Em um estudo envolvendo a manipulação da operação estabelecedora como estratégia de tratamento de comportamentos-problema, Kahng, Iwata, Thompson e Hanley (2000) forneceram evidências de que a apresentação de reforçamento social em esquema de reforçamento de tempo fixo (FT) promove a redução desses comportamentos. Duas condições experimentais foram apresentadas a três indivíduos com diagnóstico de Retardo Mental. Na condição FT-EXT houve a liberação de reforços sociais de acordo com um esquema FT e extinção para a ocorrência de comportamentos-problema, durante 10 min. Na condição EXT subseqüente não houve liberação de reforços sociais durante 20 min. As condições experimentais foram manipuladas dentro de uma mesma sessão. Os resultados da condição FT-EXT revelaram que a apresentação do reforço sob o esquema FT contribuiu para a redução dos comportamentos-problema, em função de dois possíveis efeitos: primeiro, o reforçamento sob esquema FT pode ter gerado um efeito semelhante à saciação, devido ao acesso freqüente ao reforço; segundo, a extinção que ocorria simultaneamente pode ter sido a responsável pela diminuição na freqüência do comportamento. A condição EXT visou a testar se esses resultados ocorreram em função da saciação ou da extinção. Se ocorresse um aumento inicial na freqüência dos comportamentos-problema, poderia ser dito que a saciação foi a responsável pela redução desses comportamentos durante o reforçamento sob o esquema FT. Caso contrário, os resultados obtidos pela extinção poderiam ser explicados. Os resultados indicaram que diante da condição EXT, o comportamento-problema permaneceu com baixa freqüência. Esse dado sugere que os efeitos da extinção durante a apresentação do esquema FT podem ter permanecido durante a condição EXT. Assim, a transição entre as condições FT-EXT (reforço presente) ANÁLISE DO COMPORTAMENTO e EXT (reforço ausente) pode não ter sido relevante para evocar o comportamento-problema. Os autores discutem ainda que a dificuldade de utilização de esquemas FT deve-se ao fato de que nesses esquemas há um componente de extinção presente, o qual obscurece os efeitos diferenciados da saciação e da extinção, embora ambos os efeitos possam ser responsáveis pela redução da freqüência do comportamento (ver também Hagopian, Crockett, van Stone, DeLeon e Bowman, 2000). Implicações do conceito de operações estabelecedoras para a clínica A clínica analítico-comportamental é caracterizada por uma proposta de intervenção que visa não só à mudança de comportamentos, mas à identificação das variáveis que os mantém. Skinner (1953/2000) afirmou que não se pode esperar uma explicação adequada do comportamento sem que suas relações com essas variáveis sejam analisadas. O clínico analítico-comportamental que está interessado em fazer uma intervenção adequada no contexto terapêutico deve ter clareza dos diferentes papéis das variáveis das quais o comportamento é função. Os problemas comportamentais têm sido explicados com base na contingência tríplice (antecedente – comportamento – conseqüência), em que os eventos antecedentes históricos e atuais são identificados sem, às vezes, serem distinguidos como eventos com funções comportamentais particulares. Skinner (1953/2000, p. 34) chamou a atenção para certos eventos ambientais que têm funções específicas sobre o comportamento. Esses eventos podem atuar no sentido de, certamente, produzir comportamento: É decididamente falsa a afirmação de que se pode levar um cavalo até a água, mas que não se pode fazê-lo beber. Privando-o de água por algum tempo, poderemos estar “absolutamente certos” de que o cavalo irá bebê-la assim que chegar até ela. Essa afirmação revela a presença da privação (OE) como variável determinante do comportamento. É claro que outras variáveis 41 (história de condicionamento, potencial biológico) também participam do processo de produção de comportamento, mas é notório o papel da OE. Desse modo, a clareza do papel dessa variável permitirá uma intervenção mais efetiva do terapeuta analítico-comportamental. Sundberg (1993) sugere que o analista do comportamento, ao incluir a análise da OE no contexto clínico, como um termo a mais na relação de contingência, poderá: a) tatear as operações estabelecedoras no ambiente natural de vida do cliente; b) manipular as operações estabelecedoras no momento em que podem estar atuando com maior força; c) distinguir seus efeitos motivacionais dos efeitos discriminativos sobre o comportamento. No contexto de vida humana, são observadas algumas operações estabelecedoras comuns. Carências afetivas (atenção, sexo, reconhecimento social, prestígio, popularidade, entre outras), carência de bens de consumo (roupas, automóveis, imóveis entre outras), carência de lazer e diversão são situações que exercem papel de operações estabelecedoras, as quais estabelecem a efetividade reforçadora de certos estímulos, objetos ou eventos. Ao realizar a coleta de dados, o terapeuta deve identificar e tatear as possíveis operações estabelecedoras em atuação, bem como verificar seus efeitos sobre os padrões de comportamento apresentados por seu cliente. Em alguns casos de escassez de contatos sociais (carência de atenção e de reconhecimento), por exemplo, o indivíduo pode apresentar padrões de comportamento de insistência e cobrança queixosa em relação ao outro. Esses comportamentos podem, inclusive, ocorrer na relação terapêutica (p. ex.: um cliente que descreve que ninguém se interessa ou se preocupa com ele e, fitando os olhos do terapeuta, diz enfaticamente: “Ninguém me ama!”). Esse comportamento pode consistir em um mando disfarçado de tato. O terapeuta pode apresentar estímulos discriminativos, na presença dos quais a disponibilidade diferencial de reforço social é maior do que na sua ausên- 42 ABREU-RODRIGUES, RIBEIRO & COLS. cia e, portanto, o comportamento verbal é evocado. No entanto a privação de afeto (OE) parece ser a variável controladora da queixa em relação aos outros, que, na verdade, está sendo dirigida ao terapeuta. Uma estratégia a ser utilizada pelo clínico analítico-comportamental, em casos desse tipo, poderá ser o reforço diferencial de outras iniciativas comportamentais do cliente (DRO) e a liberação de reforço social em esquemas de tempo fixo (FT), o que pode minimizar os efeitos da carência afetiva por meio de um efeito contrário à operação de privação (saciação). Minimizados os efeitos da carência afetiva, o terapeuta poderá modelar comportamentos mais adequados no repertório comportamental do cliente, começando, por exemplo, pela clareza na comunicação do que se quer: “Valorize-me! Dê-me amor!”. Michael (1993) define uma OE com base em seus efeitos momentâneos (efeito evocativo e efeito estabelecedor do reforço), considerando apenas eventos temporalmente próximos. Daugher e Hackbert (2000), entretanto, discutem a possibilidade de que eventos temporalmente distantes funcionam como operações estabelecedoras, as quais apresentam um efeito mais duradouro. Esse efeito poderia ser considerado em termos de cognição e de emoção. Eventos como a perda de um grande amor, abuso sexual, trauma, seqüestro, entre outros, são eventos que geram fortes emoções e que alteram a efetividade reforçadora/punidora de outros eventos ambientais, inclusive a longo prazo. Instruções verbais como “mantenha-se longe do casamento, você pode sofrer” ou “você tem de ser o melhor” estabelecem o valor de certos objetos, eventos ou condições de estímulo como reforçadores, valor esse que também pode perpetuar-se na vida de uma pessoa. Essas condições, em geral, quando observadas no contexto clínico, caracterizam os efeitos de uma OE a longo prazo. Skinner (1953/ 2000) afirma que as relações entre as variáveis ambientais e o comportamento, que delas é função, são quase sempre complexas e sutis, adquiridas a partir de uma história de interação do organismo com o ambiente. Diante dessa ótica, Daugher e Hackbert sugerem uma análise de relações possivelmente sutis que preci- sam de esclarecimentos resultantes de muita reflexão. As relações entre operações estabelecedoras e estados emocionais podem ser complexas e intrincadas. Contextos históricos de grave privação de alimento podem manter comportamentos de estocagem de alimento, sem que haja necessidade. O mesmo pode acontecer com indivíduos submetidos a privações de afeto por períodos prolongados. Esses indivíduos podem apresentar alta freqüência de comportamentos reforçados por afeto, mesmo em situações em que não haja carência, e sentimentos de menos valia e rejeição, os quais se perpetuam por longos períodos na vida. Clientes que apresentam histórias prolongadas de carência afetiva, rejeições, ridicularizações e críticas têm, em certos eventos ambientais, reforçadores/punidores efetivos. A história de interação prolongada efetivamente determina as funções comportamentais de relações sociais e interpessoais afetivas como reforçadores e do isolamento ou solidão como punidores. Por exemplo, um dos autores atendeu um cliente que apresentava um quadro de pânico e observou a presença de respostas emocionais típicas e de padrões de esquiva das situações que provocam essas respostas emocionais. O cliente queixava-se de medo de morte iminente quando se deparava com situações de viagens de avião do casal ou do cônjuge, de necessidade de andar de elevador ou de ter de sair da sua cidade por mais de dois dias. Os dados a respeito de sua história de vida indicaram a presença prolongada de críticas e de ridicularizações dos familiares, desqualificação de qualquer iniciativa comportamental do cliente e carência afetiva em relação aos pais e irmãos. Esse contexto de desproteção afetiva (operação estabelecedora) alterou tanto a efetividade reforçadora de qualquer interação social e interpessoal afetiva de cuidado e proteção quanto a efetividade punidora de situações de isolamento, de avaliação, de críticas e de rejeições. Essas situações, no contexto do referido cliente, provocavam respostas emocionais de pânico e evocavam comportamentos de esquiva. Em casos de depressão, a persistência de níveis insuficientes de reforçamento, a perda ANÁLISE DO COMPORTAMENTO de grandes fontes de reforço e o excesso de punições e de estimulações aversivas produzem efeitos comportamentais, como, por exemplo, diminuir a freqüência de comportamentos adequados, eliciar reações emocionais negativas e alterar a efetividade de conseqüências de certos comportamentos. Essas condições de estímulos, como operações estabelecedoras, podem estabelecer a efetividade reforçadora da atenção, da valorização, da assistência e de cuidados especiais, além de potencializar o valor reforçador do alimento, do isolamento, do sono, de drogas ou álcool. E, ainda, as contingências geradoras da depressão podem abolir a efetividade reforçadora da interação social, do trabalho e de atividades de lazer (Daugher e Hackbert, 2000). Em geral, os comportamentos depressivos são reforçados negativamente. Por exemplo, a esquiva pode ser reforçada pela prevenção de interações sociais, uma vez que esses tipos de interações, no passado, estiveram relacionadas a algum tipo de crítica negativa. Por outro lado, os comportamentos depressivos podem ser reforçados positivamente pela atenção, pelos cuidados e pela assistência de parentes mais próximos. Uma estratégia de atuação terapêutica, em casos de depressão, seria apresentar o reforço social contingente aos comportamentos mais adequados e não aos comportamentos depressivos. Dessa forma, o aumento na densidade de reforçamento de outros comportamentos pode produzir o aumento na freqüência de comportamentos mais funcionais e a diminuição na freqüência dos comportamentos depressivos. A partir dessa intervenção, podese modelar comportamentos mais funcionais no repertório comportamental do cliente, de modo que as contingências de reforço naturais mantenham esses comportamentos em alta freqüência. Na terapia, os comportamentos verbais do cliente e do terapeuta são de fundamental importância. A audiência não-punitiva estabelecida no contexto terapêutico permite ao cliente falar a respeito de sua vida e de suas experiências sem o risco do julgamento. A verbalização de certos eventos traumáticos permite a diminuição de seu impacto negativo sobre a vida do cliente, por um processo de 43 dessensibilização, no qual os estímulos eliciadores relacionados à situação traumática perdem gradualmente o poder eliciador de respostas emocionais negativas. Esse processo de dessensibilização e de extinção respondente altera as funções reforçadoras positivas e negativas de certas contingências relevantes na vida do cliente, permitindo o aumento na freqüência de alguns comportamentos adequados e a diminuição na freqüência de comportamentos inadequados. Esses comportamentos estão relacionados às contingências de reforço cuja efetividade é alterada pela verbalização. Portanto, a alteração da OE funciona como um ponto-chave para uma intervenção efetiva por parte do analista do comportamento junto aos casos clínicos apresentados no consultório de psicologia, na tentativa de melhorar o repertório comportamental do cliente e, conseqüentemente, sua qualidade de vida. CONCLUSÃO Um dos aspectos fundamentais da proposta de Michael é a possibilidade de a análise do comportamento investigar o controle de variáveis motivacionais, como variáveis independentes, proporcionando, de certa forma, o resgate do tópico de motivação nesta abordagem. As operações estabelecedoras designam um instrumento conceitual e metodológico para o estudo experimental do tópico de motivação. O maior impacto do conceito de operação estabelecedora tem sido sobre a análise aplicada do comportamento, considerando os vários contextos de aplicação. Segundo Iwata e colaboradores (2000), vários temas de pesquisa estão envolvidos na aplicação da operação estabelecedora. Para esses autores, as pesquisas de manipulação da variável motivacional, como componente relevante para a análise funcional do comportamento, são as mais importantes porque podem potencializar as intervenções. Inúmeras são as possibilidades de aplicação do conceito de operação estabelecedora na análise do comportamento, como, por exemplo, nos contextos de medicina comportamental, de clínica, de educação, de organizações, de esportes, entre outros. Inde- 44 ABREU-RODRIGUES, RIBEIRO & COLS. pendentemente do contexto em que ocorra, o comportamento sempre será o mesmo – um fenômeno natural determinado por variáveis ambientais. A tarefa do analista do comportamento é identificar e analisar as relações entre o comportamento e os eventos ambientais para, assim, programar contingências de reforçamento efetivas em sua prática em quaisquer um desses contextos. REFERÊNCIAS BIBLIOGRÁFICAS Alling, K. L. (1990). The effects of a conditioned establishing operation on performance of two component chain. Dissertação de Mestrado não publicada, Western Michigan University, Kalamazoo, MI. da Cunha, R. N. (1993). An experimental demonstration of the transitive conditioned establishing operation with pigeons. Tese de Doutorado não publicada, Western Michigan University, Kalamazoo, MI. da Cunha, R. N. (1995). Motivação e análise do comportamento. Temas em Psicologia, 3, 11-18. da Cunha, R. N. (2000). Motivação: Uma tradução comportamental. Em R. C. Wielenska (Org.), Sobre Comportamento e Cognição: Vol. 6. Questionando a teoria e as intervenções clínicas em outros contextos (p. 7882). Santo André, SP: SET. Daugher, M. J.; Hackbert, L. (2000). Establishing operations, cognition, and emotion. The Behavior Analyst, 23, 11-24. Durand, V. M.; Crimmins, D. B. (1988). Identifying the variables maintaining self-injurious behavior. Journal of Autism and Developmental Disorders, 18, 99-117. Friman, P. C. (2000). “Transitional objects” as establishing operations for thumb sucking: A case study. Journal of Applied Behavior Analysis, 33, 507-509. Hagopian, L. P.; Crockett, J. L.; van Stone, M.; DeLeon, I. G.; Bowman, L. G. (2000). Effects of noncontingent reinforcement on problem behavior and stimulus engagement: The role of satiation, extinction and alternative reinforcement. Journal of Applied Behavior Analysis, 33, 433-449. Instituto Antônio Houaiss (2001). Dicionário eletrônico Houaiss da língua portuguesa (Versão 1.0) [Software]. Rio de Janeiro: Editora Objetiva. Iwata, B. A.; Smith, R. G.; Michael, J. (2000). Current research on the influence of establishing operations on behavior in applied settings. Journal of Applied Behavior Analysis, 33, 411-418. Kahng, S.; Iwata, B. A.; Thompson, R. H.; Hanley, G. P. (2000). A method for identifying satiation versus extinction effects under noncontingent reinforcement schedules. Journal of Applied Behavior Analysis, 33, 419-432. Keller, F. S.; Schoenfeld, W. N. (1974). Princípios de psicologia – Um texto sistemático na ciência do comportamento (C. M. Bori,; R. Azzi, trads.). São Paulo: EPU (Obra publicada originalmente em 1950). Mace, F. C. (2000), Establishing operation in applied behavior analysis [Special Section]. Journal of Applied Behavior Analysis, 33. McCommas, J.; Hoch, H.; Paone, D.; El-Roy, D. (2000). Exchange behavior during academic tasks: A preliminary analysis of idiosyncratic establishing operations. Journal of Applied Behavior Analysis, 33, 479-493. McGill, P. (1999). Establishing operations: Implications for the assessment, treatment and prevention of problem behavior. Journal of Applied Behavior Analysis, 29, 43-51. McPherson, A.; Osborne, J. G. (1986). The emergence of establishing-stimulus control. Psychological Record, 36, 375-386. McPherson, A.; Osborne, J. G. (1988). Control of behavior by an establishing stimulus. Journal of the Experimental Analysis of Behavior, 49, 213-227. Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37, 149-155. Michael, J. (1993). Establishing operations. The Behavior Analyst, 16, 191-206. Michael, J. (2000). Implications and refinements of establishing operation. Journal of Applied Behavior Analysis, 33, 401-410. Miguel, C. F. (2000). O conceito de operação estabelecedora na análise do comportamento. Psicologia: Teoria e Pesquisa, 16, 259-267. Millenson, J. R. (1967). Principles of behavioral analysis. New York: Macmillan. Millenson, J. R.; Leslie, J. C. (1979). Principles of behavioral analysis. New York: Macmillan. Mook, D. G. (1987). Motivation – The organization of action. New York: W. W. Norton Company. Skinner, B. F. (1938). The behavior of organisms. New York: Applenton-Century-Crofts. Skinner, B. F. (2000). Ciência e comportamento humano (J. C. Todorov; R. Azzi, trads.). São Paulo: Martins Fontes (Obra publicada originalmente em 1953). Smith, R. G.; Iwata, B. A. (1997). Antecedent influences on behavior disorders. Journal of Applied Behavior Analysis, 24, 279-291. Sundberg, M. L. (1993). The applications of establishing operations. The Behavior Analyst, 16, 211-214. ANÁLISE DO COMPORTAMENTO HISTÓRIA DE REFORÇAMENTO 45 3 RAQUEL MOREIRA ALÓ A sensibilidade comportamental é um fator primordial para a manutenção das espécies, tendo em vista as mudanças constantes que ocorrem no ambiente. De acordo com Madden, Chase e Joyce (1998), um comportamento é considerado sensível se apresentar uma mudança sistemática e replicável diante de mudanças nas contingências de reforçamento. Por outro lado, se a contingência mudar, mas o comportamento permanecer inalterado, este será considerado insensível às contingências. A literatura tem demonstrado que a sensibilidade comportamental é afetada, dentre outras variáveis, pela história passada de reforçamento. Estudos que investigam os efeitos da história passada procuram produzir um responder estável sob diferentes esquemas de reforçamento, realizando, em seguida, alguma modificação nesses esquemas e observando se os resultados de tal modificação apresentam diferenças em função dos esquemas iniciais. O efeito de variáveis históricas é exemplificado por estudos que mostram que o organismo tende a apresentar um responder similar àquele encontrado antes da mudança no esquema de reforçamento em vigor, principalmente quando essa mudança não é sinalizada (LeFrancois e Metzger, 1993; Ono e Iwabuchi, 1997; Wanchisen e Tatham, 1991). Neste capítulo, será apontada a importância de pesquisas sobre história de reforçamento, bem como serão apresentadas algumas definições para o termo e contribuições de pesquisas básicas e aplicadas sobre esse tema. Finalmente, será discutida a relevância de se consi- derar variáveis históricas nas mais diversas áreas de atuação do psicólogo e de outros profissionais e será proposta a sistematização de pesquisas cujo interesse é o efeito de variáveis históricas. HISTÓRIA DE REFORÇAMENTO: RELEVÂNCIA E DEFINIÇÃO De acordo com Skinner (1953), um dos objetivos da análise experimental do comportamento é demonstrar que o comportamento é função do ambiente. Diversos estudos têm indicado que esse controle ambiental pode ser estabelecido por uma história de exposição a contingências de reforçamento e punição (Baron e Leinenweber 1995; Bickel et al., 1988; Cohen et al., 1994; Cole, 2001; Freeman e Lattal, 1992; Johnson et al., 1991; LeFrancois e Metzger, 1993; Nader e Thompson, 1987; Nevin e Grace, 2000; Ono e Iwabuchi, 1997; Poppen, 1982; Taylor, O’Reilly e Lancioni, 2000; Urbain et al., 1978; Wanchisen, 1990; Wanchisen e Tatham, 1991; Wanchisen, Tatham e Mooney, 1989; Weiner, 1964; 1965; 1969). Entretanto muitos pesquisadores em análise do comportamento têm mostrado desinteresse pelos efeitos da história de reforçamento, os quais comumente são minimizados ou ocultados (Baer, Detrich e Weninger, 1988; Hayes et al., 1985). Tal desinteresse está baseado em dois argumentos. Primeiro, os efeitos de história, quando observados, denotariam deficiên- 46 ABREU-RODRIGUES, RIBEIRO & COLS. cia no controle experimental: se as variáveis manipuladas na contingência atual não produziram mudanças sistemáticas no desempenho, conclui-se que o controle experimental não foi adequado para minimizar os efeitos de variáveis passadas às quais o sujeito foi exposto. Segundo, apesar das condições passadas de reforçamento e punição, a única maneira de modificar o comportamento seria a partir de manipulações nas contingências atuais; portanto, o interesse principal deveria ser a elaboração de intervenções eficazes para mudar comportamentos inadequados, não importando investigar como esses comportamentos foram adquiridos. Esses argumentos apresentam alguns problemas. Primeiro, de acordo com Cirino (2001, p. 138), quando os resultados de um estudo são atribuídos a variáveis históricas não-controladas, transforma-se a história de reforçamento na “lata de lixo” da análise do comportamento. Para evitar que isso ocorra, por outro lado, é necessário que os efeitos de contingências históricas sejam investigadas como variáveis independentes. Segundo, de acordo com Lattal e Neef (1996), como as contingências atuais afetam o comportamento em função de histórias de reforçamento distintas, a compreensão dos efeitos da história possibilitaria a elaboração de intervenções eficazes no sentido de tornar um comportamento inadequado (ou um comportamento adequado), produzido por contingências passadas, menos (ou mais) resistente aos efeitos das contingências atuais. Ainda que os efeitos de variáveis históricas sejam considerados relevantes, a falta de uma definição consensual para o termo “história de reforçamento” dificulta a identificação dos estudos que investigam tais variáveis. Como observou Cirino (2001), essa indefinição é refletida na profusão de termos utilizados indistintamente para se referir aos efeitos de contingências passadas sobre o comportamento atual e sem uma preocupação em apontar suas definições; por exemplo, história de condicionamento, história comportamental, história passada, história operante, história de esquema, história latente, história de desempenho e história de reforçamento. Uma vez que cada um desses termos pode ser definido diferente- mente, a sistematização dos estudos sobre efeitos de história fica comprometida. Tatham e Wanchisen (1998) apresentaram uma definição para história comportamental ao argumentar que qualquer estudo sobre condicionamento operante pode ser considerado um estudo sobre os efeitos de história. De fato, qualquer mudança no comportamento descrita como aprendizagem operante revela o efeito de uma história de reforçamento. Por exemplo, em procedimentos de modelagem, um desempenho só é alcançado porque houve, no passado, reforçamento diferencial de aproximações sucessivas ao desempenho final desejado; um estímulo só adquire propriedades discriminativas devido a uma história de reforçamento diferencial na presença desse estímulo (isto é, o reforçamento é mais provável na presença do estímulo do que em sua ausência) e um estímulo só adquire propriedades reforçadoras condicionadas por meio de uma história de pareamento sistemático com estímulos reforçadores incondicionados ou condicionados. No entanto definir história comportamental como condicionamento operante acarretaria problemas que inviabilizariam os estudos de história, a saber: a) o termo se tornaria demasiado abrangente para justificar seu uso, já que, de acordo com Tatham e Wanchisen (1998), todos os estudos que incluem comportamentos operantes aprendidos seriam, então, estudos sobre história de reforçamento; b) o uso do termo seria desnecessário e redundante, dada a existência do termo condicionamento operante que incluiria os mesmos fenômenos; c) não é possível a delimitação entre variáveis atuais e variáveis históricas, pois nenhum limite arbitrário no tempo é estabelecido; d) é inviável acessar o efeito de todos os condicionamentos que ocorrem ao longo da vida de um organismo (Cirino, 2000). Autores como Metzger (1992), Freeman e Lattal (1992), Wanchisen (1990) e Sidman ANÁLISE DO COMPORTAMENTO (1960) propuseram outras definições de história de reforçamento. De acordo com Metzger (1992), o termo história comportamental refere-se a exposições anteriores a contingências de reforçamento e punição, as quais estiveram em vigor tanto dentro quanto fora do laboratório. Dessa forma, estudos de história incluiriam todas as variáveis que afetaram o comportamento do organismo durante toda a sua vida. Essa definição apresenta os mesmos problemas da definição anteriormente discutida. Outra definição, proposta por Freeman e Lattal (1992), afirma que a história de reforçamento é caracterizada por seus efeitos, observados quando o controle exercido pelas contingências atuais é nitidamente influenciado por contingências passadas. Essa definição parece apresentar os mesmos problemas encontrados nas definições anteriores; entretanto, de acordo com Cirino (2000), ela apresenta também um avanço na discussão sobre variáveis históricas, uma vez que enfatiza os efeitos da interação de contingências atuais e históricas sobre o comportamento, o que não havia sido considerado nas definições anteriores. Uma outra definição de história comportamental a ser considerada é aquela proposta por Wanchisen (1990, p. 32). De acordo com essa definição, história consiste na “exposição a contingências respondentes e operantes cuidadosamente controladas em laboratório antes da fase de teste desejada”. Dessa forma, um estudo só poderia ser definido como estudo de história se seu objetivo for, em uma fase de teste, acessar os efeitos das contingências passadas que contribuíram para a aquisição e para a manutenção da resposta atual. Cirino (2000) apresenta duas vantagens dessa definição. A primeira vantagem refere-se à parcimônia, isto é, a definição apresenta uma delimitação: uma determinada história é construída e seus efeitos são avaliados em detrimento dos efeitos de outras variáveis históricas não-manipuladas, o que torna a definição mais econômica. Segundo, a definição aponta a possibilidade de teste dos efeitos de variáveis históricas, como variáveis independentes, sobre o comportamento. 47 A proposta de Sidman (1960) para a definição de história comportamental é consistente com a de Wanchisen (1990). Sidman argumentou que variáveis históricas podem ser estudadas sistematicamente se forem arranjadas certas experiências e se forem avaliados os efeitos dessas experiências no comportamento subseqüente. Ou seja, estudos de história seriam aqueles que investigam a interação entre padrões comportamentais anteriores (p. ex.: taxas de respostas altas ou baixas, pausas no responder) e contingências atuais. Os estudos baseados na proposta de Sidman têm utilizado o delineamento intrasujeito ou de grupo, em que a exposição a esquemas de reforçamento diferentes, até que o desempenho alcance um determinado critério de estabilidade, precede a exposição a um único esquema de reforçamento, que consiste no teste. Alguns desses estudos serão descritos a seguir. CONTRIBUIÇÕES DA PESQUISA BÁSICA Com o objetivo de investigar os efeitos de duas histórias diferentes de condicionamento sobre a sensibilidade comportamental em esquemas de intervalo fixo em humanos, Weiner (1964) expôs três participantes a um esquemas de razão fixa 40 (FR, em que cada reforço é contingente à emissão de um determinado número de respostas) e três participantes a um esquema de reforçamento diferencial de taxas baixas 20 s (DRL, em que cada reforço é liberado apenas se houver transcorrido um intervalo mínimo entre duas respostas). Cada esquema foi sinalizado por um estímulo luminoso distinto e nenhuma instrução foi fornecida sobre a realização da tarefa. Em seguida, todos os participantes foram expostos a um esquema de intervalo fixo 10 s (FI, em que uma resposta é reforçada se for emitida após transcorrido um determinado intervalo a partir do último reforço). Durante a história de condicionamento sob o esquema FR 40 os participantes emitiram taxas de respostas relativamente altas e constantes, enquanto sob o esquema DRL 20 s os participantes emitiram taxas de respostas bai- 48 ABREU-RODRIGUES, RIBEIRO & COLS. xas. Quando ambos os esquemas foram mudados para um FI 10 s, foi observada a manutenção das taxas de respostas anteriormente aprendidas, indicando insensibilidade do desempenho à mudança na contingência em função da história passada. Essa manutenção do desempenho sugere ainda que a variabilidade da taxa de respostas em esquemas FI, observada em muitos estudos, pode ser atribuída a variáveis históricas não-controladas. Em um estudo posterior, Weiner (1965, Emperimento 1) investigou se os efeitos da história passada seriam alterados pela adição de uma contingência de custo da resposta. Para tanto, durante o treino, três grupos foram expostos a um esquema FR 40, FI 10 s ou DRL 20 s. O reforço consistia na adição de 100 pontos a um contador. Em seguida, os participantes foram expostos a um esquema FI 10 s com custo de resposta, que consistia na perda de um ponto para cada resposta emitida antes do final do intervalo. Durante o treino sob o esquema FR 40, os participantes emitiram taxas de respostas relativamente altas e constantes; sob o esquema DRL 20 s, os participantes emitiram taxas de respostas baixas, apresentando pausas entre respostas e, sob o esquema FI 10 s, os participantes responderam em taxa intermediária e constante. Durante o teste, os participantes do grupo FR 40 emitiram respostas antes do término do intervalo, o que provocou perda de pontos. Por outro lado, os participantes dos grupos FI 10 s e DRL 20 s obtiveram uma pontuação mais alta, pois emitiram poucas respostas entre os reforços. Esses resultados indicaram que o desempenho em FI foi influenciado pela história anterior de condicionamento, apesar da perda de pontos que o comportamento controlado por variáveis históricas produziu. Visando a dar continuidade aos estudos anteriores sobre a história de reforçamento e custo da resposta, no Experimento 2, Weiner (1969) expôs os participantes de um dos três grupos experimentais a um esquema DRL 20 s seguido de um esquema FR 40. Depois dessa história de condicionamento, os participantes foram expostos a um esquema FI 10 s com custo. Cada esquema de reforçamento foi sinalizado por um estímulo luminoso diferente. O esquema DRL produziu taxas de respostas baixas e pausas entre respostas, enquanto o esquema FR produziu taxas de respostas altas e constantes; sob o esquema FI ocorreu um decréscimo na taxa de respostas, tendo os participantes apresentado taxas de respostas semelhantes àquelas observadas sob o esquema DRL. Para os participantes dos outros dois grupos, expostos ao esquema FR 40 ou DRL de 20 s, foi observada a manutenção das taxas de respostas anteriormente aprendidas (taxas alta e baixa, respectivamente), durante o teste com o esquema FI 10 s com custo ou FI 600 s sem custo. Novamente, os resultados mostraram que o responder em taxas altas e baixas pode ser produzido e controlado experimentalmente por meio da manipulação das histórias de reforçamento. Além disso, o fato de ter sido observada uma mudança na taxa de respostas sob o esquema FI com custo apenas para os participantes que foram expostos ao esquema DRL seguido do esquema FR indica que a exposição prévia ao esquema DRL pode anular a insensibilidade comportamental resultante da exposição ao esquema FR. No Experimento 3 (Weiner, 1969), os efeitos da história comportamental no desempenho subseqüente em esquemas FI foram investigados como o uso de delineamento intra-sujeito. Dois participantes foram expostos aos seguintes esquemas, nessa ordem: FR 40, FI 10 s com custo, DRL 10 s com custo, FI 10 s com custo, FR 40 e FI 10 s com custo, sendo cada esquema sinalizado por um estímulo luminoso diferente. Ambos os participantes apresentaram taxas altas no esquema FR 40 inicial, que se mantiveram no esquema FI 10 s com custo subseqüente. Quando expostos ao esquema DRL 10 s com custo, ocorreu uma diminuição na taxa de respostas. Após esse esquema, ambos os participantes apresentaram taxas baixas de respostas sob o esquema FI 10 s com custo, mesmo depois de reexpostos ao esquema FR 40, no qual responderam em taxas altas. Esses resultados indicaram, novamente, que a exposição ao esquema DRL pode gerar taxas baixas sob esquemas FI, mesmo depois ANÁLISE DO COMPORTAMENTO de terem sido produzidas taxas altas no esquema FR. Resultados similares foram observados com a utilização de um esquema de tempo fixo 10 s (FT, em que o reforço é liberado após transcorrido um intervalo fixo de tempo, independente da emissão de respostas) com custo (Weiner, 1969, Experimento 4). Com o objetivo de investigar se os resultados encontrados por Weiner (1969, Experimentos 2 a 5) seriam replicados com sujeitos não-humanos, LeFrancois e Metzger (1993) separaram seis ratos em dois grupos. Os sujeitos do primeiro grupo foram expostos ao esquema DRL 20 s e os sujeitos do segundo grupo, expostos ao esquema DRL de 20 s seguido de um esquema FR de valores diferentes para cada sujeito. Em seguida, os sujeitos de ambos os grupos foram expostos a diferentes esquemas FI com valores determinados pela média de reforços obtidos nos esquemas anteriores. Todos os sujeitos apresentaram taxas baixas de resposta sob o esquema DRL. Quando expostos ao esquema FR, os sujeitos do segundo grupo apresentaram um aumento na taxa de respostas, sendo observada uma relação direta entre a taxa e o valor do esquema FR. No esquema FI, os sujeitos do primeiro grupo apresentaram um pequeno aumento na taxa de respostas; os sujeitos do segundo grupo, por outro lado, mantiveram as taxas altas de respostas observadas no esquema FR. Esses resultados indicaram que o desempenho sob o esquema FI variou em função da taxa de respostas produzida no esquema imediatamente anterior e que a história de reforçamento sob o esquema DRL não diminuiu a insensibilidade comportamental produzida pela exposição mais recente ao esquema FR. Esses resultados são inconsistentes com aqueles encontrados por Weiner (1969, Experimentos 2 a 5), em que a exposição prévia ao esquema DRL gerou taxas baixas sob o esquema FI. A discrepância entre os resultados pode ser atribuída a diferenças entre humanos e nãohumanos relativas às histórias pré-experimentais e a diferenças nos procedimentos, como o método utilizado em cada estudo para a aquisição do comportamento, o tipo de reforço utilizado e o fato de, no estudo realizado por 49 LeFrancois e Metzger (1993), não terem sido utilizados estímulos sinalizadores diferentes para cada esquema de reforçamento, ao contrário do estudo realizado por Weiner (1969), em que a mudança do estímulo discriminativo sinalizava a alteração do esquema. O efeito da história de condicionamento também foi investigado com o uso de drogas que afetam o desempenho em esquemas de reforçamento. Urbain e colaboradores (1978), por exemplo, investigaram se variáveis históricas afetariam os efeitos da d-anfetamina sobre o desempenho de ratos em um esquema FI. O primeiro grupo foi exposto ao esquema FR 40, enquanto outro grupo foi exposto ao esquema DRL 11 s. Os valores dos esquemas foram estabelecidos de forma a igualar o número de reforços liberados por sessão para os dois grupos. Em seguida, todos os sujeitos foram expostos ao esquema FI 15 s, durante o qual receberam ou uma injeção de salina, ou diferentes doses de d-anfetamina. Os resultados mostraram que a taxa de respostas no esquema FI, antes da aplicação da droga, variou em função da história experimental: taxas altas ou baixas produzidas pelos esquemas FR ou DRL, respectivamente, foram mantidas sob o esquema FI. Com a aplicação da droga, a taxa de respostas dos sujeitos que foram expostos anteriormente ao esquema FR diminuiu em relação à taxa de respostas na sessão com administração de salina, enquanto a taxa produzida pelo esquema DRL anterior aumentou. Os resultados indicaram que a história de reforçamento pode afetar o desempenho sob o esquema FI, o que replica os resultados dos estudos anteriormente descritos, e que o efeito da d-anfetamina foi função da história de reforçamento nos esquemas FR e DRL. Nos estudos anteriores, não somente os esquemas utilizados durante a fase de história eram diferentes, como também eram diferentes as taxas de reforços liberados pelos esquemas (ver Urbain et al., 1978). Esse fato pode ter sido responsável pelos efeitos observados, já que vários estudos têm indicado que quanto maior a taxa de reforços obtida em um dado esquema de reforçamento menor será a mudança na taxa de respostas diante de mudanças no esquema (p. ex.: Cohen, Riley e Wiegle, 50 ABREU-RODRIGUES, RIBEIRO & COLS. 1993; Hearst, 1961, Experimento 1; Nevin, 1974, Experimento 2). Para investigar essa possibilidade, Freeman e Lattal (1992, Experimento 1) expuseram três pombos a duas sessões diárias separadas por um intervalo de 6 h: na primeira, o animal foi exposto a um esquema DRL e, na segunda, a um esquema FR (Fase 1). Os estímulos luminosos foram diferentes para cada esquema, e o valor do DRL determinava o valor do FR na sessão posterior de forma a igualar a taxa de reforços nos dois esquemas. Em seguida, os esquemas FR e DRL foram substituídos por dois esquemas FI (Fase 2), cujo valor foi determinado pela média do intervalo entre reforços (IRI) das 10 últimas sessões da fase anterior. Os estímulos luminosos não foram alterados. Na Fase 1, a taxa de respostas no esquema FR foi mais alta do que no esquema DRL. Na Fase 2, inicialmente, a taxa de respostas foi mais alta na presença do estímulo previamente correlacionado com o esquema FR do que na presença do estímulo correlacionado com o esquema DRL. No entanto a taxa de respostas na presença dos dois estímulos luminosos tendeu a convergir para um valor intermediário ao longo das sessões. No Experimento 2, Freeman e Lattal (1992) investigaram se os efeitos de história seriam menos observados quando os esquemas FR e DRL fossem alterados para um esquema VI, uma vez que a taxa de respostas estável sob os esquemas FR e DRL produz regularidade temporal na liberação de reforços, o que não acontece em esquemas VI. Para isso, três pombos ingênuos foram expostos às mesmas fases e condições do Experimento 1, porém esquemas VI estavam em vigor na Fase 2. Assim como no Experimento 1, a taxa de respostas no esquema FR foi mais alta do que no esquema DRL durante a Fase 1 e, no início da Fase 2, as taxas continuaram diferenciadas. Entretanto, para dois sujeitos, as taxas de respostas na presença dos estímulos luminosos convergiram para valores intermediários em um número menor de sessões do que no Experimento 1, indicando que o efeito da experiência prévia sobre a resposta foi menor no esquema VI do que no esquema FI e sugerindo que a distribuição temporal irregular entre reforços pode minimizar os efeitos da história (cf. Lattal, 1975). Os resultados encontrados nas primeiras exposições à Fase 2, nos dois experimentos, indicaram controle dos estímulos discriminativos presentes na fase de história sobre o responder subseqüente: isto é, a taxa de respostas durante as primeiras sessões no esquema FI ou VI dependeram do estímulo sinalizador relacionado a cada componente do esquema múltiplo. Outros estudos, como aquele realizado por Hanna, Blackman e Todorov (1992), apoiaram os resultados encontrados por Freeman e Lattal (1992), ao mostrar que, quando os estímulos discriminativos permaneceram inalterados após as mudanças em um esquema concorrente VI VI, houve manutenção dos padrões comportamentais anteriormente reforçados; por outro lado, quando os estímulos discriminativos foram modificados, as taxas de respostas ajustaram-se aos novos esquemas. Dessa forma, os estudos de Freeman e Lattal (1992) e de Hanna e colaboradores (1992) indicam que, além da relação entre a resposta e o reforço (contingência R-S), uma outra variável que afeta os efeitos da história de reforçamento é a relação entre o estímulo discriminativo e o reforço (contingência S-S). Okouchi (2003) também avaliou o papel do controle discriminativo nos efeitos da história de reforçamento mas, em vez de usar estímulos exteroceptivos, seu interesse recaiu sobre as funções discriminativas dos IRIs. Especificamente, foi investigado se IRIs idênticos àqueles observados durante a Fase de História funcionariam como estímulos discriminativos e, assim como ocorre com estímulos exteroceptivos, controlariam os efeitos dessa história. Estudantes universitários foram expostos, na Fase de Treino, a um esquema mix FR DRL, no qual a mudança de um componente para o outro não é sinalizada. Os valores dos esquemas FR e DRL foram estabelecidos de forma a produzir IRIs diferentes em cada componente. Em seguida, os participantes foram expostos à Fase de Teste, que consistiu em um esquema misto (mix) FI 5 s e FI 20 s por 12 sessões (Experimento 1) ou em seis esquemas FI, cujos valores variaram entre 5 s e 40 s (Experimento 2). Sob o esquema mix FR DRL foram produzidas taxas de respostas diferencia- ANÁLISE DO COMPORTAMENTO das e maiores no esquema FR. Na Fase de Teste, as taxas de respostas sob o esquema FI foram mais altas quando os IRIs desse esquema assemelhavam-se aos IRIs produzidos anteriormente pelo esquema FR; por outro lado, quando os IRIs do esquema FI assemelhavamse àqueles produzidos anteriormente pelo esquema DRL, as taxas de respostas foram baixas. Esses resultados sugerem que os IRIs podem desenvolver propriedades discriminativas e, dessa forma, afetar os efeitos da história. O objetivo do estudo conduzido por Ono e Iwabuchi (1997) foi investigar se o intervalo temporal entre a exposição às contingências de treino e de teste afetaria a adaptação do responder às novas contingências, uma vez que, na maioria dos estudos sobre história, a fase de teste é iniciada no dia seguinte à última sessão do treino (p. ex.: Freeman e Lattal, 1992; Wanchisen, Tatham e Mooney, 1989). Na primeira condição da primeira fase, os sujeitos (pombos) foram expostos a um esquema múltiplo – mult DRH (reforçamento diferencial de taxas altas, em que uma resposta é reforçada apenas se for emitida antes de transcorrido um determinado intervalo desde a última resposta) DRL –, sinalizados por luzes verde e vermelha, respectivamente, e com taxas de reforços semelhantes. A segunda condição, iniciada no dia posterior ao término da primeira, consistia em um esquema VI sinalizado por uma luz branca, cujo valor foi determinado pelo intervalo médio entre reforços das 10 últimas sessões da condição anterior. Em seguida, os sujeitos foram expostos à condição de teste que consistia em um esquema VI de valor idêntico àquele da segunda condição; entretanto, em sessões alternadas, a sinalização do esquema era idêntica à da primeira condição (luz verde e vermelha apresentadas randomicamente) ou à da segunda condição (luz branca). A segunda fase do experimento foi idêntica à primeira, entretanto a primeira condição foi separada das condições subseqüentes por um intervalo de seis meses. Os resultados da primeira fase indicaram que, após 10 sessões de teste, as taxas de respostas no esquema VI continuaram diferenciadas na presença dos estímulos correspondentes ao esquema DRH e ao esquema DRL; entretanto, na segunda fase do estu- 51 do, a diferença entre as taxas de respostas na presença dos estímulos previamente relacionados ao esquema DRH e ao esquema DRL foi menor e menos duradoura do que na primeira fase, indicando que os efeitos de história foram amenizados em função do intervalo de tempo entre o final da fase de história e o início da fase de teste. Manipulações no nível de saciação dos sujeitos também têm sido usadas para avaliar os efeitos da história passada. Um procedimento comumente utilizado para manipular o nível de saciação consiste na alimentação prévia, ou seja, no fornecimento de diferentes quantidades de alimento em algum momento antes da sessão experimental. Tal procedimento representa uma mudança na relação respostaconseqüência porque modifica o valor do reforço, alterando, assim, a taxa de respostas (para uma discussão mais completa sobre variáveis que alteram o valor do reforço, ver Capítulo 2), entretanto a maneira como a taxa de respostas é alterada depende do esquema de reforçamento presente na fase de história (Aló, 2002) e de características desse esquema, tais como a densidade, a magnitude e o atraso do reforço (p. ex.: Bell, 1999; Harper, 1996; Nevin, Mandell e Atak, 1983). Para investigar os efeitos de manipulações no nível de saciação e da história de reforçamento sobre a sensibilidade a mudanças nas contingências, Aló (2002) expôs pombos a um esquema mult FR DRL durante as três primeiras condições experimentais. Inicialmente, foi determinada a quantidade máxima de alimento que cada sujeito, pesando 80% de seu peso livre, era capaz de consumir. Na condição de Linha de Base, todo o alimento diário era obtido na sessão experimental (economia fechada). Em seguida, iniciou-se a condição de Teste de Sensibilidade 1, em que os sujeitos foram separados em dois grupos: o Grupo 100% teve acesso a 100% da quantidade máxima de consumo, antes das sessões, enquanto o Grupo 20% teve acesso somente a 20% dessa quantidade. Após a reexposição à Linha de Base, o procedimento de saciação foi repetido na condição de Teste de Sensibilidade 2. O esquema em vigor era um mult FI FI com valores idênticos, sendo que os estímulos sinalizadores pre- 52 ABREU-RODRIGUES, RIBEIRO & COLS. sentes nas condições anteriores não foram alterados. Os resultados indicaram que, quando o esquema múltiplo não foi modificado (Teste de Sensibilidade 1), a taxa de respostas no componente FR apresentou decréscimos apenas no maior nível de saciação (100%), enquanto a taxa DRL permaneceu inalterada nos dois níveis de saciação. Quando o esquema foi modificado (Teste de Sensibilidade 2), as taxas “FR” (aquelas obtidas sob o estímulo sinalizador anteriormente correlacionado com o esquema FR) decresceram até o maior nível de saciação e permaneceram inalteradas no menor nível de saciação, enquanto as taxas “DRL” (aquelas obtidas sob o estímulo sinalizador previamente correlacionado ao esquema DRL) aumentaram para ambos os níveis de saciação, de modo que as taxas nos dois componentes alcançaram valores semelhantes (como seria esperado em um esquema mult FI FI de valores idênticos) mais rapidamente para os sujeitos do Grupo 100%. Esses resultados mostraram que: a) a sensibilidade das taxas produzidas a despeito da mudança no esquema FR dependeu do aumento no nível de saciação, apesar da mudança no esquema; b) a sensibilidade das taxas produzidas pelo esquema DRL dependeu da mudança no esquema de reforçamento, a despeito do nível de saciação; c) os efeitos do aumento no nível de saciação foram modulados pela história de reforçamento, contribuindo, assim, para uma transição mais rápida do controle da contingência passada para a contingência atual. Em suma, os estudos sobre história de reforçamento têm indicado, de uma forma geral, que a história de exposição a esquemas de reforçamento pode produzir insensibilidade a mudanças nesses esquemas. Entretanto tal insensibilidade pode ser amenizada por variáveis como a exposição prévia a determinados tipos de esquema (Aló, 2002, Fase 2; Weiner, 1969, Experimentos 2 e 3), a diferença na regularidade temporal da liberação dos reforços nas fases de treino e de teste (Freeman e Lattal, 1992, Experimento 2; Okouchi, 2003), a diferença entre os estímulos sinalizadores nas fases de treino e de teste (Hanna et al., 1992), o atraso entre o final da contingência histórica e o início do teste (Ono e Iwabuchi, 1997) e aumentos no nível de saciação (Aló, 2002). CONTRIBUIÇÕES DA PESQUISA APLICADA Apesar de muitas pesquisas básicas indicarem a importância de variáveis históricas para a compreensão do comportamento exposto a novas contingências, tais variáveis não vêm sendo explicitamente investigadas em pesquisas aplicadas (Lattal e Neef, 1996). Um levantamento bibliográfico realizado no periódico mais importante da área, o Journal of Applied Behavior Analysis, revela apenas duas pesquisas cujo objetivo consistiu em avaliar os efeitos da exposição a determinadas condições experimentais sobre o comportamento em condições subseqüentes. Esses estudos serão descritos a seguir. Martens, Bradley e Eckert (1997) procuraram investigar os efeitos de três histórias de reforçamento diferentes sobre o engajamento de duas crianças em tarefas escolares durante o período de extinção. O procedimento incluiu quatro condições, nas quais o contato entre o experimentador e o participante ocorria de acordo com um esquema FI 30 s durante os dois primeiros minutos de cada sessão; os oito minutos finais da sessão consistiam em extinção. Na Condição A, os observadores apenas registraram o engajamento dos participantes nas tarefas propostas pelo professor. Em seguida, os participantes foram expostos à Condição B, na qual receberam quatro elogios consecutivos (p. ex.: “Bom trabalho!”), contingentes ao engajamento na tarefa escolar. Durante a Condição C, os participantes receberam os mesmos elogios contingentes ao envolvimento na tarefa escolar durante o primeiro e o terceiro intervalo de 30 s dos dois primeiros minutos da sessão; durante o segundo e o quarto intervalos de 30 s foram fornecidas instruções para que os participantes voltassem a estu- ANÁLISE DO COMPORTAMENTO dar, caso não estivessem engajados na tarefa proposta pelo professor (p. ex.: “Por favor, pare de conversar e trabalhe na sua tarefa”). Durante a Condição D, o procedimento foi semelhante àquele utilizado na Condição C; no entanto, no segundo e no quarto intervalos de 30 s, os participantes receberam atenção do experimentador contingente a comportamentos de não-engajamento na tarefa escolar (p. ex.: “algumas vezes é bom fazer uma pausa no trabalho”). Considerando-se os dois primeiros minutos de cada sessão (esquema FI 30 s), os resultados indicaram acréscimos na freqüência do comportamento de estudo na Condição B, para os dois participantes, em relação à freqüência observada na Condição A. Para o primeiro participante, a freqüência do comportamento de estudo permaneceu constante a partir da segunda condição; para o segundo participante, essa freqüência apresentou acréscimos adicionais na Condição C e decresceu na Condição D. Com relação aos períodos de extinção, para o primeiro participante, a freqüência do comportamento de estudo em relação à freqüência média desse comportamento nos dois primeiros minutos da sessão manteve-se constante na Condição B, apresentou aumentos na Condição C e diminuiu na Condição D. Para o segundo participante, foram observados decréscimos na freqüência do comportamento de estudo em relação aos dois primeiros minutos da sessão nas Condições B, C e D, sendo mais abrupto na Condição D. Esses resultados indicam que a história de elogios para o comportamento de estudar (Condição B), principalmente quando aliada a instruções para o estudo (Condição C), produziu uma menor sensibilidade à retirada do reforço que a história de elogios para estudar alternada com atenção para pausas no estudo (Condição D). No entanto a falta de sistematicidade dos resultados encontrados para os dois sujeitos indica que o controle experimental deveria ser aprimorado. O segundo estudo na área aplicada que discutiu efeitos da história de reforçamento foi realizado por Progar e colaboradores (2001). O participante desse estudo foi uma criança com diagnóstico de autismo, que apresentava 53 comportamentos agressivos mantidos por esquiva de tarefas aversivas. O participante e seus dois terapeutas haviam sido transferidos para uma nova instituição após o fechamento da instituição em que o tratamento foi iniciado. Esse tratamento consistia no fornecimento de itens comestíveis contingentes ao seguimento de instruções fornecidas pelo terapeuta e à ausência de comportamentos agressivos (esquema de reforçamento diferencial de outros comportamentos – DRO). Na nova instituição, o mesmo tratamento foi utilizado, realizado por quatro terapeutas: os dois terapeutas que já haviam trabalhado com o participante e dois que não lhe eram familiares. Foram realizadas no mínimo 10 sessões de 10 min por dia, em que os comportamentos agressivos foram registrados em intervalos de 10 s por dois observadores treinados. Os resultados indicaram diferenças sistemáticas na freqüência dos comportamentos agressivos direcionados aos terapeutas familiares versus não-familiares, sendo essa freqüência consistentemente mais alta com os terapeutas que já haviam trabalhado com o participante. De acordo com os autores, a alta freqüência de comportamentos agressivos direcionada aos dois terapeutas familiares pode ser explicada pela história de exposição a situações aversivas na antiga instituição em que o participante foi tratado por esses dois terapeutas; tais situações incluíram mudanças freqüentes na medicação utilizada, restrições de movimentos e reclusão em um ambiente fechado. No entanto, considerando-se que não houve manipulação das variáveis históricas apontadas, essa interpretação deve ser considerada com cautela. Concluindo, as duas pesquisas apresentadas que discutem explicitamente efeitos de história de reforçamento, encontradas no periódico de pesquisas aplicadas de maior renome, apresentam problemas de controle experimental que comprometem a discussão dos efeitos das variáveis históricas de interesse. Considerando-se os resultados de pesquisas básicas que demonstram a importância de variáveis históricas na determinação do comportamento atual (o que inclui a determinação da eficácia do tratamento utilizado), é imperativo que sejam desenvolvidas pesquisas aplica- 54 ABREU-RODRIGUES, RIBEIRO & COLS. das sobre o efeito de tais variáveis. Para o aprimoramento do controle experimental que favoreceria conclusões acerca dos efeitos dessas variáveis, poderia ser adotado um procedimento-padrão para o estudo na pesquisa aplicada, assim como vem sendo feito na pesquisa básica por estudos baseados nas propostas de Sidman (1960) e de Wanchisen (1990). Ou seja, o estudo sistemático da história de reforçamento por meio da exposição a certas experiências e avaliação dos efeitos dessas experiências no comportamento subseqüente deveria ser adaptado e adotado em pesquisas aplicadas interessadas nos efeitos de variáveis históricas. DA PESQUISA BÁSICA PARA A APLICAÇÃO Em conjunto, os resultados obtidos por estudos na área de história de reforçamento indicam que as variáveis históricas devem ser consideradas para a compreensão do ajustamento do comportamento a novas contingências, bem como para a elaboração de intervenções eficazes em todos os contextos de aplicação da psicologia e de outras áreas que compartilhem do interesse pelo comportamento humano. É importante ressaltar, no entanto, que alguns cuidados devem ser tomados com relação à aplicação do conhecimento adquirido por meio da pesquisa básica. A obtenção de resultados sistemáticos em uma pesquisa no laboratório não implica a possibilidade de aplicação direta desses resultados para o comportamento humano no ambiente natural. Para que os resultados possam ser úteis no contexto humano, é necessário que se verifique a sua replicabilidade com outros sujeitos da mesma espécie e nas mesmas condições (replicação direta), e com sujeitos de outras espécies em condições diferentes daquelas do experimento original (replicação sistemática), o que aumenta a fidedignidade e a generalidade dos resultados inicialmente encontrados (Sidman, 1960). À medida que crescem as evidências sobre os efeitos das variáveis em questão (isto é, na medida em que os resultados são consistentemente replicados), novos tipos de análise funcional e de intervenção podem ser elaborados. Ainda que sejam necessárias replicações que favoreçam a fidedignidade e a generalidade dos resultados aqui descritos, o fato de que os estudos empíricos têm sistematicamente demonstrado que histórias de reforçamento diferentes resultam em desempenhos diferencialmente sensíveis a mudanças nas contingências sugere que variáveis históricas devem ser consideradas nas intervenções comportamentais das mais diversas áreas da psicologia. No contexto da psicologia organizacional, por exemplo, a produtividade e a satisfação dos funcionários de uma empresa podem ser favorecidas se houver uma preocupação da parte dos profissionais responsáveis em planejar a contratação, a alocação e o remanejamento de pessoal, levando-se em conta o histórico de cada funcionário. Outras instituições que seriam favorecidas pela consideração de variáveis históricas são aquelas cujo interesse primário é a aprendizagem (p. ex.: escolas). Por exemplo, atrasos (ou acelerações) no desenvolvimento, que, em muitos casos, são atribuídos a outras variáveis (p. ex.: herança genética), podem ser prioritariamente função da história de reforçamento sob contingências que prejudicaram (ou favoreceram) a aprendizagem. Conhecendo-se os efeitos de diferentes histórias, seria possível não somente prever questões relacionadas ao desenvolvimento de cada indivíduo, mas também elaborar intervenções para produzir um desenvolvimento mais acelerado quando este for o interesse. O conhecimento acerca da importância de variáveis históricas pode ser útil, também, no contexto clínico. A história de reforçamento de um cliente muitas vezes é negligenciada, ou sua importância é minimizada, porque muitos terapeutas acreditam que, qualquer que seja essa história, nada pode ser feito para modificála e, portanto, a terapia deve focalizar as contingências atuais. Entretanto, uma vez que o papel das contingências atuais é modulado por variáveis históricas, conhecer essa história parece ser imprescindível para a compreensão do controle do comportamento (Lattal e Neef, ANÁLISE DO COMPORTAMENTO 1996). Somente por meio de análises funcionais precisas estaria o clínico habilitado a desenvolver estratégias de intervenção eficazes. A importância de variáveis históricas para o processo terapêutico pode ser ilustrada com o caso clínico descrito a seguir. Pedro (nome fictício), 22 anos, morava em uma cidade do interior, onde as pessoas eram “muito moralistas e religiosas”. Ele relatava que, desde sua infância, engajava-se em “jogos sexuais” com alguns primos e amigos e que se sentia sexualmente atraído por meninos. Ao mesmo tempo, ouvia de sua mãe e de outras pessoas que o homossexualismo era “sujo e pecaminoso”, que era “uma escolha de uma pessoa má” e que os homossexuais, quando morressem, “iriam para o inferno”. Para se esquivar de seus pensamentos (e possíveis atos) “pecaminosos”, ele se dedicou intensamente aos estudos e passou a ser reconhecido na cidade como um menino “bonzinho, ingênuo e inteligente”. Sua vida social era muito restrita e permaneceu dessa forma até ocorrer uma mudança de cidade para iniciar um curso superior, o que representou uma grande alteração nas contingências: Pedro foi morar no alojamento estudantil, onde passou a dividir um apartamento com outros alunos da universidade que, de acordo com ele, interessavam-se muito mais por atividades sociais do que por atividades acadêmicas. No começo, ele negava convites para sair, argumentando que tinha de estudar. No entanto, após alguns meses, ele passou a sair com os amigos e conheceu um rapaz por quem se interessou e com quem iniciou um namoro; seu tempo dedicado aos estudos diminuiu drasticamente, e ele passou a ser reprovado em várias matérias. O comportamento de estudar, quando ocorria, era sempre na véspera de testes e de provas, o que não era suficiente para ser aprovado nas disciplinas. Decidiu, então, procurar uma terapia. O levantamento do histórico desse cliente foi muito útil para a compreensão de seu caso e para a elaboração da intervenção. Suas dificuldades atuais relacionadas ao estudo eram, em última instância, fruto das experiências passadas que produziram um padrão comportamental inadequado para as atuais contingências. Ficou claro que seu comporta- 55 mento em relação ao estudo, até o início da faculdade, estava sendo mantido prioritariamente por reforçamento negativo (esquiva de críticas e rejeição) e não por reforçamento positivo (p. ex.: aprendizagem, boas notas, prestígio entre colegas e professores). Além disso, esse comportamento era ineficiente uma vez que, embora o ajudasse a ter um bom desempenho escolar, consumia todo o seu tempo fora da escola (mesmo não envolvendo conteúdos e exercícios além daqueles exigidos pelos professores). Quando as contingências foram alteradas, inserido no contexto o reforçamento positivo de atividades sociais e de práticas homossexuais, seu comportamento em relação ao estudo, como seria esperado, declinou substancialmente, passando a ocorrer somente em ocasiões de forte controle aversivo (possibilidade de reprovação). As novas contingências, portanto, exigiam um equilíbrio entre estudo e lazer, algo que não fazia parte do repertório comportamental de Pedro. Para tanto, era necessário que seu comportamento em relação ao estudo se tornasse mais eficiente e passasse a ser controlado prioritariamente por contingências reforçadoras positivas, o que se tornou um dos objetivos terapêuticos. Outro caso clínico que ilustra a importância de se considerar variáveis históricas no contexto terapêutico é o de Sandra (nome fictício), 24 anos, que vinha de uma cidade do interior, onde morava com a mãe e três irmãos. Os primeiros seis meses de terapia dessa cliente pareceram pouco proveitosos: ela tinha dificuldades em detalhar eventos que lhe haviam acontecido, especialmente aqueles relacionados à sua família, e em discriminar sentimentos relacionados a esses eventos. Quanto a seu namorado, afirmava que não sabia o que sentia por ele, mas que ele a amava muito, a ponto de lhe dizer que ela era “a maior de todas as suas conquistas” e de ter tentado suicídio quando ela terminou o namoro. Sandra relatou que todos os seus ex-namorados foram profundamente apaixonados por ela, mas não sabia dizer o que havia sentido por eles. Os namoros eram sempre terminados por iniciativa dela, talvez porque, segundo ela, era uma mulher muito independente e auto-suficiente. Percebendo que ela se esquivava de falar sobre o 56 ABREU-RODRIGUES, RIBEIRO & COLS. seu relacionamento familiar e sobre seus sentimentos, a terapeuta procurou bloquear essa esquiva, insistindo em assuntos relacionados à sua família e criando situações que provocassem determinadas emoções, principalmente aquelas que a cliente revelava nunca sentir (p. ex.: raiva, ciúme). Nessas situações, no entanto, Sandra continuava esquivando-se e dizia que a terapeuta estava interpretando seu comportamento de maneira errônea. Eventualmente, Sandra decidiu abandonar a terapia, argumentando que não estava preparada para falar dos assuntos que a terapeuta insistia em abordar. Após três meses de intervalo, a terapeuta entrou em contato com a cliente e esta decidiu, então, voltar à terapia. Após seu retorno, a cliente passou a relatar sobre seu histórico familiar e afetivo. Esses relatos foram extremamente úteis para a compreensão do caso e para a intervenção. De acordo com Sandra, sua mãe (empregada doméstica) era muito apaixonada por seu pai (vendedor ambulante), mas o sentimento não era recíproco. Seu pai viajava com muita freqüência, sem data para voltar e, quando isso acontecia, a família passava fome. Sua mãe foi descrita como “uma pessoa sem o menor controle emocional”: nos períodos em que o marido estava ausente, falava alto e sem parar durante todo o dia, principalmente reclamando do marido e afirmando que ele queria matá-la. Além disso, atirava objetos pela janela e nas pessoas que não acatavam as suas ordens, e, por isso, de acordo com a cliente, a casa “vivia toda quebrada”. Quando o marido retornava, a mãe parecia ficar ainda mais nervosa, gritando e brigando com ele o tempo inteiro. Seus irmãos acabaram ficando “perturbados” devido à convivência com a mãe: um irmão era “depressivo”, outro tornou-se um “fanático religioso” e o último comportava-se de forma muito semelhante à de sua mãe. Diante da fragilidade emocional da mãe e da ausência do pai, Sandra passou a assumir grande parte das responsabilidades familiares. Nos períodos em que estava em casa, seu pai era muito carinhoso e atencioso com ela, dizendo-lhe freqüentemente que sua mãe e seus irmãos eram “loucos” e que o principal motivo para ele voltar para casa era ela, sua filha preferida e a única pessoa equilibrada da família. Sempre que relatava esses eventos, Sandra chorava muito e dizia que se sentia abandonada pela única pessoa em quem confiava e a quem mais amava, que era seu pai. Ela relatava que não sabia exatamente o que sentia por todos os outros membros de sua família, mas que era algo “confuso e ruim”. Esse sentimento de “confusão” foi descrito pela cliente em diversas outras situações, quando se referia a episódios relacionados a seu namorado (p. ex.: quando outra mulher demonstrava interesse por ele) e a sua vida profissional (uma vez que ela não estava certa a respeito da profissão que iria seguir). A análise funcional do caso de Sandra indicou que o déficit no repertório de tato discriminado, por ela apresentado, tinha como origem a ausência de modelos apropriados e a falta de reforçamento diferencial para tal comportamento. Além disso, seu contexto familiar apresentava uma alta probabilidade de punição para o relato de sentimentos e de pensamentos. Ou seja, expressar opiniões e revelar o que sentia poderiam torná-la mais vulnerável à agressividade de sua mãe e gerar a perda do afeto de seu pai, uma vez que ele afirmava que ela era sua filha preferida justamente por ser a mais diferente da mãe, ou seja, por não fazer cobranças, não se queixar de nada, ser sempre carinhosa com ele, enfim, a única “emocionalmente controlada” na família. Diante desse contexto, a cliente desenvolveu estratégias de esquiva que, no início, consistiam em não revelar sentimentos e pensamentos e que, no momento da terapia, eram caracterizadas por uma dificuldade generalizada de discriminar o que pensava e sentia, tanto em situações aversivas quanto em situações reforçadoras. Além disso, esse padrão de esquiva, antes limitado ao ambiente familiar, passou a ser emitido nos demais relacionamentos interpessoais da cliente, incluindo o relacionamento com a terapeuta. Ou seja, em função de uma história de exposição a contingências aversivas, as quais selecionaram o comportamento de esquiva emocional, a cliente apresentava insensibilidade às contingências reforçadoras presentes em seus contextos atuais. O acesso ao histórico de Sandra, além de ter sido útil para o fortalecimento do vínculo ANÁLISE DO COMPORTAMENTO terapêutico, uma vez que esse histórico incluía informações muito íntimas e delicadas para a cliente, também permitiu a compreensão do quadro funcional de suas dificuldades atuais. Essa compreensão, por sua vez, foi fundamental para que a terapeuta abandonasse estratégias anteriormente utilizadas (p. ex.: bloqueio da esquiva), as quais tinham um forte teor aversivo para a cliente e, assim, acabaram reforçando o padrão de esquiva que se desejava extinguir. A terapeuta decidiu, então, implementar estratégias terapêuticas caracterizadas pelo uso de modelação e modelagem. Os relatos sobre a história familiar, bem como aqueles sobre os acontecimentos atuais, permitiram que Sandra “revivesse” momentos difíceis em um local seguro, onde era permitido que ela “perdesse o controle emocional” sem que isso implicasse a perda de afeto por parte da terapeuta. Ou seja, a terapeuta procurou construir uma nova história de relacionamento interpessoal, diferente daquela vivida com os pais da cliente, oferecendo modelos e reforçando diferencialmente a expressão de sentimentos e também a emissão de opiniões, de comentários e de sugestões. Sandra foi, pouco a pouco, aprendendo a discriminar seus sentimentos, de forma que os relatos sobre “sentimento de confusão” foram gradativamente substituídos por relatos de raiva, de ciúme, de afeto e de admiração, por exemplo. Ela também foi gradualmente aprendendo a expressar suas opiniões e, assim, a construir relacionamentos interpessoais mais reforçadores. Em suma, esse caso ilustra como o conhecimento sobre a história de reforçamento e punição pode ser extremamente útil para a análise funcional e para a intervenção terapêutica, e não somente para o conhecimento das origens do comportamento. A relevância de se considerar variáveis históricas não se restringe apenas ao trabalho do psicólogo, mas também diz respeito a todas as ciências sociais e políticas, uma vez que a história de uma população ou grupo social é refletida na forma como esse grupo reage às mais diversas contingências. Conhecendo o efeito de variáveis históricas, poderíamos tentar prever, por exemplo, como um degredado político adapta-se a um país com uma cultura diferen- 57 te da sua, como os valores atuais do gênero feminino são função, em grande parte, das lutas feministas do passado e como uma população reage com ataques terroristas a uma longa história de imperialismo e subjugo, por exemplo. Dessa forma, é importante que educadores, psicólogos, sociólogos e todos os profissionais interessados na saúde de homens ou de grupos humanos estudem os efeitos da história de reforçamento e que considerem tais efeitos na elaboração de suas intervenções. Grande parte do conhecimento sobre os efeitos de história tem sido construída com a realização de pesquisas básicas; portanto, é importante que os mais diversos profissionais considerem a importância de tais pesquisas e que se beneficiem de seus achados. CONCLUSÃO Investigações sobre os efeitos de variáveis históricas vêm sendo desenvolvidas por diversas áreas de pesquisa em análise do comportamento. No entanto observa-se uma falta de sistematização dos estudos realizados nessas áreas, uma vez que eles não são reconhecidos como estudos de história de reforçamento e, conseqüentemente, seus resultados não são integrados com aqueles obtidos em pesquisas de história. A integração dos resultados dessas pesquisas poderia contribuir para o acúmulo do conhecimento sobre o comportamento humano (e não-humano), por vários motivos. Primeiro, porque os resultados de alguns estudos poderiam ser considerados replicações sistemáticas de resultados obtidos em uma outra área, favorecendo a fidedignidade e a generalidade dos dados encontrados, além de evitar gastos desnecessários de tempo e de recursos financeiros com outras replicações. Segundo, porque variáveis que alteram os efeitos da história de reforçamento, identificadas em uma área de pesquisa, poderiam ser manipuladas de modo a aumentar o controle experimental de estudos de outras áreas que também investigam efeitos de história. Terceiro, porque os resultados de estudos em uma dessas áreas de pesquisa poderiam suscitar questões a serem 58 ABREU-RODRIGUES, RIBEIRO & COLS. investigadas, também, por outras áreas de pesquisa. Para que os resultados dos estudos que investigam os efeitos de variáveis históricas sejam integrados, é necessária uma retomada da definição anteriormente apresentada de história de reforçamento. De acordo com a definição proposta por Wanchisen (1990), um estudo poderá ser considerado um estudo de história quando o seu objetivo for acessar, em uma fase de teste, os efeitos da exposição prévia a diferentes condições experimentais. Dentre os estudos com tais objetivos encontramse aqueles da área denominada resistência à mudança (apresentada no Capítulo 4 deste livro). Ou seja, as pesquisas que investigam a resistência à mudança e os efeitos da história de reforçamento compartilham o mesmo interesse: a sensibilidade do desempenho previamente reforçado diante de mudanças nas contingências (Santos, 2001). Quanto menor a sensibilidade comportamental observada, maior a resistência à mudança ou, alternativamente, maior o efeito da história de reforçamento sobre o responder atual. No entanto os procedimentos utilizados nas duas áreas de investigação guardam algumas diferenças. Primeiro, a variável histórica é diferente nas duas áreas: enquanto os estudos de história investigam os efeitos da exposição, na fase de treino, a dois ou mais esquemas de reforçamento diferentes (p. ex.: FR e DRL), estudos sobre resistência investigam os efeitos da liberação de reforços com taxa, magnitude ou atraso diferentes sob um único esquema de reforçamento (p. ex.: um esquema mult de VI 1 min VI 3 min), na fase de treino. Segundo, enquanto os estudos sobre história geralmente investigam a sensibilidade comportamental à mudança nas contingências, utilizando esquemas diferentes nas fases de treino e de teste, estudos sobre resistência à mudança investigam a sensibilidade implementando outros tipos de alterações nas contingências vigentes, tais como aumentos no nível de saciação, apresentação de um estímulo sinalizador de choques inevitáveis e extinção. Possivelmente devido a essas diferenças, estudos sobre resistência à mudança não são reconhecidos como estudos de história de reforçamento. Os estudos de resistência à mudança têm consistentemente indicado que os efeitos de mudanças nas condições experimentais são alterados por diversas variáveis históricas. Por exemplo, vários experimentos têm indicado que aumentos no nível de saciação, sobrepostos ao esquema em vigor, produzem um menor declínio na taxa de respostas produzida pelo esquema de reforçamento que envolve a liberação de reforços com maiores magnitudes (Harper e McLean, 1992, Experimento 1; Nevin, 1974, Experimento 3; Nevin, Mandell e Yarensky, 1981, Experimento 1), maiores taxas (Cohen et al., 1993, Experimentos 3 e 4; Nevin, 1974, Experimento 1) e menores atrasos (Grace, Schwendiman e Nevin, 1998, Fase 2; Nevin, 1974, Experimento 4). No entanto os efeitos de tais variáveis não foram ainda investigados em função da mudança no esquema de reforçamento, isto é, utilizando-se o procedimento mais comum na área de história comportamental. Outros estudos em análise do comportamento que investigam efeitos de variáveis históricas, de acordo com a definição proposta por Wanchisen (1990), são aqueles incluídos na área de desamparo aprendido, apresentada no Capítulo 5. De uma forma geral, estudos sobre desamparo aprendido utilizam três grupos experimentais que são expostos, na fase de treino, a eventos aversivos independentes da resposta, eventos aversivos dependentes da resposta ou não recebem nenhum tipo de tratamento; na fase de teste, todos os grupos são expostos a uma única situação experimental, na qual os efeitos da exposição às condições anteriores são avaliados. Assim como os estudos sobre resistência à mudança, estudos sobre desamparo aprendido não são reconhecidos como investigações sobre história de reforçamento, uma vez que os procedimentos utilizados nessas duas áreas guardam algumas diferenças. Primeiro, a variável histórica cujos efeitos são investigados não é a mesma: enquanto estudos de história investigam os efeitos da exposição, na fase de treino, a dois ou mais esquemas de reforçamento, estudos de desamparo investigam os ANÁLISE DO COMPORTAMENTO efeitos da exposição a dois esquemas (VI e VT), em que há ocorrência de eventos aversivos (p. ex.: choques ou tons altos) dependentes ou independentes da resposta nessa mesma fase. Segundo, enquanto estudos de história envolvem condições em que há uma relação de dependência entre o evento e a resposta, tanto na fase de treino quanto na fase de teste, estudos de desamparo geralmente envolvem condições em que há independência entre a resposta e o evento na fase de treino e dependência entre a resposta e o evento, na fase de teste. Terceiro, as variáveis dependentes avaliadas nas duas áreas de investigação são diferentes: enquanto estudos de história investigam os efeitos de manipulações em variáveis históricas sobre a sensibilidade da taxa de respostas, estudos de desamparo investigam os efeitos dessas variáveis sobre o tempo de reação e o número de acertos na nova contingência. Os resultados de estudos sobre desamparo aprendido têm indicado que o grupo exposto a eventos independentes da resposta apresenta maiores déficits na aprendizagem (tempos de reação mais longos e menor número de acertos) subseqüente do que os demais grupos (Benson e Kennely, 1976; Overmier e Seligman, 1967). Em outras palavras, a história de exposição a eventos independentes da resposta diminui a sensibilidade à alteração nas condições experimentais (de independência para dependência), uma vez que o sujeito permanece comportando-se como se não houvesse relação de contingência entre suas respostas e o reforço. Além disso, muitos estudos sobre desamparo indicam que a exposição a condições em que a ocorrência dos eventos depende da resposta, antes da fase de treino ou entre esta e a fase de teste, pode anular os efeitos da história de independência entre os eventos e as respostas, não sendo observado, assim, o desamparo aprendido na fase de teste (Prindaville e Stein, 1978; Williams e Maier, 1977; Yano e Hunziker, 2000, Experimento 2). Tais condições têm sido denominadas como “imunização” e “terapia”, respectivamente. Diversas variáveis investigadas na área de história de reforçamento não foram ainda investigadas na área de desamparo aprendido. Considerando-se os resultados de estudos que 59 indicam que a diferença na regularidade temporal da apresentação dos eventos nas fases de treino e de teste (Freeman e Lattal, 1992), aumentos no atraso entre a fase de treino e a fase de teste (Ono e Iwabuchi, 1997) e aumentos no nível de saciação (Aló, 2002) promovem a sensibilidade à mudança nas contingências ou, alternativamente, minimizam os efeitos da história de exposição a diferentes esquemas de reforçamento, seria interessante investigar se essas variáveis diminuiriam também os efeitos da história de independência entre os eventos e o responder. O objetivo dos estudos sobre comportamento governado por regras (CGR, apresentado no Capítulo 12) também consiste em investigar, na fase de teste, os efeitos da exposição prévia a determinadas condições experimentais e, portanto, também podem ser considerados estudos sobre história de reforçamento, de acordo com a definição proposta por Wanchisen (1990). No entanto esses estudos não são reconhecidos como tais, provavelmente em função de diferenças entre os procedimentos adotados nas duas áreas. Primeiro, as variáveis históricas investigadas são diferentes: enquanto estudos sobre história investigam os efeitos da exposição prévia a diferentes esquemas de reforçamento, estudos sobre CGR investigam os efeitos da exposição prévia a regras. Segundo, estudos de história geralmente envolvem apenas contingências não-verbais, enquanto estudos de CGR envolvem dois tipos de contingências de reforçamento: verbais e não-verbais. Terceiro, enquanto os estudos sobre história investigam a sensibilidade comportamental à mudança nas contingências utilizando esquemas diferentes nas fases de treino e de teste, estudos sobre CGR não envolvem, necessariamente, mudanças no esquema de reforçamento. Para avaliar a sensibilidade do CGR, são utilizadas duas metodologias básicas. Na primeira, uma regra é fornecida ao participante, que é, então, exposto a uma contingência; em seguida, essa contingência é modificada, enquanto a regra permanece a mesma. Na segunda, ocorre o inverso, a regra é modificada, e a contingência permanece inalterada. Caso a modificação da contingência seja acompanhada de mudanças no desempenho, o com- 60 ABREU-RODRIGUES, RIBEIRO & COLS. portamento é considerado sensível e, caso contrário, insensível. Alternativamente, caso a mudança na regra seja acompanhada de mudanças no desempenho, este é considerado insensível; caso contrário, o desempenho é considerado sensível. Diversos estudos têm demonstrado que a história de reforçamento por seguir regras pode promover insensibilidade a mudanças nas contingências ambientais (Hayes et al., 1976; Kaufman, Baron e Kopp, 1966; Otto, Torgrud e Holborn, 1999). Outros estudos têm indicado que essa insensibilidade pode ser minimizada ou anulada por variáveis como o contato com a discrepância entre a regra e a contingência (Buskist e Miller, 1986; Galizio, 1979), a história de exposição a instruções ou esquemas de reforçamento variados (LeFrancois, Chase, e Joyce, 1988) e a utilização de esquemas com freqüência alta de reforços (Newman et al., 1994). Entretanto os efeitos da interação entre a história de reforçamento por seguir regras e outras variáveis estudadas na área de história de reforçamento não foram ainda investigados. Considerando-se os resultados dessa área que indicam que a saciação, por exemplo, pode minimizar os efeitos da história, seria plausível supor que aumentos no nível de saciação dos reforços fornecidos na contingência não-verbal minimizariam a insensibilidade produzida pela história de reforçamento por seguir regras. Concluindo, áreas de pesquisa que investigam os efeitos da história de reforçamento, como aquelas denominadas de resistência à mudança, desamparo aprendido e comportamento governado por regras, vêm se desenvolvendo independentemente, não se beneficiando mutuamente com os resultados obtidos. Muitas vezes, pesquisadores interessados em uma área de pesquisa realizam experimentos com base apenas no que tem sido discutido na área específica, não procurando integrar os resultados obtidos com os de outras áreas. Conforme se procurou ilustrar aqui, os resultados encontrados por estudos em diferentes áreas poderiam contribuir para o aprimoramento do controle experimental, para suscitar novas questões de investigação, ou para complementar as questões formuladas por pesquisadores de outras áreas. A identificação de estudos cujas variáveis de inte- resse são comuns, de uma forma geral, poderá promover a integração dos resultados obtidos em diversas áreas, favorecendo a predição e o controle do comportamento humano. REFERÊNCIAS BIBLIOGRÁFICAS Aló, R. M. (2002). História de reforçamento e operações estabelecedoras: Efeitos sobre a sensibilidade comportamental. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF. Baer, R. A.; Detrich, R.; Weninger, J. M. (1988). On the functional role of the verbalization in correspondence training procedures. Journal of Applied Behavior Analysis, 21, 345-356. Baron, A.; Leinenweber, A. (1995). Effects of a variableratio conditioning history on sensitivity to fixed-interval contingencies in rats. Journal of the Experimental Analysis of Behavior, 63, 97-110. Bell, M. C. (1999). Pavlovian contingencies and resistance to change in a multiple schedule. Journal of the Experimental Analysis of Behavior, 72, 81-96. Benson, J. S.; Kennely, K. J. (1976). Learned helplessness: The result of controllable reinforcements or uncontrollable aversive stimuli? Journal of Personality and Social Psychology, 34, 138-145. Bickel, W. K.; Higgins, S. T.; Kirby, K.; Johnson, M. (1988). An inverse relationship between baseline fixedinterval response rate and the effects of a tandem response requirement. Journal of the Experimental Analysis of Behavior, 50, 211-218. Buskist, W. F.; Miller, H. L.; Jr. (1986). Interaction between rules and contingencies in the control of human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 36, 109-116. Cirino, S. (2000). O que é história comportamental. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 153-158). Santo André, SP: ESETec. Cirino, S. (2001). Detecção da história de reforçamento: Problemas metodológicos para lidar com a história passada. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 8. Expondo a variabilidade (p. 137-147). Santo André, SP: ESETec. Cohen, S. L.; Pedersen, J.; Kinney, G. G.; Myers, J. (1994). Effects of reinforcement history on responding under progressive-ratio schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 61, 375-387. Cohen, S. L.; Riley, D. S.; Wiegle, P. A. (1993). Tests of behavior momentum in simple and multiple schedules with rats and pigeons. Journal of the Experimental Analysis of Behavior, 60, 255-291. Cole, M. R. (2001). The long-term effect of high- and low-rate responding histories on fixed-interval respon- ANÁLISE DO COMPORTAMENTO ding in rats. Journal of the Experimental Analysis of Behavior, 75, 43-54. Freeman, T. J.; Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57, 5-15. Galizio, M. (1979). Contingency-shaped and rulegoverned behavior: Instructional control of human loss avoidance. Journal of the Experimental Analysis of Behavior, 31, 53-70. Grace, R. C.; Schwendiman, J. W.; Nevin, J, A. (1998). Effects of unsignaled delay of reinforcement on preference and resistance to change. Journal of the Experimental Analysis of Behavior, 69, 247-261. Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992). Stimulus effects on concurrent performance in transition. Journal of the Experimental Analysis of Behavior, 58, 335-347. Harper, D. N. (1996). Response-independent food delivery and behavioral resistance to change. Journal of the Experimental Analysis of Behavior, 65, 549-560. Harper, D. N.; McLean, A. P. (1992). Resistance to change and the law of effect. Journal of the Experimental Analysis of Behavior, 57, 317-337. Hayes, S. C.; Brownstein, A. J.; Zettle, R. D.; Rosenfarb, I.; Korn, Z. (1976). Rule-governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45, 237-256. Hayes, S. C.; Rosenfarb, I.; Wulfert, E.; Munt, E. D.; Korn, Z.; Zettle, R. D. (1985). Self-reinforcement effects: An artifact of social standard setting? Journal of Applied Behavior Analysis, 18, 201-214. Hearst, E. (1961). Resistance-to-extinction functions in the single organism. Journal of the Experimental Analysis of Behavior, 4, 133-144. Johnson, L. M.; Bickel, W. K.; Higgins, S. T.; Morris, E. K. (1991). The effects of schedule history and the opportunity for adjunctive responding on behavior during a fixed-interval schedule of reinforcement. Journal of the Experimental Analysis of Behavior, 55, 313-322. Kaufman, A.; Baron, A.; Kopp, R. E. (1966). Some effects of instructions on human operant behavior. Psychonomic Monograph Supplements, 1, 243-250. Lattal, K. A. (1975). Reinforcement contingencies as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 23, 241-246. Lattal, K. A.; Neef, N. A. (1996). Recent reinforcementschedule research and applied behavior analysis. Journal of Applied Behavior Analysis, 29, 213-230. LeFrancois, J. R; Chase, P. N.; Joyce, J. H. (1988). The effects of a variety of instructions on human fixedinterval performance. Journal of the Experimental Analysis of Behavior, 49, 383-393. LeFrancois, J. R.; Metzger, B. (1993). Low-responserate conditioning history and fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 59, 543-549. Madden, G. J.; Chase, P. N.; Joyce, J. H. (1998). Making sense of sensitivity in the human operant literature. The Behavior Analyst, 21, 1-12. 61 Martens, B. K.; Bradley, T. A.; Eckert, T. L. (1997). Effects of reinforcement history and instructions on the persistence of student engagement. Journal of Applied Behavior Analysis, 30, 569-572. Metzger, B. (1992). Stimulus control of behavioral history and subsequent fixed-interval performance. Tese de doutorado não publicada. West Virginia University, Morgantown, WV, USA. Nader, M. A.; Thompson, T. (1987). Interaction of methadone, reinforcement history, and variable-interval performance. Journal of the Experimental Analysis of Behavior, 48, 303-315. Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 21, 389-408. Nevin, J. A.; Grace, R. C. (2000). Preference and resistance to change with constant-duration schedule components. Journal of the Experimental Analysis of Behavior, 74, 79-100. Nevin, J. A.; Mandell, C.; Atak, J. R. (1983). The analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39, 49-59. Nevin, J. A.; Mandell C.; Yarensky, P. (1981). Response rate and resistance to change in chained schedules. Journal of Experimental Psychology: Animal Behavior Processes, 7, 278-294. Newman, B.; Hemmes, N. S.; Buffington, D. M.; Andreopoulos, S. (1994). The effects of schedules of reinforcement on instruction-following in human subjects with verbal and nonverbal stimuli. The Analysis of Verbal Behavior, 12, 31-41. Okouchi, H. (2003). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79, 49-64. Ono, K.; Iwabuchi, K. (1997). Effects of histories of differential reinforcement of response rate on variableinterval responding. Journal of the Experimental Analysis of Behavior, 67, 311-322. Otto, T. L.; Torgrud, L. J.; Holborn, S. W. (1999). An operant blocking interpretation of instructed insensitivity to schedule contingencies. Journal of the Experimental Analysis of Behavior, 49, 663-684. Overmier, J. B.; Seligman, M. E. P. (1967). Effects of inescapable shock on subsequent escape and avoidance learning. Journal of Comparative and Physiological Psychology, 63, 28-33. Poppen, R. (1982). Human fixed-interval performance with concurrently programmed schedules: A parametric analysis. Journal of the Experimental Analysis of Behavior, 37, 251-266. Prindaville, P.; Stein, N. (1978). Predictability, controllability, and inoculation against learned helplessness. Behavior Research and Therapy, 16, 263-271. Progar, P. R.; North, S. T.; Bruce, S. S.; DiNovi, B. J.; Brett, J. N.; Eberman, E. M.; Bailey, J. R.; Jr.; Nussbaum, C. N. (2001). Putative behavioral history effects and aggression maintained by escape from therapists. Journal of Applied Behavior Analysis, 34, 69-72. 62 ABREU-RODRIGUES, RIBEIRO & COLS. Santos, C. V. (2001). Efeitos do contexto social sobre a resistência a mudança. Dissertação de mestrado não-publicada. Universidade de Brasília, Brasília, DF. Sidman, M. (1960). Tactics of scientific research. New York: Basic Books. Skinner, B. F. (1953). Science and human behavior. New York: Free Press. Tatham, T. A.; Wanchisen, B. A. (1998). Behavioral history: A definition and some common findings from two areas of research. The Behavior Analyst, 21, 241-251. Taylor, I.; O’Reilly, M. F.; Lancioni, G. (2000). Behavioral history: Implications for applied behavior analysis. Em J. C. Leslie; D. Blackman (Eds.), Experimental and applied analysis of human behavior (p. 235-250). Reno, Nevada: Context Press. Urbain, C.; Poling, A.; Millam, J.; Thompson, T. (1978). d-Amphetamine and fixed-interval performance: Effects of operant history. Journal of the Experimental Analysis of Behavior, 29, 385-392. Wanchisen, B. A. (1990). Forgetting the lessons of history. The Behavior Analyst, 13, 21-37. Wanchisen, B. A.; Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling human operant behavior. Behavior Analyst, 14, 139-144. Wanchisen, B. A.; Tatham, T. A.; Mooney, S. E. (1989). Variable-ratio conditioning history produces high- and low-rate fixed-interval performance in rats. Journal of the Experimental Analysis of Behavior, 52, 167-179. Weiner, H. (1964). Conditioning history and human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 7, 383-385. Weiner, H. (1965). Conditioning history and maladaptive human operant behavior. Psychological Reports, 17, 935-942. Weiner, H. (1969). Controlling human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 12, 349-373. Williams, J. L.; Maier, S. F. (1977). Transituational immunization and therapy of learned helplessness in the rat. Journal of Experimental Psychology, 3, 240-252. Yano, Y.; Hunziker, M. H. L. (2000). Desamparo aprendido e imunização com diferentes respostas de fuga. Acta Comportamentalia, 8, 143-166. ANÁLISE DO COMPORTAMENTO MOMENTO COMPORTAMENTAL 63 4 CRISTIANO VALÉRIO DOS SANTOS A manutenção da resposta em face de modificações nas condições ambientais é uma questão de extrema relevância, tanto para quem trabalha com pesquisa básica quanto para quem está interessado em propiciar mudanças duradouras no comportamento de seus clientes. Quem trabalha com pesquisa básica ou aplicada dentro do referencial teórico analíticocomportamental, muito freqüentemente, usa delineamentos nos quais as variáveis são manipuladas intra-sujeito, e conhecer como manipulações prévias podem afetar o desempenho sob contingências atuais torna-se crítico. Similarmente, quem se preocupa com a aplicação direta dos princípios da análise do comportamento em situações fora do laboratório constantemente se questiona sobre como conseguir resultados duradouros ou sobre comportamentos especialmente difíceis de modificar. Em ambos os casos, conhecer as variáveis responsáveis pela maior ou menor persistência da resposta é imprescindível. Tradicionalmente, essa questão tem sido tratada, em análise do comportamento, sob o rótulo de “força da resposta”. Mais recentemente, esse termo vem sendo substituído pelo conceito de “momento comportamental”, que envolve a observação de duas medidas: a freqüência com que essa resposta é emitida por unidade de tempo (taxa de respostas) e o grau de alteração no responder quando alguma condição é alterada (resistência a mudanças). Embora as variáveis que afetam a taxa de respostas já tenham sido amplamente estudadas, somente a partir da década de 1980 procurou-se estudar mais detalhadamente a resistência a mudanças (Nevin e Grace, 2000). O produto da taxa de respostas e a resistência a mudanças é chamado “momento comportamental”, em analogia à noção de quantidade de movimento na Mecânica Clássica: a taxa de respostas seria equivalente à velocidade com que um corpo se desloca e a resistência a mudanças seria equivalente à massa (quantidade de inércia) desse corpo (Nevin, Mandell e Atak, 1983). Por exemplo, a força necessária para parar um carro a 100 km/h é maior do que a força necessária para parar esse mesmo carro se ele estiver a 60 km/h. Por outro lado, parar um caminhão requer um esforço muito maior do que parar um carro, pois o caminhão tem maior massa. Analogamente, seria necessária uma alteração maior nas condições ambientais para perturbar o responder que apresenta alto momento comportamental. Este capítulo é basicamente sobre resistência a mudanças. Inicialmente, serão discutidas questões metodológicas presentes nos estudos de resistência a mudanças, com ênfase na definição e na mensuração desse fenômeno. Em seguida, será feita uma revisão sobre as principais variáveis que afetam a resistência a mudanças e sobre seus processos determinantes. A isso, segue-se um item no qual serão discutidas as semelhanças e as diferenças entre o conceito de resistência a mudanças e outros conceitos presentes na análise do comportamento. Por fim, serão apresentados alguns estudos que tentaram fazer uma ponte entre 64 ABREU-RODRIGUES, RIBEIRO & COLS. os dados obtidos em laboratório sobre resistência a mudanças e possíveis aplicações práticas desse conceito. MOMENTO COMPORTAMENTAL: PESQUISA BÁSICA A pesquisa básica sobre momento comportamental, em especial sobre resistência a mudanças, tem sido desenvolvida ao longo dos últimos 30 anos. Antes desse período, já havia estudos conduzidos com o objetivo de avaliar a resistência do ato de responder em face de mudanças nas contingências, principalmente diante de procedimento de extinção, mas alguns problemas na forma como os dados foram analisados, discutidos a seguir, tornam difícil uma comparação entre esses estudos e os conduzidos mais recentemente. Assim, a revisão que se segue focalizará os estudos mais recentes que não apresentam tais problemas e que se enquadram dentro do quadro conceitual do momento comportamental. Questões metodológicas Uma forma de se estudar a resistência a mudanças no laboratório poderia ser feita expondo um organismo a um esquema de reforçamento qualquer e observando mudanças na resposta quando alguma condição (p. ex.: nível de privação) é modificada. Contudo Nevin (1979) apontou que esse procedimento pode não ser o mais adequado: é possível que a resposta não seja alterada sob aquele esquema de reforçamento, como também pode ser que aquela mudança no nível de privação não afete a resposta sob nenhum esquema. Assim sendo, pouca ou nenhuma informação sobre resistência é obtida. Um procedimento mais adequado para o estudo da resistência a mudanças envolve a exposição de um organismo a duas ou mais contingências diferentes. Essas contingências são, em geral, apresentadas em um esquema múltiplo, que envolve a apresentação sucessiva de dois ou mais esquemas de reforçamento e com sinalização antecedente diferencia- da para cada esquema. O esquema múltiplo é preferido por garantir que uma condição ambiental vai afetar a resposta em todas as contingências aproximadamente da mesma forma e intensidade. Depois da obtenção de uma taxa de respostas estável em todas as contingências, alguma condição ambiental é modificada, e alterações na taxa de respostas são observadas. Uma resposta é considerada mais resistente a mudanças quanto menos ela se alterar em face das modificações nas condições ambientais. Grandes alterações são indicativas de menor resistência. Uma outra questão importante para a qual se deve atentar é a medida de resistência a mudanças. Observem que o interesse não é mais na taxa de respostas em si, mas na maior ou menor manutenção da resposta – que pode ser a taxa de respostas ou qualquer outra dimensão do comportamento – em face de alguma mudança. Se a dimensão de interesse for semelhante entre os componentes do esquema múltiplo e for observado que, depois da mudança em alguma condição, essa dimensão foi afetada em graus diferentes entre os componentes, a identificação do componente no qual a obtenção da resposta era mais resistente é bastante clara. Contudo considerem o seguinte exemplo: em um dos componentes de um esquema múltiplo, a taxa de respostas era de 100 respostas por minuto (R/min); no outro componente, a taxa era de 50 R/min. Após a alteração de alguma condição, a taxa de respostas no primeiro componente passou a ser de 80 R/min e no segundo, de 30 R/min. Em ambos, a taxa de respostas sofreu um decréscimo absoluto semelhante: 20 R/min. No entanto esse mesmo valor representa uma redução de 20% no primeiro componente e uma redução de 40% no segundo. Assim, não faz sentido dizer que ambos os componentes apresentam igual resistência se, em relação à condição anterior, a redução no segundo componente foi duas vezes maior. Esse problema é contornado usando-se uma medida relativa ou uma escala que leve em conta o nível da resposta antes da alteração (p. ex.: escala logarítmica). A maioria dos estudos apresentados a seguir tomou esse cuidado; em caso de exceção, esse fato será ressaltado explicitamente. ANÁLISE DO COMPORTAMENTO Um exemplo do procedimento comumente utilizado para estudar resistência a mudanças no laboratório é apresentado no estudo de Bouzas (1978). Nesse estudo, pombos foram expostos a um esquema múltiplo com dois componentes. Em um deles, vigorava um esquema de reforçamento de intervalo variável (VI) 1 min; no outro, vigorava um esquema de VI 4 min. Assim que a taxa de respostas tornou-se estável nos dois componentes, uma condição ambiental foi alterada: uma contingência de punição foi sobreposta ao esquema múltiplo. Em ambos os componentes, choques de intensidades variadas eram liberados de acordo com um esquema de VI 30 s. Essa alteração ambiental provocou um decréscimo na taxa de respostas nos dois componentes, como era de se esperar. Entretanto esse decréscimo foi maior no componente que liberava menos reforços (VI 4 min). De acordo com a definição já apresentada, a resposta mantida pelo esquema VI 4 min foi menos resistente à mudança na contingência. A introdução de uma contingência de punição é somente uma entre várias condições que podem ser alteradas. Outras operações que freqüentemente são realizadas incluem o procedimento de extinção (retirada da conseqüência mantenedora da resposta), alterações no nível de privação (em especial, saciação antes da sessão experimental), acréscimo de “reforçadores” livres dentro do próprio componente ou em um intervalo entre componentes, introdução de estímulos que sinalizam a ocorrência de estímulos aversivos inevitáveis, entre outras. A lista não pretende ser exaustiva; é possível pensar em vários outros procedimentos que vão, de alguma forma, afetar a resposta, aumentando-a ou diminuindo-a, e qualquer um deles pode ser considerado uma operação que vai, de alguma forma, alterar o curso normal da resposta (DO, do inglês Disrupting Operation). Usando como referência a Mecânica Clássica, o modelo de momento comportamental pode ser expresso matematicamente conforme a seguinte função: log (Bx /Bo) = -f/m (1) 65 Nessa função Bo e Bx representam a taxa assintótica de respostas durante a linha de base e após a introdução da DO, respectivamente; f é o valor da DO (p. ex.: taxa de “reforçadores” livres, quantidade de alimento fornecido antes da sessão ou número de sessões de extinção), e m é a massa comportamental (resistência a mudanças). O sinal negativo antes de f indica que a DO diminui a taxa de respostas e, uma vez que o lado esquerdo da equação é adimensional, f e m devem ser medidos nas mesmas unidades. A função logarítmica presente na equação é preferida por três motivos principais: a) como já mencionado, a escala logarítmica leva em consideração o nível da resposta antes da introdução da DO; b) essa escala evita o efeito “chão”, uma vez que vai até – ∞; c) as funções que relacionam log (Bx /Bo) aos valores da DO são aproximadamente lineares (Nevin, 2002). Um dado interessante apresentado por Nevin é o fato de que a medida de resistência a mudanças apresenta propriedades aditivas, o que a qualifica como uma escala de razão. Por exemplo, se duas DOs são combinadas (p. ex.: introdução de “reforçadores” livres durante o intervalo entre componentes e extinção), essa combinação terá o mesmo efeito, numericamente, que a soma algébrica dos efeitos das DOs isoladas. O mesmo vale para combinação de diferentes dimensões dos reforçadores (p. ex.: taxa e magnitude). Variáveis que afetam a resistência a mudanças Ao contrário do que acontece na Mecânica Clássica, na qual a massa de um corpo em movimento raramente muda de um momento para outro, a resistência da resposta a mudanças pode ser afetada por uma série de variáveis. Muitas delas afetam igualmente a taxa de respostas; porém, como veremos adiante, os processos determinantes da taxa de respos- 66 ABREU-RODRIGUES, RIBEIRO & COLS. tas e da resistência a mudanças podem ser diferentes. Além disso, a resistência a mudanças pode ser diferencialmente afetada pelo tipo de mudança que é realizado. Dentre as variáveis que afetam a resistência a mudanças da resposta mantida por reforçamento positivo, destacam-se a magnitude, o atraso e a taxa de reforços. Tanto a magnitude quanto a taxa de reforços, em geral, apresentam uma relação direta com a resistência a mudanças; o atraso do reforço e a resistência a mudanças, por outro lado, apresentam uma relação inversa. O efeito da magnitude do reforço é exemplificado no estudo de Harper e McLean (1992, Experimento 1), no qual pombos foram expostos a um esquema múltiplo VI 120 s VI 120 s, cujos componentes diferiam somente na duração de acesso ao alimento que era fornecido (6 s ou 2 s). Em seguida, 3 s de alimento livre foram fornecidos no intervalo entre componentes de acordo com esquemas de tempo variável (VT) 30 ou 120 s. Todas as condições foram mantidas até que a taxa de respostas atendesse a um critério de estabilidade. As mudanças na taxa de respostas em face da liberação de alimento livre foram analisadas tanto nas cinco sessões iniciais quanto nas cinco últimas sessões. Em ambos os casos, a taxa de respostas no componente que liberava o reforço de maior magnitude apresentou um menor decréscimo com a introdução de alimento livre, indicando, portanto, maior resistência a essa manipulação. Resultados semelhantes a esses foram obtidos em outras ocasiões usando extinção (Pavlik e Collier, 1977), diferentes magnitudes de alimento livre no intervalo entre componentes (Harper, 1996) e saciação (Nevin, Mandell e Yarensky, 1981) como DO. O atraso do reforço, em geral, diminui a resistência a mudanças, como demonstrado nos estudos de Nevin (1974) e Grace, Schwendiman e Nevin (1998). Entretanto esse efeito pode ser revertido caso o atraso seja sinalizado. Bell (1999) treinou pombos em um esquema múltiplo com três componentes, separados por períodos de blackout. No primeiro componente, vigorava um esquema VI de 120 s e a primeira resposta após o término do intervalo iniciava um atraso não sinalizado de 3 ou 8 s. O segundo componente era idêntico ao primeiro, com exceção de que o atraso após o esquema VI era sinalizado por uma mudança na cor do disco. No terceiro componente vigorava um esquema VI de 123 ou 128 s, dependendo do atraso em vigor nos outros dois componentes. Três testes de resistência foram realizados: saciação, apresentação de alimento livre durante os períodos de blackout e extinção. Os três procedimentos provocaram decréscimos na taxa de respostas nos três componentes, porém de forma mais acentuada no componente com atraso não-sinalizado; o decréscimo na taxa de respostas do componente com atraso sinalizado foi semelhante ao do componente sem atraso. De todas as variáveis estudadas, a taxa de reforços é a que tem recebido maior atenção dos pesquisadores. Um grande número de pesquisas investigou os efeitos de reforçamento contínuo (CRF) versus reforçamento parcial (PRF) sobre a resistência à extinção, e um dado foi sistematicamente obtido: o ato de responder mantido por reforçamento parcial, geralmente, apresentou maior resistência à extinção. Esse efeito ficou conhecido como o “efeito do reforçamento parcial” (PRE, do inglês partial reinforcement effect). O PRE tem sido compreendido como resultado do que se chama decréscimo de generalização. Após um treino extensivo, os reforçadores passam a fazer parte da situação de estímulo na qual o treino ocorre e, quando a extinção começa, há uma mudança maior na situação de estímulo da condição de CRF para extinção do que da condição de PRF para extinção, pois o PRF já inclui períodos em que não ocorre reforçamento. Essa maior mudança na situação de estímulo provocada pela transição de CRF para extinção geraria um decréscimo maior na taxa de respostas (Grace e Nevin, 2000). Contudo, mais recentemente, esses dados têm sido alvo de questionamentos, sendo o principal deles o tipo de medida utilizado para avaliar a resistência à extinção. A medida de resistência à extinção nos estudos que demonstraram o PRE, em geral, era expressa em valores absolutos. Essa medida, como exposto an- ANÁLISE DO COMPORTAMENTO teriormente, não é uma medida fidedigna de resistência uma vez que não leva em consideração o nível da resposta antes da extinção. Ao fazer uma reanálise desses estudos usando, como medida de resistência, a taxa de respostas ao longo das sessões de extinção expressa como proporção da taxa de respostas na primeira sessão de extinção, Nevin (1988) observou que a inclinação da curva de extinção variava de um estudo para outro em função do total de reforços obtidos na condição anterior à extinção: quanto maior o total de reforços recebidos, mais a resistência à extinção da resposta mantida por CRF aumentava em relação à resistência à extinção da resposta mantida por PRF, chegando freqüentemente a superá-la. Os dados apresentados por Nevin (1988), junto com outros (Blackman, 1968; Bouzas, 1978; Nevin, 1974, 1984; Nevin, Mandell e Atak, 1983; Nevin et al., 1990), têm sugerido que a resistência a mudanças é função direta da taxa de reforços obtidos. Apesar da sistematicidade dos resultados obtidos nesses estudos, algumas variáveis importantes devem ser consideradas. Primeiro, a relação direta entre taxa de reforços e resistência a mudanças é observada basicamente com o uso de esquemas múltiplos, cujos componentes alternam com uma freqüência relativamente alta (durante a mesma sessão); se as diferentes taxas de reforços forem apresentadas em esquemas simples ou se os componentes alternarem a cada dia ou a cada semana, essa relação direta não se mantém (Cohen, 1998; Cohen, Riley e Wigley, 1993). Segundo, os estudos que obtiveram essa relação direta utilizaram, em sua grande maioria, procedimentos de operante livre, enquanto estudos que obtiveram PRE usaram procedimentos de tentativa discreta. Com esse segundo tipo de procedimento, o PRE pode ser observado apesar do uso de uma medida relativa e, até o momento, não se sabe exatamente que aspecto desse procedimento levaria a esse resultado. Por fim, a resistência a mudanças, assim como a taxa de respostas, não é determinada somente pela taxa de reforços obtidos em um componente isolado, mas depende da taxa de reforços de todos os outros comportamentos alternativos, fenômeno esse co- 67 nhecido como contraste comportamental (Nevin, 1992). Além das várias dimensões do estímulo reforçador, o tipo de evento usado como reforçador também pode afetar diferencialmente a resistência a mudanças. Mace e colaboradores (1997, Experimento 3) expuseram ratos a um esquema múltiplo cujos componentes diferiam somente no estímulo que era usado como reforçador (sacarina versus ácido cítrico). Em uma condição anterior, foi observado que os ratos apresentavam preferência por sacarina em relação ao ácido cítrico. Quando colocados em extinção, a resposta mantida por sacarina mostrou-se mais resistente do que a resposta mantida por ácido cítrico, sugerindo que a qualidade do reforçador também é uma variável importante. Variáveis sociais também podem afetar a resistência a mudanças. Santos (2001) investigou o efeito da presença de um outro indivíduo da mesma espécie sobre a resistência a saciação. Inicialmente, ratos foram expostos a um esquema múltiplo com dois componentes (VI 10 s e VI 90 s). Após a obtenção de taxa de respostas estável, os sujeitos foram submetidos a um procedimento de saciação antes da sessão experimental e expostos novamente ao esquema múltiplo. Contudo, nas sessões em que ocorria a saciação, os sujeitos poderiam estar sozinhos na caixa experimental ou na presença de outro rato, que poderia estar igualmente respondendo ou meramente presente. A mera presença do outro rato aumentou tanto a taxa absoluta de respostas quanto a resistência à saciação, porém o efeito sobre a resistência a mudanças só foi significante no componente VI 10 s. A própria topografia da resposta, ou a forma como a resposta é organizada, também pode ser afetada diferencialmente por mudanças no ambiente. Doughty e Lattal (2001), por exemplo, observaram que o comportamento de variação pode ser mais resistente a mudanças do que o comportamento de repetição. Nesse estudo, pombos foram expostos a um esquema múltiplo com dois componentes, sendo que, em ambos, a unidade de análise era seqüências de quatro respostas, emitidas em dois discos: E, para o disco da esquerda e D, para o 68 ABREU-RODRIGUES, RIBEIRO & COLS. disco da direita. Em um dos componentes, somente a seqüência EDED seria reforçada (componente de repetição); no outro, qualquer seqüência poderia ser reforçada desde que sua freqüência relativa se situasse abaixo de um patamar predeterminado (componente de variação). A taxa de reforços foi igualada entre os componentes e foram realizados dois testes de resistência: saciação antes da sessão e introdução de alimento livre entre os componentes. A resposta no componente de variação foi ligeiramente mais resistente aos dois testes realizados do que a resposta no componente de repetição, indicando que a resposta pode ser afetada diferencialmente por mudanças no ambiente em função da própria organização da resposta em análise. Os dados mencionados até o momento referem-se a pesquisas com animais não-humanos. Existem poucas pesquisas que investigaram o efeito de diferentes taxas de reforços sobre a resistência a mudanças com humanos, usando o modelo proposto por Nevin (1974). Desses, dois merecem destaque, ambos realizados com participantes que apresentavam atraso de desenvolvimento. Mace e colaboradores (1990) expuseram dois indivíduos com retardo mental a um esquema múltiplo com dois componentes. Em ambos os componentes, a tarefa dos sujeitos consistia em agrupar talheres em conjuntos de garfos, facas e colheres. Os componentes eram sinalizados pela cor dos talheres (verde e vermelho), e reforços eram liberados de acordo com diferentes esquemas VI em cada um. O comportamento sob investigação foi alterado pela introdução de um videoteipe durante a tarefa. A taxa de respostas caiu em ambos os componentes, porém mais acentuadamente no componente com menor taxa de reforço. Além disso, em uma segunda parte do experimento, reforços adicionais foram introduzidos, em um dos componentes, independentes da resposta dos sujeitos. Essa manipulação diminuiu a taxa de respostas nesse componente, porém aumentou a resistência à mudança quando o videoteipe foi introduzido. Dube e McIlvane (2001) obtiveram resultado semelhante, usando como tarefa um procedimento simples de discriminação condicional (pareamento de identidade) e esquemas de razão variável (VR) no lugar de esquemas VI. Se a quantidade de pesquisas sobre resistência a mudanças com reforçamento positivo já não é tão grande, menor ainda é a quantidade de pesquisas sobre a resistência de comportamentos mantidos por reforçamento negativo. Além disso, as poucas pesquisas que investigaram esse assunto são, em sua maioria, antigas e apresentam os mesmos problemas na análise dos dados que as primeiras pesquisas com reforçamento positivo (uso de uma medida absoluta em vez de uma medida relativa), de forma que seus resultados devem ser lidos com cautela. Dos estudos existentes, todos investigaram a resistência à extinção dos comportamentos de fuga e esquiva, usando choque como o estímulo aversivo, obtendo-se os seguintes resultados: a resistência à extinção dos comportamentos de fuga e esquiva aumenta com o aumento na intensidade do choque (Franchina, 1969; Stavely, 1966), com o acréscimo de um estímulo aviso (Shnidman, 1966) e com o aumento na freqüência de choques liberados (Courtney e Perone, 1992). Por outro lado, um aumento na probabilidade de reforço provoca uma diminuição na resistência à extinção de comportamentos de esquiva (Galvani, 1971; 1973; Olson, Davenport e Kamichoff, 1971). Dos estudos sobre resistência à extinção de comportamentos mantidos por reforçamento negativo, o trabalho de Courtney e Perone (1992) foi o único que usou uma medida relativa de resistência e o único em que a variável de interesse (freqüência de choques liberados) foi manipulada entre os componentes de um esquema múltiplo concorrente. Processos determinantes da resistência a mudanças A taxa de respostas durante o condicionamento e a resistência a mudanças (entendida como maior ou menor alteração em alguma medida da resposta quando alguma operação que a modifique é realizada) geralmente têm sido consideradas medidas de força da res- ANÁLISE DO COMPORTAMENTO posta. No entanto, já em 1938 (p. 85), Skinner sugeriu uma baixa correlação entre essas duas medidas: A definição de condicionamento que foi dada aqui é em termos de uma mudança na força do reflexo, mas o ato de reforçamento tem outro efeito distinto. Ele estabelece a potencialidade de uma curva de extinção subseqüente, cujo tamanho é uma medida da extensão do condicionamento. Não há uma relação simples entre essas duas medidas. É possível atingir uma taxa máxima de respostas (uma força máxima) muito rapidamente. Reforços adicionais não afetam essa medida, mas continuam a fortalecer a reserva descrita por uma curva de extinção subseqüente. O efeito típico do “supercondicionamento” é sentido não em alguma propriedade imediata do comportamento, mas sobre suas mudanças subseqüentes durante a extinção. (A ausência de uma relação entre as duas medidas não é incompatível com o pressuposto de uma relação entre taxa e reserva devido à interposição da reserva imediata limitada.) (itálico adicionado) Alguns estudos têm reforçado a proposição de uma ausência de relação entre taxa de respostas e resistência a mudanças. Fath e colaboradores (1983), por exemplo, expuseram pombos a um esquema múltiplo VI 60 s VI 60 s, aos quais sobrepuseram um procedimento de pacing, segundo o qual as respostas só seriam reforçadas se ocorressem em uma taxa específica. Essa estratégia experimental diferenciou a taxa de respostas entre os componentes, mantendo a taxa e a probabilidade de reforços constantes entre eles. Taxas de respostas diferentes mantidas pela mesma probabilidade de reforço apresentaram a mesma resistência quando alimento livre foi introduzido entre os componentes. Por outro lado, Blackman (1968), usando um procedimento de supressão condicionada, observou que taxas de respostas semelhantes mantidas por diferentes taxas de reforços apresentaram resistência diferenciada. Esses dados levaram Nevin (1984) a sugerir que a taxa de respostas e a resistência a mudanças seriam determinadas por processos distintos. Mais precisamente, a taxa de respos- 69 tas seria determinada pela relação de contingência entre resposta e conseqüência (relação R-S), enquanto a resistência a mudanças seria determinada pela relação de contingência entre estímulo antecedente e conseqüência (relação S-S). Existe uma relação de contingência entre dois eventos A e B quando a probabilidade de B ocorrer dada a presença de A for maior do que em sua ausência. Assim, quanto maior a probabilidade de a conseqüência ocorrer na presença de um estímulo ou de uma resposta, em comparação com sua ausência, mais forte será a relação entre eles. Uma série de estudos tem sido realizada com o objetivo de avaliar a proposta de Nevin (1984) e, de forma geral, essa proposta tem recebido algum apoio empírico (Nevin et al., 1990; Nevin, Smith, e Roberts, 1987). Em um estudo freqüentemente citado, Nevin e colaboradores (1990), enfraqueceram a relação RS, ao mesmo tempo em que fortaleceram a relação S-S, ao fornecerem uma fonte alternativa de reforços na presença do mesmo estímulo antecedente. No Experimento 1, os sujeitos foram expostos a um esquema múltiplo no qual esquemas VI idênticos vigoravam nos dois componentes. Em um dos componentes, além do esquema VI, o alimento era liberado independentemente da resposta, de acordo com um esquema VT, em uma taxa que variava de 40 a 240 reforços por hora. Dessa forma, a relação R-S foi enfraquecida – visto que parte do alimento liberado no componente era independente da resposta – e o enfraquecimento dessa relação provocou um decréscimo na taxa de respostas que foi diretamente relacionado à quantidade de alimento livre obtido. Contudo a relação S-S foi fortalecida no componente com reforços adicionais, já que uma maior quantidade de alimento era recebida na presença do estímulo que sinalizava aquele componente. Para avaliar a proposta de que a resistência a mudanças seria aumentada pelo fortalecimento da relação S-S, dois testes de resistência a mudanças foram realizados: saciação e extinção. Nos dois testes, a proposta foi confirmada: quanto maior a taxa de reforços obtidos, contingentes ou não à resposta, maior foi a resistência. No Experimento 2, re- 70 ABREU-RODRIGUES, RIBEIRO & COLS. sultados semelhantes foram obtidos, usando um procedimento ligeiramente diferente: nesse caso, os reforços adicionais poderiam ser obtidos respondendo em outro disco, cuja cor era a mesma que sinalizava o componente. Além disso, um outro estudo mostrou que os reforçadores liberados independentemente da resposta podem ser qualitativamente diferentes dos reforçadores liberados dependentes da resposta e, mesmo assim, a resistência é aumentada. No estudo de Grimes e Shull (2001), os sujeitos (ratos) respondiam em um esquema múltiplo e recebiam pelotas de alimento como reforçador. Em um dos componentes, leite condensado era liberado independentemente da resposta e, após a obtenção de taxas de respostas estáveis, a extinção era realizada. A resistência à extinção foi maior no componente no qual o leite condensado era liberado independentemente da resposta, resultado semelhante ao de Nevin e colaboradores (1990). Esses resultados, em conjunto, salientam a importância de se considerarem todas as conseqüências que estão sendo liberadas dentro de um contexto ou mesmo em contextos semelhantes, a despeito do tipo de conseqüência. Apesar disso, mais recentemente, tem-se observado a influência de algumas relações RS sobre a resistência a mudanças (Bell, 1999; Nevin et al., 2001). No estudo de Bell, descrito anteriormente, em um dos componentes vigorava um esquema VI 120 s mais um atraso não-sinalizado de 3 s, enquanto em outro componente vigorava um esquema VI 123 s. Dessa forma, o tempo entre o início do componente e a liberação do reforço era idêntico entre os componentes (igual relação S-S), porém o atraso não-sinalizado enfraquecia a relação R-S. Como descrito, o atraso do reforço não-sinalizado enfraqueceu a resistência a mudanças, mostrando que esta também pode ser afetada por modificações na relação R-S. Resistência a mudanças e preferência As variáveis que afetam a resistência a mudanças parecem também afetar a preferência de uma alternativa entre várias dispostas em esquemas concorrentes encadeados. Nevin (1979) sugeriu que tanto a resistência a mudanças quanto a preferência são manifestações de um constructo maior, a massa comportamental, que seria análoga à massa de um corpo físico. Alguns estudos têm mostrado que a resistência a mudanças e a preferência entre elos terminais de esquemas concorrentes encadeados realmente são co-variantes. Grace e Nevin (1997) expuseram pombos a duas situações na mesma sessão experimental. Na primeira parte da sessão, vigoravam esquemas concorrentes encadeados com elos iniciais iguais e elos terminais que diferiam somente na taxa de reforços liberados. Na segunda parte, os elos terminais dos esquemas concorrentes encadeados usados na primeira parte da sessão foram apresentados em esquemas múltiplos. A resistência a mudanças foi testada com a liberação de alimento livre no intervalo entre os componentes do esquema múltiplo, e a preferência foi avaliada pela proporção de respostas nos elos iniciais. Tanto a preferência quanto a resistência a mudanças mostraram-se diretamente relacionadas à taxa de reforços liberados. Além disso, preferência e resistência apresentaram alta correlação entre si, o que sugere que essas duas medidas podem ser expressões diferentes e independentes de um mesmo constructo, como sugerido por Nevin (1979). Resultados semelhantes foram obtidos com componentes de duração constante ou variável (Grace e Nevin, 2000) e com manipulações na magnitude do reforço (Grace, Beddel e Nevin, 2002). Resistência a mudanças versus sensibilidade comportamental versus efeitos da história de reforçamento Outras áreas dentro da análise do comportamento, além daquela sobre resistência a mudanças, observam a manutenção de padrões de respostas após a alteração de alguma variável ambiental. Entre elas, destacam-se os estudos sobre a sensibilidade comportamental e sobre os efeitos de história de reforçamento e punição. Embora a nomenclatura seja diferen- ANÁLISE DO COMPORTAMENTO te, todas essas áreas compartilham um mesmo interesse: a persistência de padrões de comportamento anteriormente reforçados quando mudanças nas contingências são realizadas. Essa persistência tem sido denominada, por diferentes grupos de pesquisadores, de alta resistência a mudanças, baixa sensibilidade comportamental ou efeito de história. O termo sensibilidade comportamental é geralmente usado em dois contextos diferentes. O primeiro deles se refere à área de escolha e de preferência. Nas pesquisas dessa área, o procedimento padrão consiste em expor os sujeitos a um esquema concorrente, cujos componentes são, em geral, esquemas VI que liberam diferentes taxas de reforços. Após as taxas de respostas tornarem-se estáveis, os valores dos esquemas VI são alterados ao longo de várias condições, e a proporção de respostas em cada uma das alternativas é calculada. Herrnstein (1961) observou que a proporção de respostas em cada alternativa igualava a proporção de reforços liberados naquela alternativa. Esse resultado ficou conhecido como a lei da igualação e tem sido replicado várias vezes (p. ex.: Brownstein e Pliskoff, 1968; Reynolds, 1963). Baum (1974), entretanto, observou que a lei da igualação parecia não descrever acuradamente alguns resultados obtidos por meio do procedimento já descrito. Alguns sujeitos apresentavam grandes mudanças na proporção de respostas em face de pequenas mudanças na proporção de reforços; outros sujeitos, por sua vez, apresentavam o padrão contrário. Em função disso, foram acrescentados dois parâmetros à lei da igualação: o viés e a sensibilidade. O viés refere-se a uma preferência por uma das alternativas que se mantém apesar das manipulações na taxa de reforços. A sensibilidade, por outro lado, é uma medida que mostra o quanto o comportamento muda em função de mudanças na taxa de reforços. Nesse sentido, a sensibilidade comportamental seria o contrário da resistência a mudanças: uma alta sensibilidade seria equivalente a uma baixa resistência a mudanças e vice-versa. A única diferença seria o tipo de operação utilizada (ver Capítulo 9 para uma discussão mais detalhada sobre escolha e preferência). 71 É interessante notar que a sensibilidade comportamental estudada na área de escolha pode ser influenciada, assim como a resistência a mudanças, pela relação de contingência entre o estímulo antecedente e a conseqüência. Por exemplo, Todorov e colaboradores (1983) expuseram alguns pombos a diferentes pares de esquemas concorrentes VI VI em 9 condições de 30 sessões cada (Fase 1) e a 5 condições de 55 sessões cada (Fase 2). Os mesmos estímulos antecedentes foram utilizados em todas as condições. Os resultados mostraram que a sensibilidade comportamental em ambas as fases diminuiu com o aumento no número de condições experimentais e aumentou com o aumento no número de sessões. O decréscimo da sensibilidade com o aumento no número de condições pode ter sido devido ao fato de que, apesar de os valores dos esquemas VI terem mudado, o estímulo antecedente permaneceu o mesmo. Ao se mudarem os valores dos esquemas, padrões anteriormente reforçados na presença dos estímulos antecedentes tenderam a persistir, sendo tal persistência evidenciada na baixa sensibilidade (ou alta resistência) às mudanças nos valores dos esquemas. Um suporte adicional para essa possibilidade foi fornecido posteriormente por Hanna, Blackman e Todorov (1992). Nesse estudo, seis pombos foram expostos a 20 combinações de cinco valores de esquemas VI arranjados concorrentemente, em uma sessão de 5 h. Na primeira fase, para três sujeitos, cada valor de intervalo era sinalizado por uma cor diferente, enquanto para os outros três, a cor do disco de resposta era sempre a mesma, independente do esquema em vigor. Na segunda fase, as condições de estímulos foram revertidas para cada pombo. A presença de estímulos diferentes sinalizando diferentes esquemas exerceu um controle sobre a taxa de respostas logo na primeira hora de sessão; já nas condições com estímulos antecedentes iguais, as taxas de respostas foram inicialmente semelhantes, tornando-se diferenciadas após a segunda hora de sessão. A sensibilidade comportamental também foi afetada pela presença de diferentes estímulos, sendo alta desde o início da sessão (valores próximos a 1) em comparação com a 72 ABREU-RODRIGUES, RIBEIRO & COLS. condição na qual os esquemas foram sinalizados pela mesma cor. Novamente, quando o estímulo antecedente permaneceu o mesmo, pode-se supor que padrões de comportamento anteriormente reforçados tenderam a permanecer, diminuindo a sensibilidade (ou aumentando a resistência) às mudanças nas contingências. Esses dados, em conjunto, apontam para a importância da relação entre o estímulo antecedente e a conseqüência como determinante da sensibilidade em procedimentos de escolha, assim como da resistência a mudanças em esquemas múltiplos. O segundo contexto no qual o termo sensibilidade é utilizado é na área de comportamento governado por regras. Vários estudos presentes na literatura têm mostrado que o uso de regras pode tornar o comportamento insensível a mudanças nas contingências ambientais (Catania, Shimoff e Matthews, 1989; Hayes et al., 1986; Otto, Torgrud e Holborn, 1999). O procedimento básico para a avaliação da insensibilidade do comportamento governado por regras envolve a exposição dos sujeitos a uma contingência precedida por uma instrução. Depois de algum tempo, a contingência é modificada e mudanças no comportamento são registradas. Se o comportamento for alterado em função da mudança na contingência, ele é dito sensível; caso contrário, é considerado insensível (Madden, Chase e Joyce, 1998). Alternativamente, podese manter a contingência e mudar as instruções fornecidas. Nesse caso, o comportamento seria dito sensível caso não se alterasse com a mudança nas instruções. Um exemplo desse último tipo de procedimento foi apresentado no estudo de Kauffman, Baron e Kopp (1966), no qual estudantes universitários foram expostos a uma tarefa por seis sessões de 30 min, nas quais estava em vigor um esquema VI 1 min. Além disso, os autores forneceram instruções precisas e imprecisas aos sujeitos: para alguns deles, foi dito que deveriam responder de acordo com um esquema VI 1 min; para outros, que deveriam responder de acordo com um esquema FI 1 min e, para os demais, de acordo com um esquema VR 150. Todos os participantes responderam conforme o padrão descrito na instrução, da pri- meira à última sessão, mostrando insensibilidade à contingência programada ou, alternativamente, alta resistência a mudanças (ver Capítulo 12 para informações mais detalhadas sobre a sensibilidade do comportamento governado por regras). Apesar de alguns autores terem argumentado que a insensibilidade é uma característica intrínseca ao comportamento governado por regras, ela também pode ser entendida à luz do conceito de resistência a mudanças. As instruções utilizadas nos procedimentos dessa área são estímulos antecedentes verbais que podem funcionar como estímulos discriminativos (Okouchi, 1999), operações estabelecedoras (Michael, 1982) ou operações que alteram a função de outros estímulos (Schlinger, 1993). Independentemente da função exercida, as instruções são correlacionadas com a ocorrência de reforçamento, tanto positivo quanto negativo. Essa alta correlação entre estímulo antecedente e conseqüência pode ser responsável pela resistência a mudanças comumente observada em comportamentos sob controle funcional de instruções. Por outro lado, se a relação entre a instrução e a conseqüência é enfraquecida, o comportamento rapidamente muda em face das contingências alteradas, como demonstrou Galizio (1979). No Experimento 3 desse estudo, dois participantes foram expostos a quatro componentes de um esquema múltiplo e lhes foi dito que os estímulos antecedentes sinalizavam a ocorrência de perdas monetárias, que poderiam acontecer ou não a cada 10, 30 ou 60 s, dependendo do componente. Inicialmente, a contingência de perda não estava em vigor (condição sem contato); em seguida, perdas monetárias aconteciam a cada 10 s, independente do componente (condição com contato), após a qual a condição sem contato foi retomada. Além disso, em cada uma das condições, o experimentador dizia aos participantes que, na presença de uma luz laranja, as instruções recebidas seriam sempre precisas; quando uma luz púrpura se acendesse, as instruções seriam inacuradas. Na primeira condição sem contato, o desempenho dos participantes foi de acordo com as instruções recebidas, a despeito de sua precisão. Na condição com contato, os partici- ANÁLISE DO COMPORTAMENTO pantes continuaram comportando-se de acordo com as instruções quando estas eram “precisas”, mas as abandonaram rapidamente quando eram “imprecisas”. Nessa condição, a correlação entre a instrução (estímulo antecedente) e a conseqüência foi diminuída. Na condição seguinte (sem contato), os participantes abandonaram as instruções quando estas eram imprecisas, ao contrário do que aconteceu na primeira exposição a essa condição, indicando uma alta sensibilidade à contingência ou, alternativamente, baixa resistência a mudanças. Esses dados sugerem que, novamente, a relação de contingência entre antecedente e conseqüência parece ser uma importante variável na determinação da (in)sensibilidade comportamental. Uma segunda variável que guarda semelhança com a resistência a mudanças é o chamado “efeito de história”. Esse efeito também se refere à observação da persistência de padrões de respostas, anteriormente reforçadas sob um tipo de esquema de reforçamento, quando as contingências são alteradas. Um experimento típico delineado para investigar o efeito de história envolve a exposição dos sujeitos a um tipo de esquema de reforçamento, o qual posteriormente é substituído por outro. O efeito de história é observado quando padrões de respostas emitidos no primeiro esquema permanecem no esquema seguinte. Wanchisen, Tatham e Mooney (1989), por exemplo, observaram o efeito de história expondo ratos a um esquema VR e, em seguida, a um esquema FI. Um segundo grupo (controle) foi exposto somente ao esquema FI. Em contraste com o grupo controle, os ratos inicialmente expostos ao esquema VR exibiram, no esquema FI, taxas de respostas altas e pausas pós-reforço curtas, padrões de respostas tipicamente encontrados sob o esquema VR, sugerindo que a resposta sob contingências atuais pode ser influenciada por contingências passadas. Essa persistência da resposta é comumente descrita como efeito da história de reforçamento, mas pode igualmente ser considerada como evidência de alta resistência ou baixa sensibilidade a mudanças (ver Capítulo 3 para informações mais detalhadas sobre história de reforçamento). 73 O efeito de história pode igualmente ser influenciado pela taxa de reforços, assim como a resistência a mudanças. Okouchi e Lattal (2000) testaram essa possibilidade ao treinarem pombos em um esquema múltiplo em cujos componentes vigoravam esquemas tandem VI DRL. Os valores dos esquemas VI foram ajustados de maneira a tornar a taxa de reforços em um dos componentes maior do que no outro. Em seguida, os esquemas tandem VI DRL foram substituídos por esquemas FI de diferentes valores, porém os estímulos que sinalizavam cada componente foram mantidos. Durante o treino, os sujeitos responderam em taxas baixas e semelhantes nos dois componentes. Quando houve a mudança para o esquema FI, a resposta permaneceu em taxas baixas (padrão anteriormente reforçado no esquema DRL) na presença do estímulo associado com a maior taxa de reforços durante o treino por mais tempo do que a resposta no componente com menor taxa de reforços, replicando os resultados encontrados na literatura de resistência a mudanças. Com isso, podemos concluir que a análise dos conceitos de resistência a mudanças, de sensibilidade comportamental e de efeito de história acaba por revelar grandes semelhanças ou, até mesmo, superposições. Nos três casos, a variável de interesse é a persistência de padrões de comportamento. Em segundo lugar, o mesmo processo parece ser responsável pela ocorrência dessas três variáveis: a relação entre o estímulo antecedente e a conseqüência, como os estudos citados têm demonstrado. Apesar de existirem diferenças de procedimento e de as variáveis de interesse não serem exatamente as mesmas, as semelhanças encontradas levantam a possibilidade, pouco estudada, de interação entre diferentes áreas de pesquisas. Conforme Sidman (1960), o mais produtivo para a ciência é a busca de similaridades, e não de diferenças. Por exemplo, interrelações entre fenômenos podem conduzir à integração de áreas de pesquisa, e perguntas de uma área podem ser esclarecidas ou complementadas por outra. Além disso, perguntas que já foram formuladas em uma área podem suscitar outros questionamentos em áreas afins. Assim, pesquisadores que, até o momento, trabalharam separadamente poderiam 74 ABREU-RODRIGUES, RIBEIRO & COLS. beneficiar-se dos conhecimentos produzidos em outras áreas que não se restringem às discutidas aqui, caso semelhanças entre elas sejam identificadas. APLICAÇÕES DOS CONCEITOS DE MOMENTO COMPORTAMENTAL E DE RESISTÊNCIA A MUDANÇAS O conceito de resistência a mudanças, junto com os dados obtidos em pesquisa básica, tem sido utilizado por alguns pesquisadores na solução de problemas aplicados. O comportamento sobre o qual existe um maior número de trabalhos aplicados é a aquiescência a instruções (Strand, 2000). O procedimento padrão nesses estudos compreende a apresentação de uma instrução a que o participante raramente obedece (instrução de baixa probabilidade), precedida por um conjunto de instruções a que o participante freqüentemente obedece (instruções de alta probabilidade). Com o uso desse procedimento, ocorre um aumento na freqüência com a qual a instrução de baixa probabilidade controla o comportamento do participante. A lógica por trás do uso desse procedimento é a seguinte: o comportamento de seguir instruções é uma classe de respostas de ordem superior (nesse caso, chamada aquiescência), que abarca várias instâncias nas quais instruções são fornecidas. Dentro dessa classe, algumas instruções controlam mais facilmente o comportamento do participante e são aquelas a que o participante obedece com uma alta probabilidade; outras instruções dificilmente controlam o comportamento do participante. Usando a metáfora do momento comportamental, a introdução de instruções que o participante dificilmente segue pode ser considerada uma DO, algo que vai alterar o fluxo comportamental normal do indivíduo. Contudo, uma vez que tanto as instruções de alta probabilidade quanto as instruções de baixa probabilidade pertencem à mesma classe de respostas de ordem superior (aquiescência), o reforçamento de algumas instâncias dessa classe pode aumentar a resistência a mudanças da classe como um todo, inclusive das instâncias com baixa probabilidade de ocorrência. Esse fenômeno foi observado nos exemplos a seguir. Mace e colaboradores (1988) realizaram uma série de experimentos, investigando os efeitos do reforçamento da aquiescência a uma série de instruções de alta probabilidade sobre a aquiescência a uma instrução de baixa probabilidade, com participantes que apresentavam atraso no desenvolvimento. No Experimento 1, o participante foi exposto a cinco condições. Na linha de base, instruções de baixa probabilidade, tanto afirmativas (p. ex.: “Por favor, afaste sua lancheira”) quanto negativas (p. ex.: “por favor, não coloque sua lancheira na mesa”), eram apresentadas em intervalos de 1 min e, se seguidas, tinham como conseqüência um elogio. Nas condições seguintes, ora as instruções de baixa probabilidade afirmativas, ora as negativas, eram precedidas por três ou quatro instruções de alta probabilidade (p. ex.: “venha cá e me dê um abraço”), afirmativas ou negativas, respectivamente, também tinham um elogio como conseqüência. A introdução de instruções de alta probabilidade aumentou significativamente a aquiescência às instruções de baixa probabilidade. No Experimento 2, os autores adicionaram uma condição-controle, na qual somente atenção era dada ao participante antes de uma instrução de baixa probabilidade, o que não foi suficiente para aumentar a aquiescência; o reforçamento do seguimento de instruções de alta probabilidade foi necessário para que esse aumento ocorresse. No Experimento 3, foi investigado o efeito da taxa de reforços sobre a aquiescência. O procedimento foi semelhante ao do Experimento 1. Contudo em algumas condições o experimentador, depois de ter fornecido a última instrução de alta probabilidade, fazia uma pausa de 20 s antes de fornecer a instrução de baixa probabilidade; em outras condições, a pausa era de 5 s. Uma pausa maior entre as instruções supostamente diminuiria a taxa de reforços, e os resultados, condizentes com a literatura de pesquisa básica, mostraram que o aumento da pausa diminuiu a probabilidade de aquiescência. No Experimento 4, o procedimento de instruções de alta probabilidade foi usado para diminuir a latência ao iniciar tare- ANÁLISE DO COMPORTAMENTO fas instruídas e, no Experimento 5, o procedimento foi usado para diminuir o tempo de execução de tarefas (no caso, os vários passos que deveriam ser realizados ao tomar banho). O procedimento foi semelhante ao do Experimento 1. Novamente, o fornecimento de instruções de alta probabilidade diminuiu a latência para iniciar uma tarefa exigida e o tempo para a execução de tarefas. Os efeitos observados no estudo de Mace e colaboradores (1988) também podem ser influenciados pelo tipo de reforçador utilizado. Conforme anteriormente descrito, Mace e colaboradores (1997, Experimento 3) mostraram que o comportamento de ratos mantido por sacarina foi mais resistente à extinção do que o comportamento mantido por ácido cítrico, apesar de a taxa de reforços ter sido semelhante nos dois casos. Nos Experimentos 1 e 2 desse mesmo estudo, os autores observaram o efeito da exposição ao procedimento de instruções de alta probabilidade, de forma semelhante ao estudo de Mace e colaboradores (1988), porém manipulando o tipo de reforçador. Em algumas condições, seguir as instruções de alta probabilidade era reforçado com elogios; em outras, com alimento. Seguir as instruções de baixa probabilidade, apresentadas em seguida às instruções de alta probabilidade, era reforçado sempre com elogio, independentemente da condição. Os resultados dos dois experimentos mostraram uma relação clara entre o tipo de reforçador e o aumento na probabilidade de aquiescência: quando o alimento era usado como reforçador, a probabilidade de aquiescência era maior do que quando eram usados elogios como reforço. Além disso, esses resultados são compatíveis com a noção de que a resistência a mudanças e a preferência estão intimamente relacionadas, pois, nos três experimentos, o reforçador que se mostrou mais eficaz em aumentar a resistência foi o mesmo para o qual os participantes já apresentavam uma preferência anterior. Esses dados, juntamente com aqueles obtidos por Grace e Nevin (1997), sugerem que uma boa forma de se identificar os reforçadores que serão mais eficazes em produzir alta resistência é identificar os eventos preferidos pelos participantes. 75 O procedimento de instruções de alta probabilidade também foi usado com sucesso para melhorar o desempenho na resolução de problemas matemáticos em participantes sem atraso no desenvolvimento e sem o uso de reforçadores arbitrários. Belfiore, Lee, Vargas e Skinner (1997) realizaram inicialmente uma avaliação de preferência entre exercícios de multiplicação com um ou três dígitos. As participantes foram duas adolescentes que estudavam em uma escola alternativa, pois haviam sido expulsas da escola regular, em função de se recusarem a iniciar tarefas e a obedecer às normas da escola. Os resultados da avaliação de preferência mostraram que ambas as participantes preferiam exercícios de multiplicação com um único dígito. Em seguida, a latência para iniciar os problemas de multiplicação com três dígitos foi avaliada em duas condições: na primeira, as participantes eram simplesmente expostas aos problemas com três dígitos; na segunda, antes de cada problema com três dígitos, as participantes eram expostas a três problemas de multiplicação com um único dígito. Nenhum tipo de feedback era fornecido pelos investigadores em nenhuma condição. A latência para iniciar os problemas de três dígitos diminuiu significativamente com a introdução dos três problemas de multiplicação com um único dígito. Esses resultados foram replicados posteriormente por Belfiore, Lee, Scheeler e Klein (2002). Esses dados são interessantes ao se pensar na generalidade da aplicação do procedimento de instruções de alta probabilidade. Primeiro, nesses dois estudos, as atividades de alta probabilidade e as atividades de baixa probabilidade eram funcionalmente relacionadas, uma vez que ambas consistiam na resolução de problemas matemáticos equivalentes, diferindo somente no grau de complexidade (em contraste com estudos anteriores, nos quais as instruções de alta probabilidade não tinham uma relação tão clara com as de baixa probabilidade). Segundo, o evento reforçador para os problemas era a própria conclusão do problema, e não algum evento estabelecido arbitrariamente (p. ex.: elogio). Em uma situação natural, é praticamente impossível dar a atenção individual que seria necessária para a liberação de reforçadores ar- 76 ABREU-RODRIGUES, RIBEIRO & COLS. bitrários. O uso de reforçadores naturais aumenta, assim, a generalidade da aplicação do procedimento para situações nas quais o controle das conseqüências pelo investigador não pode ser feito individualmente, como em uma sala de aula, por exemplo. A metáfora do momento comportamental tem sido empregada em várias outras situações, como, por exemplo, em hospitais. Esses estudos têm demonstrado um aumento da aquiescência aos procedimentos médicos (McComas, Wacker e Cooper, 1998), iniciação de contatos sociais (Davis et al., 1994), redução de comportamentos autolesivos e agressão (Horner et al., 1991) e redução de estereotipias (Mace e Belfiore, 1990). Outros estudos, apesar de não terem sido diretamente delineados dentro do quadro conceitual do momento comportamental, podem ser considerados como tal. Por exemplo, Parpal e Maccoby (1985) observaram que um aumento nas interações parentais recíprocas com crianças durante brincadeiras aumentava a probabilidade de elas obedecerem aos pedidos posteriores de suas mães para que guardassem os brinquedos. Dentro da perspectiva do momento comportamental, ao se engajarem em interações recíprocas com as crianças, os pais podem acabar reforçando uma ampla classe de respostas que poderiam ser denominadas de cooperação. O reforçamento dessa classe de respostas durante as brincadeiras pode ter aumentado a resistência a mudanças dessas respostas, fazendo com que as mesmas permanecessem, mesmo na ausência de reforçamento. A metáfora do momento comportamental e o procedimento de alta probabilidade também podem ter funções heurísticas até mesmo em áreas nas quais um teste experimental não pode ser facilmente realizado, como na análise de jogos esportivos. Por exemplo, Mace e colaboradores (1992) analisaram sete jogos de basquete e investigaram, por meio de correlações, duas questões: a) se a resposta de um time de basquete a uma situação aversiva – considerada uma DO – durante o jogo estaria relacionada à taxa local de reforços que precedia a situação aversiva; b) se um pedido de tempo seria uma intervenção efetiva na redução do momento comportamental do time adversário. Para responder à primeira questão, eles calcularam a porcentagem de adversidades a que um time respondeu favoravelmente em função da taxa de reforços anterior à adversidade (a taxa de reforços foi calculada dividindo-se o número de eventos considerados reforçadores por períodos de 3 min e agrupada em classes discretas). Esse cálculo mostrou que a porcentagem de adversidades a que um time respondia favoravelmente apresentou correlação positiva com a taxa de reforços anterior. A segunda questão foi avaliada calculando-se a razão de reforço (taxa de reforços do time adversário dividida pela do time alvo) 3 min antes e 3 min depois de um pedido de tempo. Esse cálculo revelou que o pedido de tempo foi eficaz na redução da taxa de reforços do time adversário. Esses resultados, apesar de correlacionais, são consistentes com os resultados de Mace e colaboradores (1988), que observaram que a probabilidade de se engajar em um comportamento de baixa probabilidade era aumentada se este fosse precedido por reforçamento de comportamentos de alta probabilidade pertencentes à mesma classe e que esse efeito é afetado pelo tempo desde o último reforço (Experimento 3). A metáfora do momento comportamental, junto com os dados de pesquisas sobre resistência a mudanças, também pode lançar luz sobre tratamentos já tradicionais em análise aplicada do comportamento. Por exemplo, um dos procedimentos mais usados no tratamento de comportamentos disfuncionais é o reforçamento diferencial de outros comportamentos (DRO), que consiste no fornecimento de reforçadores para comportamentos incompatíveis ou quaisquer outros comportamentos que não sejam o comportamento-alvo. Esse procedimento provoca uma redução na freqüência do comportamento-alvo, como predito pela Lei da Igualação (McDowell, 1982). Entretanto um efeito colateral indesejável pode ocorrer em função do uso desse procedimento. Nevin e colaboradores (1990) mostraram ANÁLISE DO COMPORTAMENTO que a adição de reforçadores, contingentes ou não a uma outra resposta, no mesmo contexto diminui a freqüência da resposta sob análise, mas aumenta sua resistência a mudanças. O uso do procedimento DRO, nesse sentido, pode diminuir a taxa da resposta sob análise, mas pode aumentar sua persistência quando alguma condição for alterada. Segundo Mace (2000), ele e seus colaboradores testaram essa possibilidade, usando dois procedimentos de extinção de comportamentos problemáticos com crianças com atraso no desenvolvimento. Em uma fase, o procedimento de extinção foi precedido por uma linha de base de reforçamento intermitente. Em outra, o procedimento de extinção foi precedido por tratamento com reforçamento diferencial de comportamentos adaptativos no mesmo contexto no qual os comportamentos problemáticos ocorriam e eram reforçados. A freqüência de comportamentos problemáticos diminuiu com o reforçamento diferencial de comportamentos adaptativos, porém os comportamentos problemáticos foram muito mais resistentes à extinção quando esta era precedida por DRO, em comparação com reforçamento intermitente. Apesar de não ter havido uma condição na qual o procedimento DRO ocorria em um contexto diferente do contexto em que os comportamentos problemáticos eram reforçados, esse estudo sugere que o contexto no qual o procedimento DRO ocorre deve ser levado em consideração por clínicos e por pesquisadores que o utilizarem como forma de intervenção. A pesquisa básica sobre resistência a mudanças também pode lançar luz sobre outras áreas em análise aplicada do comportamento. A análise que Rachlin (1995) fez do autocontrole, por exemplo, tem semelhanças com o modelo de momento comportamental. Esse autor propôs que o autocontrole envolve um padrão de engajamento em comportamentos altamente valorizados (p. ex.: um estilo de vida sadio), apesar da presença de alternativas tentadoras (p. ex.: comidas gordurosas, consumo de bebidas alcoólicas, etc.). As alternativas tentadoras, nesse caso, podem ser entendidas dentro do modelo de momento comportamental como formas de DO, já que podem alterar o progresso dos comportamentos altamente va- 77 lorizados. Esses comportamentos altamente valorizados seriam reforçados por conseqüências de grande magnitude (p. ex.: saúde) e, se elas fossem imediatas e ocorressem com alta freqüência, esses comportamentos seriam realmente muito resistentes às tentações. Contudo as conseqüências que mantêm esses comportamentos são geralmente atrasadas ou podem nunca acontecer, o que dificulta a aquisição e a manutenção dos mesmos. Ainda com base nos dados de Nevin e colaboradores (1990), Nevin e Grace (2000) sugeriram que a escolha por comportamentos saudáveis, por exemplo, poderia ser aumentada com a adição de reforçadores adicionais não relacionados à saúde, tal como ouvir músicas preferidas em ambientes associados à emissão de comportamentos saudáveis. Essa análise é obviamente especulativa e merece a realização de trabalhos empíricos que a investiguem com mais detalhes, mas fornece uma sugestão bastante promissora de como aumentar os comportamentos de autocontrole (ver Capítulo 10 para informações mais detalhadas sobre autocontrole). CONCLUSÃO Com os avanços metodológicos e refinamentos na análise dos dados, têm sido obtidas relações sistemáticas e quantificáveis entre o grau de persistência da resposta em face de modificações no ambiente e algumas variáveis ambientais, tais como a taxa e a magnitude de reforços. A obtenção dessas relações sistemáticas e a identificação dos processos comportamentais por trás delas têm ressaltado a relevância do papel do contexto no qual o comportamento ocorre, das relações entre os estímulos antecedentes à resposta e os estímulos que a sucedem. Cada vez mais, observamos que os estímulos que sucedem a ocorrência de uma resposta não selecionam simplesmente classes de respostas, mas relações entre os estímulos antecedentes e essas classes de respostas. São esses estímulos antecedentes que servirão de guia para o comportamento em situações futuras (Donahoe e Palmer, 1994); são eles que fazem a ponte entre o passado, o presente e o futuro. 78 ABREU-RODRIGUES, RIBEIRO & COLS. A observação de que existem conceitos intimamente relacionados, tal como mostraram Grace e Nevin (1997) em relação à resistência a mudanças e à preferência, ou como foi sugerido anteriormente, mesmo que especulativamente, em relação aos conceitos de resistência a mudanças, sensibilidade e efeito de história, aponta para uma possibilidade instigante: a possibilidade de uma teoria unificada do comportamento, coerente internamente e com alto grau de generalidade. Precisamos de mais estudos que lidem diretamente com essa questão, de análises que sistematizem melhor os dados existentes. O conceito de momento comportamental, com seus componentes velocidade e massa comportamental, tem muito a oferecer, desencadeando esse processo de unificação. REFERÊNCIAS BIBLIOGRÁFICAS Baum, W. M. (1974). On two types of deviation from the matching law: Bias and undermatching. Journal of the Experimental Analysis of Behavior, 22, 231-242. Belfiore, P. J.; Lee, D. L.; Scheeler, M. C.; Klein, D. (2002). Implications of behavioral momentum and academic achievement for students with behavior disorders: Theory, application, and practice. Psychology in the Schools, 39, 171-179. Belfiore, P. J.; Lee, D. L.; Vargas, A. U.; Skinner, C. H. (1997). Effects of high-preference single-digit mathematics problem completion on multiple-digit mathematics problem performance. Journal of Applied Behavior Analysis, 30, 327-330. Bell, M. C. (1999). Pavlovian contingencies and resistance to change in a multiple schedule. Journal of the Experimental Analysis of Behavior, 72, 81-96. Blackman, D. (1968). Response rate, reinforcement frequency, and conditioned suppression. Journal of the Experimental Analysis of Behavior, 11, 503-516. Bouzas, A. (1978). The relative law of effect: Effects of shock intensity on response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 30, 307-314. Brownstein, W. N.; Pliskoff, S. S. (1968). Some effects of relative reinforcement rate and changeover delay on response independent concurrent schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 11, 683-688. Catania, A. C.; Shimoff, E.; Matthews, B. A. (1989). An experimental analysis of rule-governed behavior. Em S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies and instructional control (p. 119-150). New York: Plenum Press. Cohen, S. L. (1998). Behavioral momentum: The effects of the temporal separation of the rates of reinforcement. Journal of the Experimental Analysis of Behavior, 69, 29-47. Cohen, S. L.; Riley, D. S.; Wiegley, P. A. (1993). Tests of behavior momentum in simple and multiple schedules with rats and pigeons. Journal of the Experimental Analysis of Behavior, 60, 255-291. Courtney, K.; Perone, M. (1992). Reduction in shock frequency and response effort as factors in reinforcement by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 58, 485-496. Davis, C. A.; Brady, M. P.; Hamilton, R.; McEvoy, M. A.; Williams, R. E. (1994). Effects of high-probability requests in the acquisition and generalization of social interaction skills of young children with severe disabilities. Journal of Applied Behavior Analysis, 27, 619-638. Donahoe, J. W.; Palmer, D. C. (1994). Learning and complex behavior. Massachusetts: Allyn and Bacon. Doughty, A. H.; Lattal, K. A. (2001). Resistance to change of operant variation and repetition. Journal of the Experimental Analysis of Behavior, 76, 195-215. Dube, W. V.; McIlvane, W. J. (2001). Behavioral momentum in computer-presented discrimination in individuals with severe mental retardation. Journal of the Experimental Analysis of Behavior, 75, 15-23. Fath, S. J.; Fields, L.; Mallot, M. K.; Grosset, D. (1983). Response rate, latency and resistance to change. Journal of the Experimental Analysis of Behavior, 39, 267-274. Franchina, J. J. (1969). Escape behavior and shock intensity: Within-subject versus between-groups comparisons. Journal of Comparative and Physiological Psychology, 69, 241-245. Galizio, M. (1979). Contingency-shaped and rulegoverned behavior: Instructional control of human loss avoidance. Journal of the Experimental Analysis of Behavior, 31, 53-70. Galvani, P. F. (1971). The effects of partial reinforcement on the acquisition and extinction of avoidance behavior in gerbils. Psychonomic Science, 24, 242-244. Galvani, P. F. (1973). Punished and classical-trial extinction of avoidance in gerbils following partial and continuous reinforcement. Psychological Reports, 32, 723-729. Grace, R. C.; Bedell, M. A.; Nevin, J. A. (2002). Preference and resistance to change with constant- and variable-duration terminal links: Independence of reinforcement rate and magnitude. Journal of the Experimental Analysis of Behavior, 77, 233-255. Grace, R. C.; Nevin, J. A. (1997). On the relation between preference and resistance to change. Journal of the Experimental Analysis of Behavior, 67, 43-65. Grace, R. C.; Nevin, J. A. (2000). Comparing preference and resistance to change in constant- and variableduration schedule components. Journal of the Experimental Analysis of Behavior, 74, 165-188. Grace, R. C.; Schwendiman, J. W.; Nevin, J. A. (1998). Effects of unsignaled delay of reinforcement on ANÁLISE DO COMPORTAMENTO preference and resistance to change. Journal of the Experimental Analysis of Behavior, 69, 247-261. Grimes, J. A.; Shull, R. L. (2001). Response-independent milk delivery enhances persistence of pelletreinforced lever pressing by rats. Journal of the Experimental Analysis of Behavior, 76, 179-194. Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992). Stimulus effects on concurrent performance in transition. Journal of the Experimental Analysis of Behavior, 58, 335-347. Harper, D. N. (1996). Response-independent food delivery and behavioral resistance to change. Journal of the Experimental Analysis of Behavior, 65, 549-560. Harper, D. N.; McLean, A. P. (1992). Resistance to change and the law of effect. Journal of the Experimental Analysis of Behavior, 57, 317-337. Hayes, S. C.; Brownstein, A. J.; Zettle, R. D.; Rosenfarb, I.; Korn, Z. (1986). Rule-governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45, 237-256. Herrstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267272. Horner, R.; Day, H. M.; Sprague, J.; O’Brien, M.; Heathfield, L. (1991). Interspersed requests: A nonaversive procedure for decreasing aggression and selfinjury during instructions. Journal of Applied Behavior Analysis, 24, 265-278. Kaufmann, A.; Baron, A.; Kopp, R. E. (1966). Some effects of instructions on human operant behavior. Psychonomic Monograph Supplements, 1, 243-250. Mace, F. C. (2000). Clinical applications of behavioral momentum. Behavioral and Brain Sciences, 23, 105-106. Mace, F. C.; Belfiore, P. (1990). Behavioral momentum in the treatment of escape-motivated stereotypy. Journal of Applied Behavior Analysis, 23, 507-514. Mace, F. C.; Hock, M. L.; Lalli, J. S.; West, B. J.; Belfiore, P.; Brown, D. K. (1988). Behavioral momentum in the treatment of noncompliance. Journal of Applied Behavior Analysis, 21, 123-141. Mace, F. C.; Lalli, J. S.; Shea, M. C.; Lalli, E. P.; West, B. J.; Roberts, M.; Nevin, J. A. (1990). The momentum of human behavior in a natural setting. Journal of the Experimental Analysis of Behavior, 54, 163-172. Mace, F. C.; Lalli, J. S.; Shea, M. C.; Nevin, J. A. (1992). Behavioral momentum in college basketball. Journal of Applied Behavior Analysis, 25, 657-663. Mace, F. C.; Mauro, B. C.; Boyajian, A. E.; Eckert, T. L. (1997). Effects of reinforcer quality on behavioral momentum: Coordinated applied and basic research. Journal of Applied Behavior Analysis, 30, 1-20. Madden, G. J.; Chase, P. N.; Joyce, J. H. (1998). Making sense of sensitivity in the human operant literature. The Behavior Analyst, 21, 1-12. McComas, J. J.; Wacker, D. P.; Cooper, L. J. (1998). Increasing compliance with medical procedures: Application of the high-probability request procedure 79 to a toddler. Journal of Applied Behavior Analysis, 31, 287-290. McDowell, J. J. (1982). The importance of Herrnstein’s mathematical statement of the law of effect for behavior therapy. American Psychologist, 37, 771-779. Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37, 149-155. Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 21, 389-408. Nevin, J. A. (1979). Reinforcement schedules and response strength. Em M. D. Zeiler; P. Harzem (Eds.), Advances in analysis of behaviour: Vol. 1. Reinforcement and the organization of behaviour (p. 117 – 158). New York: John Wiley e Sons. Nevin, J. A. (1984). Pavlovian determiners of behavioral momentum. Animal Learning and Behavior, 12, 363370. Nevin, J. A. (1988). Behavioral momentum and the partial reinforcement effect. Psychological Bulletin, 103, 44-56. Nevin, J. A. (1992). Behavioral contrast and behavioral momentum. Journal of Experimental Psychology: Animal Behavior Processes, 18, 126-133. Nevin, J. A. (2002). Measuring behavioral momentum. Behavioural Processes, 57, 187-198. Nevin, J. A.; Grace, R. C. (2000). Behavioral momentum and the Law of Effect. Behavioral and Brain Sciences, 23, 73-90. Nevin, J. A.; Grace, R. C.; Holland, S.; McLean, A. P. (2001). Variable-ratio versus variable-interval schedules: Response rate, resistance to change, and preference. Journal of the Experimental Analysis of Behavior, 76, 43-74. Nevin, J. A.; Mandell, C.; Atak, J. R. (1983). The analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39, 49-59. Nevin, J. A.; Mandell, C.; Yarensky, P. (1981). Response rate and resistance to change in chained schedules. Journal of Experimental Psychology: Animal Behavior Processes, 7, 278-294. Nevin, J. A.; Smith, L. D.; Roberts, J. (1987). Does contingent reinforcement strengthen operant behavior? Journal of the Experimental Analysis of Behavior, 48, 17-33. Nevin, J. A.; Tota, M. E.; Torquato, R. D.; Shull, R. L. (1990). Alternative reinforcement increases resistance to change: Pavlovian or operant contingencies? Journal of the Experimental Analysis of Behavior, 53, 359-379. Okouchi, H. (1999). Instructions as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 72, 205-214. Okouchi, H.; Lattal, K. A. (2000, julho). Reinforcement rate as a determinant of the effects of behavioural history. Trabalho apresentado no Quatrième Congrès Européen pour l’Analyse Experimentale du Comportement, Amiens, França. 80 ABREU-RODRIGUES, RIBEIRO & COLS. Olson, R. D.; Davenport, D. G.; Kamichoff, N. (1971). Discriminated avoidance and the partial reinforcement effect. Psychonomic Science, 22, 12-14. Otto, T. L.; Torgrud, L. J.; Holborn, S. W. (1999). An operant blocking interpretation of instructed insensitivity to scheduled contingencies. Journal of the Experimental Analysis of Behavior, 49, 663-684. Parpal, M.; Maccoby, E. E. (1985). Maternal responsiveness and subsequent child compliance. Child Development, 56, 1326-1334. Pavlik, W. B.; Collier, A. C. (1977). Magnitude and schedule of reinforcement on rat’s resistance to extinction – within subjects. American Journal of Psychology, 90, 195-205. Rachlin, H. (1995). Self-control: Beyond commitment. Behavioral and Brain Sciences, 18, 109-121. Reynolds, G. S. (1963). On the determinants of choice in pigeons. Journal of the Experimental Analysis of Behavior, 15, 249-251. Santos, C. V. (2001). Efeitos do contexto social sobre a resistência a mudança. Dissertação de Mestrado não publicada, Universidade de Brasília, Brasília, DF. Schlinger, H. D. (1993). Separating discriminative and function-altering effects of verbal stimuli. The Behavior Analyst, 16, 9-23. Shnidman, S. S. (1966). Extinction of Sidman avoidance behavior. Journal of the Experimental Analysis of Behavior, 11, 153-156. Sidman, M. (1960). Tactics of scientific research. Boston: Authors Cooperative, Inc. Skinner, B. F. (1938). The behavior of organisms. New York: Appleton-Century-Crofts. Stavely, H. E. (1966). Effect of escape duration and shock intensity on the acquisition and extinction of an escape response. Journal of Experimental Psychology, 72, 698-703. Strand, P. S. (2000). A modern behavioral perspective on child conduct disorder: Integrating behavioral momentum and matching theory. Clinical Psychology Review, 20, 593-615. Todorov, J. C.; Oliveira-Castro, J. M.; Hanna, E. S.; Bittencourt de Sá, M. C. N.; Barreto, M. Q. (1983). Choice, experience, and the generalized matching law. Journal of the Experimental Analysis of Behavior, 40, 99-111. Wanchisen, B. A.; Tatham, T. A.; Mooney, S. E. (1989). Variable-ratio conditioning history produces high- and low-rate fixed-interval performance in rats. Journal of the Experimental Analysis of Behavior, 52, 167-179. ANÁLISE DO COMPORTAMENTO DESAMPARO APRENDIDO 81 5 ELISA TAVARES SANABIO-HECK KARINA DE GUIMARÃES SOUTO E MOTTA Um dos objetivos principais da Psicologia é compreender o comportamento humano. De acordo com a Análise do Comportamento, as causas dos comportamentos podem ser encontradas nas relações entre o organismo e o ambiente. Como apontado por Skinner (1953/1994), a explicação do comportamento deve sempre levar em consideração as variáveis que “estão fora do organismo, em seu ambiente imediato e em sua história ambiental” (p. 42). Para identificar essas variáveis, utiliza-se o conceito de contingência, mais especificamente, o conceito de contingência tríplice, definida como uma relação entre eventos ambientais ou entre comportamento e eventos ambientais, na forma “se, então” (Todorov, 1985). Uma análise das contingências irá especificar sob que condições presentes ou antecedentes um comportamento irá produzir, como conseqüência, alguma alteração no ambiente. Em uma análise de contingências, o papel da conseqüência é fundamental, pois além de gerar aumentos ou diminuições na probabilidade futura de emissão do comportamento, também possibilita que a condição antecedente adquira funções de controle sobre o desempenho do organismo (Skinner, 1974/ 1993). A importância das conseqüências fica evidente quando Skinner (1981) propõe um modelo para se tentar compreender as variáveis de controle do comportamento dos organismos. Segundo esse modelo, a partir da interação do organismo com o ambiente, de- terminadas conseqüências ambientais passariam a selecionar não só características anatômicas e fisiológicas dos indivíduos ao longo de gerações (seleção filogenética), mas também características comportamentais de um indivíduo no decorrer de sua vida (seleção ontogenética) (Matos e Tomanari, 2002). Uma vez que o comportamento ocorre em função de conseqüências passadas, a Análise do Comportamento esbarra em uma dificuldade (Hunziker, 2001): como é possível se ter acesso a uma classe de eventos que não existe mais? Uma alternativa seria a utilização dos relatos, seja do próprio sujeito ou de outros indivíduos, acerca das contingências passadas. Entretanto os relatos nem sempre correspondem com precisão às contingências às quais os indivíduos foram expostos (Simonassi, Fróes e Sanabio, 1995; Simonassi, Oliveira e Gosch, 1997; Simonassi, Oliveira e Sanabio, 1994), podendo estar sob controle de outras variáveis ambientais (Critchfield, 1993, 1996; Critchfield e Perone, 1990, 1993; Sanabio e AbreuRodrigues, 2002). Para tentar resolver esse problema, a análise das contingências passadas poderia ser realizada em situações experimentalmente controladas. Ou seja, “pode-se estabelecer experimentalmente uma série de relações de contingência que se sucedem de forma a permitir uma investigação sistemática da influência das contingências passadas sobre o comportamento atual” (Hunziker, 2001, p. 230). Um exemplo dessa forma de investigação é fornecido pelos 82 ABREU-RODRIGUES, RIBEIRO & COLS. estudos sobre os efeitos da história de incontrolabilidade. De acordo com a literatura, a exposição a situações de incontrolabilidade, caracterizadas por uma relação de independência entre os eventos programados e o comportamento do organismo, produz um retardo na aquisição de novos desempenhos em situações subseqüentes envolvendo eventos controláveis. Diferentes hipóteses e teorias foram propostas para explicar os efeitos da história de incontrolabilidade (para uma discussão detalhada das teorias, ver Maier e Seligman, 1976), dentre as quais se destaca a teoria do desamparo aprendido. A idéia central na teoria do desamparo aprendido é que os organismos expostos a eventos incontroláveis aprendem que os eventos ambientais são independentes de suas respostas, uma aprendizagem que irá interferir futuramente na aquisição de novos desempenhos. Segundo Maier e Seligman (1976), essa aprendizagem ocorre de acordo com duas etapas. Primeiramente, os arranjos entre o comportamento e o meio fornecem a informação sobre a relação de independência. Em um segundo momento, a informação sobre a relação de independência é “processada e transformada em uma representação cognitiva da contingência” (Maier e Seligman, 1976, p. 17). Tal representação é definida como a expectativa de que respostas e eventos ambientais são independentes. Em função dessa expectativa, o organismo pode apresentar três tipos de déficits: déficit motivacional (diminuição da motivação para emitir respostas), déficit cognitivo (interferência na aprendizagem de relações de controlabilidade) e déficit emocional (alterações fisiológicas como perda de peso, perda de apetite, aparecimento de úlceras estomacais e passividade). A dificuldade na aprendizagem de novos comportamentos ou, alternativamente, a redução na sensibilidade a novas contingências, resultante da exposição a condições de incontrolabilidade, tem sido denominada tanto de efeito do desamparo aprendido (Maier e Seligman, 1976; Seligman e Beagley, 1975; Seligman, Rosellini e Kozak, 1975) como de efeito de interferência (p. ex.: Crowel e Anderson, 1981; Glazer e Weiss, 1976a; 1976b). Hunziker (1981) considera o termo efeito do desamparo aprendido inadequado, por envolver uma formulação teórica sobre o fenômeno ainda sujeita a questionamentos, podendo a mesma observação ser aplicada ao termo efeito de interferência. Uma vez que o presente trabalho propõe-se a abordar os efeitos da exposição a eventos incontroláveis a partir de uma perspectiva analítico-comportamental e que os termos desamparo aprendido e efeito de interferência estão comprometidos com uma visão cognitiva desse fenômeno, serão adotados aqui os termos efeitos da história de incontrolabilidade ou efeitos da exposição a eventos incontroláveis,1 os quais foram escolhidos em função de seu caráter estritamente descritivo. Ou seja, tais termos indicarão apenas que a aquisição de novos comportamentos após uma história de incontrolabilidade não ocorreu tão prontamente quanto na ausência dessa história. A revisão da literatura a seguir apresentará, inicialmente, um panorama da pesquisa básica sobre os efeitos da experiência prévia com eventos não-controláveis, enfatizando a metodologia comumente empregada na área, os procedimentos de prevenção e reversão desses efeitos, bem como o papel dos relatos verbais. Finalmente, algumas implicações clínicas relacionadas aos achados empíricos serão analisadas. CONTRIBUIÇÕES DA PESQUISA BÁSICA Uma das primeiras demonstrações do efeito da história de incontrolabilidade foi feita por Overmier e Seligman (1967). Durante a Fase de Treino, cães eram presos a arreios. Os sujeitos do Grupo Controle não foram expostos a choques, sendo apenas colocados nos arreios. Os três grupos restantes foram expostos a choques inescapáveis, isto é, nenhuma resposta emitida pelo sujeito poderia eliminar a ocorrência destes, e se diferenciaram em relação ao número, à duração e ao intervalo médio entre os choques. Na Fase de Teste, todos os sujeitos foram expostos a uma contingência 1Os autores mantiveram o termo desamparo aprendido no título do capítulo em função de sua ampla utilização na literatura pertinente. ANÁLISE DO COMPORTAMENTO de fuga e esquiva, ou seja, o sujeito poderia eliminar ou evitar o choque, caso a resposta de saltar uma barreira que dividia a caixa experimental fosse emitida. Os três grupos expostos aos choques inescapáveis apresentaram tempos de reação mais longos nas respostas de fuga e esquiva do que o Grupo Controle, não havendo diferenças entre os primeiros. A partir desses resultados, os autores concluíram que a exposição a choques inescapáveis interfere na aquisição de respostas de fuga e esquiva. A questão se tal interferência é produto da exposição aos choques em si ou da incontrolabilidade dos mesmos foi investigada por Seligman e Maier (1967, Experimento 1), por meio de um modelo triádico (Tabela 5.1). Na Fase de Treino, um grupo de cães recebeu choques escapáveis, os quais eram interrompidos quando os sujeitos emitiam uma resposta de pressão a um painel (Grupo Escapável). Um segundo grupo foi exposto ao mesmo padrão de choques (mesma duração, intensidade e número de choques) que o Grupo Escapável, mas as respostas dos sujeitos não interrompiam os choques (Grupo Inescapável). O terceiro grupo não foi exposto a choques (Grupo Controle). Na Fase de Teste, todos os sujeitos foram expostos a uma contingência de fuga e esquiva semelhante àquela descrita por Overmier e Seligman (1967). O efeito da história de incontrolabilidade foi observado no Grupo Inescapável, que apresentou tempos de reação mais longos e mais falhas na aprendizagem das respostas de fuga e esquiva do que os grupos Escapável e Controle, que não diferiram entre si. Isto é, o Grupo Inescapável não aprendeu as respostas de fuga e esquiva, enquanto os dois outros grupos aprenderam essas respostas rapidamente. Seligman e Maier concluíram que a incontrolabilidade dos choques foi a variável TABELA 5.1 Modelo triádico Grupos Condições Treino Teste Escapável Inescapável Controle Controlabilidade Incontrolabilidade Controle Controlabilidade Controlabilidade Controlabilidade 83 responsável pela dificuldade de aprendizagem das respostas de fuga e esquiva, uma vez que: a) os grupos Escapável e Inescapável foram semelhantes em relação à exposição aos choques, mas diferiram em termos de grau de controlabilidade dos mesmos, tendo apresentado desempenhos diferentes; b) os grupos Escapável e Controle diferiram em relação à exposição aos choques, mas apresentaram desempenhos semelhantes. O efeito da exposição a eventos incontroláveis também foi demonstrado com participantes humanos. Em um estudo realizado por Hiroto (1974), estudantes universitários foram expostos a um estímulo auditivo durante a Fase de Treino. Para o Grupo Escapável, o estímulo auditivo poderia ser interrompido pela emissão da resposta de pressão a um botão; para o Grupo Inescapável, as respostas dos participantes não tinham controle sobre a eliminação do som. Para o Grupo Controle, não foram programadas apresentações do som. Na Fase de Teste, todos os participantes foram expostos a tentativas de fuga e esquiva em que, na presença de um estímulo ou sinal, o participante deveria mover uma alavanca para eliminar ou interromper o som. Os resultados foram semelhantes àqueles obtidos por Seligman e Maier (1967) e Overmier e Seligman (1967): o Grupo Inescapável demonstrou efeitos da história de incontrolabilidade, com tempos de reação mais longos nas respostas de fuga e esquiva do que os grupos Escapável e Controle, que não demonstraram diferenças entre si (ver também Hiroto e Seligman, 1975; Lamb, Davis, Tramill e Kleinhammer-Tramill, 1987). Hunziker (1981) apontou um problema metodológico nos estudos que demonstram o efeito da história de incontrolabilidade. Tal problema é relacionado à programação da situação de incontrolabilidade, que se refere a um arranjo experimental em que a probabilidade de um evento, dada uma resposta específica, é igual à probabilidade desse evento, dada a nãoocorrência da mesma resposta. Entretanto, nesses estudos, o critério para a apresentação do 84 ABREU-RODRIGUES, RIBEIRO & COLS. evento, não é a ocorrência ou não de uma resposta específica, e sim a passagem do tempo. A ocorrência do evento ambiental em função da passagem de tempo não garante uma ausência de relação entre resposta e evento, pois esta pode ser estabelecida por reforçamento acidental. Dessa forma, a afirmação de que a dificuldade de aprendizagem de um novo comportamento resulta de experiências prévias com situações de incontrolabilidade é questionável, uma vez que os arranjos experimentais comumente utilizados não têm atendido as exigências da definição de incontrolabilidade. Prevenção e reversão do efeito da história de incontrolabilidade O efeito da história de incontrolabilidade pode ser prevenido ou revertido por meio de dois procedimentos. No primeiro deles, uma situação de controlabilidade é programada antes de o organismo ser exposto a eventos incontroláveis. Tal processo é chamado de imunização, uma vez que previne a ocorrência do efeito da exposição a eventos incontroláveis. No segundo procedimento, denominado de terapia, o efeito é revertido: após a experiência com incontrolabilidade e anterior à Fase de Teste, o organismo é exposto a uma situação na qual os eventos são controláveis (Tabela 5.2). Imunização O estudo pioneiro que investigou os efeitos do procedimento de imunização foi realizado por Seligman e Maier (1967, Experimento 2), utilizando cães como sujeitos experimentais. Os grupos I, II e III foram expostos a diferentes seqüências de choques inescapáveis e escapáveis ao longo das fases de imunização, treino e teste. O Grupo I (imunização) foi exposto à seqüência choques escapáveis → choques inescapáveis → choques escapáveis, o Grupo II foi exposto a choques inescapáveis → choques escapáveis e o Grupo III recebeu choques escapáveis → choques escapáveis. De acordo com os resultados, o efeito da história de incontrolabilidade só foi observado para o Grupo II, tendo o Grupo I e o Grupo III apresentado desempenhos semelhantes. Ou seja, quando expostos a choques escapáveis, antes de serem expostos a choques inescapáveis, os participantes não demonstraram uma diminuição na sensibilidade às novas contingências. Tais resultados evidenciam a eficácia do procedimento de imunização para prevenir o efeito da história de incontrolabilidade. Douglas e Anisman (1975, Experimento 3) demonstraram os efeitos do procedimento de imunização com participantes humanos. Durante a Fase de Imunização, o Grupo I deveria pressionar botões para desligar luzes coloridas, enquanto o Grupo II deveria encontrar a saída de labirintos impressos em folhas de papel. Para ambos os grupos, as tarefas eram solucionáveis. Na Fase de Treino, os grupos I e II foram solicitados a pressionar botões para desligar luzes. Contudo, nessa fase, pressionar botões e desligar luzes eram eventos independentes. Na Fase de Teste, a tarefa consistia na mesma da Fase de Treino (pressionar botões), mas agora as respostas de pressionar desligavam as luzes. O Grupo III foi exposto apenas às fases de treino e teste, que foram idênticas àquelas programadas para os grupos I e II. O Grupo IV, que funcionou como controle, foi exposto apenas à Fase de Teste. Os resultados da Fase de Teste demonstraram que os grupos I e II, expostos às tarefas solucionáveis antes de receberem tarefas insolucionáveis, apresentaram um melhor desempenho (maior número de respostas cor- TABELA 5.2 Procedimentos de imunização e terapia Condições Procedimento Treino de imunização Treino Terapia Teste Imunização Terapia Controlabilidade ________ Incontrolabilidade Incontrolabilidade ________ Controlabilidade Controlabilidade Controlabilidade ANÁLISE DO COMPORTAMENTO retas) quando comparados aos outros grupos. Os autores concluíram que o procedimento de imunização previne a ocorrência de efeitos da história de incontrolabilidade também em participantes humanos, e que a imunização ocorre a despeito de as tarefas utilizadas no prétreino e no treino serem iguais (Grupo I) ou diferentes (Grupo II). A relação entre diferentes esquemas de reforçamento e o procedimento de imunização foi investigada por Jones, Nation e Massad (1977). Os participantes eram expostos a uma tarefa de discriminação visual que consistia na apresentação de quatro problemas diferentes, em blocos de 10 tentativas. A cada problema, o experimentador selecionava uma característica dentre cinco dimensões diferentes: letra (A ou T), cor (vermelha ou preta), tamanho (grande ou pequeno), borda ao redor da letra (círculo ou quadrado) e posição (direita ou esquerda). Em cada tentativa, era apresentada uma configuração composta pelas cinco dimensões, cabendo aos participantes a tarefa de adivinhar a característica selecionada pelo experimentador. Para tanto, eles deveriam indicar se a configuração apresentada incluía ou não a característica pré-selecionada. Na Fase de Imunização, o Grupo 0% Imunizado recebeu quatro problemas insolucionáveis de discriminação. Tais problemas não tinham solução específica, uma vez que cada resposta era sempre seguida do feedback “Incorreto”. O Grupo 50% Imunizado recebeu dois problemas insolucionáveis e dois problemas solucionáveis (as respostas sempre produziam o feedback “Correto”). O Grupo 100% Imunizado e o Grupo Solucionável foram expostos a quatro problemas solucionáveis. Na Fase de Treino, todos os grupos receberam quatro problemas de discriminação diferentes daqueles apresentados na fase anterior. Para os três primeiros grupos, os problemas eram insolucionáveis; para o último grupo, os problemas eram solucionáveis. O Grupo Controle foi exposto aos problemas de discriminação, mas não foi solicitado a resolvê-los. Na Fase de Teste, todos os grupos foram expostos a anagramas solucionáveis. Cada anagrama era compostos de cinco letras embaralhadas. A tarefa do participante consistia em ordenar corretamente as letras para for- 85 mar uma palavra. A ordem de apresentação das letras era a mesma para todos os anagramas (3-4-2-5-1), e os participantes eram alertados de que todos poderiam ser resolvidos de uma mesma maneira. Dos dois grupos que foram expostos a problemas solucionáveis durante a Fase de Imunização (grupos 50% e 100%), apenas o Grupo 50% demonstrou o efeito de imunização, apresentando um desempenho na tarefa do anagrama semelhante aos grupos solucionável e controle. Por outro lado, os grupos 100% e 0% mostraram desempenhos semelhantes, caracterizados por tempos de reação mais longos e maior número de falhas na resolução do anagrama do que o desempenho do Grupo 50%. Segundo Jones e colaboradores (1977), os resultados do Grupo 100% são contrários à literatura animal, a qual prediz que, quanto maior a exposição a eventos controláveis, maior o efeito de imunização observado. Esses autores explicam tal divergência com base na noção de intermitência do reforço. O Grupo 50% foi exposto a uma situação de reforçamento intermitente na Fase de Imunização: problemas solucionáveis seriam equivalentes ao reforçamento, e os problemas insolucionáveis, à ausência de reforçamento. Em função dessa experiência com reforçamento e extinção, os participantes apresentaram uma maior persistência nas respostas de resolução nas fases seguintes, o que minimizou a influência da história de incontrolabilidade. Em contrapartida, os participantes do Grupo 100% foram expostos a uma situação de reforçamento contínuo (apenas problemas solucionáveis), produzindo respostas de resolução menos persistentes. Conseqüentemente, os efeitos da exposição a eventos incontroláveis foram observados (ver também Prindaville e Stein, 1978). Terapia Como citado anteriormente, além de serem prevenidos por meio do procedimento de imunização, os efeitos da história de incontrolabilidade podem também ser revertidos pelo procedimento de terapia, ou seja, pela expo- 86 ABREU-RODRIGUES, RIBEIRO & COLS. sição a eventos controláveis após a experiência com incontrolabilidade e anterior à Fase de Teste. O efeito do procedimento de terapia foi inicialmente investigado por Seligman e colaboradores (1975), que utilizaram ratos como sujeitos. Inicialmente, os sujeitos foram expostos a 80 tentativas de choques inescapáveis, liberados de acordo com um esquema de intervalo variável de 1 min (VI 1 min). Posterior a essa exposição, os animais foram testados em uma nova situação, na qual o choque poderia ser interrompido a cada três respostas de pressão à barra. Os sujeitos que não apresentaram respostas de fuga durante 20 s, o que foi considerado como evidência do efeito da história de incontrolabilidade, foram selecionados para constituir os grupos experimentais. Em um grupo, os sujeitos eram puxados pelo experimentador por meio de uma correia e forçados a emitir a resposta de pressionar uma barra (Grupo Fuga Forçada). Tal procedimento era finalizado quando os sujeitos emitissem respostas de fuga em 10 tentativas consecutivas sem intervenção do experimentador. Um segundo grupo foi acoplado ao Grupo Fuga Forçada recebendo, assim, o mesmo número e duração de choques. Os sujeitos desse grupo também eram puxados pelo experimentador, mas não eram forçados a pressionar a barra (Grupo Controle). Os sujeitos do terceiro grupo não eram puxados pelo experimentador nem forçados a emitir respostas de pressão à barra (Grupo Controle Acoplado), além de receberem o mesmo número e duração de choques que os sujeitos dos grupos fuga forçada e controle. Os sujeitos do Grupo Fuga Forçada conseguiram atingir o critério de escapar do choque por 10 tentativas consecutivas, sem qualquer intervenção por parte do experimentador. Por outro lado, os sujeitos do Grupo Controle e Grupo Controle Acoplado não atingiram o critério, ou seja, apresentaram efeitos da história de incontrolabilidade. Os autores concluíram, então, que a terapia forçada foi um procedimento efetivo na reversão do efeito produzido pela exposição a eventos aversivos incontroláveis. Klein e Seligman (1976, Experimento 1) investigaram os efeitos do procedimento de terapia com humanos. Na Fase de Treino, estudantes universitários deveriam eliminar tons. Entretanto os tons programados eram inescapáveis. Na Fase de Terapia, problemas de discriminação visual eram apresentados aos participantes: um grupo recebeu 12 problemas solucionáveis (Grupo Solucionável 12), um segundo grupo foi exposto a quatro problemas solucionáveis (Grupo Solucionável 4) e um terceiro grupo foi apenas exposto aos problemas sem resolvê-los (Grupo Controle). Na Fase de Teste, todos os grupos deveriam mover uma alavanca para eliminar ou interromper tons. Os participantes expostos aos problemas solucionáveis (grupos solucionável 12 e solucionável 4) demonstraram tempos de reação mais curtos e um menor número de falhas nas respostas de fuga e esquiva do que o Grupo Controle, o que demonstra que a exposição prévia à incontrolabilidade não afetou o desempenho posterior. Os efeitos do procedimento de terapia também foram investigados por Nation e Massad (1978). Estudantes universitários foram distribuídos em quatro grupos. Na Fase de Treino, o Grupo SOL recebeu quatro problemas solucionáveis de discriminação visual. Para esse grupo, cada resposta emitida pelo participante era seguida de feedbacks precisos. Os grupos IN-CRF e IN-PRF receberam quatro problemas insolucionáveis. Ou seja, a ordem dos feedbacks (“Correto” e “Incorreto”) era programada previamente, independente das respostas emitidas pelos participantes. O Grupo NOT não recebeu tratamento (era exposto aos problemas sem resolvê-los). Na Fase de Terapia, os participantes deveriam pressionar um botão para eliminar ou interromper tons. Para os grupos SOL, IN-CRF e NOT, todos os tons eram escapáveis. Ou seja, os participantes desses grupos foram expostos a um esquema de reforçamento contínuo. O Grupo IN-PRF, por sua vez, poderia eliminar ou interromper apenas 50% dos tons apresentados, isto é, esse grupo era exposto a um esquema de reforçamento parcial. Na Fase de Teste, todos os par- ANÁLISE DO COMPORTAMENTO ticipantes receberam tons inescapáveis, o que diferencia este estudo dos anteriores, nos quais a Fase de Teste era caracterizada como uma situação de controlabilidade. Os resultados observados ao final da Fase de Terapia indicaram que os grupos expostos a problemas insolucionáveis durante a Fase de Treino e a problemas solucionáveis na Fase de Terapia (IN-CRF e IN-PRF) apresentaram desempenhos semelhantes aos dos grupos expostos apenas a problemas solucionáveis (SOL e NOT), sugerindo que tanto uma situação de reforçamento contínuo (grupos IN-CRF, SOL e NOT) como uma situação de reforçamento parcial (Grupo IN-PRF) são eficazes para reverter o efeito da exposição a eventos incontroláveis. Contudo, na Fase de Teste, quando novamente expostos a uma situação de incontrolabilidade, os participantes expostos ao esquema de reforçamento parcial (IN-PRF) mostraram desempenhos mais persistentes quando comparados aos participantes expostos ao reforçamento contínuo (IN-CRF), uma vez que se mantiveram respondendo por mais tempo (para uma discussão sobre os efeitos de reforçamento contínuo e parcial na Fase de Terapia, ver também Carvalho, 1998). O papel dos estímulos verbais nos estudos sobre história de incontrolabilidade Conforme já descrito anteriormente, os efeitos da história de incontrolabilidade têm sido atribuídos a diferentes variáveis. Autores como Maier e Seligman (1976) propõem que, quando exposto a eventos incontroláveis, o indivíduo desenvolve uma expectativa de independência entre respostas e eventos ambientais, sendo essa expectativa considerada a variável de controle mais relevante para o efeito da história de incontrolabilidade. As possíveis funções exercidas pelas expectativas dos indivíduos são investigadas por meio de duas metodologias. Na primeira, os participantes são expostos a situações de controlabilidade e/ou incontrolabilidade, assumin- 87 do-se que essas diferentes situações irão produzir diferentes expectativas (p. ex.: Alloy, Peterson, Abramson e Seligman, 1984; Levine, Rotkin, Jankovic e Pitchford, 1977; Prindaville e Stein, 1978; Tiggeman e Winefield, 1987). Na segunda, os participantes também são expostos a controlabilidade e/ou incontrolabilidade; entretanto, os participantes recebem, diferentes tipos de instruções (p. ex.: Hiroto, 1974; Klein, Fencil-Morse e Seligman, 1976; Mikulincer, 1986; Oakes e Curtis, 1982, Experimento 2; Tennen, Gillen e Drum, 1982) ou, na ausência de instruções, eles são expostos a diferentes tarefas (p. ex.: Douglas e Anisman, 1975; Ford e Neale, 1985; Klein e Seligman, 1976; Oakes e Curtis, 1982, Experimento 1; Tennen, Drum, Gillen e Stanton, 1982). Esses estudos assumem que as instruções apresentadas ou as diferenças de tarefas (p. ex.: fáceis e difíceis) deverão produzir expectativas distintas. Tanto nos estudos que apenas expõem os participantes a situações de controlabilidade e/ou incontrolabilidade quanto naqueles que manipulam a instrução e o tipo de tarefa, o experimentador tem acesso às expectativas por meio dos relatos dos participantes (p. ex.: Ford e Neale, 1985; Klein et al., 1976; Klein e Seligman, 1976; Mikulincer, 1986; Oakes e Curtis, 1982; Tennen, Drum et al., 1982; Tennen Gillen et al., 1982, Experimento 2). Tais relatos podem ser solicitados antes do experimento, por meio de questionários e inventários, ou podem ser solicitados ao longo do estudo, após as fases de treino ou teste. A prática de solicitar relatos sugere que os mesmos são considerados descrições precisas das expectativas dos participantes. Entretanto, é possível encontrar estudos nos quais os relatos não são solicitados e, nesses casos, a expectativa é inferida somente com base nas manipulações efetuadas (p. ex.: Douglas e Anisman, 1975; Hiroto, 1974). Além dessas diferenças, é comum encontrar variações nos tipos de relatos solicitados. Por exemplo, em alguns estudos (Alloy et al., 1984; Klein et al., 1976; Mikulincer, 1986; Oakes e Curtis, 1982; Tennen, Drum et al., 88 ABREU-RODRIGUES, RIBEIRO & COLS. 1982; Tennen, Gillen et al., 1982), o relato do participante deve indicar os eventos ambientais responsáveis por seu desempenho. Tais relatos serão denominados, daqui por diante, de julgamentos de causalidade e podem ser divididos em seis tipos principais: a) global: relatos que descrevem o desempenho como produto de fatores presentes em diversas situações; b) específico: relatos que descrevem o desempenho como produto de fatores presentes apenas em uma dada situação; c) estável: relatos que descrevem o desempenho como produto de fatores que se mantêm ao longo do tempo; d) instável: relatos que descrevem o desempenho como produto de fatores temporários; e) interno: relatos que indicam que o próprio desempenho exerceu controle sobre os eventos ambientais; f) externo: relatos que indicam que o desempenho não afetou os eventos ambientais. Os julgamentos de causalidade são coletados por meio de escalas: para formular julgamentos de causalidade global ou específica, por exemplo, os participantes devem escolher um valor em uma escala de 0 a 10, de modo que 0 corresponde a “fatores globais”, e 10, a “fatores específicos”. Os participantes também podem ser solicitados a relatar o grau de controle que seus desempenhos exercem sobre os eventos ambientais (Ford e Neale, 1985; Klein e Seligman, 1976; Mikulincer, 1986; Oakes e Curtis, 1982; Prindaville e Stein, 1978; Tennen, Drum et al., 1982; Tennen, Gillen et al., 1982; Tiggeman e Winefield, 1987). Nesse caso, os relatos são denominados de julgamentos de controle, que também são coletados por meio de escalas. Por exemplo, para responder à pergunta “Quanto você acha que seu desempenho produziu o término do tom?”, o participante deve escolher um valor em uma escala de 0 a 10, sendo o valor 0 correspondente à opção “muito pouco” e o valor 10 correspondente a “totalmente”. Há ainda um terceiro tipo de relato: após serem expostos a uma determinada tarefa, os participantes são solicitados a descrever a solução para o problema apresentado. Nesse caso, os relatos são denominados de descrições do desempenho, as quais são formuladas sem a utilização de escalas, isto é, o participante pode apresentar qualquer descrição para o problema (p. ex.: Levine et al., 1977). Correspondência entre o comportamento verbal e o comportamento não-verbal Conforme assinalado anteriormente, ao serem expostos a situações de controlabilidade e incontrolabilidade, os participantes são solicitados a relatar seus julgamentos acerca da situação experimental. Esses julgamentos consistem em descrições de prováveis relações comportamento-ambiente (ou, simplesmente, do próprio comportamento) em vigor. Quando tais descrições referem-se a relações futuras entre comportamento e ambiente (ou a comportamentos futuros), elas são denominadas de expectativas. Dessa forma, julgamentos e expectativas são comportamentos verbais. Os estudos sobre os efeitos da história de incontrolabilidade comumente assumem uma correspondência entre julgamentos e expectativas, sendo atribuído a essas expectativas o status de “causa” dos déficits de aprendizagem observados. Ou seja, caso o participante relate que suas respostas não exercem controle sobre os eventos ambientais (julgamento de ausência de controle), uma expectativa de ausência de controlabilidade é inferida e considerada como a variável responsável pela dificuldade de aprendizagem em situações subseqüentes, em detrimento da experiência prévia com incontrolabilidade per si. Um exemplo dessa forma de utilização dos relatos é fornecido por Alloy e colaboradores (1984) ao investigarem o papel da similaridade entre as tarefas de treino e de teste, bem como dos julgamentos de causalidade, em situações de incontrolabilidade. Estudantes universitários foram divididos em seis grupos conforme o tipo de julgamento emitido (global ou específico) e o tipo de tratamento rece- ANÁLISE DO COMPORTAMENTO bido (controlabilidade, incontrolabilidade e ausência de tratamento). Os julgamentos eram coletados por meio de um questionário que continha seis eventos positivos (p. ex.: receber elogio de um amigo) e seis eventos negativos (p. ex.: não ser bem-sucedido em uma tarefa). Os participantes deveriam, então, relatar a principal causa de cada evento, como se estes tivessem sido experienciados por eles próprios. Após relatar as causas, os participantes deveriam classificá-las utilizando uma escala de 0 a 7, sendo o valor 7 correspondente a julgamentos de causalidade global, e o valor zero correspondente a julgamentos de causalidade específica. No Experimento 1, durante a Fase de Treino, os participantes foram expostos a 50 tons. Os participantes com julgamentos globais e com julgamentos específicos foram subdivididos em três grupos cada: para o Grupo Escapável, os tons podiam ser interrompidos ou eliminados pressionando um botão; o Grupo Inescapável era acoplado ao Grupo Escapável em relação à duração e ao número de tons, mas estes eram inescapáveis; o Grupo Controle recebeu a mesma quantidade de tons sem emitir respostas de fuga e esquiva. Na Fase de Teste, uma tarefa semelhante à tarefa do treino foi programada: 20 tons eram apresentados e, para interrompê-los ou evitá-los, os participantes deveriam mover uma alavanca. Foi observado que apenas os grupos inescapáveis (tanto aquele com julgamentos globais quanto aquele com julgamentos específicos) apresentaram uma aprendizagem mais lenta das respostas de fuga e esquiva. Ou seja, os julgamentos não afetaram diferencialmente os participantes, sendo seus desempenhos no teste determinados pelas condições de treino. O Experimento 2 apresentou uma única diferença em relação ao Experimento 1: na Fase de Teste, os participantes deveriam resolver 20 anagramas, de modo que as tarefas do treino e do teste eram diferentes. Dentre os participantes do Grupo Inescapável, apenas aqueles com julgamentos de causalidade global apresentaram déficits de aprendizagem. A partir dos resultados dos experimentos 1 e 2, Alloy e colaboradores (1984) concluíram que as duas variáveis investigadas contri- 89 buíram para a ocorrência de efeitos da exposição a eventos incontroláveis: a) os julgamentos de causalidade que os participantes formulam a respeito dos eventos incontroláveis; b) a semelhança entre a situação atual (teste) e a situação original (treino). Caso os julgamentos de causalidade sejam globais, o efeito da exposição à incontrolabilidade ocorrerá em situações semelhantes ou distintas da situação original. Caso os julgamentos sejam específicos, o efeito da exposição à incontrolabilidade será observado apenas quando a situação for semelhante à situação original. Mikulincer (1986) investigou se o efeito da história de incontrolabilidade poderia ser atribuído aos julgamentos de controle dos participantes. Na Fase de Treino, os participantes deveriam resolver quatro problemas de discriminação visual. Para o primeiro grupo, os problemas apresentados eram solucionáveis (Grupo Solucionável). Para o Grupo Insolucionável, os quatro problemas não tinham solução programada. O Grupo Controle resolvia os quatro problemas, mas não recebeu feedbacks após as respostas de resolução. Outros dois grupos receberam problemas insolucionáveis e instruções que se diferenciavam em termos de conteúdo: um grupo de participantes recebeu uma instrução global, enquanto um outro grupo recebeu uma instrução específica. Antes de iniciar a Fase de Teste, julgamentos de controle eram solicitados e, após responder, todos os participantes eram expostos a problemas solucionáveis de discriminação diferentes daqueles apresentados na Fase de Treino. Os participantes expostos a problemas insolucionáveis sem instruções e aqueles expostos a problemas insolucionáveis com instruções globais apresentaram tempos de reação mais longos e um maior número de erros na resolução dos problemas do que os grupos restantes (ver também Mikulincer e Nizan, 1988), além de serem os únicos a apresentarem julgamentos de baixo controle. Ou seja, os participantes que apresentaram esse tipo de julgamento também demonstraram o efeito da história de incontrolabilidade. 90 ABREU-RODRIGUES, RIBEIRO & COLS. Diferente dos estudos descritos, Levine e colaboradores (1977) não solicitaram julgamentos de causalidade ou de controle, mas sim descrições de desempenho. Esse procedimento foi adotado porque, segundo os autores, quando expostos a uma determinada situação, os participantes formulam diferentes descrições de desempenho, até que a mais precisa seja selecionada pela contingência em vigor. Quando uma nova tarefa é apresentada, o desempenho seria insensível às novas contingências em função das descrições formuladas anteriormente. Para avaliar essa possibilidade, os autores expuseram os participantes a problemas de discriminação visual durante a Fase de Treino. O primeiro grupo (Solucionável) recebeu 40 problemas solucionáveis. O segundo grupo (Insolucionável) era exposto a 40 problemas sem nenhuma solução programada, isto é, os feedbacks “Correto” e “Incorreto” eram apresentados aleatoriamente, independentemente das respostas dos participantes. O terceiro grupo recebeu 30 problemas insolucionáveis. Entretanto, nos 10 problemas finais, apenas o feedback “Correto” era apresentado (Grupo Insolucionável-Correto). Após essa fase, todos os participantes eram solicitados a descrever a solução para o problema apresentado. Na Fase de Teste, 40 novos problemas solucionáveis de discriminação eram apresentados a todos os grupos. Os resultados indicaram que o Grupo Solucionável apresentou um número menor de tentativas para resolver o problema do que os grupos insolucionável e insolucionável-correto. Uma vez que esses dois últimos grupos apresentaram desempenhos semelhantes, Levine e colaboradores (1977) concluíram que a exposição a eventos incontroláveis não é o aspecto crítico para a dificuldade na aprendizagem de uma nova tarefa. A principal variável de controle seria as descrições de desempenho, uma vez que os participantes que formularam descrições simples (baseadas em uma dimensão dos estímulos) mostraram tempos de reação mais curtos na resolução do problema na Fase de Teste do que aqueles que apresentaram descrições complexas (baseadas em seqüências, combinações ou padrões irrelevantes dos estímulos). Em suma, nos estudos descritos anteriormente, o comportamento verbal dos participantes (julgamentos de controle e causalidade, descrições do desempenho e expectativas) foi considerado como a variável crítica para a ocorrência do efeito da história de incontrolabilidade, a despeito da experiência com eventos incontroláveis per si. Ausência de correspondência entre o comportamento verbal e o comportamento não-verbal Enquanto os estudos anteriormente descritos apontam a ocorrência de correspondência entre o comportamento verbal e o comportamento não-verbal em situações de incontrolabilidade e, a partir desse resultado, afirmam que julgamentos/expectativas dos indivíduos determinam o retardo na aprendizagem de novos comportamentos não-verbais, outros estudos têm demonstrado ausência de correspondência entre comportamento verbal e nãoverbal em situações semelhantes, o que sugere que o retardo na aprendizagem é controlado por outras variáveis. Oakes e Curtis (1982) apontaram um problema metodológico nos estudos que afirmam que a dificuldade de aprendizagem é produto dos relatos dos participantes. Nesses estudos, após serem expostos a uma situação de incontrolabilidade e relatarem os eventos ambientais como sendo independentes de seus desempenhos, os participantes apresentaram um retardo na aprendizagem subseqüente de novos comportamentos. Uma vez que a exposição a eventos incontroláveis e o relato de incontrolabilidade ocorrem simultaneamente, não é possível indicar a contribuição de cada uma dessas variáveis para a ocorrência de tal retardo. Para separar os efeitos dessas variáveis, Oakes e Curtis (1982) programaram uma situação caracterizada pela ausência de correspondência entre o relato e as condições experimentais em vigor. No Experimento 1, durante a Fase de Treino, os participantes receberam uma tarefa de tiro ao alvo, sendo o tiro um feixe de luz. A resposta de tiro ao alvo poderia ser seguida ANÁLISE DO COMPORTAMENTO pela apresentação de um tom ou pela ausência deste. A sala experimental era iluminada de maneira a impedir a discriminação da relação de independência entre respostas e ocorrência do tom. Para o Grupo Contingente Positivo, apenas as respostas corretas (tiro no alvo) eram seguidas da apresentação do tom, enquanto para o Grupo Contingente Negativo, apenas as respostas incorretas eram seguidas da apresentação do tom. Os grupos não-contingente positivo e não-contingente negativo eram acoplados aos grupos contingente positivo e negativo, respectivamente, em relação ao número e à seqüência de tons apresentados. O Grupo Controle foi exposto apenas à Fase de Teste, na qual todos os participantes receberam anagramas solucionáveis. Nessa fase, os participantes deveriam indicar o grau de controle que exerciam sobre a tarefa (julgamentos de controle) e o grau em que acertos e erros dependiam de sua própria habilidade, dificuldade da tarefa, esforço, sorte ou controle do experimentador (julgamentos de causalidade). Os participantes dos grupos não-contingentes apresentaram um tempo de reação mais longo e maior número de erros nas respostas de resolução do anagrama quando comparados aos grupos contingentes e controle, que não diferiram entre si. Em relação aos julgamentos de controle, estes foram semelhantes para todos os grupos, o mesmo ocorrendo com os julgamentos de causalidade (o fator “controle do experimentador” foi descrito como o principal responsável pelos desempenhos). Durante o Experimento 2, a discriminação da relação de independência entre respostas e eventos ambientais foi manipulada por meio de diferentes instruções. As fases de treino e de teste foram semelhantes àquelas do experimento anterior, com a seguinte exceção: apenas a condição positiva estava em vigor. Na Fase de Teste, metade dos participantes do Grupo Contingente e metade dos participantes do Grupo Não-Contingente foi informada de que, durante a fase anterior, os tons eram independentes das respostas emitidas. Dessa forma, formaram-se cinco grupos experimentais diferentes: Contingente Informado, Contingente Não-Informado, Não-Contingente Informado, Não-Contingente Não-Informado e 91 Controle. Após a Fase de Teste, todos os participantes deveriam emitir julgamentos de controle e de causalidade, de maneira semelhante àquela descrita no Experimento 1. Os resultados foram semelhantes aos do Experimento 1: apesar dos julgamentos de controle terem sido semelhantes para os participantes dos grupos contingente e não-contingente, o desempenho na tarefa do anagrama foi diferente, tendo os grupos não-contingentes (com e sem instrução) demonstrado dificuldades para resolver os anagramas. Em relação aos julgamentos de causalidade, os participantes que receberam a instrução, tanto do Grupo Contingente quanto do Grupo Não-Contingente, tenderam a atribuir os acertos e os erros a fatores externos (p. ex.: dificuldade da tarefa, controle do experimentador). Os participantes que não receberam instrução não apresentaram julgamentos de causalidade com diferenças significativas entre os fatores apresentados (sua própria habilidade, dificuldade da tarefa, esforço, sorte ou controle do experimentador). Os resultados dos experimentos 1 e 2 indicam que a experiência prévia com eventos contingentes ou não-contingentes foi um fator preditivo do desempenho posterior, o que não ocorreu com os julgamentos de controle e de causalidade; ou seja, efeitos da história de incontrolabilidade foram observados apenas para os participantes do Grupo Não-Contingente, os quais apresentaram julgamentos de controle e de causalidade semelhantes àqueles dos participantes do Grupo Contingente. De acordo com Oakes e Curtis (1982), se tais julgamentos fossem responsáveis por esse efeito, ambos os grupos deveriam ter apresentado dificuldades na resolução dos anagramas, o que não foi observado. A partir disso, esses autores sugeriram que o efeito da exposição a eventos incontroláveis provavelmente é produzido pela condição de incontrolabilidade e não pelos julgamentos em si (ver também Ford e Neale, 1985; Tiggeman e Winefield, 1987). Resultados semelhantes foram encontrados por Tennen, Gillen e colaboradores (1982). Na Fase de Treino do Experimento 1, os participantes eliminavam ou interrompiam tons. Para o primeiro grupo, os tons eram escapáveis (Grupo Escapável). Os quatro grupos restan- 92 ABREU-RODRIGUES, RIBEIRO & COLS. tes receberam tons inescapáveis e eram acoplados ao Grupo Escapável em relação ao número e à duração dos tons. Dois grupos receberam uma instrução informando que a ocorrência dos tons não dependia apenas do desempenho do participante, mas também das respostas de outro participante. Para o Grupo Inescapável-Ajuda, essas respostas eram emitidas, na verdade, pelo próprio experimentador; para o Grupo Inescapável-Sem Ajuda, tais respostas não eram emitidas. Por fim, o Grupo Controle recebeu tons inescapáveis. Na Fase de Teste, os participantes resolviam anagramas solucionáveis. Após essa fase, os participantes eram solicitados a julgar o grau de controle sobre a tarefa. Os participantes do Grupo Inescapável e do Grupo Inescapável-Ajuda apresentaram tempos de reação mais longos e um maior número de falhas na resolução dos anagramas do que os participantes expostos a tons escapáveis, demonstrando também julgamentos de baixo controle. Tal resultado é inconsistente com os resultados de Oakes e Curtis (1982), pois mostra uma correspondência entre os julgamentos dos participantes e seus desempenhos. A ausência de correspondência, entretanto, foi observada para os participantes dos grupos inescapável-sem ajuda e controle, os quais, apesar de terem mostrado um desempenho semelhante ao dos participantes do Grupo Escapável (tempos de reação reduzidos e poucas falhas na resolução do anagrama), apresentaram julgamentos de baixo controle, o que corrobora os dados de Oakes e Curtis (1982). Esses resultados indicam, portanto, relações inconsistentes entre julgamentos de controle e desempenho no teste. O procedimento utilizado no Experimento 2 foi semelhante ao utilizado no Experimento 1. Após o treino, além de descreverem seus julgamentos de controle, os participantes formulavam julgamentos de causalidade. Os resultados mostraram que os julgamentos de causalidade global versus específica, estável versus instável e interna versus externa foram semelhantes para os participantes de todos os grupos, isto é, apesar de apresentaram desempenhos distintos entre si, os participantes de todos os grupos relataram seus desempenhos como sendo produto dos mesmos fatores. Baseados na ausência de correspondência entre os julgamentos de causalidade e o desempenho no teste, os autores concluíram que tais julgamentos não exerceram controle sobre o comportamento dos participantes (ver também Tennen, Drum et al., 1982). IMPLICAÇÕES CLÍNICAS Diversos autores têm considerado os estudos sobre o efeito da história de incontrolabilidade como um modelo experimental de depressão (p. ex.: Alloy e Abramson, 1979; Hiroto, 1974; Hiroto e Seligman, 1975; Klein et al., 1976; Klein e Seligman, 1976), uma vez que os participantes expostos a uma situação experimental de incontrolabilidade apresentam com-portamentos semelhantes àqueles observados em clientes depressivos. Na situação experimental, a experiência com eventos incontroláveis diminui a freqüência da resposta. Essa diminuição generaliza-se para situações em que existe uma relação de controlabilidade entre os eventos ambientais e o responder, ocasionando a perda de reforços disponíveis. Similarmente, indivíduos depressivos comumente apresentam uma história de exposição a eventos incontroláveis, uma redução generalizada de responder, bem como um baixo nível de reforçamento positivo. Entretanto comportamentos classificados como depressivos são multideterminados, e a incontrolabilidade é apenas uma de suas variáveis de controle. Por exemplo, é possível que um indivíduo apresente um quadro depressivo em função de uma história passada de reforçamento para comportamentos de isolamento social (p. ex.: brincar sozinho em casa quando criança) e uma história de punição para comportamentos sociais (p. ex.: trazer colegas para brincar em casa). Nesse caso, as contingências de reforçamento/punição, juntamente (ou não) com uma possível exposição a eventos incontroláveis (p. ex.: pais ora punem, ora não punem o mesmo comportamento), deveriam ser incluídas na análise funcional do repertório comportamental desse indivíduo. No caso de clientes com história de exposição a eventos incontroláveis, os resultados ANÁLISE DO COMPORTAMENTO da pesquisa básica sugerem que a experiência com eventos controláveis pode ser efetiva na reversão dos efeitos dessa história (Carvalho, 1998; Nation e Massad, 1978; Seligman et al., 1975; Williams e Maier, 1977); ou seja, indivíduos expostos a eventos incontroláveis e, em seguida, a eventos controláveis não apresentam dificuldade de aprendizagem de novos comportamentos. Em termos de prática clínica, esses resultados sugerem que o terapeuta deve estabelecer situações discrimináveis de controlabilidade ou criar condições para que o cliente discrimine situações de controlabilidade já existentes, o que pode ser feito na própria sessão terapêutica. Tais intervenções serão feitas de modo a promover a aprendizagem de novos comportamentos (ou aumentar a freqüência de comportamentos adequados anteriormente aprendidos), visando à generalização dos mesmos para o ambiente natural do indivíduo. Partindo do pressuposto de que os principais dados a respeito da história de vida do cliente já foram levantados pelo terapeuta, assim como as informações sobre contingências atuais, algumas propostas de intervenção serão apresentadas a seguir. Treino de auto-observação O contato com situações controláveis pode ser favorecido a partir da auto-observação, ou seja, da observação do próprio comportamento e de eventos ambientais relevantes. Alguns clientes apresentam dificuldades de auto-observação, sendo necessário que o terapeuta promova o treino desse comportamento. Para tanto, o terapeuta pode utilizar, dentre outros, dois procedimentos: a modelação e o registro comportamental. No primeiro procedimento, o terapeuta fornece modelos de auto-observação, descrevendo seu próprio comportamento e identificando variáveis de controle antecedentes e conseqüentes, passadas e atuais. O comportamento-alvo pode ter sido emitido tanto fora como dentro da sessão terapêutica. O mesmo pode ser feito em relação aos comportamentos do cliente. No segundo procedimento, o terapeuta solicita ao clien- 93 te registros constantes de comportamentos emitidos fora do setting terapêutico que foram (ou não) efetivos na obtenção de reforços. Esses registros permitem a identificação, por parte do cliente (e também do terapeuta), dos reforços disponíveis em seu ambiente. Tanto os modelos fornecidos pelo terapeuta como os registros de comportamentos e suas conseqüências poderão auxiliar o cliente a discriminar situações de controlabilidade. Treino de repertórios não-verbais Ao discriminar as situações de controlabilidade na sua história passada e atual, o cliente estará identificando as contingências às quais será mais provável que se exponha e, a partir de então, a exposição a essas contingências pode ser programada. Dessa forma, a exposição a situações de controlabilidade deve começar levando-se em consideração os comportamentos já presentes no repertório do cliente. Por exemplo, considere uma cliente que apresenta um quadro de isolamento social (p. ex.: só sai de casa para trabalhar, raramente interage com os familiares, não sai com amigos, chora freqüentemente) após uma história de repetidos fracassos em relacionamentos amorosos. Ao longo das sessões, algumas contingências reforçadoras passadas são identificadas: no trabalho, ela era prestigiada pelo chefe por suas habilidades no computador; em casa, ajudava a mãe e os irmãos com os serviços bancários e era valorizada por isso; com os amigos, era elogiada por seus conselhos “sempre úteis”. A partir da identificação desses comportamentos e de suas conseqüências, é possível programar atividades nas quais a cliente terá grande probabilidade de emitir tais comportamentos e nas quais os mesmos provavelmente serão reforçados. A reexposição a essas contingências reforçadoras poderá minimizar os efeitos da exposição anterior a eventos aversivos incontroláveis e, assim, promover a generalização desses comportamentos para novas situações. Quando as condições para a emissão de comportamentos mais eficientes e adequados 94 ABREU-RODRIGUES, RIBEIRO & COLS. envolvem eventos aversivos para o cliente (p. ex.: situações novas, possibilidade de rejeição e crítica), o terapeuta pode programar a exposição às contingências por meio de aproximações sucessivas. Uma cliente cujo isolamento social consiste em esquiva do risco de outras desilusões afetivas poderá ser treinada a se expor gradualmente a situações que favoreçam relacionamentos amorosos e, simultaneamente, a se comportar de maneira mais efetiva nesses relacionamentos. Por exemplo, ela poderá iniciar conversas com pessoas mais próximas de seu convívio diário, isto é, a aprendizagem desses comportamentos deve ser iniciada em contextos interpessoais com baixo teor aversivo. O ambiente terapêutico, bem como o ambiente familiar, caso sejam caracterizados como reforçadores, também podem oferecer um contexto inicial. Em ambas as situações, a cliente pode aprender a discriminar quando e como emitir comportamentos socialmente relevantes, tais como expressar sentimentos, fazer e negar pedidos, criticar, elogiar, etc. Os próximos passos envolveriam um potencial de risco gradativamente maior. A cliente poderia ser incentivada a se relacionar mais intensamente com os amigos e, em seguida, com pessoas desconhecidas visando ao desenvolvimento de um relacionamento amoroso. No decorrer desse processo de aproximações sucessivas, é de extrema importância ressaltar todo e qualquer progresso do cliente, tanto pelo simples fato de se expor a situações de “risco” como também pelos reforços obtidos em função de seus novos comportamentos. Isso deve ser feito para que o cliente aprenda a discriminar as contingências reforçadoras presentes em seu ambiente e, assim, tornar a exposição a tais contingências cada vez mais provável. Treino de repertórios verbais Um aspecto importante do processo terapêutico refere-se à identificação do grau de correspondência entre as regras do cliente e as contingências em vigor em seu cotidiano. Considere um cliente adolescente com uma história de vida caracterizada pela indepen- dência entre sucessos/fracassos e seus comportamentos (p. ex.: não passou no vestibular apesar de ter estudado muito, ganhou um carro dos pais sem um motivo especial). Em decorrência dessa história, o cliente desenvolveu a regra “não adianta fazer A ou B, as coisas acontecem quando têm de acontecer”, e sempre a verbaliza quando quer justificar o fato de não lutar por seus objetivos. É importante lembrar que seguir essa regra pode gerar reforços eventualmente (já que situações de incontrolabilidade fazem parte do nosso cotidiano), o que torna difícil o seu abandono (Abreu-Rodrigues e Sanabio, no prelo). Uma vez identificado o grau de correspondência entre regra e contingências, cabe ao terapeuta ajudar o cliente a discriminar quando tal regra é precisa e quando é imprecisa (o Capítulo 12 contém informações mais detalhadas sobre controle verbal). No diálogo (fictício) que se segue é exemplificado o uso de frases paradoxais com o objetivo de colocar o cliente em contato com a imprecisão da regra. C: – Nada do que eu faço adianta... T: – É, realmente, nada do que você faz adianta. C: – Como assim? T: – Você disse que nada do que você faz adianta, talvez você tenha razão. C: – Mas não é bem assim... Sei lá... T: – Como é então? C: – Eu devo conseguir às vezes. Todo mundo consegue algo que deseja de vez em quando, né? T: – É? C: – É. T: – Você sabe identificar o que e quando você consegue? C: – Hum, deixa eu ver... Ah, por exemplo, quando eu quero muito acampar com meus amigos nos finais de semana, eu converso com meus pais e quase sempre consigo convencê-los a me deixarem ir. T: – É um bom exemplo de algo que você consegue conquistar em função do que você mesmo fez. Lembra de mais algum? C: – Na escola, por exemplo, eu estudo bastante em época de prova e sempre consigo tirar boas notas. ANÁLISE DO COMPORTAMENTO T: – Isso mesmo, mais um ótimo exemplo! Você parece conseguir conquistar algumas coisas então, né? C: – É verdade... Eu consigo muita coisa, mas muitas vezes eu não percebo. Por que isso acontece? Nesse exemplo, é possível observar que o terapeuta, além de não reforçar o comportamento verbal inadequado do cliente (“nada do que eu faço adianta”), apresenta estímulos discriminativos diferentes daqueles usualmente apresentados em seu ambiente (“é, realmente, nada do que você faz adianta”, “... talvez você tenha razão”) de modo a evocar comportamentos alternativos (“Como assim?”, “Mas não é bem assim...”). Essa estratégia poderá auxiliar o cliente a discriminar suas regras inadequadas, assim como algumas das contingências reforçadoras presentes em sua história. Os relatos dos clientes fornecem informações importantes sobre atribuição de causalidade. Em função de uma história de exposição a explicações mentalistas, os indivíduos comumente atribuem seus comportamentos a eventos internos e, conseqüentemente, seus objetivos na terapia focalizam a eliminação de sentimentos e pensamentos negativos (p. ex.: “se eu perder essa insegurança e melhorar minha auto-estima, acho que as coisas vão melhorar”). Outras vezes, as explicações fornecidas pelo cliente apóiam-se em eventos ambientais, mas uma análise cuidadosa revela que os eventos apontados são irrelevantes para a ocorrência do comportamento (p. ex.: “não tenho estudado porque ler muito me dá dor de cabeça” quando, na realidade, o cliente está esquivando-se do estudo em função de dificuldades na compreensão do conteúdo). Ambos os relatos não apresentam a interação comportamentoambiente como o foco da atenção. Diante desse quadro, é importante que o terapeuta considere com cautela os relatos do cliente, uma vez que eles podem descrever variáveis irrelevantes para a compreensão do comportamento (ver Sanabio e Abreu-Rodrigues, 2002). Embora essa imprecisão possa ser de interesse à medida que sugere contingências de reforçamento e punição às quais o cliente foi (ou continua sendo) exposto, é impor- 95 tante estabelecer contingências para gerar relatos acurados. Para tanto, o terapeuta pode promover o treino de auto-observação, anteriormente discutido. Dessa forma, o cliente irá aprender a identificar, com acurácia, relações funcionais entre seus comportamentos e os eventos ambientais, uma aprendizagem que geralmente ocorre a partir de modelos fornecidos pelo terapeuta ou por meio de reforçamento diferencial por ele estabelecido. A modelagem das verbalizações do cliente, assim como a modelação, pode ser feita a partir dos eventos que ocorrem na própria relação terapêutica (Kohlenberg e Tsai, 1991/2001). CONCLUSÃO De acordo com a proposta de Maier e Seligman (1976), os efeitos da história de incontrolabilidade seriam produto das expectativas dos indivíduos, as quais são avaliadas por meio dos relatos. Entretanto a sugestão desses autores apresenta alguns problemas, ampliando a necessidade de manipulações experimentais mais rigorosas na área. O primeiro deles se refere ao status de “causa” atribuído às expectativas dos participantes. Para que qualquer evento seja considerado como variável de controle do comportamento, é necessário demonstrar que há relação funcional entre esse evento e o comportamento. Para isso, o evento é alterado de maneira sistemática (variável independente), enquanto possíveis alterações sobre o comportamento (variável dependente) são observadas. Quando a variável dependente varia sistematicamente com manipulações da variável independente, tem-se uma relação funcional. Dessa forma, afirmar que a variável dependente está funcionalmente relacionada à variável independente implica dizer que, sob determinadas condições ambientais, mudanças na primeira ocorrerão em função de mudanças na segunda; em condições ambientais diferentes, é possível que tal relação não seja observada. Nesse caso, a variável independente não é considerada a causa (Chiesa, 1994), uma vez que uma relação causal sugere que a ocorrência de um evento é condição necessária e suficiente 96 ABREU-RODRIGUES, RIBEIRO & COLS. para a ocorrência de outro evento, o que raramente é observado na natureza (Johnston e Pennypacker, 1993). Os estudos sobre o efeito da exposição a eventos incontroláveis que investigam o papel das expectativas dos indivíduos não identificam relações funcionais entre tais expectativas e o comportamento dos participantes. Isso porque as expectativas, enquanto eventos não-observáveis, não são manipuladas, sendo apenas inferidas a partir dos relatos dos indivíduos, os quais também não são diretamente manipulados. Um segundo problema está relacionado ao uso do relato como instrumento de coleta de dados. Conforme discutido anteriormente, essa prática apóia-se no pressuposto de que os relatos retratam com fidedignidade as expectativas dos indivíduos. Entretanto vários estudos (p. ex.: Critchfield e Perone, 1990; 1993; Critchfield, 1993; 1996; Sanabio e AbreuRodrigues, 2002; Shimoff, 1986; Simonassi et al., 1994, 1995, 1997) têm demonstrado que os relatos podem estar sob controle de inúmeras variáveis e, assim, podem consistir em descrições imprecisas das contingências em vigor. Uma vez que os relatos podem não descrever com precisão eventos públicos, é viável supor que o mesmo pode ocorrer com relação aos relatos de eventos privados, principalmente se for considerado que a comunidade verbal não pode prover reforçamento diferencial consistente para tais relatos. Dessa forma, eles devem ser considerados com cautela nas tentativas de explicar o comportamento. Considerar o efeito de uma história de incontrolabilidade como produto da expectativa (um evento privado) gera um terceiro problema. De acordo com abordagens mentalistas, modificações no ambiente externo produziriam modificações em comportamentos privados não-observáveis, sendo estes últimos considerados como a variável de controle dos comportamentos públicos. Ou seja, o foco de interesse dessas abordagens seria os processos comportamentais não-observáveis diretamente. Sob uma perspectiva analítico-comportamental, entretanto, o mentalismo representa um problema, pois, conforme apontado por Skinner (1953/1994, p. 41), “o hábito de buscar dentro do organismo uma explicação do comportamento tende a obscurecer as variáveis que estão ao alcance de uma análise científica”. Assim sendo, as variáveis de controle devem ser buscadas no ambiente. Quando isso ocorre, o controle do comportamento torna-se possível, uma vez que eventos ambientais podem ser manipulados. O quarto problema é que os estudos sobre efeito de uma história de incontrolabilidade comumente negligenciam as funções de controle exercidas pelas variáveis manipuladas. Todos os estudos da área manipulam a história de controlabilidade/incontrolabilidade. Outros, adicionalmente, manipularam o conteúdo das instruções apresentadas (Hiroto, 1974; Klein et al., 1976; Mikulincer, 1986) ou o tipo de tarefa às quais os participantes foram expostos (Douglas e Anisman, 1975; Klein e Seligman, 1976). Nesses estudos, entretanto, a história, as instruções e o tipo de tarefa não foram considerados como fontes primárias de controle do desempenho não-verbal. De fato, essas variáveis só eram relevantes à medida que, supostamente, alteravam as expectativas dos participantes. Um quinto problema também pode ser apontado: os resultados sobre as possíveis relações entre os relatos e os efeitos da exposição a eventos incontroláveis são inconsistentes. Enquanto alguns autores (p. ex.: Alloy et al., 1984; Douglas e Anisman 1975; Hiroto 1974; Klein et al., 1976) demonstraram correspondência entre os relatos e o desempenho não-verbal, outros autores (p. ex.: Ford e Neale 1985; Oakes e Curtis 1982; Prindaville e Stein 1978; Tennen, Drum et al., 1982; Tennen, Gillen et al., 1982) demonstraram independência entre esses dois comportamentos. Essa inconsistência de resultados sugere a necessidade de estudos adicionais para identificar as variáveis responsáveis pela correspondência entre os relatos e os efeitos da exposição a eventos incontroláveis. Apesar desses problemas, os estudos sobre a exposição a eventos incontroláveis são importantes porque apontam a possibilidade de contingências verbais influenciarem o comportamento não-verbal dos indivíduos, além de investigarem a influência de contingências não-verbais passadas sobre o comportamen- ANÁLISE DO COMPORTAMENTO to atual. A identificação de variáveis históricas justifica-se por duas razões: porque permite aprimorar o controle experimental, uma vez que efeitos da história passada, quando não “desejáveis”, poderiam ser minimizados, ou mesmo eliminados, e porque contribui para a elaboração de intervenções comportamentais eficazes, à medida que contingências atuais influenciam o comportamento de maneiras diferenciadas em função de histórias de reforçamento/punição distintas (Aló, 2002). Os estudos sobre a história de incontrolabilidade também são relevantes por fornecerem subsídios para a prática clínica. No momento, as intervenções terapêuticas, embora se mostrem efetivas no tratamento de indivíduos expostos a situações de incontrolabilidade, parecem não se beneficiar dos achados da pesquisa básica. Similarmente, os terapeutas têm apontado diversas variáveis envolvidas no fenômeno da incontrolabilidade, mas essas variáveis ainda não foram experimentalmente investigadas. Da mesma forma que a prática clínica pode ser enriquecida com dados experimentais que contribuam para o estabelecimento de intervenções mais eficazes, fenômenos e processos clínicos podem gerar questões experimentais de suma relevância. É preciso, então, que clínicos e pesquisadores promovam a interação entre essas duas áreas. REFERÊNCIAS BIBLIOGRÁFICAS Abreu-Rodrigues, J.; Sanabio, E. T. (no prelo). Instruções e auto-instruções: Contribuições da pesquisa básica. Em C. N. Abreu; H. J. Guilhardi (Orgs.), Manual prático de psicoterapia comportamental, cognitiva e construtivista. São Paulo: Editora Roca. Alloy, L. B.; Abramson, L. Y. (1979). Judgment of contingency in depressed and nondepressed students: Sadder but wiser? Journal of Experimental Psychology: General, 108, 441-485. Alloy, L. B.; Peterson, C.; Abramson, L. Y.; Seligman, M. E. P. (1984). Attributional style and the generality of learned helplessness. Journal of Personality and Social Psychology, 46, 681-687. Aló, R. M. (2002). História de reforçamento e operações estabelecedoras: Efeitos sobre a sensibilidade comportamental. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF. Carvalho, M. V. (1998). Interação entre eventos aversivos controláveis/incontroláveis e reforçamento contínuo parcial: Efeitos sobre a sensibilidade à mudança de estímu- 97 los. Dissertação de mestrado não publicada. Universidade de Brasília, Brasília, DF. Chiesa, M. (1994). Radical behaviorism: The philosophy and the science. Boston: Authors Cooperative, Inc. Publishers. Critchfield, T. S. (1993). Signal-detection properties of verbal self-reports. Journal of the Experimental Analysis of Behavior, 60, 495-514. Critchfield, T. S. (1996). Differential latency and selective nondisclosure in verbal self-reports. The Analysis of Verbal Behavior, 13, 49-63. Critchfield, T. S.; Perone, M. (1990). Verbal self-reports of delayed matching-to-sample by humans. Journal of the Experimental Analysis of Behavior, 53, 321-344. Critchfield, T. S.; Perone, M. (1993). Verbal self-reports about matching-to-sample: Effects of the number of elements in a compound sample stimulus. Journal of the Experimental Analysis of Behavior, 59, 193-214. Crowell, C. R.; Anderson, D. C. (1981). Influence of duration and number of inescapable shocks on intrashock activity and subsequent interference effects. Animal Learning e Behavior, 9, 28-37. Douglas, D.; Anisman, H. (1975). Helplessness or expectation incongruency: Effects of aversive stimulation on subsequent performance. Journal of Experimental Psychology: Human Perception and Performance, 1, 411-417. Ford, C. E.; Neale, J. M. (1985). Learned helplessness and judgments of control. Journal of Personality and Social Psychology, 49, 1330-1336. Glazer, H. I.; Weiss, J. M. (1976a). Long-term and transitory interference effects. Journal of Experimental Psychology: Animal Behavior Processes, 2, 191-201. Glazer, H. I.; Weiss, J. M. (1976b). Long-term interference effect: An alternative to “learned helplessness”. Journal of Experimental Psychology: Animal Behavior Processes, 2, 202-213. Hiroto, D. S. (1974). Locus of control and learned helplessness. Journal of Experimental Psychology, 102, 187-193. Hiroto, D. S.; Seligman, M. E. P. (1975). Generality of learned helplessness in man. Journal of Personality and Social Psychology, 31, 311-327. Hunziker, M. H. L. (1981). Um estudo sobre incontrolabilidade: Considerações metodológicas. Tese de doutorado não publicada, Universidade de São Paulo, São Paulo, SP. Hunziker, M. H. L. (2001). O estudo do desamparo aprendido como estratégia de uma ciência histórica. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 227-233). Santo André: ESETec. Johnston, J. M.; Pennypacker, H. S. (1993). Strategies and tactics of human behavioral research. Hillsdale, N.J.: Lawrence Erlbaum. Jones, S. L.; Nation, J. R.; Massad, P. (1977). Immunization against learned helplessness in man. Journal of Abnormal Psychology, 86, 75-83. Klein, D. C.; Seligman, M. E. P. (1976). Reversal of performance deficits and perceptual deficits in learned 98 ABREU-RODRIGUES, RIBEIRO & COLS. helplessness and depression. Journal of Abnormal Psychology, 85, 11-26. Klein, D. C.; Fencil-Morse, E.; Seligman, M. E. P. (1976). Learned helplessness, depression and the attribution of failure. Journal of Personality and Social Psychology, 33, 508-516. Kohlenberg, R. J.; Tsai, M. (2001). Psicoterapia analítica funcional – Criando relações terapêuticas intensas e curativas (F. Comte; M. Delliti; M. Z. Brandão; P. R. Oerdyk; R. R. Kerbauy; R. C. Wielenska; R. A. Banaco e R. Starling, trads.). Santo André: ESETec (Obra publicada originalmente em 1991). Lamb, D. G.; Davis, S. F.; Tramill, J. L.; KleinhammerTramill, P. J. (1987). Noncontingent reward-induced learned helplessness in humans. Psychological Reports, 61, 559-564. Levine, M.; Rotkin, L.; Jankovic, I. N.; Pitchford, L. (1977). Impaired performance by adult humans: Learned helplessness or wrong hypotheses? Cognitive Therapy and Research, 1, 275-285. Maier, S. F.; Seligman. M. E. P. (1976). Learned helplessness: Theory and evidence. Journal of Experimental Psychology: General, 105, 3-46. Matos, M. A.; Tomanari, G. Y. (2002). A análise do comportamento no laboratório didático. Barueri, S.P.: Manole. Mikulincer, M. (1986). Attributional processes in the learned helplessness paradigm: Behavioral effects of global attributions. Journal of Personality and Social Psychology, 51, 1248-1256. Mikulincer, M.; Nizan, B. (1988). Causal attribution, cognitive interference, and the generalization of learned helplessness. Journal of Personality and Social Psychology, 55, 470-478. Nation, J. R.; Massad, P. (1978). Persistence training: A partial reinforcement procedure for reversing learned helplessness and depression. Journal of Experimental Psychology: General, 107, 436-451. Oakes, W. F.; Curtis, N. (1982). Learned helplessness: Not dependent upon cognitions, attributions, or other such phenomenal experiences. Journal of Personality, 50, 387-408. Overmier, J. B.; Seligman, M. E. P. (1967). Effects of inescapable shock upon subsequent escape and avoidance responding. Journal of Comparative Physiological Psychology, 63, 28-33. Prindaville, P.; Stein, N. (1978). Predictability, controllability and inoculation against learned helplessness. Behavior Research and Therapy, 16, 263-271. Sanabio, E. T.; Abreu-Rodrigues, J. (2002). Efeitos de contingências de punição sobre os desempenhos ver- bal e não-verbal. Psicologia: Teoria e Pesquisa, 18, 161172. Seligman, M. E. P.; Beagley, G. (1975). Learned helplessness in the rat. Journal of Comparative Physiology and Psychology, 88, 534-541. Seligman, M. E. P.; Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74, 1-9. Seligman, M. E. P.; Rosellini, R. A.; Kozak, M. J. (1975). Learned helplessness in the rat: Time course, immunization, and reversibility. Journal of Comparative and Physiological Psychology, 88, 542-547. Shimoff, E. (1986). Post-session verbal reports and the experimental analysis of behavior. The Analysis of Verbal Behavior, 4, 19-22. Simonassi, L. E.; Fróes, A. C.; Sanabio, E. T. (1995). Contingências e regras: Considerações sobre comportamentos conscientes. Estudos (Goiânia), 22, 71-82. Simonassi, L. E.; Oliveira, C. I.; Gosch, C. S. (1997). Exposição a contingências, conteúdo de instrução e formulação de regras. Psicologia: Teoria e Pesquisa, 13, 189-195. Simonassi, L. E.; Oliveira, C. I.; Sanabio, E. T (1994). Descrição sobre possíveis relações entre contingências programadas e formulação de regras. Estudos (Goiânia), 21, 97-112. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. Skinner, B. F. (1993). Sobre o behaviorismo (M. P. Villalobos, trad.). São Paulo: Cultrix (Obra publicada originalmente em 1974). Skinner, B. F. (1994). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins Fontes (Obra publicada originalmente em 1953). Tennen, G.; Drum, P. E.; Gillen, R.; Stanton, A. (1982). Learned helplessness and the detection of contingency: A direct test. Journal of Personality, 50, 426-442. Tennen, H.; Gillen, R.; Drum, P. E. (1982). The debilitating effect of exposure to noncontingent escape: A test of the learned helplessness model. Journal of Personality, 50, 409-425. Tiggemann, M.; Winefield, A. H. (1987). Predictability and timing of self-report in learned helplessness experiments. Personality and Social Psychology Bulletin, 13, 253-269. Todorov, J. C. (1985). O conceito de contingência tríplice na análise do comportamento humano. Psicologia: Teoria e Pesquisa, 1, 75-81. Williams, J. L.; Maier, S. F. (1977). Transituational immunization and therapy of learned helplessness in the rat. Journal of Experimental Psychology: Animal Behavior Processes, 3, 240-252. ANÁLISE DO COMPORTAMENTO COMPORTAMENTO ADJUNTIVO: DA PESQUISA À APLICAÇÃO 99 6 LINCOLN DA SILVA GIMENES ALESSANDRA DE MOURA BRANDÃO MARCELO FROTA BENVENUTI Nosso problema não é o da analogia, mas o de conseguir uma compreensão suficiente tanto dos ratos como dos homens, para que possamos reconhecer semelhanças nos processos comportamentais. Temos de ser capazes de classificar nossas variáveis de uma tal maneira que nos permita reconhecer semelhanças entre os seus princípios de operação, apesar de suas especificações físicas poderem ser bem diferentes (Sidman, 1960/1976, p. 35-36). Comportamento adjuntivo pode ser genericamente definido como um comportamento que é mantido de maneira indireta pelas variáveis, que tipicamente controlam um outro comportamento, em vez de ser mantido diretamente por suas próprias variáveis controladoras (Falk, 1971). Em geral, diz-se que o comportamento diretamente controlado é governado pela contingência (tanto R-S – resposta dependente – como S-S – resposta independente), enquanto o comportamento adjuntivo é induzido pela contingência. Essa distinção é importante pelo fato de aquele ser programado por meio das relações contingenciais, enquanto este ocorre como um correlato dessas relações. Em um estudo pioneiro, Falk (1961a) observou a ocorrência sistemática de um comportamento não-programado pela contingência inicial. Em seu experimento com ratos, no qual pressões à barra eram reforçadas com pelotas de alimento, segundo um esquema de intervalo variável de 60 s, ele observou um con- sumo excessivo de água (polidipsia) disponível durante a sessão experimental, sem que os sujeitos estivessem submetidos a qualquer privação da mesma. A polidipsia ocorria principalmente após o consumo da pelota de ração e mantinha-se por toda a sessão que tinha a duração de aproximadamente 3 h. Para alguns sujeitos, o consumo de água durante a sessão excedeu em dois terços seu peso corporal e mostrou-se superior ao consumo de água na gaiola-viveiro nos períodos entre as sessões experimentais. A polidipsia também foi observada na utilização de um esquema de liberação de alimento não-contingente à resposta, com duração fixa de 60 s, mas não sob um esquema de reforçamento contínuo (Falk, 1961b). Falk denominou o fenômeno de polidipsia psicogênica, sugerindo que sua natureza seria comportamental, e não fisiológica. Os objetivos deste capítulo são apresentar ao leitor os fundamentos experimentais do comportamento adjuntivo, bem como sugerir o modelo desse comportamento como uma alternativa para a compreensão de transtornos comportamentais. Com esses objetivos serão apresentadas inicialmente as características do comportamento adjuntivo, incluindo uma discussão da pertinência da classificação desse comportamento em uma terceira classe, além da descrição de diferentes tipos de comportamentos adjuntivos e da generalidade desse fenômeno comportamental. A seguir, serão apre- 100 ABREU-RODRIGUES, RIBEIRO & COLS. sentados exemplos de transtornos comportamentais, para cuja compreensão o modelo de comportamento adjuntivo pode contribuir. Esses exemplos incluem drogadição, obesidade e bulimia, anorexia por atividade e a síndrome do cólon irritável. Finalmente será discutido o controle de estímulos sobre o comportamento adjuntivo e suas implicações para a análise funcional do comportamento. CARACTERÍSTICAS DO COMPORTAMENTO ADJUNTIVO Baseando-se nos trabalhos sobre polidipsia, Falk (1971) destacou sete características básicas do comportamento adjuntivo: • A maior taxa desse comportamento ocorre logo após a apresentação do reforço/estímulo, isto é, a distribuição do comportamento no intervalo entre reforços/estímulos é representada por uma curva decrescente negativamente acelerada. • O comportamento depende da duração dos intervalos entre a apresentação dos reforços/estímulos, resultando em uma relação bitônica (curva em forma de U invertido) entre o tamanho do intervalo e a taxa do comportamento, com taxas reduzidas quando o intervalo é pequeno ou muito grande, e altas quando o intervalo é de um valor intermediário. • O comportamento varia de acordo com o nível de privação dos sujeitos, apresentando uma relação direta entre o nível de privação e a taxa do comportamento. • O comportamento ocorre em excesso se comparado às condições de controle. • O comportamento pode ser induzido tanto por esquemas dependentes (contingências R-S) como por esquemas em que a liberação dos estímulos não depende da resposta (contingências S-S). • O comportamento pode ser usado como reforço para outros comportamentos, por exemplo, um rato pode aprender uma nova resposta conseqüenciada pelo acesso à água quando exposto a um esquema intermitente de apresentação de alimento. • O comportamento depende dos estímulos ambientais disponíveis, com as taxas variando em função dos arranjos do ambiente, como, por exemplo, a localização e o tipo de vasilhame utilizado para apresentação da água. Além dessas características, os comportamentos adjuntivos também estão sujeitos aos efeitos de algumas manipulações ambientais que afetam o comportamento operante. Dessa forma, o comportamento adjuntivo pode ser afetado tanto por contingências de punição – diminuição na taxa do comportamento (Pellon e Blackman, 1987) – como pela administração de diferentes drogas, tais como apomorfina – diminuição na taxa de comportamento (Snodgrass e Aleen, 1988), d-anfetamina e diazepam – alterações na distribuição do comportamento dentro do intervalo entre reforços, mas sem alterar as taxas (Flores e Pellon, 1997; Pellon e Blackman, 1992), e amperozide – diminuição na taxa do comportamento (Tung et al., 1994). Os efeitos da radiação ionizante observados sobre o comportamento operante também foram observados sobre o comportamento adjuntivo de ingestão de água – diminuição na taxa do comportamento (Brandão, Gimenes e Rodrigues, 2003). Assim como o operante, o comportamento adjuntivo pode também interagir com outras variáveis biológicas, como, por exemplo, o ritmo circadiano – a taxa do comportamento adjuntivo reflete a distribuição do comportamento ao longo de 24 h em condições de livre acesso sem imposição de contingências, isto é, o horário da sessão experimental afeta a taxa do comportamento para mais ou para menos, de acordo com as taxas observadas no mesmo horário do dia na condição de livre acesso (Gimenes e Melo, 1993; Melo et al., 1991). ANÁLISE DO COMPORTAMENTO Comportamento adjuntivo como uma terceira classe A polidipsia observada nos arranjos experimentais descritos veio a ser designada como comportamento adjuntivo ou comportamento induzido pelo esquema (esses dois termos têm sido utilizados de forma intercambiável na literatura), para diferenciá-lo do comportamento governado pelo esquema, o operante em questão, como definido anteriormente. O termo comportamento induzido por esquemas de reforçamento surgiu a partir do trabalho de Staddon e Simmelhag (1971), no qual o efeito de contingências estímulo-estímulo sobre o comportamento de pombos e suas implicações para a compreensão do comportamento de uma forma mais geral foram explicitamente explorados. Esses autores observaram que os pombos que recebiam acesso ao alimento de acordo com esquemas temporais, dependentes ou independentes das respostas, passaram a apresentar um padrão típico e estereotipado de respostas entre as apresentações do alimento. O padrão geral dos sujeitos consistiu em respostas variadas logo após a apresentação do alimento e respostas de bicar o comedouro pouco antes da apresentação do alimento. Portanto, respostas variadas ocorriam freqüentemente no início dos intervalos entre as apresentações do alimento, e foram denominadas de respostas interinas. Respostas de bicar, que se tornavam muito prováveis para todos os sujeitos conforme se aproximava uma nova liberação do alimento foram denominadas de respostas terminais. Outras respostas, que ocorreriam durante o intervalo, entre as respostas interinas e as respostas terminais, mas sem aumento na sua probabilidade em função do esquema, foram denominadas de respostas facultativas, sendo o comportamento de correr em uma roda de atividade um exemplo apresentado por Staddon e Ayres (1975). Staddon e Simmelhag (1971) consideraram que respostas interinas e respostas terminais seriam induzidas pelo esquema, no sentido de que são respostas que se tornam mais prováveis de ocorrer na vigência do esquema indutor, 101 e não na sua ausência. Nesse contexto, o termo comportamento induzido por esquema serviria para enfatizar que a ocorrência de respostas terminais e interinas não poderia ser explicada por reforçamento. A ocorrência e as características definidoras dos comportamentos induzidos por esquemas dificilmente poderiam ser entendidas a partir dos princípios até então utilizados na análise do comportamento operante. Para Staddon (1977), a polidipsia induzida por esquemas de reforçamento seria, assim, um tipo de resposta interina. Algumas das características do comportamento adjuntivo, tais como excesso, dependência dos parâmetros do esquema intermitente de reforçamento (principalmente parâmetros temporais), localização da ocorrência dentro do intervalo entre reforços, distribuição bitônica em função do tamanho dos intervalos dos esquemas, propriedades motivadoras desses comportamentos, entre outras, levaram Falk (1971) a propor uma nova classe de comportamentos. Essa terceira classe, a de comportamentos adjuntivos, viria a se contrapor ou a complementar as outras duas, a de comportamentos operantes e a de comportamentos respondentes. A propriedade dessa classificação foi, e ainda é, questionada (ver Wetherington, 1982, para uma análise detalhada dessa questão). Tipos e generalidades dos comportamentos adjuntivos Os achados iniciais de Falk, pelas características aberrantes da polidipsia observada, geraram um grande interesse pelo fenômeno e desencadearam uma longa empreitada de pesquisas na área. Além da polidipsia, outros comportamentos adjuntivos têm sido demonstrados em estudos realizados com animais, como, por exemplo, o consumo de álcool em ratos (Lester, 1961), ingestão de materiais nãocomestíveis (pica) em macacos (Villareal, 1967), agressão em pombos (Hutchinson, Azrin e Hunt, 1968), uso da roda de atividades em ratos (Levitsky e Collier, 1968), lambedura de 102 ABREU-RODRIGUES, RIBEIRO & COLS. jatos de ar em ratos (Mendelson e Chillag, 1970), motilidade intestinal em ratos (Rayfield, Segal e Goldiamond, 1982), hiperfagia em ratos (Wilson e Cantor, 1987) e auto-administração de drogas em ratos (Falk et al., 1990). Apesar de não mencionar o termo comportamento adjuntivo, Fernandez e Timberlake (2003) demonstraram a ocorrência de diferentes comportamentos estereotipados em ursos polares quando eles eram alimentados segundo esquemas temporais específicos. Além dos diferentes tipos de comportamentos adjuntivos, os mesmos têm sido observados em uma ampla variedade de espécies. Segundo Falk (1998), a polidipsia tem sido observada em várias linhagens de ratos, camundongos, porquinhos-daíndia, gerbilo da Mongólia, chinchilas, macacos rhesus, macacos de Java, chimpanzés, pombos e humanos. A generalidade do fenômeno do comportamento adjuntivo (p. ex.: Roper, 1981) e sua ocorrência em seres humanos (p. ex.: Overskeid, 1992) têm sido ocasionalmente questionadas. Entretanto vários estudos têm demonstrado em algum grau sua ocorrência tanto em crianças como em adultos. Enquanto os comportamentos adjuntivos de beber, de comer, de atividades motoras, de fumar e de asseio foram observados em adultos em uma situação de jogos (Fallon, Allen e Butler, 1979; Wallace e Singer, 1976; Wallace, Sanson e Singer, 1978), crianças submetidas a esquemas de intervalo fixo para operação de uma chave telegráfica apresentaram comportamentos adjuntivos de vocalização, de beber e de atividades motoras (Porter, Brown e Goldsmith, 1982) (para uma resposta às críticas sobre a ocorrência de comportamentos adjuntivos em humanos, ver Falk, 1993). COMPORTAMENTO ADJUNTIVO E TRANSTORNOS COMPORTAMENTAIS A seguir serão apresentados alguns transtornos comportamentais juntamente com os fundamentos experimentais que fornecem elementos para um modelo de comportamento adjuntivo como um modelo alternativo para a compreensão dessas disfunções. Drogadição A diversidade de excessos comportamentais que podem ocorrer sob um esquema de reforçamento indutor localiza o abuso de drogas como um caso especial dentro de um contexto em que condições ambientais podem gerar muitos tipos de disfunções comportamentais (Falk, 1993). Quando água ou outras soluções são disponibilizadas sob um esquema indutor, seu consumo excessivo e a manutenção da auto-administração dessas substâncias podem ocorrer. O consumo excessivo de diferentes drogas, tais como etanol, barbitúricos, opióides, benzodiazepínicos, cocaína e nicotina, tem sido investigado sob o modelo experimental de comportamento adjuntivo por serem substâncias de adição em seres humanos. Para algumas substâncias, tem sido demonstrado o desenvolvimento de dependência física, enquanto para outras tem-se observado conseqüências comportamentais negativas após a sua ingestão, como, por exemplo, “alterações no controle motor” (Samson e Falk, 1974). Em um estudo pioneiro, Lester (1961) observou a intoxicação por etanol em ratos submetidos a um esquema de reforçamento de intervalo variável, utilizando alimento como reforço e com uma solução de etanol a 5,6% disponível durante a sessão experimental. Após 3 h de sessão, pôde-se observar um aumento elevado na concentração de etanol no sangue dos animais e sinais de intoxicação. Investigações posteriores confirmaram que ratos sob esquemas indutores semelhantes ingeriram grande quantidade de solução de etanol em sessões com duração de até 3,5 h de duração (Everett e King, 1970; Freed, Carpenter e Hymowitz, 1970). A ingestão de etanol induzida por esquema de reforçamento também pôde ser observada em outras espécies, como camundongos e macacos, com o consumo de grandes quantidades de etanol, resultando em alta concentração sangüínea dessa substância (Mello e Mendelson, 1971; Woods e Winger, 1971). A auto-administração oral induzida por esquema de reforçamento de outras substâncias, como cocaína, também tem sido alvo ANÁLISE DO COMPORTAMENTO de diversos trabalhos. Tang e Falk (1987) observaram que ratos expostos a um esquema de reforçamento de tempo fixo, com pelotas de alimentos utilizadas como reforço, aumentaram drasticamente a ingestão de uma solução de cocaína, sendo que seu consumo aumentou em função do aumento da concentração da droga na solução. Posteriormente, Falk e colaboradores (1990), em um estudo sob condições semelhantes em que água e uma solução de cocaína em baixa concentração eram disponibilizadas, não observaram uma preferência pela droga. Os autores notaram que a preferência pela solução de cocaína só foi observada quando sacarina e glicose foram acrescentadas à solução, mostrando que o sabor da substância pode ser considerado como um fator relevante da ingestão por via oral. Uma série de estudos estendeu os procedimentos de auto-administração induzida por esquemas de reforçamento de diferentes agentes tóxicos, como nicotina e cocaína, para a rota intravenosa, no sentido de eliminar uma variável indesejável da administração oral que é o sabor aversivo da droga (Singer, Oei e Wallace, 1982; Smith e Lang, 1980). Assim, ao invés de uma garrafa com água ou uma solução, os animais tinham acesso a uma barra para obter infusões intravenosas da droga. Lang, Latiff, McQueen e Singer (1977) observaram em ratos que esquemas de razão fixa 1 (FR 1) de injeções intravenosas de nicotina não era suficiente para controlar o comportamento de auto-administração. Entretanto, quando o peso dos animais foi diminuído de 100 para 80% do peso livre, a nicotina passou a funcionar como reforçador e quando essa condição foi combinada com um esquema de tempo fixo de 1 min (FT 1 min), a auto-administração de nicotina aumentou significativamente. Em humanos, vários estudos têm enfatizado a importância do comportamento adjuntivo de ingestão de substâncias como álcool e cocaína como um modelo animal para alcoolismo e drogadição. Doyle e Samson (1988) observaram o consumo de cerveja em humanos sob dois esquemas de intervalo fixo para a operação de uma máquina caça-níqueis e verificaram que os sujeitos expostos ao esquema 103 de intervalo fixo mais longo ingeriram significativamente mais cerveja do que aqueles expostos ao esquema de intervalo fixo mais curto. Além disso, foram observadas algumas características básicas dos comportamentos adjuntivos para o grupo exposto ao esquema de intervalo fixo mais longo, sugerindo, assim, que a ingestão de álcool em humanos ocorre de maneira similar ao modelo animal de polidipsia induzida por esquema de reforçamento. Além disso, os autores sugeriram que a exposição a esquemas indutores é crucial na formação da história de consumo, e que a exposição a ambientes nos quais reforçamento intermitente, talvez na forma de interação social, e álcool estão disponíveis pode levar a um padrão de consumo excessivo que pode se tornar habitual ou potencializado por ambientes similares em ocasiões futuras. As drogas que afetam diretamente o sistema nervoso central podem também produzir fortes efeitos sensoriais. Tanto esses estímulos internos como também os estímulos externos ambientais associados ao comportamento de procura e ingestão da droga formam um conjunto de estímulos discriminativos que estão associados à interação do indivíduo com a droga. Alguns desses estímulos, tanto internos como externos, podem tornar-se condicionados ao efeito farmacológico da droga. Assim, eles podem levar à ingestão da droga em função da instalação de um quadro de abstinência como também a uma retomada dos comportamentos de busca e ingestão da droga porque esses comportamentos foram associados aos reforços positivos produzidos pela ação intrínseca dessas substâncias (Falk, 1998). Dessa forma, em humanos, o abuso de drogas não é um excesso comportamental isolado e único, ao contrário, ele é apenas um dos aspectos de uma variedade de outros comportamentos disfuncionais. A aquisição e a manutenção do abuso de drogas são facilitados não apenas por fatores intrínsecos ou propriedades farmacológicas das drogas, mas também por condições econômica e socialmente estabelecidas por esquemas de reforçamento restritivos que podem proporcionar a geração de esquemas indutores para esses excessos comportamentais (Falk, 1993). 104 ABREU-RODRIGUES, RIBEIRO & COLS. Obesidade e bulimia Embora o comportamento adjuntivo de consumo de alimento (hiperfagia) não tenha sido tão claramente demonstrado quanto a polidipsia (p. ex.: Carlisle, Shanab e Simpson, 1972; King, 1974; Wetherington e Brownstein, 1979), alguns estudos demonstraram que a ingestão excessiva de alimentos também pode ser induzida ou adjuntiva a certas contingências (Bellingham, Wayner e Barone, 1979; Gimenes e Marinho, 1993; Marinho, Gimenes e Nogueira, 1991; Wilson e Cantor, 1987). Vale observar, entretanto, que o consumo de alimento adjuntivo dificilmente pode ocorrer com o mesmo vigor que a polidipsia adjuntiva. O rato tem um sistema renal bastante eficiente, capaz de eliminar facilmente líquidos excessivamente ingeridos. Por outro lado, isso não ocorre com a eliminação do alimento, pois, além das restrições físicas do estômago para receber alimentos em excesso em um curto período de tempo, o período para processamento e eliminação é maior. Bellingham e colaboradores (1979) observaram a ocorrência do consumo de alimento adjuntivo em ratos privados de água quando esta era apresentada em esquemas de intervalo fixo e de tempo fixo. Esse consumo de alimento foi significativamente superior àquele observado durante a condição de controle quando os sujeitos recebiam a mesma quantidade de água de uma única vez e tinham acesso ao alimento durante o período da sessão experimental. Além disso, o consumo de alimento foi maior na condição de tempo fixo do que na condição de intervalo fixo, lembrando que nesta última a apresentação da água requeria a emissão de respostas de pressão à barra. Comparando seus procedimentos com os de outros estudos, os autores concluíram que um fator crítico para a produção da hiperfagia parece ser o arranjo ambiental da disponibilidade do alimento em relação ao mecanismo de apresentação da água. Wilson e Cantor (1987) sugeriram que os procedimentos de comportamentos adjuntivos podem fornecer um modelo do consumo de alimento excessivo não-regulador que contribui para a obesidade em humanos. Esses autores demonstraram a ocorrência do comer adjuntivo em ratos não-privados de alimento e expostos a contingências de intervalo fixo e razão fixa cujo reforçamento era estimulação elétrica no cérebro. Durante as sessões experimentais, os sujeitos tinham acesso a uma mistura (mingau) de ração e água. Os sujeitos consumiram significativamente mais alimento durante as sessões de reforço intermitente do que durante as sessões de controle de reforçamento maciço (apresentação de todo o alimento de uma única vez) ou extinção. Além disso, a maioria dos sujeitos consumiu, em sessões de 3 h de duração, o equivalente a aproximadamente metade da quantidade de alimento consumido em 24 h. Manipulando o conteúdo calórico da ração de manutenção de ratos, Marinho, Gimenes e Nogueira (1991; ver também Gimenes e Marinho, 1993) observaram uma relação inversa entre a quantidade de calorias dessa ração e a quantidade de consumo de alimento adjuntivo sob contingências de liberação de água em esquemas de intervalo. Diferentes animais foram mantidos sob dietas de diferentes concentrações calóricas. Quando privados de água e expostos a sessões de liberação intermitente de água na qual tinham livre acesso a pelotas regulares de alimento (pelotas industrializadas de 45 mg), os animais mantidos na dieta calórica mais baixa apresentaram um consumo de alimento significativamente maior do que os animais mantidos em dietas de média e alta concentração calórica. Esses dados sugerem que a falha de muitos de programas de dieta para redução de peso pode estar no fato de que, sob certas contingências diárias, a redução do valor calórico da dieta pode potencializar o consumo de alimento. Embora não sejam encontrados na literatura trabalhos específicos que demonstrem a hiperfagia induzida por contingências em humanos, casos clínicos podem ilustrar a possibilidade de análise desse comportamento a partir do modelo de comportamento adjuntivo. Um caso clínico citado por Goldiamond (1984) apresenta uma paciente bulímica cujo padrão alimentar era constituído de alguns episódios diários de consumo excessivo de alimento, seguidos de vômitos provocados. A partir do re- ANÁLISE DO COMPORTAMENTO gistro diário das atividades dessa paciente, foi possível identificar rotinas bem-estabelecidas que ocorriam anteriormente aos episódios bulímicos. Mudanças observadas nesses episódios, decorrentes de alterações propostas nas rotinas diárias, levaram à identificação de variáveis controladoras da bulimia dessa paciente como funcionalmente semelhantes àquelas que controlam outros comportamentos definidos como adjuntivos. Dessa forma, além do comportamento bulímico, o consumo excessivo de alimento, não-bulímico, e que geralmente leva à obesidade pode também ser controlado por contingências funcionalmente semelhantes àquelas observadas nos diferentes tipos de comportamentos adjuntivos. Esse tipo de análise oferece uma alternativa para a compreensão e intervenção em problemas alimentares de alto risco para a saúde. Anorexia por atividade Um dos comportamentos adjuntivos que tem sido relatado na literatura, tanto com humanos como com outros animais, é o relacionado com atividades motoras. Ratos, quando expostos a certas contingências de reforço para respostas de pressão à barra, tendem a utilizar a roda de atividades em uma taxa muito superior àquela observada em situações de controle (Levitsky e Collier, 1968). Humanos, adultos e crianças, quando expostos a contingências similares, também apresentam um aumento nas taxas de atividades motoras (Fallon, Allen e Butler, 1979; Kachanoff, et al., 1973; Porter, Brown e Goldsmith, 1982; Wallace, Sanson e Singer, 1978). Em geral, as taxas de comportamentos adjuntivos observadas em animais estão correlacionadas com o nível de privação utilizado como operação estabelecedora das contingências indutoras desses comportamentos (Falk, 1971). Assim, existe uma relação direta entre nível de privação e taxa do comportamento adjuntivo, com maiores taxas do comportamento correlacionadas aos maiores níveis de privação. Independentemente de contingências programadas para respostas, a restrição ao alimento, além de provocar redução no peso, 105 pode provocar um correspondente aumento de atividades físicas, o que, por sua vez, pode reduzir o consumo de alimento e subseqüente perda de peso (Pierce e Epling, 1994). Dessa forma, a contingência indutora, aliada à privação, pode potencializar as taxas de comportamentos motores, como, por exemplo, o uso excessivo da roda de atividade em animais ou o excesso de exercícios físicos em humanos. Observações clínicas em casos de pacientes com anorexia indicam uma similaridade funcional entre a anorexia observada em pacientes e as observações no laboratório com ratos. Pierce e Epling (1994) sugeriram a busca de evidências convergentes para o estabelecimento dessa similaridade funcional. Alguns fatos, como: a) atividade física em excesso estar associada com anorexia em humanos; b) atividade física em excesso diminuir o consumo de alimentos em humanos e em animais; c) a redução no consumo de alimentos aumentar a atividade física em humanos e em animais; d) o início do processo de anorexia em humanos e em animais desenvolverse de modo semelhante e e) a função reprodutiva ser afetada em ratos ativos, atletas e pacientes anoréxicos, constituem exemplos de evidências convergentes que indicam similaridade funcional entre anorexia em humanos e os dados obtidos com ratos no procedimento de anorexia por atividade. Podemos incluir, ainda, nessas evidências o fato de que a exposição a certas contingências induz o aumento da atividade motora em humanos e em animais. Tomadas em conjunto, essas observações sugerem que o paradigma de laboratório pode ser um modelo útil para a exploração de determinantes da anorexia sob condições controladas. Baseados em 12 anos de pesquisa, Epling e Pierce (1988; Pierce e Epling, 1994) propuseram uma teoria biocomportamental de anorexia por atividade, que se iniciou no laboratório animal e tem demonstrado ser útil na 106 ABREU-RODRIGUES, RIBEIRO & COLS. compreensão de anorexia em humanos. Esse modelo de análise enfatiza o impacto cultural sobre os comportamentos de fazer dieta e exercícios físicos. Esses comportamentos seriam governados por contingências de reforçamento estabelecidas pelos grupos sociais referentes, como o da família e o dos amigos. Sob algumas condições particulares, a restrição alimentar seria combinada com as atividades físicas para iniciar os processos fisiológicos da anorexia. Algumas dessas condições particulares poderiam ser contingências indutoras de atividades físicas, isto é, atividades físicas poderiam surgir como adjuntivas a essas contingências, potencializando, assim, o efeito da restrição alimentar sobre o comportamento de fazer exercícios. Essa proposta oferece modos alternativos de intervenção para o tratamento dessa alteração comportamental que pode, em muitos casos, ser fatal. Síndrome do cólon irritável Rayfield e colaboradores demonstraram, no início da década de 1980, que comportamentos autonômicos também poderiam ser induzidos ou adjuntivos a certas contingências (Rayfield, Segal e Goldiamond, 1982). Utilizando ratos como sujeitos experimentais, esses pesquisadores obtiveram dados sistemáticos do funcionamento intestinal por meio da manipulação de diferentes tipos de contingências. Os dados iniciais mostraram a ocorrência sistemática de defecação durante sessões em que os ratos eram expostos a esquemas temporais de reforçamento por alimento e a ausência de defecação durante sessões cujas contingências eram de razão ou de reforçamento contínuo. As contingências temporais associadas à defecação eram tanto de intervalo fixo como variável, ou ainda, de tempo fixo ou variável. Uma das características da distribuição dos bolos fecais, observada no estudo de Rayfield e colaboradores (1982), foi a concentração destes no início da sessão, descrevendo uma curva negativamente acelerada, ao longo da mesma. Essa característica, entretanto, parece ser um efeito da medida utilizada para avaliar a ocorrência da motilidade intestinal, que é medida pelo número de bolos fecais. Assim, essa medida necessita da existência de material fecal no intestino do animal para que os bolos fecais sejam produzidos. A curva negativamente acelerada estaria, assim, refletindo o esvaziamento do intestino, e não a diminuição da motilidade do mesmo. Os dados obtidos por Rayfield e colaboradores (1982) foram replicados com variações no tipo de reforço (envolvendo diferentes topografias da resposta consumatória) e na densidade de reforçamento, demonstrando a sistematização da motilidade intestinal como comportamento adjuntivo. Utilizando alimento em pó como reforço e diferentes magnitudes, de forma a igualar a quantidade de alimento consumido em sessões de reforçamento contínuo e de intervalo fixo, Gimenes, Andronis e Goldiamond (1987) observaram a sistemática ocorrência de defecação nas sessões de esquema de intervalo fixo e sua ausência nas sessões de esquema de reforçamento contínuo. Para avaliar a precisão do controle da motilidade intestinal observada entre as sessões, nesses experimentos, Gimenes, Andronis e Goldiamond (1988) utilizaram um procedimento de esquema múltiplo no qual períodos de esquema de reforçamento contínuo e de esquema de intervalo fixo eram alternados ao longo da sessão. Nesse procedimento, quase a totalidade dos bolos fecais ocorreu durante os períodos de esquema de intervalo fixo, demonstrando um estrito controle da contingência sobre a motilidade intestinal dos animais. Além disso, esse procedimento atenuou a curva negativamente acelerada de distribuição dos bolos fecais ao longo da sessão, demonstrando também que a motilidade intestinal não é um comportamento do tipo “tudo ou nada”, isto é, quando se inicia, continua até o esvaziamento do intestino; ela pode, sim, ser interrompida e reiniciada de acordo com as contingências vigentes, mesmo que essas alterações nas contingências ocorram em pequenos intervalos de tempo. Buscando avaliar a persistência do controle da motilidade intestinal, Gimenes e colaboradores (1989) registraram a motilidade intestinal de ratos expostos a diferentes contingências em sessões diárias, durante um perío- ANÁLISE DO COMPORTAMENTO do superior a um ano. Quatro grupos foram expostos às seguintes condições: esquema de reforçamento contínuo, esquema de intervalo fixo, alternação semanal entre esquema de reforçamento contínuo e esquema de intervalo fixo e nenhuma contingência, isto é, os animais permaneciam na câmara experimental durante o período da sessão, mas sem nenhuma contingência programada. Os animais do grupo sem contingência apresentaram uma taxa moderada de defecação durante as sessões ao longo do ano. Utilizando esse grupo como controle, os animais expostos à contingência de esquema de intervalo fixo apresentaram uma taxa superior de defecação. Os animais do grupo exposto à alternação entre esquema de reforçamento contínuo e esquema de intervalo fixo apresentaram defecação durante as sessões semanais de esquema de intervalo fixo e ausência de defecação durante as sessões semanais de esquema de reforçamento contínuo. Os animais do grupo exposto à contingência de reforçamento contínuo apresentaram ausência total de defecação durante todas as sessões. Esses dados sugerem que a motilidade intestinal pode ser controlada, via contingências operando sobre outros comportamentos, tanto em seu aumento como em sua diminuição. Além disso, o controle parece ser mais rigoroso quando se trata da diminuição da motilidade, isto é, contingências de reforçamento contínuo desenvolvem um controle mais estrito. Os resultados obtidos por Wylie, Layng e Meyer (1993) tendem a corroborar essa afirmação. Trabalhando com ratos expostos a esquemas de reforçamento contínuo, de razão e de intervalo, esses pesquisadores observaram a ausência de defecação sob a condição de reforçamento contínuo e a sua ocorrência sob as outras duas condições. Assim, a intermitência ou não da apresentação do alimento (ou outro estímulo) parece ser o que determina o aumento ou a redução do comportamento adjuntivo. O controle mais estrito da contingência de reforçamento contínuo aponta para cuidados que devem ser tomados quando da escolha de uma linha de base adequada para avaliação do comportamento adjuntivo (ver Roper, 1981, para uma discussão sobre escolha de linha de base). 107 Observações clínicas de pacientes diagnosticados como tendo a Síndrome do Cólon Irritável fornecem indícios para a proposição do comportamento adjuntivo como um possível modelo para análise e intervenção nesse problema de saúde (Gimenes, 1988, 1990, 1997/2000). Essa síndrome é caracterizada por ocorrências de constipação ou de diarréia, ou ainda uma combinação de ambas, com ausência de patologias orgânicas. Alguns estudos têm relacionado a Síndrome do Cólon Irritável com alterações psicológicas como depressão, ansiedade e somatização (Lynn e Friedman, 1993) ou ainda com o estresse (Payne et al., 1992; Suls, Wan e Blanchard, 1994). O tipo de relação entre esses fatores e a síndrome está ainda aberto a confirmações. Uma vez que os dados psicológicos são geralmente obtidos após o diagnóstico da síndrome, ambos podem ser tanto causa como efeito, ou ainda, ambos podem ser colaterais, isto é, adjuntivos a contingências cotidianas que podem não ser necessariamente aversivas ou estressantes. Além disso, o estresse, ou o desconforto psicológico, relatado por alguns pacientes pode ser uma “característica de demanda” da situação social. Muitas vezes a audiência desses pacientes espera uma causa psicológica para o distúrbio intestinal relatado, e são essas expectativas sociais (as demandas) que governam os relatos subjetivos sobre os desconfortos experienciados por esses pacientes (cf. Azrin, Holz e Goldiamond, 1961; Azrin et al., 1961). Dados obtidos a partir de registros de atividades diárias, realizados por dois pacientes com a Síndrome do Cólon Irritável (Gimenes, 1997), sugerem que pelo menos alguns casos possam ser explicados a partir do modelo de comportamento adjuntivo. Em um dos casos, o de um paciente com um quadro de diarréia crônica, as atividades diárias eram caracterizadas por tarefas pontuais em determinados horários, com tempo livre e sem nenhuma programação específica para os períodos entre essas atividades pontuais. Guardadas as devidas proporções e características, suas atividades poderiam ser descritas como semelhantes àquelas apresentadas por um organismo sob controle de uma contingência de intervalo fixo. No segundo caso, uma paciente com quadro de 108 ABREU-RODRIGUES, RIBEIRO & COLS. constipação crônica apresentava uma rotina de atividades caracterizada por repetições e por invariabilidade ao longo do dia. A sua rotina diária poderia ser caracterizada como semelhante àquela programada por contingências de razão fixa ou de reforçamento contínuo. As análises dos registros desses pacientes permitem observar a alteração do comportamento intestinal quando ocorrem mudanças ou quebra nessas rotinas estruturadas e bemestabelecidas. O tipo de intervenção sugerida, baseada nessa análise, é o de reestruturação das atividades por parte do paciente, buscando encontrar um padrão de atividades que melhor se correlacione com um comportamento intestinal mais regular. No primeiro caso, atividades e uma rotina mais estruturada deveriam ser sugeridas. No segundo caso, diversificação de atividades e flexibilização da rotina poderiam alterar o padrão do comportamento intestinal. CONTROLE DE ESTÍMULOS SOBRE COMPORTAMENTOS ADJUNTIVOS Segundo Terrace (1966), “controle de estímulos refere-se a extensão na qual o valor de um estímulo antecedente determina a probabilidade de ocorrência de uma resposta condicionada” (p. 271). Uma das maneiras de se aferir o grau de controle de estímulos do comportamento é a partir da obtenção de gradientes de generalização. Esses gradientes são obtidos a partir do registro do número de respostas emitidas na presença de diferentes estímulos que compõem um mesmo contínuo, incluindo-se aí o estímulo original ao qual a resposta foi condicionada. Um tipo de gradiente de generalização que indique forte controle de estímulos pode ser obtido logo após o treino com reforçamento diferencial. Durante o treino, respostas são reforçadas na presença de um estímulo definido pelo experimentador (S+), mas não são reforçadas na presença de um outro estímulo (S-). No teste, graduações de uma certa dimensão do S+ são apresentadas, e as respostas são registradas na presença de cada uma dessas graduações, mas sem a ocorrência de reforço. Tipicamente, a resposta será tão mais freqüente quanto mais próximo do S+ for o estímulo no teste (p. ex.: Gutman e Kalish, 1956). O gradiente de generalização, obtido a partir de condições experimentais como essa, fornece um parâmetro preciso para avaliar o grau de controle de um estímulo sobre o comportamento (para uma revisão sobre generalização de estímulos, ver Capítulo 8). Hamm, Porter e Kaempf (1981) avaliaram o controle de estímulos sobre a polidipsia induzida por esquemas de reforçamento por alimento a partir de um procedimento que possibilitou a obtenção de um gradiente de generalização para o consumo de água. Ratos foram expostos a um esquema múltiplo de tempo randômico e extinção, sendo o componente de tempo randômico sinalizado por um som de 40 Hz (S+) e o componente de extinção sinalizado por um som de 10 Hz (S-). Ao final de 30 sessões de treino, a taxa de consumo de água foi consistentemente maior durante os períodos de S+ do que durante os períodos de S-. Em seguida foram realizados dois testes de generalização. No primeiro, períodos de S+ foram intercalados por períodos nos quais estímulos-teste, graduações da freqüência do S+, foram apresentados sob extinção. No segundo teste de generalização, períodos de S+ foram intercalados por períodos nos quais estímulosteste foram apresentados ao mesmo tempo que o alimento. Um gradiente de generalização, com a forma de “U” invertido, para o consumo de água foi obtido somente no segundo teste, mas não no primeiro, no qual os estímulos-teste foram apresentados sob extinção. Para os autores, o fato de os animais não consumirem água durante o primeiro teste demonstra a dependência de beber com o alimento, reafirmando o caráter adjuntivo do consumo de água sob condições nas quais o alimento é periodicamente liberado. Benvenuti e colaboradores (2000) replicaram o estudo de Hamm e colaboradores (1981), utilizando um esquema múltiplo com um dos componentes em extinção e o outro com reforçamento contingente às respostas – esquema de intervalo variável. O componente de intervalo variável foi sinalizado por um som de 40 Hz (S+), enquanto no componente de extinção o som estava ausente (S-). Para o tes- ANÁLISE DO COMPORTAMENTO te de generalização (cinco sessões para cada sujeito), períodos de S+ foram intercalados por períodos nos quais estímulos sonoros de diferentes freqüências foram apresentados (estímulos-teste: 0, 5, 10, 40, 120 e 140 Hz). Nos períodos com os estímulos-teste as respostas de pressão à barra nunca eram reforçadas. Três dos quatro sujeitos utilizados apresentaram gradientes de generalização característicos para as respostas de pressão à barra, com a maior freqüência de respostas ocorrendo na presença do estímulo de 40 Hz, o S+ inicial. Similarmente, esses três sujeitos apresentaram também gradientes de generalização para as respostas de beber, com algumas diferenças nas curvaturas dos gradientes. Enquanto dois dos sujeitos apresentaram a maior freqüência de respostas na presença do estímulo de 40 Hz, o terceiro apresentou mais respostas na presença dos estímulos de 10 e de 120 Hz. Esses resultados demonstraram a possibilidade de se desenvolver controle de estímulos sobre o comportamento adjuntivo e que esse controle reflete o controle exercido sobre a reposta operante, quando se utilizam esquemas com reforçamento contingente às respostas. Além da utilização de procedimentos para obtenção de gradientes de generalização, outros procedimentos podem ser utilizados para a avaliação do desenvolvimento de controle de estímulos sobre o comportamento. No trabalho desenvolvido por Gimenes e colaboradores (1988) sobre a indução de motilidade intestinal por esquema múltiplo de reforçamento, pode ser observado o controle estabelecido pelos estímulos sinalizadores dos componentes do esquema múltiplo sobre o comportamento operante governado pelos diferentes componentes. Apesar de os autores não terem realizado nenhum teste de controle de estímulos, observações dos registros cumulativos das sessões mostram mudanças de padrão de respostas adequadas ao novo componente tão logo os componentes são alternados acompanhados da respectiva mudança de estímulos. Gimenes e colaboradores (1996) replicaram esse estudo, programando sessões de sondagem para avaliar o controle de estímulos sobre o comportamento adjuntivo de motilidade intestinal gerado pelo esquema múltiplo. Inicialmente, 109 os sujeitos – ratos – foram expostos a 40 sessões diárias sob um esquema de reforçamento múltiplo de intervalo fixo e de reforçamento contínuo, nas quais os dois componentes eram intercalados ao longo da sessão em um total de três ciclos. Para alguns sujeitos, o componente de intervalo fixo era sinalizado pela presença de uma luz e o componente de reforçamento contínuo pela ausência da luz; para os outros sujeitos, a sinalização dos componentes era invertida. Após essas sessões (sessões de desempenho) os sujeitos foram expostos a 10 sessões semanais de teste, além das sessões diárias de desempenho. Nas sessões de teste, os sujeitos eram expostos às mesmas sessões de desempenho, porém sem a presença da barra na caixa experimental, isto é, durante a sessão os sujeitos eram expostos à alternação dos estímulos sinalizadores dos componentes do esquema múltiplo sem a possibilidade de emitir as respostas operantes governadas pelos esquemas de reforçamento. A ocorrência e a ausência de defecação durante as sessões de desempenho replicaram os dados anteriores, isto é, quase 100% das ocorrências de defecação aconteceram durante os períodos com o componente de intervalo fixo. Durante as sessões de teste, cerca de 80% das ocorrências de defecação aconteceram também durante os componentes de intervalo fixo. Embora o controle observado nessas sessões de teste não tenha sido da mesma magnitude daquele observado nas sessões de desempenho, esses dados mostram uma extensão do controle dos estímulos sinalizadores do esquema múltiplo para o comportamento adjuntivo resultante dessa contingência. Os dados sobre controle de estímulos podem nos fornecer pistas para a identificação de relações funcionais controladoras de comportamentos, que, em uma primeira análise, parecem não estar relacionados a nenhuma contingência específica. No caso da motilidade intestinal, por exemplo, esses comportamentos são, muitas vezes, considerados como respondentes, principalmente a estímulos estressores ou associados a estados emocionais (Ester e Goulston, 1973; Johnsen, Jacobsen e Forde, 1986; West, 1970). Os dados obtidos com animais em laboratório, entretanto, têm 110 ABREU-RODRIGUES, RIBEIRO & COLS. demonstrado que esses comportamentos podem ser produto de contingências positivas, as quais não são associadas a situações aversivas ou geradoras de estresse. CONCLUSÃO Sumarizando, uma das características principais dos comportamentos adjuntivos é a sua sistematização, isto é, sua dependência a uma determinada contingência e ao contexto no qual essa contingência opera. O comportamento adjuntivo, além de poder ser alterado por modificações nas relações entre os elementos da contingência, pode ser alterado também por variáveis de contexto, como, por exemplo, as variáveis potenciadoras da contingência – as operações estabelecedoras – ou, ainda, a história de desenvolvimento da contingência, entre outras. Diferente dos outros elementos relacionados a uma contingência, o comportamento adjuntivo não atua sobre a contingência, mas é colateral às intrincadas relações contingenciais. Dessa forma, os comportamentos adjuntivos podem ser vistos como “sintomas” ou descritores das contingências, isto é, eles podem indicar o que está acontecendo em um dado momento, que tipo de contingência está em operação. Assim, qualquer intervenção direcionada à alteração desses comportamentos, baseada em uma análise linear (cf. Goldiamond, 1974, 1984) estará sujeita ao fracasso, pois, como qualquer “sintoma”, esses comportamentos podem ser passíveis de substituição ou de recorrência. O controle desses comportamentos só é possível por meio da identificação das contingências às quais eles são adjuntivos e da intervenção direta sobre essas contingências. Além dos exemplos apresentados no texto, as emoções podem ser também entendidas como comportamentos adjuntivos. Nesse contexto, as emoções não são causas das ações de uma contingência, mas, em vez disso, descrevem a contingência, podendo, assim, serem consideradas como “tatos não falados” (cf. Layng, 2000). O relato sobre uma emoção ou o sentimento de uma emoção como comportamento encoberto podem revelar que tipo de contingência estava ou está operando no momento daquela emoção. Por exemplo, um sentimento de medo descreve uma contingência cuja conseqüenciação é para uma resposta de fuga ou esquiva – nesse caso, o medo é adjuntivo a essa contingência. A emoção pode ou não ser expressa, e, quando o é, gera um comportamento emocional. Assim, essa análise permite diferenciar as emoções do comportamento emocional que, uma vez expresso, pode satisfazer uma outra contingência e passar a ser governado por ela, ou, em outras palavras, tornar-se um operante (ver o Capítulo 7 para uma discussão sobre comportamento emocional). Concluindo, o modelo de comportamento adjuntivo para a compreensão de diferentes transtornos comportamentais sugere intervenções dirigidas a alterações nas contingências das quais esses transtornos são função. Essas contingências representam, geralmente, as atividades diárias dos indivíduos, entre elas rotinas de trabalho e de estudo além das interações sociais. Nem sempre, porém, é possível alterar essas contingências que dependem de um controle externo muitas vezes longe do alcance do terapeuta ou do indivíduo. Sendo assim, é necessário, nesses casos, identificar novas contingências no mesmo contexto como alternativas para o desenvolvimento de padrões de comportamento mais salutares e adaptativos. REFERÊNCIAS BIBLIOGRÁFICAS Azrin N. H.; Holz, W.; Goldiamond, I. (1961). Response bias in questionnaire reports. Journal of Consulting Psychology, 25, 324-326. Azrin, N. H.; Holz, W.; Ulrich, R.; Goldiamond, I. (1961). The control of the content of conversation through reinforcement. Journal of the Experimental Analysis of Behavior, 4, 25-30. Bellingham, W. P.; Wayner, N. J.; Barone, F. C. (1979). Schedule-induced eating in water deprived rats. Physiology and Behavior, 23, 1105-1107. Benvenuti, M. F.; Gimenes, L. S.; Brandão, A. M.; Rodrigues, A. V.; Bastos, J. C. (2000). Uma tentativa de estabelecer controle de estímulos sobre polidipsia induzida por esquemas de reforçamento. Resumos de Comunicações Científicas da XXX Reunião Anual de Psicologia (p. 106). Brasília: SBP. Brandão, A. M.; Gimenes, L. S.; Rodrigues, J. L. (2003). Efeitos da radiação ionizante sobre polidipsia induzida por esquema de reforçamento. Interação em Piscologia, 7, 63-72. ANÁLISE DO COMPORTAMENTO Carlisle, H. J.; Shanab, M. E.; Simpson, C. W. (1972). Schedule-induced behavior: Effects of intermitent water reinforcement on food intake and body temperature. Psychonomic Science, 26, 35-36. Doyle, T. F.; Samson, H. H. (1988). Adjunctive alcohol drinking in humans. Physiology and Behavior, 44, 775-779. Epling, W. F.; Pierce, W. D. (1988). Activity-based anorexia – A biobehavioral perspective. International Journal of Eat Disorder, 7, 475-485. Ester, W. K.; Goulston, K. J. (1973). Levels of anxiety in colonic disorders. New England Journal of Medicine, 288, 16-20. Everett, R. B.; King, R. A. (1970). Schedule-induced alcohol ingestion. Psychonomic Science, 18, 278-279. Falk, J. L. (1961a). Production of polydipsia in normal rats by an intermittent food schedule. Science, 133, 195-196. Falk, J. L. (1961b). The behavioral regulation of waterelectrolyte balance. Em M. R. Jones (Ed.), Nebraska symposium on motivation (p. 1-33). Lincoln, NE: University of Nebraska Press. Falk, J. L. (1971). The nature and determinants of adjunctive behavior. Physiology and Behavior, 6, 577-588. Falk, J. L. (1993). Schedule-induced drug self-administration. Em F. van Haaren (Ed.), Methods in behavioral pharmacology (p. 301-328). New York: Elsevier Science Publishers. Falk, J. L. (1998). Drug abuse as an adjunctive behavior. Drug and Alcohol Dependence, 52, 91-98. Falk, J. L.; Vigorito, M.; Tang, M.; Lau, C. E. (1990). Schedule-induced cocaine drinking: Choice between cocaine and vehicle. Pharmacology, Biochemistry e Behavior, 35, 187-193. Fallon, J. H.; Allen, J. D.; Butler, J. A. (1979). Assessment of adjunctive behaviors in humans using a stringent control procedure. Physiology and Behavior, 22, 1089-1092. Fernandez, E. J.; Timberlake, W. (2003, maio). The effects of fixed and variable time schedules on stereotypic behaviors in an adult polar bear. Trabalho apresentado na 29th Annual Convention of the Association for Behavior Analysis, San Francisco, USA. Flores, P.; Pellon, R. (1997). Effects of d-amphetamine on temporal distribution of schedule-induced polydipsia. Pharmacology, Biochemistry and Behavior, 57, 81-87. Freed, E. X.; Carpenter, J. A.; Hymowitz, N. (1970). Acquisition and extinction of schedule-induced polydipsia consumption of alcohol and water. Psychological Reports, 26, 915-922. Gimenes, L. S. (1988). Um exemplo de interação entre pesquisa de laboratório e clínica. Psicologia: Relfexão e Crítica, 3, 26-31. Gimenes, L. S. (1990). Alterações intestinais como comportamentos adjuntivos: Análise e possíveis aplicações. Anais da XX Reunião Anual de Psicologia (p. 266-270). Ribeirão Preto, SP: SPRP. Gimenes, L. S. (1997). Comportamento adjuntivo: Um possível modelo para a análise e intervenção em problemas de saúde. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 395-403). São Paulo: ARBytes. Gimenes, L. S. (2000). Pesquisa animal e clínica: Um caso para divórcio ou casamento feliz? Em R. R. Kerbauy 111 (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 53-59). São Paulo: SET. Gimenes, L. S.; Andronis, P. T.; Goldiamond, I. (1987). Estudo de algumas variáveis de procedimento na defecação induzida por esquema de reforçamento. Psicologia: Teoria e Pesquisa, 3, 104-116. Gimenes, L. S.; Andronis, P. T.; Goldiamond, I. (1988). Defecação induzida por esquema múltiplo de reforçamento. Ciência e Cultura, 40, 1121-1123. Gimenes, L. S.; Bezerra, A. C. A.; Dacanal, J. N.; Campos, L. M.; Brandão, A. M. (1996). Controle de estímulos sobre defecação induzida por esquema múltiplo. Resumos de Comunicações Científicas da XXVI Reunião Anual de Psicologia (p. 52). Ribeirão Preto: SBP. Gimenes, L. S.; Marinho, M. C. S. (1993, maio). Effects of caloric content on schedule-induced food consumption. Trabalho apresentado na 19th Annual Convention of the Association for Behavior Analysis, Chicago, USA. Gimenes, L. S.; Melo, R. M. (1993, maio). Circadian behavioral patterns of water consumption and schedule-induced polydipsia. Trabalho apresentado na 19th Annual Convention of the Association for Behavior Analysis, Chicago, USA. Gimenes, L. S.; Melo R. M.; Nalini, L. E. G.; Gonçalves, F. A. S. (1989). Defecação induzida por contingências durante um longo período de exposição. Resumos da 40ª Reunião Anual da Sociedade Brasileira para o Progresso da Ciência (p. 837-838). São Paulo: SBPC. Goldiamond, I. (1974). Alternative sets as a framework for behavioral formulations and research. Behaviorism, 3, 49-86. Goldiamond, I. (1984). Training parent trainers and ethicists in nonlinear analysis of behavior. Em R. F. Dangle; A. Polster (Eds.), Foundations of research and practice (p. 504-545). New York: Guilford Press. Gutman, N.; Kalish, H. I. (1956). Discriminability and stimulus generalization. Journal of Experimental Psychology, 51, 79-88. Hamm, R. J.; Porter, J. H.; Kaempf, G. L. (1981). Stimulus generalization of schedule-induced polydipsia. Journal of the Experimental Analysis of Behavior, 36, 93-99. Hutchinson, R. R.; Azrin, N. H.; Hunt, G. M. (1968). Attack produced by intermittent reinforcement of a concurrent operant response. Journal of the Experimental Analysis of Behavior, 11, 489-495. Johnsen R.; Jacobsen, B. K.; Forde, O. H. (1986). Associations between symptoms of irritable colon and psychological and social conditions and lifestyle. British Medical Journal, 292, 1633-1635. Kachanoff, R.; Leveille, R.; McClelland, J. P.; Wayner, M. J. (1973). Schedule induced behavior in humans. Physiology and Behavior, 11, 395-398. King, G. (1974). Wheel running in the rat induced by a fixed-time presentation of water. Animal Learning and Behavior, 2, 325-328. Lang, W. J.; Latiff, A. A.; McQueen, A.; Singer, G. (1977). Self-administration of nicotine with and without a food delivery schedule. Pharmacology, Biochemistry and Behavior, 13, 657-662. Layng, J. (2000). Emoções e comportamento emocional. Resumos de Comunicações Científicas da XXX Reunião Anual de Psicologia (p. 84). Brasília: SBP. 112 ABREU-RODRIGUES, RIBEIRO & COLS. Lester, D. (1961). Self-maintenance of intoxication in the rat. Quarterly Journal of Studies on Alcohol, 22, 223-231. Levitsky, D.; Collier, G. (1968). Schedule-induced wheel running. Physiology and Behavior, 3, 571-573. Lynn, R. B.; Friedman, L. S. (1993). Irritable bowel syndrome. The New England Journal of Medicine, 329, 1940-1945. Marinho, M. C. S.; Gimenes, L. S.; Nogueira, M. V. C. (1991). Efeitos da dieta alimentar no consumo de alimento induzido por esquemas de reforçamento. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 73). Ribeirão Preto, SP: SBP. Melo, R. M.; Gimenes, L. S.; Pereira, A. B.; Coelho, D. S. (1991). Interações entre polidipsia induzida por esquemas de reforçamento e ritmos circadianos de ingestão de água. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 74). Ribeirão Preto, SP: SPB. Mello, N. K.; Mendelson, J. H. (1971). Evaluation of a polydipsia technique to induce alcohol consumption in monkeys. Physiology and Behavior, 7, 827-836. Mendelson, J.; Chillag, D. (1970). Schedule-induced air licking in rats. Physiology and Behavior, 5, 535-537. Overskeid, G. (1992). Is any human behavior scheduleinduced? The Psychological Record, 42, 323-340. Payne, A.; Blanchard, E. B.; Holt, C. S.; Schwarz, S. P. (1992). Physiological reactivity to stressors in irritable bowel syndrome patients, inflammatory bowel disease patients and non-patient controls. Behaviour Research and Therapy, 30, 293-300. Pellon, R.; Blackman, D. E. (1987). Punishment of schedule-induced drinking in rats by signalled and unsignalled delays in food presentation. Journal of the Experimental Analysis of Behavior, 48, 417-434. Pellon, R.; Blackman, D. E. (1992). Effects of drugs on the temporal distribution of schedule-induced polydipsia in rats. Pharmacology, Biochemistry and Behavior, 12, 355-362. Pierce, W. D.; Epling, W. F. (1994). Activity anorexia: An interplay between basic and applied analysis. The Behavior Analyst, 17, 7-23. Porter, J. H.; Brown, R. T.; Goldsmith, P. A. (1982). Adjunctive behavior in children on fixed interval food reinforcement schedules. Physiology and Behavior, 28, 609-612. Rayfield, F.; Segal, M.; Goldiamond, I. (1982). Schedule-induced defecation. Journal of the Experimental Analysis of Behavior, 38, 19-34. Roper, T. J. (1981). What is meant by the term “schedule-induced”, and how general is schedule induction? Animal Learning and Behavior, 9, 433-440. Samson, H. H.; Falk, J. L. (1974). Schedule-induced ethanol polydipsia: Enhancement by saccharin. Pharmacology, Biochemistry and Behavior, 2, 835-838. Sidman, M. (1976). Táticas da pesquisa científica (M. E. Paiva, trad.). São Paulo: Brasiliense. (Obra publicada originalmente em 1960). Singer, G.; Oei, T. P. S.; Wallace, M. (1982). Scheduleinduced self-injection of drugs. Neuroscience and Biobehavioral Reviews, 6, 77-83. Smith, L. A.; Lang, W. J. (1980). Changes occurring in self administration of nicotine by rats over a 28-day period. Pharmacology, Biochemistry and Behavior, 13, 215-220. Snodgrass, S. H.; Allen, J. D. (1988). The effects of apomorphine on the acquisition of schedule-induced polydipsia in rats. Pharmacology, Biochemistry and Behavior, 29, 434-488. Staddon, J. E. R. (1977). Schedule-induced behavior. Em W. K. Honig; J. E. R. Staddon (Eds.), Handbook of operant behavior (pp.125-152). Englewood Cliffs, NJ: Prentice-Hall. Staddon, J. E. R.; Ayres, S. L. (1975). Sequencial and temporal properties of behavior induced by a schedule of periodic food delivery. Behavior, 54, 46-49. Staddon, J. E. R.; Simmelhag, V. L. (1971). The “superstition” experiment: A re-examination of its implications for the principles of adaptative behavior. Psychological Review, 78, 3-43. Suls, J.; Wan, C. K.; Blanchard, E. B. (1994). A multilevel data-analytic approach for evaluation of relationships between daily life stressors and symptomatology: Patients with irritable bowel syndrome. Health Psychology, 13, 103-113. Tang, M.; Falk, J. L. (1987). Oral self-administration of cocaine: Chronic excessive intake by schedule induction. Pharmacology, Biochemistry and Behavior, 28, 517-519. Terrace, H. S. (1966). Stimulus control. Em W. K. Honig (Ed.), Operant behavior: Areas of research and application (p. 271-344). New York: Appleton-Century-Crofts. Tung, C. S.; Wu, W. H.; Tseng, C. J.; Yin, T. H. (1994). Effects of amperozide on schedule-induced polydipsia in rats. European Journal of Pharmacology, 256, 193-200. Villareal, J. (1967, maio). Schedule-induced “pica”. Trabalho apresentado no Annual Meeting of the Eastern Psychological Association, Boston, USA. Wallace, M.; Singer, G. (1976). Adjunctive behavior and smoking induced by a maze-solving schedule in humans. Physiology and Behavior, 17, 849-852. Wallace, M.; Sanson, A.; Singer, G. (1978). Adjunctive behavior in humans on a food delivery schedule. Physiology and Behavior, 20, 203-204. West, K. L. (1970). MMPI correlates of ulcerative colitis. Journal of Clinical Psychology, 26, 214-219. Wetherington, C. L. (1982). Is adjunctive behavior a third class of behavior? Neuroscience and Biobehavioral Reviews, 6, 329-350. Wetherington, C. L.; Brownstein, A. J. (1979). Schedule control of eating by fixed-time schedules of water presentation. Animal Learning and Behavior, 7, 38-40. Wilson, J. F.; Cantor, M. B. (1987). An animal model of excessive eating: Schedule-induced hyperphagia in food-satiated rats. Journal of the Experimental Analysis of Behavior, 47, 335-346. Woods, J. H.; Winger, G. D. (1971). A critique of methods for inducing ethanol self-intoxication in animals. Em N. K. Mello; J. H. Mendelson (Eds.), Recent advances in alcoholism: An interdisciplinary symposium (p. 413-436). Washington, DC: Government Printing Office. Wylie, A. M.; Layng, M. P.; Meyer, K. A. (1993). Schedule-induced defecation by rats during ratio and interval schedules of food reinforcement. Journal of the Experimental Analysis of Behavior, 60, 611-620. ANÁLISE DO COMPORTAMENTO CONTINGÊNCIAS AVERSIVAS E COMPORTAMENTO EMOCIONAL 113 7 CARLOS EDUARDO CAMESCHI JOSELE ABREU-RODRIGUES A psicologia como ciência da mente foi questionada por Skinner ao longo de toda a sua trajetória como cientista e filósofo. Seu argumento central é que a origem da mente não pode ser rastreada a partir de mudanças em qualquer traço evolutivo, enquanto a origem do comportamento verbal pode (Skinner, 1990). Assim, Skinner sustenta não haver como justificar a mente, e sim o comportamento como o objeto de estudo de uma ciência natural. De qualquer modo, embora a possibilidade de uma ciência do comportamento que inclua o comportamento humano seja ainda um assunto polêmico e controvertido, uma crítica das dificuldades formais e das suposições contrárias envolvidas pode ser resumida. De um lado, as principais dificuldades resultam da falta de consenso nas definições dos conceitos de “ciência” e de “comportamento” (Baum, 1994). Por outro lado, os argumentos contrários baseiam-se na combinação das crenças de que o comportamento humano é muito complexo para ser redutível a leis científicas, de que o fato de cada pessoa ser única impossibilita a generalização dos princípios e de que o comportamento é orientado para eventos futuros, de acordo com a noção de intencionalidade, o que viola as relações causais científicas nas quais as “causas” são antecedentes aos “efeitos” (Chiesa, 1994). Com respeito à primeira parte, a sugestão de Baum, com base no behaviorismo radical de Skinner, é que a ciência pode ser definida, em termos pragmáticos, como uma atividade dirigida à elaboração de termos e de conceitos descritivos econômicos que tornem a nossa experiência compreensível e que o conceito de comportamento refere-se a algo natural, isto é, a qualquer coisa que possamos fazer ou dizer, incluindo as crenças às quais nos referimos anteriormente e outras relativas à consciência ou à mente consciente, suas subdivisões e supostos processos. Nesse sentido, conceitos como estímulo, resposta e reforço, entre outros, permitem a descrição das relações simples e complexas da pessoa com os ambientes natural, físico e social, de modo parcimonioso e inteligível. Chiesa (1994) questiona os outros argumentos citados ao sugerir que: • as ciências naturais também começaram com a complexidade e, à medida que foram refinando seus métodos e esquemas conceituais, avançaram em direção à ordem, isto é, às leis científicas; • seus objetos de estudo são igualmente únicos, o que não impede descrições de extensas propriedades comuns em sistemas e em teorias que permitem a predição e a generalização; • a crença na intencionalidade é produto de esquemas conceituais pré-científicos embutidos nos padrões lingüísticos de nossos modos de falar aprendidos socialmente. A análise comportamental inclui também a análise do comportamento verbal, o que pode 114 ABREU-RODRIGUES, RIBEIRO & COLS. ajudar a esclarecer que, quando nos comportamos em função de eventos futuros, na verdade estamos inclinados a nos comportarmos de um modo análogo ao que no passado produziu resultados importantes (Baum, 1994; Chiesa, 1994). Sidman (1989/1995, p. 74) aponta o espaço em que os cientistas comportamentais confinam o sujeito experimental, freqüentemente um rato branco, e as simplificações típicas de um laboratório de pesquisa comportamental para, então, perguntar: “O que essa criatura intelectualmente limitada, vivendo em um espaço ecológica e socialmente estéril possivelmente pode nos dizer sobre a conduta humana?”. As implicações dessa pergunta são extensas, pois traz questionamentos sobre se devemos estudar somente ações que tenham “validade de face”, ou seja, apenas formas exatas de comportamento. Nesse caso, uma preocupação com a criatividade conduz ao estudo apenas de artistas e de compositores, ou um interesse em coerção implica investigar as prisões. Embora possa trazer informações úteis, a longo prazo essa visão pode limitar a compreensão até mesmo de problemas práticos específicos. Muitos pesquisadores observam somente as formas exatas que os interessam e há diversos tipos de especialistas em psicologia, de jogo de xadrez a sexo, de programação de computadores a doença mental, dificultando as generalizações além das fronteiras de cada área. A alternativa para o estudo de ações que parecem importantes por si mesmas é fazer exatamente o oposto, isto é, selecionar uma amostra arbitrária, alguma ação que, por ser delimitada e artificial, evita todas as limitações e restrições impostas por nosso julgamento sobre validade de face. E a vantagem de eliminar essas restrições é tornar a amostra arbitrária representativa de todo comportamento e, com isso, os resultados podem ter significados em uma ampla extensão, muito além das ações específicas que selecionamos para observação e medida (Sidman, 1989/1995). Em resumo, o estudo das variáveis que afetam a probabilidade da resposta de pressionar a barra como um modelo de análise teria generalidade semelhante ao estudo das propriedades de qualquer corpo em movimento feito por Galileu, por meio da observação de bolas polidas deslizando em planos inclinados (Skinner, 1972). Portanto, a atitude apropriada na ciência em geral e em uma ciência do comportamento em particular é impedir que a fidedignidade, a validade ou a generalidade de métodos, de resultados e de princípios sejam julgados pela opinião ou pela especulação, pois são assuntos a serem analisados por meio de testes experimentais (Sidman, 1989/1995). Nessa perspectiva, a ciência da análise do comportamento surgiu e vem evoluindo em suas tentativas de descrever eficientemente a interação entre o comportamento e o ambiente, com ênfase no lado ambiental deste intercâmbio (Hineline, 1984). E, à medida que as descrições de relações funcionais são refinadas, elas esclarecem as contingências de reforço e punição que formam os operantes e seus subprodutos respondentes, isto é, como o comportamento ocorre sob o controle de estímulos. Skinner (1938) distinguiu as categorias comportamentais em respondentes e em operantes a partir da redefinição de estímulo e resposta como classes de eventos com efeitos recíprocos, isto é, como classes funcionais em vez de eventos observáveis imediatamente. Os estímulos foram definidos em termos de energia física e correlacionados com uma classe particular de respostas; estas foram definidas não pela topografia, mas como classes de eventos suscetíveis ao controle de um estímulo específico. Zeiler (1986) ensinou que, desde então, as velhas unidades estímulo e resposta tornaram-se interdependentes, de modo que a unidade de análise do comportamento respondente é a relação funcional S-R, a unidade do comportamento operante é a relação funcional R-S e a unidade do controle de estímulos é a relação funcional S-R-S.1 Enquanto 1Essas relações funcionais ilustram: a) S-R: padrões respondentes incondicionados simples e complexos (US-UR) e padrões respondentes condicionados (CSCR), em que os estímulos antecedem as respostas; b) R-S: padrões operantes em que a resposta produz estímulos que afetam sua probabilidade futura; e c) SD-R-S: padrões operantes, cuja probabilidade é função do contexto (SD), que estabelece a ocasião em que a resposta (R) produz a conseqüência (S). ANÁLISE DO COMPORTAMENTO a relação R-S define o comportamento a partir de seus eventos antecedentes imediatos, as relações R-S e S-R-S definem o comportamento a partir de suas conseqüências, baseando-se nos princípios de reforçamento e punição (Skinner,1953/2000). Este capítulo enfatizará as relações comportamento-ambiente sob controle de contingências aversivas e seus objetivos são: a) sumariar os principais procedimentos experimentais utilizados nos estudos dos efeitos de contingências de controle aversivo e os processos comportamentais resultantes; b) apontar algumas das implicações desses estudos para a compreensão do comportamento humano em geral; c) avaliar criticamente o uso de técnicas aversivas no processo terapêutico. CONTINGÊNCIAS AVERSIVAS A punição, o reforço negativo e a supressão condicionada ilustram as principais contingências de controle aversivo estudadas e envolvem vários tipos de operações experimentais. Punição O processo de punição ocorre quando uma resposta produz efeitos que diminuem sua probabilidade. Se esse efeito ocorre quando a resposta produz estímulos, o processo é descrito como punição positiva; quando ela remove estímulos, é descrito como punição negativa (Baum, 1994; Catania, 1998/1999). Portanto, no primeiro caso a resposta produz um estímulo com propriedades aversivas e, no segundo, remove ou adia um estímulo reforçador. É importante lembrar, no entanto, que nem todas as conseqüências de uma resposta que reduzem sua probabilidade futura seriam exemplos de eventos punitivos (Azrin e Holz, 1966). Esse efeito pode ocorrer também com outros procedimentos tais como mudança de estímulos discriminativos, extinção, saciação e restrição física, conforme mostra o estudo com- 115 parativo de Holz, Azrin e Ayllon (1963). Um aspecto metodológico peculiar dos estudos de punição também merece ser destacado. Para se estudar a punição, uma classe de respostas deve ter alta probabilidade de ocorrência. Por isto, nesses estudos, uma classe de respostas mantida por reforço positivo produz também, de acordo com alguma programação, estímulos aversivos. A probabilidade da resposta punida varia em função da privação, da freqüência, da duração e da magnitude do reforço positivo, e também da freqüência, da duração e da intensidade do estímulo aversivo. A efetividade da punição tem sido alvo de muitas controvérsias. A punição foi incorporada nas primeiras versões da Lei do Efeito de Thorndike, que, mais tarde, retirou esse componente (Catania, 1998/1999). Skinner (1938) também insistiu em manter a punição em domínio separado, argumentando que a punição produz somente efeitos indiretos sobre o comportamento e enfatizou sua ineficácia com base na recuperação da resposta quando ela é interrompida. Entretanto, com base em dados disponíveis, Hineline (1984) e Catania (1998/1999) argumentam que, de acordo com o mesmo critério, o reforço positivo também deve ser considerado ineficaz, porque ambas as operações têm efeitos temporários: quando são eliminadas, as respostas retornam aos níveis prévios. Portanto, a punição é paralela ao reforço, exceto pelo fato de que os efeitos diferem quanto à direção: o reforço torna a resposta reforçada mais provável e a punição reduz a probabilidade da resposta punida. Azrin e Holz (1966) listam 13 condições necessárias para a punição levar à completa supressão do comportamento: 1. não pode haver fuga possível do estímulo punitivo; 2. o estímulo deve ser tão intenso e freqüente quanto possível; 3. a punição tem de ser imediata; 4. a intensidade não pode ser aumentada gradualmente – desde o início, o estímulo tem de ser tão intenso quanto possível; 5. se a intensidade for baixa, os períodos de punição devem ser curtos; 116 ABREU-RODRIGUES, RIBEIRO & COLS. 6. a punição não deve ser associada à apresentação de um estímulo reforçador positivo para não adquirir propriedades de estímulo discriminativo; 7. a punição deve sinalizar um período de extinção para a resposta; 8. o grau de motivação para a resposta deve ser diminuído; 9. a freqüência de reforço positivo para a resposta deve ser diminuída; 10. uma resposta alternativa à que é punida deve estar disponível; 11. se não há resposta alternativa na situação, o sujeito deve ser levado para outra situação com acesso ao estímulo reforçador; 12. se um estímulo aversivo primário não pode ser aplicado após a resposta, pode-se usar um estímulo aversivo condicionado; 13. em último caso, a punição pode ocorrer pela apresentação de timeout ou pelo aumento no custo da resposta. Os preconceitos contra a punição geraram comportamentos de esquiva em muitos pesquisadores da área. Para evitar críticas e rejeições, por exemplo, procedimentos efetivos foram até mesmo descritos por termos que não faziam menção à punição, como ocorreu com o procedimento de esquiva passiva. Considere um rato em uma plataforma acima de uma grade eletrificada que, ao pisar na grade, recebe um choque e torna-se menos propenso a descer novamente. Pode-se dizer que a resposta de descer da plataforma é punida, mas também é possível dizer que o rato está passivamente se esquivando do choque, evitando descer da plataforma (Catania, 1998/ 1999). Dinsmoor (1954) propôs que a ação supressiva da punição poderia ser atribuída ao desenvolvimento de reações de esquiva da emissão do comportamento punido. Ou seja, engajar-se em qualquer outra atividade alternativa ao comportamento punido e, com isso, evitar a punição. Azrin e Holz (1966) discordam e sugerem como mais parcimonioso considerar a punição em nível descritivo, sem ape- lar para mudanças no comportamento que geralmente são inferidas em vez de diretamente medidas. Portanto, descrevem que a punição afeta diretamente a probabilidade da resposta punida, não sendo necessária a ocorrência de respostas de fuga e esquiva para que o estímulo seja considerado punitivo. Dessa forma, Dinsmoor (1954; ver também Skinner, 1953/2000) defende que a punição é um processo secundário, pois resultaria da fuga ou esquiva do estímulo punitivo, enquanto Azrin e Holz (1966) afirmam que é um processo primário. Arbuckle e Lattal (1987) apresentaram dados favoráveis à concepção da punição como um efeito secundário do reforçamento negativo. O objetivo do estudo consistiu em separar a redução nas taxas de respostas produzida diretamente por um estímulo punitivo daquela produzida pelo reforçamento negativo da omissão da resposta. Pombos foram expostos a um esquema conjugado no qual respostas de bicar o disco produziam alimento em um esquema de intervalo variável (VI) 3 min e choques em um esquema VI 30 s (conj VI 3 min VI 30 s). Em algumas condições, o choque poderia ser evitado caso não ocorressem respostas durante um período de 5, 10 ou 30 s após o final do intervalo. As taxas de respostas variaram inversamente com a duração da pausa requerida, mesmo não havendo mudanças na freqüência e na intensidade do estímulo punitivo. Ou seja, as taxas de respostas foram controladas diretamente pelas contingências de reforçamento negativo, um resultado que apóia a posição de Dinsmoor (1954) e de Skinner (1953/2000) e não a de Azrin e Holz (1966). Os autores argumentaram que o papel do reforçamento negativo deve ser reconsiderado em estudos de punição e concluíram que é possível que a redução no responder seja resultado da interação de contingências de punição e de esquiva. Ao revisar brevemente essas concepções teóricas sobre os efeitos supressivos da punição, Spradlin (2002) concluiu que ambas ajustamse igualmente bem aos dados disponíveis. A literatura tem identificado algumas variáveis que afetam as propriedades punitivas de determinados eventos ambientais. Os efei- ANÁLISE DO COMPORTAMENTO tos discriminativos dos eventos aversivos, por exemplo, parecem ser importantes em situações de punição, pois podem sinalizar as ocasiões em que a resposta será também reforçada. Holz e Azrin (1961) relataram um experimento com pombos no qual um choque produzido por uma resposta sinalizava a disponibilidade de comida. Em uma condição, as bicadas do pombo não tinham conseqüências, e, na outra, cada bicada produzia um choque e algumas bicadas produziam alimento. Quando as respostas não produziam um choque, a taxa era baixa porque também não produziam alimento; mas a taxa aumentou assim que as respostas começaram a produzir choques, pois também, ocasionalmente, produziam alimento. Portanto, os estímulos punitivos adquiriram propriedades discriminativas porque a resposta era reforçada apenas quando também era punida. Catania (1998/1999) apontou a relevância desse processo para o comportamento humano, como quando uma criança provoca o pai a ponto de ser surrada, porque geralmente a surra é seguida de mais atenção do pai arrependido do que durante as interações menos traumáticas entre ambos. Outro aspecto importante é a relação de contingência entre a resposta e a conseqüência, isto é, quando há uma relação de dependência entre a emissão da resposta e a ocorrência do evento aversivo. Por exemplo, Camp, Raymond e Church (1967) compararam os efeitos de choques independentes das respostas e de choques produzidos pelas respostas de pressões à barra mantidas por reforço alimentar em ratos, em que as taxas de choques de ambos os grupos foram emparelhadas. Comparados com um grupo controle que não recebeu choque, os resultados mostraram que as taxas de respostas dos dois grupos expostos ao choque diminuíram, mas o choque produzido pela resposta suprimiu mais o responder do que o choque independente da resposta. Esta diferença permite afirmar que o choque produzido pela resposta era um estímulo punitivo, e que os eventos afetam mais o comportamento quando o efeito é recíproco, isto é, quando o comportamento também pode afetar esses eventos (Rachlin, 1967). 117 Alguns estudos investigaram as propriedades punitivas do custo da resposta sobre o comportamento mantido por reforçamento positivo (p. ex.: Weiner, 1962) e por reforçamento negativo (p. ex.: Weiner, 1963). No estudo de Weiner (1962), a resposta de participantes humanos era mantida, nas condições sem custo, por pontos adquiridos de acordo com esquemas VI e de intervalo fixo (FI); nas condições com custo, essas respostas também eram punidas por perdas de pontos. Quando condições com e sem custo foram alternadas, foi observado que a condição sem custo produziu taxas altas e constantes de respostas em ambos os esquemas; a condição com custo, por outro lado, diminuiu as taxas de respostas nos esquemas VI, sem perturbar a constância do responder, e gerou um padrão scallop (tipicamente observado com animais) sob os esquemas FI. Quando foram efetuadas manipulações na seqüência de apresentação dessas condições, o padrão scallop foi observado também na condição sem custo. Em um estudo subseqüente, Weiner (1963) expôs participantes humanos a uma tarefa de pressionar um botão para manter os 99.999 pontos que tinham disponíveis no início da sessão. Na condição sem custo, foi programado um esquema múltiplo com três componentes de 20 min de duração cada, durante os quais períodos de perda de pontos (PDP) foram programadas para ocorrer a cada 10 s. No componente de esquiva, os participantes poderiam adiar por 10 s os PDPs; no componente de fuga, não podiam evitá-los, apenas interrompê-los; e no terceiro componente eram possíveis tanto a esquiva quanto a fuga. Após 4 h nessas condições sem custo, cada componente foi subdividido em dois, sem e com custo, cada um com 10 min de duração. A condição com custo consistia na perda de um ponto para cada resposta emitida. Os resultados mostraram que as taxas de respostas de fuga ou esquiva eram excessivamente altas nas condições sem custo, mas muito baixas nas condições com custo. Os resultados de ambos os estudos (Weiner, 1962, 1963) sugerem que (a) a perda de pontos funciona como um evento aversivo com humanos e (b) contingências de custo exercem efeitos punitivos sobre compor- 118 ABREU-RODRIGUES, RIBEIRO & COLS. tamentos mantidos por reforçamento tanto positivo como negativo. Aumentos na intensidade e na freqüência do estímulo punitivo tendem a produzir aumentos correspondentes na supressão da resposta mantida por esquemas de razão fixa (FR) e de razão variável (VR) e esquemas FI, mas produz efeitos assistemáticos sobre o responder em esquemas VI. As razões dessa inconsistência foram investigadas por Arbuckle e Lattal (1992). Pombos foram expostos a um esquema conjugado, no qual respostas de bicar um disco produziam alimento em um esquema VI de 180 s, e também choques. No Experimento 1, os choques foram inicialmente apresentados de acordo com o esquema VI 30 s, que tendia a punir longos intervalos entre as respostas (IRTs) e, em seguida, conforme um esquema percentil, durante o qual eram liberados independentemente da duração do IRT. Ambos os esquemas reduziram igualmente a freqüência relativa de IRTs longos. No Experimento 2, os pombos foram expostos à punição diferencial de IRTs longos e curtos ao longo de diferentes condições. Os resultados mostraram um declínio na freqüência relativa dos IRTs punidos e aumentos na freqüência dos IRTs opostos aos punidos, enquanto os efeitos nas taxas de respostas não foram consistentes. Os autores argumentaram que os resultados desses experimentos iluminam a importância de se selecionar um nível apropriado de análise, pois relações ordenadas presentes em um nível (IRTs) podem não ser reveladas em outro nível (taxa total de respostas) de análise. Eles também apontam que as relações assistemáticas, comumente descritas em estudos de punição com esquemas VI, provavelmente resultam do nível de análise empregado nesses estudos. Os efeitos da punição sobre a resposta não punida foram estudados por Crosbie, Williams, Lattal, Anderson e Brown (1997) com pombos e com humanos. No Experimento 1, alguns pombos foram expostos a um esquema mult VI 3 min VI 3 min, no qual os componentes eram sinalizados por uma luz amarela ou azul (linha de base). Após atingir a estabilidade, cada resposta durante o componente azul passou a produzir um choque até que a taxa de respostas nesse componente fosse menor do que 50% daquela observada na condição anterior sob as mesmas condições de estímulo. Depois de restabelecer a linha de base, um esquema mix VI 3 min VI 3 min entrou em vigor com a luz amarela do disco em ambos os componentes. A seguir, foi introduzida a contingência de punição em um dos componentes desse esquema. No Experimento 3, estudantes universitários foram expostos a condições análogas em que o estímulo punitivo consistia na perda de pontos. Os resultados de ambos os experimentos mostraram que ocorreu uma supressão da resposta em todas as condições de punição, independentemente da presença ou da ausência de sinalização da punição. Com relação à taxa da resposta não punida, foram observados os seguintes efeitos: a) tanto o contraste (aumento na taxa) quanto a indução (diminuição na taxa) ocorreram, apesar da manutenção da taxa de reforços ao longo das condições; b) a indução foi mais comum do que o contraste; c) o contraste ocorreu somente na presença de um estímulo diferente daquele correlacionado com a punição; d) o contraste diminuiu com a exposição prolongada à punição. Os estudos anteriormente resumidos, embora apontem algumas variáveis relevantes para a punição, também indicam que sabemos muito pouco sobre o funcionamento da punição. Há ainda muitas possibilidades de investigação dos processos moleculares e molares a ela relacionados, cuja compreensão é fundamental para orientar a solução de problemas com o uso de estratégias punitivas. Certamente a punição inclui subprodutos lamentáveis que justificam o fato de Skinner (1953/2000) ter questionado sua utilidade prática em um sistema comportamental e, em muitas situações aplicadas, não deveria ser empregada (Hineline, 1984). A análise de Skinner mostra como seria saudável a vida sem estimulação aversiva e também esclarece por que a técnica é tão usada: o comportamento de quem aplica a punição é reforçado pela supressão imediata da resposta punida, ain- ANÁLISE DO COMPORTAMENTO da que não funcione a longo prazo (ver também Todorov, 2001). Com freqüência, atacamos qualquer um que nos ofenda, seja fisicamente ou com críticas, com desaprovação, com insulto, ou nos ridicularize; mas seus efeitos temporários são acompanhados por uma função de uma extensa redução da eficiência e da felicidade geral do grupo, pois resultam em sérios conflitos pessoais entre emitir a resposta que leva à punição e aquela que a evita (Skinner, 1953/2000). Nesse contexto, a longo prazo, as pessoas tornam-se revoltadas, ressentidas e agressivas, e, mesmo a curto prazo, basta infligir dor ou ameaçar a retirada de recursos para que estes efeitos sejam observados (Baum, 1994). Entretanto, mesmo sendo lamentável, a punição é um fato freqüente nas interações humanas e, em algumas circunstâncias muito especiais julgadas com base em outras alternativas, pode até proporcionar a base mais efetiva para se alcançar benefícios sociais humanitários (Hineline, 1984). Embora Skinner fosse contra o uso da punição, posição que resume afirmando “se eu fiz alguma coisa pela raça humana, foi achar alternativas para a punição” (apud em Krasner, 1989, p. 247), ele não era totalmente contrário a seu uso. Conforme Nye (2000/2002), no final de sua carreira Skinner esclareceu sua posição, observando que existem situações excepcionais em que a punição é justificada. Por exemplo, estímulos aversivos breves e inofensivos podem ser eficazes no tratamento de crianças autistas que se automutilam. Essas crianças se batem e se mordem, batem a cabeça contra objetos duros, como também se machucam de outras maneiras. Punições brandas tendem a remover esse tipo de auto-abuso, dando espaço à modelagem de comportamentos apropriados. Mas, mesmo reconhecendo que a punição pode, às vezes, servir a propósitos úteis, Skinner “enfatizou que seria um verdadeiro erro permanecer satisfeito com a punição sem explorar alternativas que não a incluam” (Nye, 2000/2002, p. 90). Sugestões semelhantes foram feitas por Lerman e Vorndran (2002) após uma revisão dos estudos sobre punição. Essas autoras relataram que os resultados da pesquisa básica com choques, com ruídos, com jorros de ar, com custo da resposta e com timeout confirmaram 119 o rápido declínio na freqüência ou na supressão imediata de respostas punidas em ratos, em pombos, em macacos e em humanos, e também que o efeito supressivo da punição com choque ou com perda de pontos ocorre mais rapidamente do que com o uso de extinção, de saciação ou de reforço diferencial. Também a pesquisa aplicada mostrou que o tratamento clínico com uso de ampla variedade de punidores (reprimenda verbal, restrição física, borrifar com água, suco de limão, choque, retirada de reforços condicionados ou interrupção de atividades reforçadoras) pode produzir supressão imediata ou substancial de comportamentos problemáticos, mesmo após outras tentativas infrutíferas com procedimentos menos aversivos. Entretanto, como é ainda relativamente incompleto o conhecimento de muitas relações complexas importantes, as autoras defenderam a relevância de pesquisas adicionais na área para desenvolver uma tecnologia sistemática e efetiva em promover mudanças no comportamento. As sugestões incluem a investigação de novas estratégias que melhorem a eficiência de procedimentos menos aversivos, bem como o esvanecimento bem-sucedido do tratamento, isto é, sua interrupção sem que ocorram reincidências do comportamento problemático. Horner (2002) concorda com a análise e as sugestões de Lerman e Vorndran (2002), considerando a punição como parte natural da vida e assinalando que a mesma ocorre por meio de carrancas, reprimendas, multas, notas vermelhas, espancamentos, entre outras inúmeras possibilidades. Vollmer (2002) também concorda que ignorar a punição como fenômeno natural e suas implicações para uma tecnologia do comportamento equivale a ignorar a natureza física do universo. Para ele, uma ciência e uma tecnologia do comportamento serão incompletas caso não avancem na pesquisa sobre punição (ver também Spradlin, 2002). Reforço negativo A contingência de fuga ilustra o processo mais simples de reforço negativo, no qual uma resposta interrompe um estímulo 120 ABREU-RODRIGUES, RIBEIRO & COLS. aversivo, enquanto na contingência de esquiva uma resposta evita ou atrasa o estímulo. Esta terminologia é consistente com o uso cotidiano: “fugimos de circunstâncias aversivas presentes, mas nos esquivamos de circunstâncias potencialmente aversivas que ainda não ocorreram” (Catania, 1998/1999, p. 117). Michael (1975) questionou a utilidade da distinção entre reforço positivo e reforço negativo, em parte porque o uso original de Skinner (1938) desses conceitos visava, respectivamente, a distinguir entre os efeitos do reforço e os da punição. Com o tempo, entretanto, a análise conceitual evoluiu em sintonia com o objetivo da ciência de descobrir melhores modos de falar sobre seu objeto de estudo (Baum, 1994). A análise funcional estabelece que o termo positivo descreve uma relação de dependência ou contingência entre uma resposta e a produção de estímulos, e negativo refere-se à contingência entre uma resposta e a remoção de estímulos. Por isso, os comportamentos de fuga e esquiva são processos que pertencem a um mesmo continuum comportamental: o do reforço negativo, que varia desde a remoção ou atenuação de um estímulo presente até o adiamento ou impedimento de um estímulo potencial. Como assinalado anteriormente, essa distinção também se estende à punição, pois uma resposta pode ser punida por produzir eventos como o choque (punição positiva) e por remover ou adiar eventos positivamente reforçadores (punição negativa). Fuga Como vimos antes, as duas formas de coerção – reforçamento negativo e punição – são estreitamente relacionadas, pois eventos que são reforçadores negativos em um momento podem ser punidores em outro, sendo seu papel particular determinado por sua relação com uma ação (Sidman, 1989/1995). Um exemplo disso seria alguém continuar fazendo qualquer coisa que remova a “cara feia” do chefe (fuga), sendo também provável que pare de fazer qualquer coisa que faça a “cara feia” reaparecer (punição). Pesquisas cujo foco principal seja o comportamento de fuga e suas variáveis de controle são raras na literatura. Os trabalhos sobre controle aversivo, que também são escassos, quando comparados com aqueles que envolvem reforçamento positivo, principalmente se forem consideradas as décadas de 1980 e 1990, geralmente têm como prioridade os processos de punição e esquiva. Uma dificuldade em pesquisar a fuga é que o estímulo aversivo deve estar presente antes da resposta e, assim, pode eliciar respostas incompatíveis com a que foi selecionada para estudo. Nas contingências de reforço positivo, o reforçador está ausente quando a resposta reforçada é emitida, de modo que responder e consumir o reforço são ações que ocupam tempos diferentes, enquanto nas contingências de fuga pode haver competição entre respostas. Esse aspecto tem sido apontado por Catania (1998/1999) como o principal motivo da carência de pesquisas nessa área, cujos desafios são descobrir estímulos sem efeitos eliciadores concorrentes com a resposta selecionada e encontrar meios de impedir respostas alternativas de fuga. Há casos análogos na punição, no sentido inverso, se o estímulo utilizado para eliminar uma resposta aumenta sua probabilidade, como no caso de alguém tentar fazer uma criança parar de chorar punindo o choro e ter problemas porque o estímulo punitivo usado elicia a mesma resposta que ele tenta suprimir. A despeito dessas dificuldades, os efeitos de contingências de fuga têm sido demonstrados com ratos e com humanos. No estudo de Keller (1966), por exemplo, alguns ratos foram treinados a pressionar uma barra para terminar uma luz aversiva por um período de 1 min. Em seguida, os animais foram expostos a diferentes atrasos (1, 2, 5 e 10 s) não sinalizados entre a emissão da resposta de fuga e o término da luz. Foi observado que a freqüência relativa de respostas de fuga com latências longas aumentou com acréscimos no atraso do reforço. Resultados similares foram obtidos por Fowler e Trapold (1962), usando uma resposta diferente (correr de um compartimento para outro da caixa experimental) e um reforço negativo diferente (choque). Esses resultados indicam que respostas mantidas por reforça- ANÁLISE DO COMPORTAMENTO mento negativo, da mesma forma que aquelas mantidas por reforçamento positivo, são sensíveis a manipulações no atraso do reforço. Em um estudo recente, Cherek, Spiga, Steinberg e Kelly (1990) estudaram a emissão de respostas agressivas em humanos mantidas por fuga ou esquiva da perda de pontos. Os participantes foram instruídos que cada 100 respostas no botão A (não-agressivas) produziam um ponto e que cada 10 respostas no botão B (agressivas) subtraíam um ponto de um participante fictício, que também estaria subtraindo pontos deles. As perdas produzidas pelo participante fictício eram programadas de acordo com um esquema de tempo randômico (RT). As respostas agressivas também produziam um período livre de perda de pontos (por meio de fuga ou esquiva), cuja duração foi manipulada sistematicamente. As contingências de esquiva e fuga programadas foram efetivas na manutenção do comportamento agressivo. Entretanto, enquanto a contingência de esquiva manteve taxas altas de respostas agressivas, mesmo quando as taxas de perda de pontos eram baixas, as contingências de fuga só produziram taxas altas de respostas agressivas na presença de taxas altas de perda de pontos. Em contraste, quando a perda de pontos não era atribuída ao comportamento de outra pessoa (mas sim ao computador), não houve manutenção da resposta agressiva. Os autores concluíram que as propriedades funcionais da perda de pontos são afetadas por contingências sociais. Esquiva As controvérsias acerca da efetividade da punição também existem em relação à esquiva. Mas, neste caso, as divergências são sobre a natureza exata do reforço, porque o estímulo aversivo não está presente nem antes, nem após a ocorrência da resposta de esquiva. Uma questão em particular, chamada de paradoxo da esquiva, foi debatida pelos primeiros teóricos da área: “Como pode a não-ocorrência de um evento (choque) servir como um reforço para a resposta de esquiva?” (Cameschi, 1997, p. 144). 121 Bechterev (1913, citado por Herrnstein, 1969), foi o primeiro a investigar esse processo adaptativo, ainda na tradição pavloviana: um cão era exposto a uma seqüência na qual um estímulo originalmente neutro precedia um choque na pata traseira. A resposta reflexa ao choque era a flexão da pata, e a mudança adaptativa era a ocorrência da flexão tão logo o estímulo neutro fosse apresentado, o que terminava o sinal e evitava o choque. As tentativas de descrever a relação sinal-choque como do tipo CS-US envolviam problemas conceituais, pois o fato de a resposta ser emitida em vez de eliciada minava a interpretação de que era exemplo de reflexo condicionado. Tais problemas conduziram a novos estudos experimentais e, conforme Herrnstein, desse esforço emergiu a primeira teoria bifatorial da esquiva sinalizada, na qual processos respondentes e operantes foram combinados: a esquiva foi interpretada como subproduto da fuga (operante) do estímulo aversivo condicionado (CS) eliciador de “medo” condicionado (respondente). Em resumo, o comportamento de esquiva não seria um processo comportamental fundamental, mas derivado de outro mais básico. Sidman (1953a) questionou a metodologia tradicional da análise do desempenho em esquiva com base na diferença entre as médias de grupos de sujeitos e outras técnicas estatísticas, porque implicavam considerável perda de dados descritivos e a utilização de inferências para explicar os resultados. Sidman promoveu uma mudança metodológica e teórica ao elaborar seu procedimento de esquiva de operante livre: na ausência de respostas, choques curtos e inescapáveis ocorrem regularmente entre períodos fixos de tempo chamados intervalo choque-choque (Intervalo SS). Uma resposta elimina esse ciclo e inicia um novo período chamado resposta-choque (Intervalo RS), durante o qual os choques não são apresentados. Se o intervalo RS transcorre sem respostas adicionais, então termina com a apresentação de um choque e o retorno ao intervalo SS. Dessa forma, Sidman (1953a) isolou as respostas de esquiva das respostas de fuga, mostrando também que o estímulo aversivo 122 ABREU-RODRIGUES, RIBEIRO & COLS. condicionado não era necessário. Isso porque os resultados indicaram que, inicialmente, os sujeitos emitiam poucas respostas, mas logo ocorriam aumentos abruptos nas taxas que continuaram altas e constantes, apesar da ausência de estímulos-sinal. Entretanto, sob influência da teoria de competição entre respostas (Schoenfeld, 1950), Sidman concluiu que a resposta de esquiva emergia por ser a única resposta não punida durante o processo, enquanto todas as outras respostas possíveis na situação eram punidas. Essa é uma das versões da teoria bifatorial, segundo a qual, exceto a resposta de esquiva, quaisquer respostas serão seguidas pelo choque e, portanto, elas e os estímulos que produzem adquirem funções eliciadoras condicionadas. Em um estudo posterior, Sidman (1953b) manipulou separadamente os intervalos SS e RS, e suas variações sistemáticas produziram resultados ordenados em ratos: a taxa da resposta de esquiva diminuiu à medida que aumentou a duração do intervalo RS. Resultados similares foram obtidos com humanos (Ader e Tatum, 1961). Sidman (1962a) ficou cético com respeito à teoria de competição entre respostas. A rapidez com que muitos sujeitos aprendem a resposta de esquiva descarta a possibilidade de que alguns poucos choques possam suprimir todos os outros comportamentos para que essa resposta torne-se preponderante. Nesse estudo, alguns ratos foram inicialmente expostos a um esquema concorrente de esquiva-esquiva com intervalos SS e RS iguais (20 s), em ambas as alternativas de escolha. Os resultados obtidos indicaram que quanto menor o intervalo SS mais rápida a aquisição da resposta e menor a tendência em responder apenas em uma das alternativas. Manipulações posteriores dos intervalos SS e RS mostraram um aumento na ocorrência de respostas de esquiva na alternativa que continha o menor intervalo RS. Ao observar que os animais escolhiam responder na alternativa em que os choques eram mais prováveis, Sidman explicou a escolha com base apenas nas conseqüências das respostas, isto é, na redução na freqüência ou na densidade de grande parte dos choques programados. Por isso, Sidman passou a descrever a esquiva como um proces- so comportamental básico, em vez de derivado de outro mais fundamental, conforme defendido por interpretações bifatoriais. Para testar a sugestão anterior, Herrnstein e Hineline (1966) elaboraram um procedimento no qual a resposta de esquiva mudava uma programação de alta probabilidade de choque para uma de baixa probabilidade. Assim, nem sempre ocorria adiamento imediato de um choque programado, mas a resposta mudava a situação de alta para baixa aversividade. A sensibilidade do comportamento a essa contingência sutil corroborou a explicação proposta por Sidman. Em conseqüência, Herrnstein (1969, p. 59) sustentou a lei do efeito em si como modelo suficiente para explicar a esquiva: “uma resposta, ao produzir um estado de coisas, aumenta em freqüência, sendo o estado de coisas aqui a redução na taxa de choque”. Segundo esse autor, qualquer versão teórica bifatorial seria antieconômica por apelar a estados internos inferidos – medo, ansiedade, etc. – como substitutos do estímulo condicionado. Para Herrnstein (1969), a teoria bifatorial, elaborada para explicar como o CS adquire o controle do comportamento, além de desnecessária e pouco parcimoniosa, apenas exagerou a importância do reforço negativo secundário. Conforme Skinner (1966), o reforço operante não somente fortalece certa classe de respostas, como também a deixa sob o controle de outros estímulos. A análise operante mostra mais parcimônia por considerar os “estímulos-sinal” não como provedores de suportes pavlovianos para transpor lacunas no tempo, mas como correlacionados com diversas variáveis que contribuam para a manutenção do comportamento (Hineline, 1981, 1984). Certamente, os estímulos-sinal podem ter funções eliciadoras, mas podem também ser descritos como sinais de mudanças na densidade de choques e, portanto, seus efeitos nas situações de esquiva envolvem, principalmente, funções discriminativas que aceleram a aquisição da resposta (Herrnstein, 1969; Hineline, 1981). Além disso, por suas relações com o choque, tais sinais podem ser descritos como operações estabelecedoras condicionadas reflexivas (Michael, 1993), porque adquirem a função de evocar a resposta de esquiva e, talvez, ANÁLISE DO COMPORTAMENTO essa seja a razão de se confundir a esquiva com o processo de eliciação (ver Capítulo 2 para informações detalhadas sobre operações estabelecedoras). Hineline (1970) demonstrou que atrasos imediatos do choque, sem redução na densidade programada, são conseqüências reforçadoras suficientes para modelar e para manter a resposta de esquiva. Foram programados ciclos de 20 s, nos quais um choque ocorria aos 8 s, a barra era removida aos 10 s e retornava aos 20 s para reiniciar um novo ciclo. Caso uma resposta ocorresse antes de 8 s, o choque era liberado aos 18 s, mantendo o resto inalterado. Os resultados mostraram a aquisição e a manutenção da resposta, cuja probabilidade aumentou e atingiu o máximo em torno do sexto segundo do ciclo. No Experimento 2, tudo permaneceu igual, exceto que a resposta adiava o choque por 8 s e, 2 s após o choque, a barra retornava, iniciando um novo ciclo. Os sujeitos que participaram do Experimento 1 logo deixaram de responder, e os sujeitos ingênuos não responderam. Nesse caso, a resposta atrasava o choque, mas reduzia a duração do ciclo temporal em que os mesmos eram programados, aumentando, assim, sua densidade, de modo que os sujeitos deixaram de responder em função dessa contingência punitiva. Portanto, a redução na densidade de eventos aversivos sem atrasos imediatos (processos molares) é condição suficiente para o reforço negativo, embora não necessária, assim como atrasos imediatos (processos moleculares) são igualmente suficientes, mas não necessários. Ou seja, uma ou outra condição pode ser suficiente para modelar e para manter a resposta de esquiva, ambas ocorrendo no procedimento de Sidman (1953a, b, 1962a). Embora considerem plausível a argumentação contra uma separação arbitrária entre as fases de aquisição e de manutenção no condicionamento de esquiva, Todorov, Carvalho e Menandro (1977) sugeriram que no procedimento de Sidman (1953a) a separação parece razoável em função dos seguintes aspectos: a) Uma vez que a estabilidade tenha sido atingida, as variáveis importantes para determinar a velocidade da aquisição 123 da resposta de esquiva podem ter pouco ou nenhum efeito sobre as taxas de respostas e de choques recebidos (p. ex.: duração do intervalo SS e de intensidade de choque). b) O procedimento de Sidman combina três fatores, redução na freqüência de choque, período livre de choque e nenhum choque logo após a resposta, e cada qual sozinho poderia ser responsável pela aquisição da resposta de esquiva. Depois de se atingir a estabilidade na resposta, somente mudanças nas relações temporais entre respostas e choques afetam claramente a taxa de respostas. c) Como confunde a influência desses três fatores, o procedimento torna-se inadequado para a análise da aquisição do comportamento de esquiva. Entretanto as relações temporais entre respostas e choques que ele permite tornam seu uso uma ferramenta conveniente para o estudo do tempo como estímulo discriminativo no controle do comportamento quando este atinge o estado estável. O controle de estímulos em esquiva de operante livre foi investigado por de Souza, de Morais e Todorov (1992). Nesse estudo, o intervalo entre a resposta e o choque (R-S2) era de 25 s, entre a resposta e o estímulo préchoque (R-S1) era de 15 s, e entre o estímulo pré-choque e o choque (S1-S2) era de 10 s. Na ausência de resposta, o intervalo choque-choque (S2-S2) era de 25 s. Para um grupo de ratos, foram usados estímulos discriminativos visuais (luz-escuro) e, para outro grupo, auditivos (som-silêncio). O controle de estímulos foi avaliado por meio da inclusão de períodos de sondagem durante a sessão, durante os quais o intervalo R-S1 foi manipulado. Se a esquiva estivesse sob controle do estímulo pré-choque, então a taxa de respostas não deveria ser afetada pelas manipulações no intervalo R-S1; caso a esquiva estivesse sob controle temporal, então uma relação direta entre a taxa de respostas e a duração desse intervalo deveria ser observada. Os resultados indicaram que o controle exercido pelo estímulo pré-choque de- 124 ABREU-RODRIGUES, RIBEIRO & COLS. pendia da modalidade desse estímulo. O controle exercido pelo estímulo auditivo foi melhor do que o do estímulo visual e não dependeu de qualquer processo de controle temporal subjacente, o qual teve um papel mais importante no desempenho do grupo exposto ao estímulo visual. As relações entre intensidade do choque e taxas de respostas em estado estável foram investigadas por de Souza, de Moraes e Todorov (1984), que submeteram alguns ratos a uma contingência de esquiva sinalizada de operante livre. Ao longo do experimento, a intensidade do choque variou de 0,1 a 8,0 mA, mas sua duração foi mantida constante (200 ms). Os resultados indicaram um efeito tudo-ou-nada da intensidade do choque sobre as taxas de respostas e de choques, a porcentagem de choques evitados e a freqüência da resposta durante o estímulo pré-choque. Nenhum efeito sistemático da intensidade de choque sobre o controle de estímulos foi observado, seja medido pela porcentagem de apresentações de estímulos seguidas por respostas ou pela porcentagem de respostas que ocorreram durante os estímulos pré-choque. Portanto, segundo os autores, para cada sujeito há uma intensidade de choque mínima necessária para estabelecer e manter a resposta de esquiva, de modo que o aumento na intensidade acima deste valor mínimo tem pouco ou nenhum efeito sobre a taxa de respostas, exceto o efeito prejudicial geral do comportamento sob intensidade de choque muito além desse limite. Esses resultados confirmam o primeiro aspecto apontado por Todorov e colaboradores (1977), anteriormente descrito, e divergem das suposições presentes na literatura sobre esquiva, na qual geralmente a taxa de respostas é descrita como uma função monotônica direta e negativamente acelerada da intensidade de choque (de Souza et al., 1984). Embora as análises conceituais e empíricas antes resumidas sustentem a esquiva como processo básico, a compreensão da natureza do seu reforço ainda não está livre de controvérsias. Por exemplo, Dinsmoor (1977, 2001) reinterpreta os resultados experimentais disponíveis com base em sua versão invertida da teoria bifatorial clássica e no conceito de sinal de segurança. Para ele, produzir esse sinal é o reforço crucial do comportamento de esquiva e, quando há estímulo precedendo o choque, como ocorre na esquiva sinalizada, remover o sinal de aviso equivale a produzir o sinal de segurança. Se não há nenhum sinal programado, Dinsmoor postula que a própria resposta de esquiva induz efeitos fisiológicos que atuam na função de sinal de segurança, que tais efeitos se dissipam ao longo do tempo desde a resposta e que uma nova resposta os restabelecem em seu valor integral. Para ele, a explicação baseada na redução na densidade de choques incorre em dificuldade lógica fatal porque a relação resposta-reforço não tem localização específica no tempo e, “portanto, [o reforço] não pode ocorrer de modo contíguo e, assim, selecionar as instâncias individuais da classe de comportamento escolhida como resposta de esquiva” (Dinsmoor, 2001, p. 318). Com a teoria do sinal de segurança, Dinsmoor (1977) desarticula a distinção entre reforço positivo e reforço negativo ao sustentar a produção de estímulos como reforço para a esquiva, conforme a análise de Cameschi (1997). Com a ênfase na contigüidade resposta-reforço, Dinsmoor (2001) parece também desconsiderar a distinção entre instância e probabilidade da resposta embutida no conceito de classe de respostas. Ao discutir esse conceito, Skinner (1989, p. 36) afirma que: Reforçamos uma resposta quando tornamos um reforçador contingente a ela, mas não a alteramos em particular. O que reforçamos, no sentido de fortalecer, é o operante, a probabilidade de que respostas similares ocorram no futuro. Isso é mais do que uma distinção entre classes e membros de uma classe. As respostas nunca são exatamente iguais, mas surgem mudanças ordenadas se só contamos as instâncias que têm uma propriedade definidora. Um operante é uma classe de respostas e também uma probabilidade, não uma instância. Como antes descrito, a redução imediata ou a longo prazo na densidade dos eventos aversivos podem modelar e manter o desempenho de esquiva (Herrnstein e Hineline, 1966; Hineline, 1970). Assim, relacionar diretamen- ANÁLISE DO COMPORTAMENTO te o desempenho a esses efeitos parece mais parcimonioso e suficiente para explicar a esquiva, sem necessidade de inferências sobre estados internos emocionais e/ou fisiológicos para transpor as lacunas espaciais e temporais. Sidman (2001, p. 337) aceita com elegância a sugestão de Dinsmoor do sinal de segurança como reforço para o comportamento de esquiva, mas aponta que “a despeito da demonstração de que o período seguro pode funcionar como um reforço condicionado, sem qualquer término concomitante de um sinal de perigo, o reforço negativo ainda é a base para a criação original do período seguro”. De modo similar, Galizio e Liborio (1995) descrevem que, nos estudos sobre os efeitos da remoção da contingência de esquiva contingente a uma resposta alternativa (timeout da esquiva), duas contingências de reforço negativo são comparadas: esquiva e fuga da esquiva. Esses autores comentam que o timeout já foi descrito como caso de reforço positivo por Sidman (1962b) e por Verhave (1962), mas como deriva suas propriedades da remoção da contingência de esquiva, parece mais apropriado identificá-lo com reforçamento negativo. Courtney e Perone (1992) descreveram que uma instância de timeout da esquiva envolve pelo menos três mudanças na situação experimental: remoção de estímulos associados com a contingência de esquiva, redução na taxa de choques liberados e a suspensão da necessidade de responder associada à contingência de esquiva. Sidman (2001, p. 338) completa sua análise, assumindo que o comportamento de esquiva pode ser reforçado pelo término de estímulos que tenham sido emparelhados com um choque, sejam eles externos, internos ou produzidos pela resposta; pela fuga do comportamento que foi correlacionado com o choque; pela redução na densidade do choque; “e agora, pela produção de um período seguro”. Baum (2001), menos condescendente, acusa Dinsmoor de apoiar sua teoria em experimentos conceitualmente falhos e de omitir a descrição completa de alguns estudos. Segundo Baum, ao rever o estudo de Weisman e Litner (1969), por exemplo, Dinsmoor não mencionou que houve um pré-treino da resposta de esquiva do choque, descrevendo ape- 125 nas que Weisman e Litner descobriram que um som inversamente correlacionado com a liberação de choques durante o condicionamento poderia ser usado como reforço para aumentar ou diminuir as taxas de respostas mantidas sob reforço diferencial de taxas altas (DRH) ou reforço diferencial de taxas baixas (DRL), respectivamente. Para Dinsmoor (2001, p. 315), a limitação lógica desse procedimento é não se poder diferenciar entre a produção de um sinal de segurança e a remoção de um sinal de aviso, concluindo que “é difícil dizer qual relação entre o estímulo e o choque seria responsável pelos efeitos sobre o comportamento”. A crítica de Baum é semelhante à de Sidman, anteriormente mencionada, e pode ser resumida na seguinte pergunta: “O que torna o som um reforço condicionado?”. Em conseqüência, Baum analisa o conflito como choque entre paradigmas e acusa Dinsmoor de defender uma visão molecular do comportamento, comprometida com o princípio de associação por contigüidade do atomismo do século XIX, já superada pela visão molar das contingências entre respostas e conseqüências, que aceita e incorpora lacunas temporais entre elas. Hineline (2001), assim como Azrin e Holz (1966), questiona Dinsmoor por avançar além do nível descritivo e sustenta que todas as explicações são descrições, embora nem todas as descrições sejam aceitáveis como explicação. Hineline descarta a dificuldade lógica da hipótese de redução na densidade de choques, afirmando que Dinsmoor reinterpretou os resultados de Herrnstein e Hineline (1966) com base em atrasos médios do choque; logo também combinou eventos temporalmente separados e irregularmente dispersos. Ou seja, os atrasos médios não são mais localizados temporalmente do que um decréscimo na freqüência de choques. Finalmente, Hineline discorda de que as concepções molecular e molar sejam mutuamente exclusivas, considerando que sua trajetória científica começou com a exploração de possíveis aspectos complementares das relações entre processos comportamentais a curto e longo prazo (cf. Herrnstein e Hineline, 1966; Hineline, 1970), e sugeriu que devemos avançar mais além da distinção molar-molecular e 126 ABREU-RODRIGUES, RIBEIRO & COLS. adotar níveis de análise que envolvam múltiplas escalas temporais e suas interações. Por outro lado, Baron e Perone (2001) julgam a teoria de Dinsmoor (2001) mais eficaz para explicar o comportamento de esquiva em função de sua ênfase no intercâmbio entre contingências respondentes e operantes, encorajando a análise dos estímulos mediadores das conseqüências molares e, assim, incorporando o controle tanto dos eventos locais como dos eventos temporalmente mais remotos, improváveis ou cumulativos. Entretanto eles criticam o valor heurístico das teorias em confronto, pois muito pouca pesquisa sobre esquiva foi realizada desde os anos 1970, de modo que “se um critério para julgar uma boa teoria é sua ‘fertilidade’, nenhuma dessas visões da esquiva parece ajustar-se a ele muito bem” (Baron e Perone, 2001, p. 360). Estudos recentes têm investigado contingências de esquiva por meio do procedimento anteriormente identificado como timeout da esquiva. Courtney e Perone (1992) expuseram alguns ratos a um esquema múltiplo com dois componentes. Em cada componente, vigorava um esquema concorrente no qual respostas de pressionar uma barra cancelavam o choque, e respostas em outra barra suspendiam a contingência de esquiva por 2 min (timeout). Os componentes diferenciavam-se, intra e intercondições, em termos da taxa de choques programada. Após cada condição, foi implementado um período de extinção durante o qual respostas na barra correlacionada com o timeout não suspendiam a contingência de esquiva. Foi verificado que a resposta na barra do timeout foi relativamente insensível à redução na taxa de choques, e que uma fonte de controle mais potente foi a redução temporária na resposta na barra de esquiva (ao produzir o timeout, os ratos escapavam da contingência que exigia uma resposta contínua e iniciavam um período sem requerimento de resposta). A resistência à extinção das respostas na barra do timeout aumentou com os acréscimos na redução da freqüência de choques e da exigência de resposta durante o treino. Os autores concluíram que seus resultados apóiam a sugestão de Hineline (1984) de que a aversividade de uma situação comportamental pode depender de uma série de eventos ou relações entre eventos (no caso, a redução no custo da resposta), além do próprio estímulo primário (p. ex.: choque). A resistência à extinção da resposta mantida por timeout da esquiva foi também examinada por Galizio (1999). No Experimento 1, alguns ratos foram treinados em um esquema concorrente no qual as respostas em uma das barras adiavam o choque de acordo com um esquema de esquiva de operante livre, e as respostas em outra barra produziam um timeout sinalizado da contingência de esquiva. Dois tipos de extinção foram estudados. No primeiro caso, as respostas na barra do timeout não mais suspendiam a contingência de esquiva e, no segundo, o procedimento de esquiva foi cancelado uma vez que não havia a liberação de choques. Os resultados indicaram que taxas de respostas estáveis foram mantidas em ambas as barras, sendo que as taxas médias de respostas na barra do timeout foram sempre maiores do que as taxas na barra da esquiva. A suspensão do reforço na barra do timeout produziu uma rápida extinção das respostas nessa barra. Em contraste, a suspensão do choque teve pouco efeito na taxas de respostas na barra do timeout, enquanto as taxas de respostas de esquiva diminuíram ao longo das sessões. No Experimento 2, durante o qual a suspensão dos choques foi mantida por um longo período, embora tenham sido observados decréscimos em ambas as respostas, as respostas na barra do timeout foram mais resistentes à extinção do que as respostas de esquiva. Conforme Galizio, a persistência da resposta na barra do timeout não apóia a suposição de Courtney e Perone (1992) de que reduções locais na freqüência de respostas são a base das propriedades reforçadoras do timeout e sugere outros determinantes além da redução do esforço em responder; a ênfase na redução na densidade de choques defendida por Herrnstein e Hineline (1966); as teorias cognitivas que enfatizam a expectativa do choque como subjacente à esquiva, conforme proposto por Seligman e Johnston (1973); as predições das teorias bifatorias tradicionais de que as respostas de esquiva e de timeout são mantidas pelo térmi- ANÁLISE DO COMPORTAMENTO no de estímulos emparelhados com choques e que as durações da extinção dessas respostas seriam proximamente relacionadas. Em função disso, Galizio (1999, p. 10) concluiu perguntando: “Por que o estímulo timeout retém suas propriedades reforçadoras quando a densidade de choque é zero e quando não há base suficiente para supor que o ‘medo’ ou a ‘expectativa’ do choque possam motivar a esquiva?”. Tendo em vista essa e outras questões anteriormente consideradas, é viável afirmar que o estudo do controle aversivo do comportamento tem ainda muito a avançar na compreensão dos processos básicos subjacentes. Entretanto o conjunto dos experimentos aqui resumidos atesta a validade do conceito de reforço negativo na descrição das relações entre respostas e suas conseqüências imediatas e/ou remotas. Outros estudos experimentais revelam que os efeitos do reforço negativo também se ajustam à lei da igualação ou lei do efeito quantitativa. Ou seja, estudos com esquemas múltiplos (de Villiers, 1974) e com esquemas concorrentes (Logue e de Villiers, 1978), em que ajustes durante o treino preliminar garantiram a distribuição das respostas entre as alternativas, demonstraram a igualação entre taxas de respostas e redução na freqüência de choques. Esses resultados são comparáveis à igualação observada entre taxa de respostas e taxas de reforços positivos e ajustam-se, portanto, às equações de Herrnstein (1970) e de Baum (1973) que resumem matematicamente essas relações (ver Capítulo 9 para informações mais detalhadas sobre escolha e preferência). Higgins e Morris (1984) revisaram a literatura disponível para avaliar a generalidade do condicionamento de esquiva entre humanos e não-humanos. De acordo com eles, a generalidade foi observada em muitas das áreas discutidas: a) aquisição da resposta; b) manutenção da resposta ao longo de vários intervalos S-S e R-S e outros esquemas experimentais; c) programação de estímulos externos; 127 d) administração de agentes farmacológicos. Algumas diferenças recorrentes, entretanto, também foram observadas e são similares àquelas que também surgem sob contingências de reforço positivo. Entre elas, os autores apontam: • Os humanos emitem altas taxas de respostas em padrões regulares que produzem mínimo contato com os eventos aversivos, enquanto os animais respondem em taxas mais baixas. • A menor susceptibilidade a mudanças nas contingências é devido às diferenças nas taxas, pois o padrão de desempenho em humanos muda somente quando essas mudanças são sinalizadas por estímulos discriminativos ou quando são superpostas contingências de punição. • O padrão de taxas altas em humanos mostra-se insensível a mudanças nos parâmetros dos esquemas de reforço. Para os autores, essas diferenças podem ser explicadas com base em outros princípios estabelecidos sobre as relações entre comportamento e ambiente, e pesquisas adicionais permitiriam o desenvolvimento de procedimentos experimentais para minimizá-las e para identificar histórias pessoais de reforço extralaboratório e repertórios de comportamentos verbais como as possíveis fontes dessas diferenças. Interação operante-respondente: efeitos emocionais As contingências de reforço e punição desenvolvem e mantêm o repertório operante, mas os estímulos envolvidos também exercem funções antecedentes que afetam o comportamento por meio dos processos de eliciação, indução e modulação (Hineline, 1984). Esses processos incluem efeitos emocionais que, quando resultam do controle aversivo, têm im- 128 ABREU-RODRIGUES, RIBEIRO & COLS. plicações clínicas extensas, pois são os motivos centrais das queixas das pessoas em situações terapêuticas. Os estímulos que sinalizam a apresentação de outros estímulos podem ser superpostos sobre linhas de base do comportamento operante. O procedimento de supressão condicionada, elaborado por Estes e Skinner (1941), foi apresentado como uma técnica de estudo da emoção e como uma medida da “ansiedade condicionada” – comportamento emocional a ser identificado e medido por meio da supressão do comportamento operante. A linha de base era a taxa de pressão à barra de ratos reforçada com alimento em um esquema VI 2 min, sobre a qual superposições de um tom de 3 min de duração precediam apresentações de um breve choque. O tom passou a suprimir as pressões à barra que, após o choque, retornavam; quando o choque foi eliminado, as pressões durante o tom voltaram a ser emitidas em taxas similares às anteriores. O processo ilustra o condicionamento respondente: um estímulo, o tom, sinaliza um outro estímulo, o choque; como o choque é um estímulo aversivo incondicionado (US aversivo), transforma o tom com ele emparelhado em estímulo pré-aversivo condicionado (CS préaversivo). Neste caso, o efeito produzido pelo CS – supressão do operante – difere do produzido pelo US – voltar a pressionar (Catania, 1998/1999). Como o CS pré-aversivo não afeta somente a pressão à barra, mas também a taxa cardíaca, a respiração e outros processos fisiológicos, a tendência é invocar a linguagem da emoção. Essa tendência parece resultar dos esquemas conceituais pré-científicos da linguagem comum que afetam nosso modo de falar sobre o comportamento (Chiesa, 1994). Quando um evento com propriedades aversivas suprime uma faixa ampla de classes de respostas diferentes, falamos de medo ou de ansiedade, assim como falaríamos de raiva se observássemos um comportamento agressivo (Catania, 1998/1999). Não se deve avançar e apontar, portanto, o medo ou a ansiedade como a cau- sa da supressão ou a raiva como a causa da agressão, pois são nomes ou rótulos, e não explicações, dos efeitos comportamentais. Os efeitos de estímulos pré-aversivos dependem da linha de base sobre a qual são superpostos. Pode ocorrer maior ou menor supressão, dependendo de variáveis tais como duração e freqüência de apresentação do CS, taxa de redução dos reforçadores e níveis de privação (Catania, 1998/1999). Se a linha de base for esquiva de choques, o efeito observado é o aumento na taxa de respostas (Sidman, Herrnstein e Conrad, 1957). Esse efeito é comparável ao de estímulos pré-apetitivos, isto é, estímulos que antecedem apresentações nãocontingentes de reforço positivo, uma operação que produz, por exemplo, a automodelagem2 ou um aumento na taxa de bicadas no disco mantida por esquemas DRL (Herrnstein e Morse, 1957). Nesses casos, por analogia às referências ao medo ou à ansiedade nos casos de supressão durante estímulos pré-aversivos, a tentação tradicional seria mencionar a alegria como a emoção envolvida e responsável pelos efeitos fortalecedores dos estímulos préapetitivos (Catania, 1998/1999; Rachlin, 1967). O procedimento de Estes e Skinner (1941) foi bastante utilizado como estratégia de pesquisa para validar teorias mediacionais que apelam a estados emocionais e/ou processos 2Brown e Jenkins (1968) descreveram um procedimento com um pombo já treinado a comer no alimentador, mas que ainda não bicava o disco. De tempos em tempos, o disco era iluminado e, alguns segundos depois, o alimentador era operado de modo independente do comportamento do pombo. Com isso, o disco iluminado tornava-se um estímulo que sinalizava alimento e este induzia o comer que, no caso do pombo, incluía o bicar. As relações entre o disco iluminado e a apresentação de alimento induziam o pombo a se orientar em direção ao disco, a se mover em sua direção e a passar a bicar o disco quando estivesse iluminado. Considerou-se que a indução do bicar o disco foi gerada por automodelagem, e a continuação do procedimento é denominada automanutenção (Williams e Williams, 1969). ANÁLISE DO COMPORTAMENTO cognitivos inferidos para explicar os efeitos comportamentais. Alguns exemplos seriam as teorias que descrevem a emoção com base em associações entre estímulos e as teorias sobre processamento de informações, respectivamente (Hineline, 1984). Embora o procedimento seja especialmente útil para detectar efeitos respondentes inibitórios e excitatórios, os teóricos mediacionais empregaram-no para definir operacionalmente constructos teóricos hipotéticos, tais como “medo condicionado”, que são, então, oferecidos para explicar o comportamento (Hineline, 1984). Na visão de Skinner, o comportamento verbal em geral e nossos relatos introspectivos evoluíram em função de práticas sociais e culturais, de acordo com critérios vagos de definição que a análise científica corrige e refina com suas descrições. Conforme resume Skinner (1974), os estímulos aversivos primários ou condicionados suscitam reações, principalmente no sistema nervoso autônomo, que são descritas em nível humano como medo e ansiedade. Esses estímulos alteram a probabilidade de qualquer comportamento positivamente reforçado em andamento e são ocasiões em que o comportamento negativamente reforçado pode ser fortalecido. Porém as condições corporais sentidas, as observações introspectivas e o comportamento alteram-se devido não aos sentimentos, mas às contingências aversivas que são causas comuns da condição sentida, das mudanças nos sentimentos e no comportamento. Schoenfeld (1969, p. 669) questionou o uso de termos do vernáculo comum como sendo apropriados para categorizar os processos psicológicos, argumentando, com eloqüência, que “as palavras do vocabulário leigo refletem atitudes e crenças sociais sobre o comportamento, são definidas por critérios sociais que agrupam atos por suas conseqüências sociais e estão quase sempre erradas no que aceitam como seus referentes comportamentais”. A ênfase é que os conceitos da análise comportamental devem ser derivados de operações experimentais e não de conversações (Hineline, 1984; Sidman, 1989/1995). Sobre essa questão, Herrnstein (1969) admitiu que, em alguns 129 casos, parece razoável supor que o rato está como medo do CS, mas somente assumindo semelhanças entre sua vida subjetiva e a humana, de modo a permitir o vocabulário comum e, com o mesmo critério, reconhecer que não há medo em outros casos, como na versão sinalizada do procedimento de Sidman. A análise comportamental observa que as semelhanças, de fato, encontram-se nos princípios do comportamento, cujas interações tornaram-se mais e mais complexas ao longo da evolução das espécies (Skinner, 1966, 1984). Para Skinner, o comportamento humano é descrito e explicado pela combinação integrada de três níveis complexos de determinação (filogenético, ontogenético e cultural), resumidos nos conceitos de seleção de variações ou seleção por conseqüências (Skinner, 1981, 1990). Desse modo, o behaviorismo radical promove uma visão moderna de ciência molar e sistêmica, ao contrário das críticas que o descrevem como reducionista e mecanicista. Essas críticas, de fato, atingem tanto os behaviorismos de Pavlov, de Watson, de Tolman e de Hull quanto, ironicamente, todas as atuais versões de psicologia estímulo-organismo-resposta (S-O-R) dos modelos teóricos psicodinâmicos, fisiológicos, cognitivos e motivacionais (Chiesa, 1994). Portanto, é à luz dessa integração conceitual que são rejeitados os apelos reducionistas ao cérebro para justificar as teorias mentalistas e suas concepções de causas internas que, por sua vez, sustentam a noção de liberdade de escolha e autodeterminação. Skinner (1990, p. 1208) questiona o fato de que: Quanto mais sabemos sobre a relação corpocérebro como uma máquina bioquímica, menos interessante ela se torna como base para o comportamento. Se há liberdade, ela somente pode ser descoberta no acaso das variações. Se novas formas de comportamento são criadas, elas são criadas pela seleção. As falhas na variação e na seleção são fontes de problemas fascinantes. Nós devemos nos adaptar a novas situações, resolver conflitos e achar soluções rápidas. Uma estrutura bioquímica não faz nada desse tipo. 130 ABREU-RODRIGUES, RIBEIRO & COLS. CONTINGÊNCIAS AVERSIVAS NO PROCESSO TERAPÊUTICO Apesar das controvérsias sobre a efetividade do controle aversivo, ele vem sendo amplamente empregado nas relações interpessoais ao longo da história da humanidade. Dessa forma, qualquer análise funcional de relações comportamento-ambiente, para ser completa, e qualquer estratégia de intervenção, para ser eficiente, devem considerar não somente contingências de reforçamento positivo, mas também aquelas que envolvem reforçamento negativo e punição (Crosbie, 1998). No contexto clínico, o controle aversivo torna-se particularmente importante uma vez que as queixas trazidas pelo cliente são resultantes de contingências históricas e atuais, de punição e esquiva/fuga. Inegavelmente, os terapeutas têm incluído as contingências aversivas em suas análises funcionais do repertório comportamental de seus clientes, porém é comum negligenciarem o papel de tais contingências em suas intervenções clínicas. Ou seja, a relação terapeuta-cliente, como qualquer outra relação interpessoal, é suscetível ao controle aversivo, mas pouco se tem refletido sobre a extensão desse controle no setting terapêutico, como também pouco se sabe sobre sua contribuição para o sucesso (ou insucesso) da terapia. A seguir, será apontada a presença de estratégias aversivas em algumas práticas clínicas amplamente utilizadas nos dias atuais. O objetivo dessa “denúncia” seria incentivar os terapeutas comportamentais a promoverem investigações sistemáticas sobre o papel de contingências aversivas na relação terapeutacliente. Nas décadas de 1960 e 1970, as técnicas comportamentais eram consideradas como o principal mecanismo de mudança terapêutica (Follette, Naugle e Callaghan,1996). Nessa época, técnicas aversivas, tais como a inundação, a implosão, a sensitização encoberta e a punição contingente, fortemente baseadas nos achados das pesquisas de laboratório, foram bastante usadas por terapeutas comportamentais (para uma revisão, ver Carrasco, 1996; Masters, Burish, Hollon e Rimm, 1987). Ape- sar de a literatura oferecer evidências da eficácia terapêutica dessas técnicas (p. ex.: Kazdin, 1972; Shipley e Boudewyns, 1980) e de diversos setores sociais (p. ex.: família, escola, trabalho) adotarem largamente estratégias aversivas, a popularidade das mesmas entre os terapeutas comportamentais declinou nos últimos 30 anos, em decorrência de diversos aspectos, alguns dos quais apresentados a seguir. Primeiro, a terapia comportamental recebeu inúmeras críticas por sua ênfase no uso de técnicas específicas para modificar determinados comportamentos contraprodutivos, sendo identificada como uma terapia focal e tecnicista. De acordo com os críticos, uma terapia focal, isto é, restrita ao comportamentoalvo e suas variáveis controladoras imediatas, negligencia o quadro complexo de inter-relações que são estabelecidas no repertório comportamental do cliente. Além disso, o uso de técnicas padronizadas não considera que a relação indivíduo-ambiente seja única e que, assim sendo, as intervenções terapêuticas devem ser individualizadas. Um segundo aspecto refere-se aos achados da pesquisa básica, os quais revelaram muitos aspectos indesejáveis da punição, tais como: a recuperação da resposta após a retirada do agente punitivo; a ocorrência de efeitos emocionais aversivos, que, por sua vez, geram respostas de fuga e esquiva; o aumento na probabilidade de comportamentos agressivos e a ausência de aprendizagem de comportamentos mais apropriados (Sidman, 1989/1995; Skinner, 1953/2000). O terceiro aspecto está relacionado a questões éticas. Uma vez que os resultados da pesquisa básica sugeriam que os procedimentos aversivos não eram justificáveis, houve uma redução drástica nas investigações sobre o tema. Essa redução ecoou no contexto clínico de tal forma que o uso de técnicas aversivas ficou restrito àquelas situações em que não havia alternativas terapêuticas não-aversivas disponíveis (Banaco, 2001). A idéia dominante era que a rejeição dessas técnicas produziria a retirada de apoio social e, conseqüentemente, promoveria a investigação de estratégias alternativas (Rangé, 1988). ANÁLISE DO COMPORTAMENTO A repercussão da abordagem construcional, proposta por Goldiamond (1974), também contribuiu para o desuso de técnicas aversivas na terapia comportamental, consistindo no quarto aspecto a ser considerado. Esse autor defendeu a posição de que a intervenção terapêutica deveria estabelecer contingências favoráveis à construção de repertórios mais produtivos, opondo-se, portanto, à postura dominante de que o objetivo da terapia era eliminar comportamentos-problema. O quinto aspecto corresponde ao interesse crescente na relação terapeuta-cliente como o principal mecanismo de mudança no contexto clínico, observado a partir do início da década de 1980. Esse interesse está apoiado no argumento de que comportamentos contraprodutivos são reproduzidos no ambiente terapêutico em decorrência das similaridades funcionais entre a relação terapêutica e as relações interpessoais que o cliente mantém fora da terapia, o que consiste em uma oportunidade única para o terapeuta modelar diretamente alternativas comportamentais mais efetivas. O papel da relação terapeuta-cliente é amplamente enfatizado em propostas terapêuticas recentes, tais como a Terapia Analítica Funcional (FAP), proposta por Kohlenberg e Tsai (1991), e a Terapia da Aceitação e do Compromisso (ACT), proposta por Hayes, Strosahl e Wilson (1999). Tanto a FAP quanto a ACT, embora tenham sido influenciadas pelos aspectos já mencionados e, conseqüentemente, promovam a utilização de estratégias positivamente reforçadoras na prática clínica, não estão totalmente livres da ocorrência de controle aversivo na relação terapeuta-cliente. A FAP, por exemplo, advoga que o terapeuta deve evocar comportamentos clinicamente relevantes durante a sessão, ou seja, se o cliente tem dificuldades afetivas e comportamentais em seus relacionamentos interpessoais, o terapeuta deve evocar essas dificuldades durante a sessão e conseqüenciá-las diferencialmente de forma a promover a aprendizagem de comportamentos mais adaptativos. Ao fazer isso, o terapeuta deliberadamente coloca o cliente em contato com os eventos aversivos que controlam seus comportamentos-problema (Kohlenberg, 1999), conforme indicado no diálogo (fictício) a seguir: 131 C: Eu gostaria que alguém mais experiente tomasse conta de mim, me ajudasse a tomar as decisões certas. T: Eu acho que você gostaria que eu decidisse se você deve ou não aceitar esse emprego. Se isso for verdade, você está fazendo o que não gostaria de fazer, ou seja, você mais uma vez está se esquivando de tomar decisões. C: Não, não é isso... Eu, bem, eu ... (desvia o olhar, gagueja). Às vezes, tenho saudade de meu pai... Ele sempre me apontava o que era certo fazer (chora). Quando o comportamento-problema é identificado e descrito pelo terapeuta, o cliente entra em contato com a situação aversiva e experiencia as conseqüências emocionais negativas desse contato. Assim sendo, evocar comportamentos-problema pode ser considerado um procedimento aversivo. Uma outra estratégia terapêutica, a de apresentar interpretações, muito utilizada por terapeutas da FAP, também pode incluir propriedades aversivas. Interpretar consiste em descrever o comportamento e suas variáveis de controle. A interpretação é um aspecto importante do processo terapêutico porque, geralmente, o cliente só é capaz de observar a topografia ou o conteúdo do comportamento, ignorando suas propriedades funcionais (Perkins, Hackbert e Dougher, 1999). Ao tentar preencher essa lacuna, a interpretação pode evocar experiências prévias com características aversivas intensas, conforme demonstrado nos exemplos a seguir: T: Dizer que é 10 anos mais nova e somente buscar relacionamentos íntimos com homens bem mais jovens parece ser uma forma de evitar críticas por viver ainda com os pais e não trabalhar aos 38 anos de idade. T: Eu acho que você começou a falar sobre o autoritarismo de sua mãe porque eu pedi para você justificar suas faltas. Quando o cliente entra em contato com situações (e emoções) aversivas na terapia, é provável que tente esquivar-se da situação, podendo até agredir o terapeuta. Em tais situações, é comum o terapeuta empregar uma es- 132 ABREU-RODRIGUES, RIBEIRO & COLS. tratégia denominada de bloqueio da esquiva (Brandão, 1999), exemplificada a seguir: C: Esse assunto de emprego já está resolvido. Não se preocupe, desta vez eu sei o que fazer. Vamos deixar esse assunto de lado, já está resolvido. Eu gostaria de aproveitar o tempo que me resta falando sobre minha namorada (cliente tenta se esquivar). T: Antes de mudar de assunto, eu gostaria de saber como a questão do emprego foi resolvida. Você poderia me dizer? (terapeuta tenta impedir a esquiva). C: Eu prefiro deixar esse assunto de lado. Estou querendo lhe contar o que ocorreu, sábado, com minha namorada (cliente continua se esquivando). T: Tenho a impressão de que você está evitando falar sobre o assunto. A questão do emprego é urgente. Se você está tendo dificuldades para tomar uma decisão, vamos conversar sobre essa dificuldade (terapeuta insiste). C: Você não me dá uma folga... Tá bem, eu estou apavorado. É uma decisão muito importante, não me acho capaz de tomar a decisão acertada. É uma sensação horrível! (cliente começa a chorar). Diante das tentativas de esquiva do cliente, o terapeuta: impediu o reforçamento dessas tentativas, passou a promover a auto-observação e contribuiu para o contato com a dificuldade de tomar decisões e com as emoções correlacionadas. Esses três aspectos têm um caráter nitidamente aversivo, sendo sua implementação justificável em função de sua relevância para a aceitação de comportamentos e de emoções contraprodutivos, análise funcional da situação-problema e aprendizagem de comportamentos mais efetivos (Brandão, 1999). A ACT também inclui diversas estratégias aversivas. Segundo essa proposta terapêutica, o cliente geralmente acredita que o comportamento é causado por eventos privados. Dessa forma, seu objetivo na terapia é aprender a controlar efetivamente seus pensamentos e sentimentos indesejáveis (esquiva emocional), o que teria como conseqüência a resolução de seus problemas. De acordo com Hayes e colaboradores (1999), a terapia deve enfraquecer essa esquiva, cabendo ao terapeuta estabelecer contingências que ajudem o cliente a se conscientizar de que seu comportamento é controlado por eventos ambientais, a aceitar seus pensamentos e sentimentos indesejáveis e a se comprometer com a mudança comportamental. Para tanto, a ACT faz um largo uso de metáforas (dentre outras estratégias) já que, devido a sua ambigüidade, dificilmente produzem aquiescência ou resistência. Algumas dessas metáforas são empregadas para mostrar ao cliente que as tentativas de eliminar pensamentos e sentimentos indesejáveis geram conseqüências aversivas, tais como falta de contato com reforçadores positivos, manutenção de sentimentos dolorosos, aumento da aversividade da situação e generalização de respostas emocionais (Brandão, 1999). Na metáfora do polígrafo, por exemplo, o cliente deve imaginar que está conectado a um polígrafo, uma máquina que detecta qualquer estado emocional, quer seja de ansiedade ou de relaxamento. Ele deve imaginar também que há uma arma apontada para sua cabeça e que, caso ele se sinta ansioso, a arma será disparada. Sua tarefa, portanto, é evitar o sentimento de ansiedade (Hayes et al., 1999). Essa metáfora tem propriedades aversivas, não somente porque gera estados emocionais negativos no decorrer do exercício, mas também porque produz uma condição de desamparo. Esse desamparo ocorre quando, ao tentar seguir as instruções do terapeuta, isto é, não se sentir ansioso, o cliente inevitavelmente se defronta com a inutilidade de suas tentativas. Essa descoberta, por sua vez, contribui para o abandono de antigas estratégias comportamentais de controle emocional. O problema surge porque o cliente não dispõe, pelo menos no momento, de estratégias alternativas eficazes. É comum, nessas situações, que o cliente emita verbalizações com teor negativo, tais como “Tudo que tenho tentado ao longo dos anos está errado? Se for assim, acho que meu problema não tem solução. Não sei o que fazer. Acho que devo me conformar, é meu destino”. Conforme sugerido por Hayes e colaboradores, cabe ao terapeuta minimizar a aversividade da situação, tornando o desamparo inicial uma condição criativa, de modo que o cliente passe a ANÁLISE DO COMPORTAMENTO discutir seus problemas sob perspectivas mais construtivas. Outros procedimentos terapêuticos, também conhecidos como não-aversivos, envolvem situações emocionalmente dolorosas. A dessensibilização sistemática é um exemplo. Esse procedimento envolve, inicialmente, a construção de uma lista hierarquizada de situações ansiogênicas e o treino de relaxamento. Posteriormente, o terapeuta contrapõe os estados de relaxamento e de ansiedade. Isto é, após o estabelecimento de um nível profundo de relaxamento, uma situação aversiva de baixa intensidade é apresentada pelo terapeuta, cabendo ao cliente imaginar (no modelo mais tradicional) a situação apresentada. Quando a imaginação de uma determinada situação gera ansiedade, o estado de relaxamento é restabelecido, e, em seguida, o ciclo recomeça. Quando a imaginação de uma determinada situação deixa de gerar ansiedade, uma outra, com teor aversivo um pouco maior é apresentada, e assim por diante (Turner, 1996; Wolpe, 1990). Dessa forma, a implementação desse procedimento envolve, desde a construção da hierarquia até a imaginação de situações ansiogênicas, um forte conteúdo aversivo. Uma observação semelhante pode ser feita com relação ao ensaio comportamental. Nesse procedimento, a aprendizagem de respostas mais efetivas ocorre por meio da representação de papéis. Terapeuta e cliente representam relações interpessoais relevantes, podendo este representar a si mesmo ou uma outra pessoa. No decorrer do ensaio, de vez em quando o terapeuta interrompe a cena para avaliar o comportamento do cliente e, nessas ocasiões, reforça aproximações sucessivas ao comportamento final desejado. Apesar da ênfase no reforçamento positivo, o ensaio comportamental também inclui características aversivas. Suponha que o cliente deseja comunicar à esposa sua decisão de se divorciar e, para tanto, está ensaiando o que e como deve ser dito. A representação do diálogo, per si, coloca o cliente em contato com diversos estímulos aversivos, o que usualmente ocasiona sentimentos muitos dolorosos. Além disso, sempre que o cliente é solicitado a repetir a cena, fica claro que seu comportamento continua inapropriado, o que 133 pode deixá-lo ansioso, envergonhado e, até mesmo, agressivo (Masters et al., 1987). O controle aversivo também está presente em outras estratégias terapêuticas, além daquelas anteriormente mencionadas, tais como a terapia de exposição e prevenção de respostas, amplamente utilizada no tratamento do Transtorno Obsessivo-Compulsivo (p. ex.: Guimarães, 2001; Zamignani, 2000). Considerando, portanto, que estratégias terapêuticas de mérito reconhecido e amplamente utilizadas nos dias atuais estão permeadas de controle aversivo, é possível afirmar que o que caiu em desuso foi o uso isolado de técnicas aversivas ou o uso dessas técnicas como forma primária de intervenção, ou, ainda, o uso de técnicas com forte teor aversivo. Na realidade, contingências aversivas continuam sendo implementadas na clínica comportamental, mas como parte de tratamentos mais amplos que envolvem reforçamento positivo em larga escala (Carrasco, 1996). A atividade clínica fornece evidências de que a administração de controle aversivo em um ambiente pleno de reforçamento positivo pode ser favorável ao desenvolvimento de repertórios comportamentais mais produtivos. Conforme indicado por Sidman (1989/1995), a administração de punições suaves pode gerar supressão da resposta (pelo menos temporária), e essa supressão pode consistir em uma ótima oportunidade para o terapeuta treinar alternativas comportamentais mais úteis. Por exemplo, uma interpretação pode gerar respostas de esquiva (como tentativas de mudar o tema da conversa). A insistência do terapeuta em permanecer conversando sobre um determinado tema pode não somente funcionar como punição, eliminando a tentativa de esquiva, mas também como uma operação estabelecedora, evocando alternativas comportamentais mais produtivas (como discutir o tema). Essas alternativas podem, então, ser sujeitas a reforçamento positivo. O processo terapêutico, caracterizado pelo uso de reforçamento positivo, mas também incluindo contingências aversivas e, ainda assim, bastante efetivo para promover mudanças comportamentais positivas e duradouras, sugere que não podemos negar ou ignorar 134 ABREU-RODRIGUES, RIBEIRO & COLS. o papel do controle aversivo na relação terapêutica. Nosso objetivo é evitar o uso incompetente e irresponsável de procedimentos aversivos. Para tanto, devemos retomar as investigações sobre o controle aversivo, tanto no âmbito da pesquisa básica quanto no da aplicada. Investigações sobre o seguimento de regras, a correspondência dizer-fazer, a resistência à mudança, o controle por operações estabelecedoras, os efeitos da história passada, dentre outros fenômenos comportamentais, em contextos aversivos, poderiam ser úteis para responder a questões clínicas relacionadas ao diagnóstico e à intervenção. CONCLUSÃO O reconhecimento do controle no comportamento humano tem sido um assunto muito polêmico e, nesse controvertido debate, o insulto é freqüente (Skinner, 1971). Entretanto os extensos resultados experimentais de pesquisas com organismos não-humanos e humanos revelam relações ordenadas e estabelecem o controle como um fato, e não como uma mera opinião. Esse fato, combinado com aqueles que resultam da aplicação dessa análise funcional em situações de intervenção, atestam que a ciência pode esclarecer os diversos tipos de relações entre pessoas, pois “apesar de gostarmos ou não, de reconhecermos ou não, estamos constantemente reforçando e punindo o comportamento uns dos outros” (Baum, 1994, p. 172). Certamente, o uso deliberado de técnicas para mudar o comportamento, coercivas ou não, envolve sérias questões éticas que devem ser avaliadas e julgadas à luz de alternativas disponíveis. A literatura da liberdade e da dignidade combate qualquer tipo de modificação do comportamento, seja com o uso de estímulos aversivos ou de reforçadores positivos, e não reconhece que nosso comportamento muda a todo instante em função das contingências naturais e das contingências artificiais socialmente construídas e mantidas (Skinner, 1971). Negar o controle não elimina tais contingências e, portanto, a “melhor defesa contra o mau uso das técnicas comportamentais é aprendermos o máximo possível sobre como elas funcionam” (Catania, 1998/1999, p. 128). Em conseqüência, poderemos oferecer alternativas ao controle coercivo das práticas tradicionais relacionadas à responsabilidade, à moralidade e à justiça, buscando apoiar o comportamento socialmente desejável com o planejamento e o uso eficiente de contingências de reforço positivo (Baum, 1994). Aos que rejeitam uma tecnologia comportamental por ser muito simples, Skinner (1971) rebateu que uma supersimplificação é o apelo tradicional a estados da mente, sentimentos e outros aspectos do homem autônomo que a análise comportamental vem substituindo. A facilidade com que podem ser inventadas explicações mentalistas ad hoc talvez seja a melhor medida da pouca atenção que elas merecem. A tecnologia que emergiu da análise experimental só deve ser avaliada em comparação com o que se faz a partir de outras concepções. “É ciência ou nada, e a única solução para a simplificação é aprender a lidar com a complexidade” (Skinner, 1971, p. 160). REFERÊNCIAS BIBLIOGRÁFICAS Ader, R.; Tatum, R. (1961). Free-operante avoidance conditioning in human subjects. Journal of the Experimental Analysis of Behavior, 4, 275-276. Arbuckle, J. L.; Lattal, K. (1987). A role for negative reinforcement of response omission in punishment? Journal of the Experimental Analysis of Behavior, 48, 407-416. Arbuckle, J. L.; Lattal, K. (1992). Molecular contingencies in schedules of intermittent punishment. Journal of the Experimental Analysis of Behavior, 58, 361-375. Azrin, N. H.; Holz, W. C. (1966). Punishment. Em W. K. Honig (Org.), Operant behavior: Areas of research and application (p. 380-447). Englewood Cliffs, NJ: Prentice-Hall. Banaco, R. A. (2001). Alternativas não aversivas para tratamento de problemas de ansiedade. Em M. L. Marinho; V. E. Caballo (Orgs.), Psicologia clínica e da saúde (p. 197-212). Londrina, PR: UEL. Baron, A.; Perone, M. (2001). Explaining avoidance: Two factors are still better than one [Reply to Dinsmoor (2001)]. Journal of the Experimental Analysis of Behavior, 75, 357-361. Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental Analysis of Behavior, 20, 137-153. ANÁLISE DO COMPORTAMENTO Baum, W. M. (1994). Understanding behaviorism: Science, behavior, and culture. New York, NY: Harper Collins College Publishers. Baum, W. N. (2001). Molar versus molecular as a paradigm clash [Reply to Dinsmoor (2001)]. Journal of the Experimental Analysis of Behavior, 75, 338-341. Brandão, M. Z. S. (1999). Terapia comportamental e análise funcional da relação terapêutica: Estratégias clínicas para lidar com o comportamento de esquiva. Revista Brasileira de Terapia Comportamental e Cognitiva, 2,179-187. Brown, P. L.; Jenkins, H. M. (1968). Autoshaping of the pigeon’s key-peck. Journal of the Experimental Analysis of Behavior, 11, 1-8. Cameschi, C. E. (1997). Comportamento de esquiva: Teorias e controvérsias. Psicologia: Teoria e Pesquisa, 13, 143-152. Camp, D. S.; Raymond, G. A.; Church, R. M. (1967). Temporal relationship between response and punishment. Journal of Experimental Psychology, 74, 114-123. Carrasco, J. C. (1996). Procedimentos aversivos. Em V. E. Caballo (Org.), Manual de técnicas de terapia e modificação do comportamento (p. 249-267). São Paulo: Santos Editora. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. de Souza et al.; trads.). Porto Alegre: Artes Médicas (Obra publicada originalmente em 1998). Cherek, D. R.; Spiga, R.; Steinberg, J. L.; Kelly, T. H. (1990). Human aggressive responses maintained by avoidance or escape from point loss. Journal of the Experimental Analysis of Behavior, 53, 293-303. Chiesa, M. (1994). Radical behaviorism: The philosophy and the science. Boston: Authors Cooperative Publishers Crosbie, J. (1998). Negative reinforcement and punishment. Em K. A. Lattal; M. Perone (Eds.), Handbook of research methods in human operant behavior (p. 163-189). New York: Plenum Press. Crosbie, J.; Williams, A. M.; Lattal, K. A.; Anderson, M. M.; Brown, S. M. (1997). Schedule interactions involving punishment with pigeons and humans. Journal of the Experimental Analysis of Behavior, 68, 161-175. Courtney, K.; Perone, M. (1992). Reduction in shock frequency and response effort as factors in reinforcemente by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 58, 485-496. de Souza, D. G.; de Moraes, A. B. A.; Todorov. J. C. (1984). Shock intensity and signaled avoidance responding. Journal of the Experimental Analysis of Behavior, 42, 67-74. de Souza, D. G.; de Moraes, A. B. A.; Todorov. J. C. (1992). Probing stimulus control in free-operant avoidance. The Psychological Record, 42, 41-55. de Villiers, P. A. (1974). The law of effect and avoidance: A quantitative relationship between response rate and shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 21, 223-235. Dinsmoor, J. A. (1954). Punishment: I. The avoidance hypothesis. Psychological Review, 61, 34-46. 135 Dinsmoor, J. A. (1977). Escape, avoidance, punishment: Where do we stand? Journal of the Experimental Analysis of Behavior, 28, 83-95. Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75, 311-333. Estes, W. K.; Skinner, B. F. (1941). Some quantitative properties of anxiety. Journal of Experimental Psychology, 29, 390-400. Follette, W. C.; Naugle, A. E.; Callaghan, G. M. (1996). A radical behavioral understanding of the therapeutic relationship in effecting change. Behavior Therapy, 27, 623-641. Fowler, H.; Trapold, M. A. (1962). Escape performance as a function of delay of reinforcement. Journal of Experimental Psychology, 63, 464-457. Galizio, M. (1999). Extinction of responding maintained by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 71, 1-11. Galizio, M.; Liborio, M. O. (1995). The effects of cocaine on behavior maintained by timeout from avoidance. Journal of the Experimental Analysis of Behavior, 63, 19-32. Goldiamond, I. (1974). Toward a constructional approach to social problems: Ethical and constitutional issues raised by applied behavior analysis. Behaviorism, 2, 1-85. Guimarães, S. S. (2001). Exposição e prevenção de respostas no tratamento do transtorno obsessivo-compulsivo. Em M. L. Marinho; V. E. Caballo (Orgs.), Psicologia clínica e da saúde (p. 177-196). Londrina, PR: UEL. Hayes, S. C.; Strosahl, K. D.; Wilson, K. G. (1999). Acceptance and commitment therapy: An experential approach to behavior change. New York: The Guilford Press. Herrnstein, R. J. (1969). Method and theory in the study of avoidance. Psychological Review, 76, 49-69. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Herrnstein, R. J.; Hineline, P. N. (1966). Negative reinforcement as shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 9, 421-430. Herrnstein, R. J.; Morse, W. H. (1957). Some effects of response-independent positive reinforcement on maintained operant behavior. Journal of Comparative and Physiological Psychology, 50, 461-467. Higgins, S. T.; Morris, E. K. (1984). Generality of freeoperant avoidance conditioning to human behavior. Psychological Bulletin, 96, 247-272. Hineline, P. N. (1970). Negative reinforcement without shock reduction. Journal of the Experimental Analysis of Behavior, 14, 259-268. Hineline, P. N. (1981). The several roles of stimuli in negative reinforcement. Em P. Harzem; M. D. Zeiler (Orgs.), Advances in analysis of behavior: Vol. 2. Predictability, correlation and contiguity (p. 203-246). New York: Wiley. 136 ABREU-RODRIGUES, RIBEIRO & COLS. Hineline, P. N. (1984). Aversive control: A separate domain? Journal of the Experimental Analysis of Behavior, 42, 495-509. Hineline, P. N. (2001). Beyond the molar-molecular distinction: We need multi-scaled analyses [Reply to Dinsmoor (2001)]. Journal of the Experimental Analysis of Behavior, 75, 342-347. Holz, W. C.; Azrin, N. H. (1961). Discriminative properties of punishment. Journal of the Experimental Analysis of Behavior, 4, 225-232. Holz, W. C.; Azrin, N. H.; Ayllon, T. (1963). A comparison of several procedures for eliminating behavior. Journal of the Experimental Analysis of Behavior, 6, 399406. Horner, R. H. (2002). On the status of knowledge for using punishment: A commentary. Journal of Applied Behavior Analysis, 35, 465-467. Kazdin, A. E. (1972). Response cost: The removal of conditioned reinforcers for therapeutic change. Behavior Therapy, 3, 533-546. Keller, J. V. (1966). Delayed escape from light by the albino rat. Journal of the Experimental Analysis of Behavior, 9, 655-658. Kohlenberg, B. S. (1999). Emotion and the relationship in psychotherapy: A behavior analytic perspective. Em M. J. Dougher (Ed.), Clinical behavior analysis (p. 271289). Reno, NV: Context Press. Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic psychotherapy: Creating intense and curative therapeutic relationships. New York: Plenum Press. Krasner, L. (1989). “A utopian voice speaks out”. The Behavior Therapist, 12, 247-257. Lerman, D. C.; Vorndran, C. M. (2002). On the status of knowledge for using punishment: Implications for treating behavior disorders. Journal of Applied Behavior Analysis, 35, 431-464. Logue, A. W.; de Villiers, P. A. (1978). Matching in concurrent variable-interval avoidance schedules. Journal of the Experimental Analysis of Behavior, 29, 61-66. Masters, J. C.; Burish, T. G.; Hollon, S. D.; Rimm, D. C. (1987). Behavior therapy: Techniques and empirical findings. New York: Harcourt Brace Jovanich. Michael, J. (1975). Positive and negative reinforcement, a distinction that is no longer necessary, or a better way to talk about bad things. Behaviorism, 3, 33-44. Michael, J. (1993). Establishing operations. The Behavior Analyst, 16, 191-206. Nye, R. D. (2002). Três psicologias: Idéias de Freud, Skinner e Rogers (R. B. Taylor, trad.). São Paulo: Pioneira Thomson Learning. (Obra publicada originalmente em 2000). Perkins, D. R.; Hackbert, L.; Dougher, M. J. (1999). Interpretation in clinical behavior analysis. Em M. J. Dougher (Ed.), Clinical behavior analysis (p. 291-302). Reno, NV: Context Press. Rachlin, H. (1967). The effect of shock intensity on concurrent and single-key responding in concurrent- chain schedules. Journal of the Experimental Analysis of Behavior, 10, 87-93. Rangé, B. P. (1988). Algumas notas sobre ética e psicoterapia comportamental. Em H. W. Lettner; B. P. Rangé (Orgs.), Manual de psicoterapia comportamental (p. 1626). São Paulo: Manole. Schoenfeld, W. N. (1950). An experimental approach to anxiety, escape, and avoidance behavior. Em P. H. Hoch; J. Zubin (Orgs.), Anxiety (p. 70-99). New York: Grune e Stratton. Schoenfeld, W. N. (1969). “Avoidance” in behavior theory. Journal of the Experimental Analysis of Behavior, 12, 669-674. Seligman, M. E. R.; Johnston, J. C. (1973). A cognitive theory of avoidance learning. Em F. J. McGuigan e D. B. Lumsden (Orgs.), Contemporary approaches to conditioning and learning (p. 69-110). Washington, DC: V. H. Winston e Sons. Shipley, R. H.; Boudewyns, P. A. (1980). Flooding and implosive therapy: Are they harmful? Behavior Therapy, 11, 503-508. Sidman, M. (1953a). Avoidance conditioning with brief shock and no exteroceptive warning signal. Science, 118, 157-158. Sidman, M. (1953b). Two temporal parameters of the maintenance of avoidance behavior by white rat. Journal of Comparative and Physiological Psychology, 46, 253-261. Sidman, M. (1962a). Reduction of shock frequency as reinforcement for avoidance behavior. Journal of the Experimental Analysis of Behavior, 5, 247-257. Sidman, M. (1962b). Timeout from avoidance as a reinforcer: A study of response interaction. Journal of the Experimental Analysis of Behavior, 5, 423-434. Sidman, M. (1995). Coerção e suas implicações (M. A. Andery; T. M. Sério, trads.). Campinas, SP: Editorial Psy (Obra publicada originalmente em 1989). Sidman, M. (2001). Safe periods both explain and need explaining [Reply to Dinsmoor (2001)]. Journal of the Experimental Analysis of Behavior, 75, 335-338. Sidman, M.; Herrnstein, R. J.; Conrad, D. G. (1957). Maintenance of avoidance behavior by unavoidable shocks. Journal of Comparative and Physiological Psychology, 50, 553-557. Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. Acton, MA: Copley Publishing Group. Skinner, B. F. (1966). The phylogeny and ontogeny of behavior. Science, 153, 1025-1213. Skinner, B. F. (1971). Beyond freedom and dignity. New York: Knopf. Skinner, B. F. (1972). Cumulative record: A selection of papers. New York: Appleton-Century Crofts. Skinner, B. F. (1974). About behaviorism. New York: Knopf. Skinner, B. F. (1981). Selection by consequences. Science, 213, 501-504. ANÁLISE DO COMPORTAMENTO Skinner, B. F. (1984). The evolution of behavior. Journal of the Experimental Analysis of Behavior, 41, 217-221. Skinner, B. F. (1989). Recent issues in the analysis of behavior. Columbus, OH: Merrill Publishing Company. Skinner, B. F. (1990). Can psychology be a science of mind? American Psychologist, 45, 1206-1210. Skinner, B. F. (2000). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins Fontes (Obra publicada originalmente em 1953). Spradlin, J. E. (2002). Punishment: A primary process? Journal of Applied Behavior Analysis, 35, 475-477. Todorov, J. C. (2001). Quem tem medo de punição? Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 37-40. Todorov, J. C.; Carvalho, L. C. F.; Menandro, P. R. M. (1977). The standard Sidman avoidance procedure as a temporal differentiation schedule. Revista Mexicana de Análisis de la Conducta, 3, 151-160. Turner, R. M. (1996). A dessensibilização sistemática. Em V. E. Caballo (Org.), Manual de técnicas de terapia e modificação do comportamento (p. 167-195). São Paulo: Santos Editora. Verhave, T. (1962). The functional properties of a timeout from an avoidance schedule. Journal of the Experimental Analysis of Behavior, 5, 391-422. Vollmer, T. R. (2002). Punishment happens: Some comments on Lerman and Vorndran’s review. Journal of Applied Behavior Analysis, 35, 469-473. 137 Weiner, H. (1962). Some effects of response cost upon human operant behavior. Journal of the Experimental Analysis of Behavior, 5, 201-208. Weiner, H. (1963). Response cost and the aversive control of human operant behavior. Journal of the Experimental Analysis of Behavior, 6, 415-421. Weisman, R. G.; Litner, J. S. (1969). Positive conditioned reinforcement of Sidman avoidance behavior in rats. Journal of Comparative and Physiological Psychology, 68, 597-603. Williams, D. R.; Williams, H. (1969). Automaintenance in the pigeon: Sustained pecking despite contingent non-reinforcement. Journal of the Experimental Analysis of Behavior, 12, 511-520. Wolpe, J. (1990). The practice of behavior therapy. New York: Pergamon Press. Zamignani, D. R. (2000). Uma tentativa de entendimento do comportamento obsessivo-compulsivo: Algumas variáveis negligenciadas. Em R. C. Wielenska (Org.), Sobre comportamento e cognição: Vol. 6. Questionando e ampliando a teoria e as intervenções clínicas em outros contextos (p. 256-266). Santo André, SP: SET. Zeiler, M. D. (1986). Behavioral units: A historical introduction. Em T. Thompson e M. D. Zeiler (Orgs.), Analysis and integration of behavioral units (p. 1-12). Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers. GENERALIZAÇÃO DE ESTÍMULOS: ASPECTOS CONCEITUAIS, METODOLÓGICOS E DE INTERVENÇÃO 8 YVANNA AIRES GADELHA LAÉRCIA ABREU VASCONCELOS O conceito de generalização tem sido amplamente utilizado tanto na pesquisa básica quanto na aplicada e sua importância é clara também no contexto de atuação do psicólogo. O conceito é central no campo da aprendizagem, isto é, no estudo da aquisição ou do fortalecimento de respostas no repertório do organismo. Entretanto observam-se variações no sentido com que o conceito é utilizado desde a década de 1930. Impõe-se, portanto, como primeiro passo para a utilização desse constructo, a análise das definições propostas para o termo generalização, o que é fundamental para o avanço das interpretações de eventos ou fenômenos comportamentais (p. ex.: Goldiamond, 1976; Skinner, 1953/1998). Assim, este capítulo abordará o fenômeno da generalização a partir dos seguintes itens: a) aspectos teórico-conceituais e metodológicos; b) estratégias tecnológicas voltadas para a promoção de generalização; c) contribuição do estudo desse fenômeno no contexto clínico, com a utilização de exemplos da clínica analíticocomportamental infantil. QUESTÕES TEÓRICO-CONCEITUAIS E METODOLÓGICAS Até o final da década de 1950, poucos estudos avaliaram a generalização de estímulos envolvendo comportamentos operantes (Pierrel, 1958). A maioria dos estudos publicados até então utilizava o paradigma de condicionamento respondente para avaliar a mudança na força da resposta condicionada quando o estímulo tornava-se mais dissimilar em relação ao estímulo condicionado inicialmente. A diminuição na força da resposta era, então, sistematicamente relacionada à diferença entre os estímulos usados durante a extinção e o primeiro estímulo condicionado. Ao realizar uma revisão dos aspectos conceituais, e também metodológicos, da generalização de estímulos, Honig e Urcuioli (1981) indicaram que os primeiros estudos, sob o paradigma do condicionamento respondente, apresentaram problemas conceituais metodológicos: os dados não eram confiáveis nem replicáveis (Razran, 1949); os gradientes de generalização1 referiam-se mais a entidades teóricas do que a fenômenos empíricos; e não havia acordo quanto às explicações do gradien- 1A função que relaciona a força da resposta à similaridade entre os estímulos é conhecida como gradiente de generalização de estímulos. 140 ABREU-RODRIGUES, RIBEIRO & COLS. te na ausência de treino discriminativo (Lashley e Wade, 1946). A consideração de uma única forma de gradiente de generalização impedia uma visão mais ampla e dinâmica do fenômeno, no qual diferentes formas dos gradientes podem ser controladas por diferentes dimensões de estímulo e condições de treino e de teste (Honig e Urcuioli, 1981). O estudo de Guttman e Kalish (1956) estabeleceu a generalização de estímulos como uma área de pesquisa com a utilização de métodos operantes. A pesquisa passou a ser dirigida a variáveis que determinavam a altura, a inclinação e a forma do gradiente de generalização (Honig e Urcuioli, 1981). A generalização de estímulos pode ser enunciada como um princípio, considerando que tem sido demonstrada nos comportamentos respondentes e operantes, conforme sugerido por Keller e Schoenfeld (1950/1968, p. 132-133): A formação da discriminação é um processo duplo. Através da generalização respondente, cada reforço direto do estímulo A é somado ao poder eliciador do estímulo B; cada extinção do estímulo B subtrai um pouco do poder de A. Outros reforços darão mais poder a A do que a B; e outras extinções tiram mais de B do que de A. A acumulação gradual de diferenças na força dos reflexos é o cerne do processo. A discriminação e a generalização no condicionamento operante são apresentadas por Keller e Schoenfeld (1950/1968, p. 133-134) como: Um reforço na presença do S D [estímulo discriminativo] aumenta sua eficácia como indício, mas também aumenta, em um grau menor, a eficácia do SΔ [estímulo delta]; uma resposta não reforçada no SΔ diminui sua eficácia e reduz ligeiramente a do SΔ. A alternação continuada de SD e SΔ provoca a separação do poder evocativo de ambos. A relação entre os processos de discriminação e generalização é usualmente apresentada nos estudos sobre a generalização de estímulos. Para Skinner (1953/1998), a discriminação refere-se ao processo por meio do qual uma resposta terá sua probabilidade aumentada quando um determinado estímulo estiver presente e diminuída na presença de estímulos diferentes. A generalização, por sua vez, estabelece um responder sob fraco controle de estímulos, e a probabilidade da resposta é semelhante na presença de qualquer estímulo. Os fenômenos de generalização e discriminação são entendidos como operações complementares (cf. Keller e Schoelfeld, 1950/1968) que sofrem influência da magnitude da diferença entre SD, o qual propicia a ocasião em que se seguirá reforço se a resposta for emitida, e o SΔ, que sinaliza uma ocasião de não apresentação de reforço e uma oportunidade para não responder. Ambos os estímulos, SD e SΔ, são discriminativos (Keller e Schoenfeld, 1950/1968). A diferença física entre eles é a variável de maior influência na formação da discriminação e do gradiente de generalização (Klein e Rilling, 1974; Pierrel e Sherman, 1962). Os gradientes de controle de estímulos obtidos por meio de manipulações experimentais demonstram tanto o grau de discriminação como o de generalização alcançado (Catania,1998/1999; Mazur, 1998). Gradientes que possuem forma pontiaguda, com o pico sobre o valor do estímulo relacionado ao reforço no treino (SD), demonstram um alto grau de discriminação entre esse estímulo e os demais apresentados no teste (SΔs) e também um baixo grau de generalização. Gradientes horizontais ou achatados demonstram que foram emitidas respostas em freqüências semelhantes diante de todos os estímulos usados no teste, ou seja, houve um alto grau de generalização, e a ausência de valor modal demonstra discriminação ausente, ou em baixo grau, e controle de estímulos fraco. Segundo Keller e Schoenfeld (1950/ 1968), o fenômeno da generalização confere ao comportamento as propriedades de estabilidade e coerência, pois se refere a um organismo, condicionado a responder a um estímulo, que responde da mesma maneira a outros estímulos. Isto é, os procedimentos de reforçamento ou extinção levam ao fortalecimento ou ao enfraquecimento de uma resposta que é acompanhada de acréscimo ou decréscimo na força de outras respostas que tenham ANÁLISE DO COMPORTAMENTO propriedades em comum com a primeira. Da mesma forma, para Millenson (1967/1975), a generalização não constitui um processo, pois não é uma mudança no comportamento. Em vez disso, ela pode ser observada após o fortalecimento ou o enfraquecimento de uma resposta por meio de procedimentos como reforçamento, punição ou extinção em determinada condição de estímulos. É interessante destacar as explicações baseadas em procedimentos ou em princípios, em oposição a um processo. Na análise experimental do comportamento, o reforçamento, por exemplo, é definido com referência a um procedimento, assim como a um processo. A definição por meio de um procedimento reportase à emissão de uma resposta seguida pela liberação de uma conseqüência e, por meio de um processo, ao aumento da probabilidade de uma resposta reforçada (Catania, 1975). Entretanto o fenômeno de generalização de estímulos tem sido apresentado como um procedimento ou um princípio. Outros conceitos foram apresentados por Razran (1949) na tentativa de explicação do fenômeno da generalização. Dois tipos de generalização foram definidos: a pseudogeneralização e a generalização verdadeira. A pseudogeneralização refere-se a uma falha na associação de estímulos na qual o sujeito é incapaz de notar características específicas do estímulo condicionado. Ela pode ser exemplificada pela emissão do comportamento de dizer “cachorro” diante de qualquer animal de quatro patas. Na generalização verdadeira, apesar de o indivíduo notar características específicas do estímulo condicionado, ele emite uma mesma resposta, diante de outros estímulos, controlada pela categorização. Um exemplo é a resposta de um adulto de dizer “cachorro” na presença de diferentes raças dessa espécie. Ademais, Razran (1949) considerou que a generalização desenvolve-se não durante o treino original das condições de estímulo, mas durante o teste subseqüente de generalização. Entretanto, para Skinner (1953/1998), a generalização de estímulos precisa ser entendida com base na relação entre os estímulos do treino e os estímulos do teste de generalização. 141 Em 1946, Lashley e Wade consideraram a generalização como resultado de um controle de estímulos ineficiente, ou seja, o sujeito responderia aos estímulos de generalização no período de teste porque ainda não estaria condicionado a responder diferencialmente ao aspecto relevante do estímulo condicionado, definido pelo experimentador (cf. Terrace, 1966). Assim, a generalização é vista como uma ausência de controle de um aspecto do estímulo sobre o comportamento. Brown, Bilodeau e Baron (1951) também se referiram à generalização como resultado de uma falha em responder diferencialmente a um estímulo. Para esses autores, essa seria a definição operacional da generalização de estímulos. Mednick e Freedman (1960) e Honig e Urcuioli (1981) apresentaram algumas variáveis importantes para a ocorrência da generalização de estímulos, como: o tipo e a quantidade de treino, a intensidade e a dimensão do estímulo, o nível de motivação, as diferenças individuais e a história de reforçamento. Para esses autores, a generalização de estímulos é o espalhamento da resposta a um estímulo previamente condicionado para os estímulos de generalização. Esse processo é favorecido quando as “condições do treino” são programadas visando ao teste de generalização que será conduzido. Portanto, a extensão das respostas dos sujeitos será proporcional à diferença entre o estímulo condicionado no treino e os estímulos do teste. A variável “quantidade de treino” na presença do estímulo condicionado tem um efeito marcante sobre o grau de generalização. Desse modo, a maior exposição do sujeito à condição de treino na qual um estímulo SD sinaliza que uma resposta será reforçada pode favorecer a diminuição ou a extinção de respostas a estímulos diferentes do SD. A variável “intensidade dos estímulos” (SD Δ e S ) no treino é também considerada na análise do gradiente de generalização. Por intensidade de estímulos entende-se a quantidade de luz utilizada, a intensidade do som ou da estimulação proprioceptiva. Uma outra variável importante na determinação da ocorrência de generalização é a “dimensão do estímulo”, que se refere ao tipo de estimulação utilizada, seja luz, som ou proprioceptiva. A utilização 142 ABREU-RODRIGUES, RIBEIRO & COLS. de diferentes dimensões de estímulos no treino e no teste pode dificultar a ocorrência de generalização. Esses resultados são apresentados em estudos sobre a generalização sonora (Littman, 1949), visual (Brown, 1942), tátil (Grant e Dittmer, 1940) e temporal (Rosenbaum, 1951), como citados na revisão de Mednick e Freedman (1960). Entretanto uma análise funcional, e não apenas dos aspectos físicos dos estímulos, é necessária ao se considerar a discriminação e a generalização operantes. Uma maior discriminabilidade entre SD e SΔ pode diminuir a taxa de respostas na presença de SΔ no teste de generalização (Pierrel e Sherman, 1962). A discriminabilidade é a sensibilidade às diferenças entre os estímulos, e essa sensibilidade pode ser alterada pelas relações funcionais, pelas contingências que envolvem estímulos físicos (Honig e Urcuioli, 1981). Assim, a situação experimental inclui mais variáveis a serem analisadas, além dos estímulos físicos apresentados (Keller e Schoenfeld, 1950/1968). Considerando-se as características dos sujeitos, a variável “motivação” pode ser entendida, por exemplo, a partir da privação, de modo que um organismo com um alto nível de privação de alimento terá maior probabilidade de generalizar sua resposta a outros estímulos diferentes daqueles estímulos do treino (Yamaguchi, 1952, como citado em Mednick e Freedman, 1960). Aspectos como a idade do sujeito, suas condições de saúde e sua história de reforçamento individual também interferem na generalização e constituem a variável diferenças individuais. Crianças mais jovens e indivíduos com dano cerebral apresentam um grau maior de generalização em testes quando comparados a crianças mais velhas e indivíduos sem dano cerebral. A história de reforçamento interfere no grau de generalização obtido após um treino. A quantidade de generalização aumenta com a ampliação do número de tentativas e com a utilização de diferentes estímulos durante o treino. Por outro lado, a quantidade de generalização diminui com o aumento da exposição a apenas um estímulo sinalizando reforço. Em 1966, Terrace descreveu a operação de controle de estímulos como explicação para o processo de generalização e propôs a utilização dessa operação, em substituição aos conceitos de generalização e discriminação, para descrever situações em que respostas a estímulos similares ao estímulo treinado ocorrem. Para Terrace, gradientes de generalização que apresentam um formato de curva mais baixa demonstram um controle de estímulos mais pobre do que aqueles que apresentam um pico na posição do estímulo treinado, com a resposta decaindo à medida que os estímulos-teste afastam-se do estímulo treinado. Para ele, o reforçamento diferencial, envolvendo SD e SΔ, é uma condição necessária para o estabelecimento de controle de estímulos (cf. Catania, 1998/ 1999; Keller e Schoenfeld, 1950/1968). Entretanto o controle de estímulos não pode ser considerado explicação do fenômeno de generalização. O termo é descritivo, não tem propriedades teóricas e refere-se a uma relação observada entre um conjunto de valores de estímulos e um conjunto de valores de respostas. Portanto, um gradiente de generalização é uma medida do controle de estímulos (Honig e Urcuioli, 1981). Guttman (1963, como citado em Honig e Urcuioli, 1981) adicionou ao estímulo físico, os valores da variável independente, o estímulo funcional, ou seja, as contingências de reforçamento passadas e presentes ao explicar a sensibilidade do comportamento. Ademais, os estímulos podem competir com outras fontes de controle e a “discriminabilidade desses estímulos com relação aos demais pode não ter uma simples correspondência com a escala física definida”. (Honig e Urcuioli, 1981, p. 408; ver também Keller e Schoenfeld, 1950/1968). Millenson (1967/1975) apontou para o envolvimento da similaridade de estímulos no fenômeno de generalização e considerou que quanto mais uma situação de treino se parecer com a situação na qual o comportamento será emitido posteriormente, mais efetivo será o treino. A ocasião em que uma resposta operante é reforçada e fortalecida torna-se um parâmetro importante no controle da emissão da resposta em condições de estímulo que não aquelas em que o reforçamento aconteceu. Apesar de o termo similaridade de estímulos aparecer pela primeira vez com Millenson (1967/1975), ANÁLISE DO COMPORTAMENTO outros pesquisadores referiram-se também às semelhanças ou propriedades comuns entre os estímulos das situações de treino e de teste (Skinner, 1938, 1953/1998; Keller e Schoenfeld, 1950/1968; Pierrel, 1958; Pierrel e Sherman, 1962; Terrace, 1966). Segundo Pierrel (1958), o fenômeno da generalização é observável no ambiente natural, no qual o organismo responde de maneira estável e consistente à estimulação que é similar, mas não idêntica à estimulação anterior. Esse fenômeno estaria relacionado com os processos de formação de conceito e de transferência de treino. Assim como em 1953, em 1974/1999, Skinner apresentou novamente o termo generalização como um responder reforçado em determinada ocasião, que tem maior probabilidade de ocorrer em situações semelhantes. Essa resposta pode ocorrer em ocasiões que compartilhem apenas algumas das mesmas propriedades da situação original. Se uma resposta é reforçada na presença de um estímulo, e alguma propriedade desse estímulo é variada, o respondr em uma outra situação dependerá da diferença existente entre o estímulo original e o novo (Catania, 1998/1999; Keller e Schoenfeld, 1950/1968; Skinner, 1953/1998, 1974/1999). Portanto, para esses autores, a generalização é definida pela dispersão do efeito do reforço na presença de um estímulo para outros estímulos, não-correlacionados com o reforço. Para falar de generalização ou discriminação, é necessário falar da operação subjacente a esses fenômenos. Alessi (1987) considerou generalização um termo vago e propôs a utilização de categorias mais específicas. Entre elas, a generalização de estímulos e de respostas, a equivalência de estímulos, a generalidade das conseqüências e de repertórios mínimos de respostas recombinativas importantes para o ensino da generalização e para a explicação de padrões de repertórios recombinativos gerados. Alessi enfatizou uma contribuição potencialmente efetiva da análise do comportamento para a educação: ensinar com um mínimo de instrução e um máximo de aprendizagem produzida pela recombinação de repertórios gerativos. Reforços condicionados generalizados são conseqüências fundamentais com uma ampla gene- 143 ralidade de aplicação, isto é, funcionam independentemente da pessoa, da situação ou da operação estabelecedora. O comportamento é reforçado na situação análoga, de treino, e no ambiente natural, o que amplia a generalidade dos comportamentos em uma variedade de situações e aumenta as oportunidades de aprendizagem. A autora enfatiza o uso de repertórios mínimos recombináveis para transformar repertórios existentes em novos. Essa abordagem pode ser chamada de recombinativa porque gera um repertório novo depois de ensinar um número mínimo de relações estímulo-resposta. Para Alessi, a generalidade de aplicação das unidades estímulo-resposta recombinativas ensinadas ocorre quando a aprendizagem é verificada com tarefas ou com estímulos novos, ausentes durante o treino. Os termos generalização e generalidade têm sido utilizados de forma permutável, gerando confusão e dificultando a especificação das condições necessárias para a obtenção de generalização (Fox e McEvoy, 1993). Ao tentar distinguir esses termos, Edelstein (1989) mostrou que a generalidade refere-se à validade externa, à universalidade ou à replicabilidade de dados ou de suas interpretações. É possível examinar a generalidade de um teste de generalização em duas situações e entre sujeitos, o que é diferente de avaliar o grau de generalização obtido após um treino. Para esse autor, uma definição útil do termo generalização é “emissão de comportamentos treinados em situações fora do treino”. Para promover a generalização consistente de um comportamento adaptativo, é necessário focalizar a generalização de estímulos como um fenômeno legítimo de estudo, passível de definição e de medida. Em situações em que se deve discriminar entre vários estímulos para sobreviver, a ausência de generalização é adaptativa; por outro lado, a generalização de estímulos garante estabilidade e consistência ao comportamento. O estudo da formação de classes de estímulos e de respostas possibilita a identificação de variáveis envolvidas no fenômeno da generalização. As variáveis que contribuem para a formação de classes funcionais e de classes de equivalência são importantes para a generali- 144 ABREU-RODRIGUES, RIBEIRO & COLS. zação. Se as classes de equivalência são, de alguma maneira, diferentes de outras classes funcionais, torna-se uma questão a ser resolvida (Zentall e Smeets, 1996). As propriedades definidoras das classes de equivalência são a reflexividade, a simetria e a transitividade. Essas propriedades têm sido verificadas entre os membros de uma classe por meio de procedimentos de discriminação condicional (ver Capítulo 14 para informações detalhadas sobre equivalência de estímulos). Uma classe funcional contém membros funcionalmente equivalentes, ou seja, que alcançam conseqüências comuns, mas não necessariamente possuem as propriedades verificadas que definem as relações de equivalência (Dougher e Markhan, 1996; Pilgrim e Galizio, 1996; Sidman, 1994). As classes funcionais são formadas por estímulos que podem ser diferentes fisicamente, mas que compartilham funções e controlam respostas comuns. Esses estímulos, por sua vez, podem ser testados, por meio de arranjos de discriminação condicional, para verificação da formação de classes de equivalência (Donahoe e Palmer, 1994). Zentall (1996) retomou a discussão da similaridade. As classes de estímulos e de respostas podem ser formadas com base na similaridade ou na não-similaridade. Quando nenhuma característica comum pode ser identificada entre os estímulos, a única característica consistente compartilhada pelos membros da classe são as contingências comuns das quais os estímulos participam. Entretanto, mesmo em situações nas quais os membros de uma classe compartilham propriedades físicas, classes funcionais também podem surgir, não por causa dos efeitos diretos dessas propriedades compartilhadas, mas porque todos os membros da classe estão necessariamente envolvidos em contingências comuns. A sobrevivência de um organismo em um ambiente imprevisível pode depender de sua habilidade em generalizar experiências para classes de estímulos que não apresentem similaridade entre os membros, mas cujos membros estejam agrupados devido ao seu efeito ou à sua função. O grau de similaridade dos itens em uma categoria afeta a probabilidade da resposta aos itens novos. Quando os estímulos usados no treino apre- sentam uma grande variação na aparência, o grau de categorização acurada dos estímulos novos é diretamente proporcional ao número de estímulos usados no treino (Wasserman e Bhatt, 1992). Isso porque a probabilidade de um estímulo novo se assemelhar, de alguma forma, aos muitos estímulos treinados tornase maior. Assim, um processo adicional para promover a categorização baseia-se em respostas e em conseqüências comuns associadas a estímulos perceptivelmente diferentes. Outros constructos têm sido acrescentados ao conceito de generalização. A possibilidade de estímulos muito diferentes produzirem o mesmo comportamento, ainda que um ou mais estímulos não tenham sido diretamente associados ao reforçamento, foi chamada por Urcuioli (1996) de equivalência adquirida. Segundo Hull (1939), estímulos perceptivelmente diferentes podem controlar o mesmo comportamento porque produzem alguma reação comum responsável pela mediação da generalização de desempenhos subseqüentes. Urcuioli acredita que a generalização mediada por reações comuns produz equivalências adquiridas e constitui o processo pelo qual estímulos diferentes podem ocasionar a emissão do mesmo comportamento. Esse fenômeno explicaria o aparecimento de novos comportamentos em situações em que nunca tenham sido diretamente reforçados. Embora a generalização de estímulos primária, baseada na similaridade física entre os estímulos, pareça prontamente explicar a transferência de controle entre estímulos explicitamente treinados e estímulos-teste, outras condições que não envolvem similaridade física entre os estímulos, mas sim reações comuns provocadas por eles, mostram que a explicação da manutenção do comportamento diante de estímulos novos pela generalização primária pode não ser suficiente. Finalmente, ao considerar um paralelo entre as pesquisas sobre generalização de estímulos que utilizam infra-humanos e humanos, observa-se que a similaridade entre estímulos é um dos parâmetros investigados (Zentall e Smeets, 1996). Para Stokes e Osnes (1989), a generalização de estímulos ou indução de estímulos ocorre quando uma resposta é reforça- ANÁLISE DO COMPORTAMENTO da na presença de uma classe de estímulos, e estímulos similares àqueles usados no treino aumentam a probabilidade de emissão da resposta treinada. Nesse sentido, a emissão do comportamento é induzida pelas condições de estímulos semelhantes. Além disso, quando um operante é reforçado, ocorre um aumento na freqüência de outros comportamentos, sem que eles tenham sido diretamente reforçados, o que se denomina generalização de respostas, indução de respostas, ou simplesmente indução e indica o fortalecimento do comportamento (Keller e Schoenfeld, 1950/1968). No procedimento de modelagem, a generalização ou a indução de respostas torna possível que o animal emita a resposta-alvo (Catania, 1998/1999). Entretanto a utilização do termo indução no contexto do fenômeno de generalização pode gerar confusões com a discussão do comportamento induzido por esquemas de reforçamento. Quando se considera o controle exercido pelos esquemas de reforçamento sobre o comportamento operante, observa-se que outros padrões de comportamento podem ocorrer em conjunto às respostas operantes governadas pelo esquema (Falk, 1971; Gimenes, 1985). Esses padrões de comportamentos, diferentes da resposta diretamente relacionada à obtenção de reforço, são os chamados de comportamentos adjuntivos ou induzidos pelo esquema. Uma variável fundamental para a produção de comportamentos induzidos pelo esquema é a relação temporal a partir da qual eventos ambientais são apresentados aos organismos. Em geral, esquemas de apresentação de reforço, de tempo fixo (FT) e tempo variável (VT) e esquemas de reforçamento de intervalo fixo (FI) e variável (VI) são utilizados nos estudos sobre comportamentos induzidos. No comportamento adjuntivo, é o esquema de liberação do reforço que induz comportamentos diferentes; na generalização de respostas, é o reforço que induz respostas similares; e, na generalização de estímulos são os estímulos similares àquele condicionado durante o treino que induzem a resposta treinada (L. S. Gimenes, comunicação pessoal, 10 de fevereiro de 2003) (ver Capítulo 6 para informações mais detalhadas sobre comportamento adjuntivo). 145 A contextualização do conceito de generalização A análise de algumas das definições propostas para o termo generalização, das explicações para o fenômeno, dos procedimentos utilizados para investigá-lo nas pesquisas básica e aplicada mostra a amplitude de utilização do conceito com diferentes significados, o que dificulta a compreensão do fenômeno e justifica uma análise conceitual. Segundo Harzem e Miles (1978), uma análise conceitual busca a lógica do conceito, seus limites e as situações nas quais seu uso é adequado. Uma análise do termo generalização exige, portanto, uma verificação sobre as circunstâncias em que ele aparece nos campos teórico e empírico da análise do comportamento e com quais objetivos vem sendo utilizado. A definição da generalização de estímulos como uma resposta treinada em certas condições que ocorre, também, em condições similares conduz a uma dificuldade conceitual, quando o conceito é usado para explicar grande parte dos comportamentos emitidos sob novas condições de estímulo. Segundo Keller e Schoenfeld (1950/1968) e Pierrel (1958), a generalização refere-se à estabilidade do responder diante de estimulação similar, mas não idêntica à anterior. Visto que no ambiente natural nenhuma situação é exatamente igual a uma anterior, todas as respostas a estímulos similares seriam atribuídas à generalização de estímulos (Mednick e Freedman, 1960). A utilização do conceito desse modo faz com que grande parte das respostas de um organismo sejam exemplos do fenômeno, e o conceito, então, se esvazia. Em psicologia, esse problema tem sido observado com alguns conceitos, tais como motivação e personalidade. É necessário especificar as variáveis ou os constructos fundamentais envolvidos no conceito, o que lhe confere clareza, completude e utilidade. Portanto, a alusão ao parâmetro similaridade entre os estímulos das situações de treino e de teste no conceito de generalização de estímulos não é suficiente para explicar o fenômeno. É necessária a especificação das dimensões dos estímulos e das características dos contextos de treino e de teste. A programação do treino 146 ABREU-RODRIGUES, RIBEIRO & COLS. discriminativo, do tipo de estímulo, do número de sessões de treino e de teste, da presença de extinção no teste, do tipo de reforço e de instruções utilizadas no treino são aspectos metodológicos que complementarão a análise e a correta aplicação do conceito de generalização de estímulos. Além disso, uma clara definição das variáveis dependente e independente é fundamental para a análise funcional, o que contribuirá para a validade interna e externa e possibilitará a história replicativa dentro da ciência psicológica. Essas considerações também se aplicam aos casos de ausência de similaridade entre os estímulos utilizados nas situações de treino e de teste, quando uma resposta similar à do treino é emitida diante de estímulos não-similares. Um exemplo da inadequação do uso do conceito desse modo é encontrado no distúrbio da linguagem chamado afasia. Nesse distúrbio, causado por lesões no sistema nervoso em regiões específicas do córtex cerebral associadas ao controle da fala, o indivíduo emite uma mesma resposta diante de diferentes estímulos e situações. Assim, diante de uma caneta ou de uma maçã, o sujeito poderia dizer bola. Nesse caso, uma mesma resposta ocorre diante de vários estímulos. Entretanto o conceito de generalização de estímulos não se aplica a esse caso, devido ao envolvimento de uma lesão que parece controlar respostas verbais e respostas não-verbais de forma diferente. Isto é, embora uma mesma resposta verbal seja emitida diante da caneta, da maçã e de outros estímulos, as respostas não-verbais são diferentes e apropriadas aos respectivos estímulos. Contudo não se pode descartar a possibilidade de o indivíduo emitir respostas verbais e nãoverbais consistentes, caso os contextos de treino e de teste tivessem algumas características específicas que permitissem a esse indivíduo responder. Assim, as inconsistências entre as respostas citadas poderiam ser explicadas por aspectos biológicos e ambientais, ao considerar que procedimentos apropriados podem ocasionar ou facilitar a emissão de respostas. Além das possíveis inadequações do uso do termo generalização citadas anteriormente, observa-se que esse constructo relaciona-se com outros fenômenos dentro da análise do comportamento, como a ressurgência, a insensibilidade comportamental à contingência e a história de reforçamento, podendo ser confundido com eles. Os estudos sobre ressurgência referem-se a um comportamento (I) que foi treinado em uma condição A e que passou por um procedimento de extinção. O mesmo organismo é então treinado em uma situação B a emitir outro comportamento (II) e também é exposto à condição de extinção. O fenômeno da ressurgência refere-se ao fato de o comportamento (I) voltar a ocorrer quando o comportamento (II) está em extinção. A confusão com o fenômeno da generalização acontece quando o comportamento (I) acontece em uma situação diferente daquela em que foi inicialmente treinado. O fenômeno da insensibilidade comportamental à contingência também pode ser confundido com a generalização. Diz-se que existe insensibilidade comportamental quando um organismo continua emitindo um mesmo padrão de respostas mesmo que haja mudança nas contingências em vigor, isto é, a contingência é modificada e a mesma resposta treinada anteriormente em outras condições é emitida na nova condição. O conceito de história de reforçamento também pode compartilhar aspectos comuns com a generalização. Isto é, se um comportamento que aconteceu no passado, sob determinadas condições, pode influenciar a maneira como o comportamento acontece em uma nova situação, e se a mesma resposta é emitida no presente em condições diferentes do passado, isso seria um exemplo de generalização. Stokes e Baer (1977) e Chandler, Lubeck e Fowler (1992) sugeriram que a análise da generalização fosse realizada com treinos e testes repetidos, com a manipulação de variáveis que podem afetar a generalização. No entanto é preciso considerar o efeito da história de exposição a treinos e a testes sucessivos, que altera a forma do gradiente de generalização e o grau de transferência dos comportamentos treinados para novas situações. Notase a importância da história de reforçamento diferencial das respostas dos sujeitos quando se observa o gradiente de generalização após o treino discriminativo e após o treino na presença de um único estímulo. O reforçamento ANÁLISE DO COMPORTAMENTO diferencial na presença de SD e de SΔ parece gerar gradientes subseqüentes mais pontiagudos, com o pico localizado nos valores próximos a SD (ver Capítulo 3 para informações mais detalhadas sobre história de reforçamento). Assim, não há problema em identificar e reconhecer o fenômeno da generalização dentro dos estudos voltados para outros fenômenos ou conceitos. O problema estaria em tentar explicá-los por meio da generalização, inutilizando as propriedades desses conceitos para a compreensão do comportamento. A ressurgência, a insensibilidade à contingência e o efeito de história são fenômenos que podem envolver o conceito de generalização, mas não são permutáveis. Novamente, é necessário recorrer à contextualização do uso do conceito de generalização de estímulos. Portanto, a generalização é um termo técnico de fundamental importância para a teoria da aprendizagem. Segundo um paradigma operante, a generalização de estímulos referese à emissão de um comportamento treinado em situações em que não houve treino (p. ex.: Catania, 1998/1999; Edelstein, 1989; Keller e Schoenfeld, 1950/1968; Skinner, 1938; 1953/ 1998; 1974/1999; Terrace, 1966). O termo é usado com um sentido de transferência de uma resposta treinada em uma situação para uma nova situação, e a extensão dessa transferência dependerá da semelhança entre a situação original e a nova (cf. Catania 1998/1999; Pierrel e Sherman, 1962). As operações de controle de estímulos e de reforçamento diferencial são subjacentes ao processo de generalização e participam da descrição das situações em que respostas a estímulos similares ao estímulo originalmente treinado ocorrem (Catania 1998/1999; Keller e Schoenfeld, 1950/1968; Terrace, 1966). Skinner (1953/1998; 1974/ 1999), Mednick e Freedman (1960), Cross e Lane (1962), Terrace (1966) e Catania (1998/ 1999) utilizaram o conceito de generalização, referindo-se ao efeito do treino discriminativo em uma situação de estímulo sobre outras situações semelhantes. A similaridade entre os estímulos utilizados no treino e no teste é um parâmetro citado em muitos estudos sobre a generalização de estímulos (p. ex.: Keller e Schoenfeld, 1950/1968; Pierrel, 1958; Roberts, 147 1996; Skinner, 1938; Stokes e Osnes, 1989; Urcuioli, 1996; Wacker et al., 1989; Weatherly, Miller e McDonald, 1999). As condições de treino, como o esquema de reforçamento ou o tipo de reforço empregado (p. ex.: Grusec, 1968; Hearst, Koresko e Poppen, 1964; Honig, 1966; Slivka e Honig, 1964; Winograd, 1965), a dimensão e a quantidade de estímulos envolvidos (p. ex.: Mednick e Freedman, 1960), o tempo de exposição ao treino discriminativo (p. ex.: Chandler et al., 1992; Farthing e Hearst, 1968; Mednick e Freedman, 1960; Sherman e Pierrel, 1961) e as taxas de respostas (p. ex.: Hanson e Guttman, 1961; Migler e Millenson, 1969; Yarczower, Dickson, e Gollub, 1966) são algumas variáveis potencialmente importantes na determinação da forma do gradiente de generalização obtido. Além das condições de treino, as condições utilizadas para testar a ocorrência de generalização também interferem na obtenção de generalização. A quantidade de testes sucessivos (Pierrel, 1958) e o tipo de teste empregado, por exemplo, sem a programação de extinção (Risley, 1964), influenciam os resultados alcançados quanto à generalização. Portanto, são muitas as variáveis que devem ser consideradas nas situações de treino e de teste para a compreensão do fenômeno da generalização de estímulos. ESTRATÉGIAS TECNOLÓGICAS Kendall (1981) observou uma tendência crescente de estudos voltados para a obtenção de generalização e de validade externa, no contexto de intervenção e de tratamento. No entanto os estudos que utilizavam o termo generalização, em geral não descreviam os procedimentos utilizados para a promoção da generalização dos comportamentos treinados. A lacuna na descrição das variáveis importantes para a ocorrência da generalização e da metodologia para a avaliação do fenômeno reduz a validade externa desses estudos e compromete a replicabilidade dos dados. A crítica de Kendall a esses estudos sobre generalização é que, em sua maioria, eles apresentam o processo de generalização como uma meta a ser 148 ABREU-RODRIGUES, RIBEIRO & COLS. alcançada que, no entanto, não recebe atenção específica na pesquisa, nem possui tipos de intervenção próprios para a sua avaliação. Para Stokes e Baer (1977), o fenômeno da generalização nas pesquisas com humanos deve ser visto como influenciado por determinadas variáveis, e não como conseqüência natural de uma intervenção comportamental. Esses autores destacaram a necessidade de manipulações específicas no treino que possam favorecer a ocorrência de generalização, aspecto discutido também nos estudos apresentados anteriormente, que abordam diferentes parâmetros do treino e do teste de generalização. Esses autores enfatizaram que a generalização refere-se não a um processo, mas a um procedimento, a uma classe de respostas que sofre efeito do meio e pode ser conseqüenciada, ensinada e instruída. Novamente, surge a discussão do fenômeno de generalização como um processo ou como um procedimento. Stokes e Baer concluem afirmando a possibilidade de reforçamento de uma classe de respostas generalizadas. A referência ao reforçamento conduz à discussão de Catania (1975), quando apresenta a definição do conceito de reforçamento a partir de um procedimento, assim como de um processo. Stokes e Baer (1977) sugeriram alguns procedimentos para a promoção da generalização: a) modificar seqüencialmente as condições – após o treino, a generalização é avaliada e, se ausente ou deficiente, um novo treino é realizado nas situações em que não houve generalização; b) introduzir condições naturais – escolher comportamentos e formas de intervenção que sejam semelhantes às condições naturais de reforçamento às quais o indivíduo é exposto; c) treinar um número suficiente de exemplares – treinar com diferentes exemplares de tarefas, experimentadores, pares (p. ex.: outras crianças no contexto experimental), comportamentos ou ambientes, e avaliar a generalização; d) treinar livremente – treinar com um controle relativamente menor sobre os estímulos apresentados e as respostas exigidas; isto é, utilizar uma maior variedade de condições que poderiam fazer parte do treino, em oposição a uma condição única mais restritiva quanto à unidade de resposta e sua conseqüência; e) usar contingências indiscrimináveis – por exemplo, esquemas de reforçamento intermitentes variáveis; f) programar estímulos comuns – utilizar durante o treino componentes comuns ao teste de generalização; g) mediar a generalização – estabelecer, como parte do treino, uma resposta que pode ser utilizada em outras situações, como a auto-instrução e o autoregistro; h) treinar a generalização – considerar a generalização como uma classe de respostas que sofre efeito do meio, assim como os demais operantes, e que pode ser ensinada, ou seja, instruída ou conseqüenciada. Stokes e Osnes (1989) descreveram estratégias de promoção de generalização, baseados nas sugestões de Stokes e Baer (1977), as quais distribuíram em três categorias: a) explorar contingências funcionais; b) treinar de maneira diversificada; c) incorporar mediadores funcionais. A primeira inclui contatar e catalogar conseqüências naturais, modificar conseqüências mal-adaptadas e reforçar ocorrências de generalização. A segunda inclui o uso de exemplares de estímulos e de respostas suficientes para a promoção de generalização e de estímulos antecedentes e conseqüentes menos discrimináveis. Finalmente, a terceira categoria inclui a introdução de estímulos físicos e sociais comuns, salientes, encobertos e verbais automediados (Osnes e Lieblein, 2002). Stokes e Osnes (1989), assim como Stokes e Baer (1977), focalizaram a necessidade de desenvolver estra- ANÁLISE DO COMPORTAMENTO tégias de promoção da generalização e observaram que a investigação empírica das variáveis que controlam a ocorrência da generalização é de fundamental importância para a compreensão do fenômeno e para a validação social dos resultados. Stokes (1992) apresentou duas perspectivas ao considerar o fenômeno da generalização, a topografia e a função do comportamento. De um ponto de vista topográfico, generalização seria a extensão dos efeitos de uma intervenção, isto é, a extensão da emissão de comportamentos-alvo modificados durante o treino a outras situações. A perspectiva funcional implica a observação das contingências nas quais os comportamentos-alvo são obtidos com eficiência e das interações do organismo com o ambiente que afetam os seus desempenhos. Em uma abordagem funcional, a avaliação das variáveis relacionadas à ocorrência da generalização é fundamental para a obtenção dos efeitos desejados. Portanto, a descrição da topografia e da função dos comportamentos generalizados contribui para a análise dos princípios e das tecnologias efetivas de generalização. A aplicação de estratégias de promoção de generalização A partir do estudo de Guttman e Kalish (1956), a generalização de estímulos tem sido investigada por meio da mensuração precisa de diversas dimensões de estímulo, descrevendo relações funcionais envolvidas na determinação da forma dos gradientes de generalização de estímulos. Nos contextos de pesquisa aplicada com humanos e de intervenção, a generalização é resultado de intervenções que geram efeitos além das mudanças-alvo. A generalização é resultado de um procedimento que permite que uma classe de respostas, modificada em um ambiente, na presença de determinada condição de estímulos, ocorra também em outras condições de estímulos, na presença de outras pessoas, em outros ambientes e momentos. Assim, é relevante a análise de como mudanças generalizadas e mantidas ao longo do tempo pós-tratamento são alcançadas 149 e de como as variáveis que as produzem podem ser funcionalmente relacionadas à mudança comportamental (Stokes e Osnes, 1989). As estratégias de programação da generalização, sugeridas por Stokes e Baer (1977) e Stokes e Osnes (1989), foram investigadas a partir do estudo de comportamentos sociais. Ao analisar a programação de estímulos comuns em situações de treino e de teste, Wacker e colaboradores (1989) observaram que o treino com pares entre adolescentes diagnosticados com retardo mental mostrou-se eficiente para a promoção de generalização do comportamento de treinar colegas em diferentes tarefas. Um resultado similar foi obtido por Hughes e colaboradores (1995), que investigaram o efeito de duas variáveis discutidas por Stokes e Baer (1977): o número suficiente de exemplares e a mediação de generalização. As participantes mostravam, inicialmente, uma baixa freqüência de interação social. O treino aconteceu em ambientes freqüentados pelas participantes em que elas interagiram com 10 estudantes voluntários, que atuavam como professores de habilidades de conversação. Esses 10 professores foram distribuídos entre as 4 participantes, de forma que 2 delas foram treinadas com 4 professores, 1 com 5 e outra com 6. Além disso, outros 38 estudantes concordaram em servir de pares para conversação durante as sessões de generalização. Assim, a cada sessão de generalização, 4, 5 ou 6 novos pares de conversação foram inseridos. A classe de comportamentos de conversar foi treinada por meio do procedimento de modelagem. A auto-instrução era apresentada em um guia com quatro comportamentos a serem seguidos: identificar o problema (eu quero falar), estabelecer a resposta (eu preciso olhar e falar), auto-avaliação (eu fiz isso, eu falei) e auto-reforçamento (eu fiz um bom trabalho). Os resultados mostraram um aumento na classe de comportamentos de conversar em ambientes treinados e nãotreinados. Observou-se também a generalização do uso da auto-instrução com diferentes pares em outros ambientes. As participantes avaliaram ter maior facilidade em suas interações sociais e julgaram-se mais falantes. 150 ABREU-RODRIGUES, RIBEIRO & COLS. Os familiares relataram que elas apresentaram também maior assertividade e confiança. Ducharme e Holborn (1997) utilizaram um procedimento de programação de generalização para comportamentos sociais com crianças pré-escolares com danos auditivos. A partir de um procedimento de treino que incluía instrução, modelação, prompting, reforçamento e pares habilidosos socialmente, os autores utilizaram uma combinação de estratégias de programação de generalização. Avaliações repetidas da generalização foram feitas após o treino e foi adicionado o treino com diferentes professores, pares, atividades e ambientes, com o cuidado de aproximar a situação de treino das condições naturais de reforçamento a que o indivíduo era exposto. Com a introdução do treino, ocorreram mudanças imediatas nas interações sociais, que aumentaram de freqüência e foram observadas com diferentes experimentadores, pares e professores em atividades e em ambientes diferentes. Os autores concluíram que o pacote de treino contendo estratégias de promoção de generalização foi efetivo em promover a mudança comportamental generalizada. Chandler e colaboradores (1992) revisaram estudos sobre a generalização de comportamentos sociais de crianças pré-escolares. Esses autores identificaram algumas dimensões da generalização freqüentemente investigadas, tais como entre situações ou ambientes, entre pares ou outras pessoas, entre tarefas e, também, no transcorrer do tempo. Foram analisados 51 estudos realizados em um período de 15 anos (de 1976 a 1990). Ao longo desses anos, notou-se um número crescente de estudos que registraram a ocorrência da generalização. No entanto não se pode dizer se realmente há um maior esforço em produzi-la ou se os artigos com sucesso na produção da generalização tendem a ser publicados com maior facilidade. Nessa revisão, Chandler e colaboradores (1992) apresentaram dois fatores que influenciam o sucesso da promoção da generalização: as características metodológicas e as características tecnológicas. Trata-se, no primeiro caso, do número de participantes, das dimensões da generalização e da duração da intervenção; no segundo, da determinação dos comportamentos-alvo e das estratégias utilizadas para a modificação do comportamento e para a promoção da generalização. Quanto às características metodológicas, os autores encontraram que, nos estudos que obtiveram sucesso na promoção da generalização, foi utilizada uma média de seis participantes. As dimensões mais freqüentemente citadas entre os estudos foram a manutenção, isto é, a generalização ao longo do tempo, a generalização entre situações ou ambientes e entre pares, experimentadores e professores. Os estudos que apresentaram sucesso na promoção da generalização tinham um tratamento com uma duração média de 33 sessões, de 21 min cada. O maior número de sessões parece favorecer uma história de desempenho suficiente para garantir que o comportamento seja emitido e reforçado em situações naturais. Quanto às características tecnológicas do treino, os estudos de maior sucesso na promoção da generalização usaram mais freqüentemente os seguintes comportamentos-alvo: iniciação de uma conversação com pares, conversação e interação recíproca. No entanto o tipo de comportamento-alvo não foi determinante para o sucesso na promoção da generalização. As estratégias de mudança mais utilizadas foram reforçamento positivo, instruções e prompting. A maioria dos estudos bem-sucedidos combinou estratégias, sendo a combinação prompting-reforçamento a mais citada. Nela, os participantes recebem um sinal ou uma dica para a emissão do comportamento que, quando ocorre, é reforçado. As estratégias voltadas para a promoção de generalização mais utilizadas nos estudos de maior sucesso foram a seleção de comportamentos-alvo que atingissem critérios para reforçamento no ambiente natural, o treino livre e o uso de contingências indiscriminadas. Os autores sugeriram que as relações entre as variáveis derivadas dessa revisão fossem submetidas a verificações empíricas. Osnes e Lieblein (2002) observaram que todos os artigos de revisão sobre o fenômeno da generalização publicados no período entre 1990 e 2002, em quatro importantes periódicos voltados para a análise do comportamento (Journal of Applied Behavior Analysis, Behavior ANÁLISE DO COMPORTAMENTO Modification, Journal of Positive Behavior Interventions e The Behavior Analyst Today), focalizam algum tipo de comportamento social. A generalização tem sido especialmente estudada nessa área com crianças, porém existe uma lacuna entre produzir interações sociais funcionais e obter a generalização desses padrões de interação. Osnes e Lieblein observaram que a generalização apresentada nesses estudos não permite a determinação das condições necessárias para sua obtenção. Grande parte dos estudos introduz manipulações de diferentes variáveis potencialmente importantes para a obtenção de generalização e o pacote de tratamento dificulta a especificação dos efeitos de cada uma das variáveis presentes no delineamento experimental. O FENÔMENO DA GENERALIZAÇÃO NO CONTEXTO CLÍNICO O contexto clínico é constituído por algumas características que envolvem um número ainda maior de variáveis a serem investigadas no estudo da generalização do que aquelas envolvidas em estudos desenvolvidos em contextos com maiores níveis de controle. A presença de contingências simultâneas a um tratamento torna a análise complexa, ao acrescentar um número significativo de variáveis. No laboratório animal, é possível uma separação clara entre as situações de treino, em que determinadas contingências estão em vigor, e as situações de teste, usualmente caracterizadas por um procedimento de extinção, no qual se apresenta ao sujeito um conjunto maior de estímulos, formado por aqueles utilizados durante o treino e por suas variações. Entretanto, no contexto clínico, uma criança é exposta a um determinado tratamento e, simultaneamente, a contingências presentes fora da situação clínica, as quais poderão apresentar ora um esquema intermitente de punição, ora extinção para comportamentos-alvo que fazem parte do tratamento. Não há, portanto, separação temporal entre treino e teste, o que é claramente estabelecido no laboratório animal. É possível argumentar que o teste, no contexto clínico, ocorreria após a suspensão do tratamento. Po- 151 rém essa afirmação pode estar servindo mais como controle para o comportamento verbal do terapeuta, enquanto o comportamento da criança está sob controle de outras contingências, ou seja, da ocorrência simultânea de treino e testes. As publicações recentes, voltadas para a promoção da generalização no contexto de intervenção, citadas anteriormente no estudo do comportamento social, assim como a Psicoterapia Analítico-Funcional (Kohlenberg e Tsai, 1991), destacam a importância da utilização de estímulos no setting terapêutico que façam parte do ambiente natural do cliente. Ao analisar as contingências de reforçamento existentes no cotidiano de um cliente, é possível considerar a existência de esquemas similares aos esquemas múltiplos de reforçamento, os quais podem contribuir para a compreensão da generalização dos resultados clínicos. O esquema múltiplo de reforçamento tem sido considerado útil por permitir a análise dos efeitos de diferentes manipulações dentro de uma mesma sessão experimental em um tempo relativamente curto de exposição. Estudos desenvolvidos nas áreas de farmacologia comportamental, toxicologia, assim como alguns estudos sobre o processo de generalização destacam a utilidade do esquema múltiplo de reforçamento (p. ex.: Barrett, 1984; Blackman e Pellon, 1993; Cross e Lane, 1962; Vasconcelos, 1999; Yarczower et al., 1966). A interação entre os componentes do esquema oferece uma rica oportunidade de análise dos dados obtidos de diferentes manipulações. No treino discriminativo, por exemplo, diferentes estímulos poderão sinalizar diferentes conseqüências para as respostas. No decorrer de uma intervenção clínica, é possível observar um esquema similar ao esquema múltiplo de reforçamento, com os componentes de reforçamento contínuo (CRF) na presença do terapeuta, e procedimento de extinção (EXT), na presença de outras pessoas. Entretanto, a duração dos componentes não é simétrica. O primeiro componente, o CRF, pode ter a duração de 50 min (período de tempo de uma sessão terapêutica), enquanto o segundo, a extinção, pode ter uma duração aproximada de 12 h no dia da sessão de tratamento (perío- 152 ABREU-RODRIGUES, RIBEIRO & COLS. do de tempo que uma criança pode estar interagindo com seus primeiros educadores, pais ou professores). Nos demais dias da semana, quando não há sessão terapêutica, a criança pode estar sendo exposta a um esquema simples de reforçamento intermitente com reforçamento negativo ou, ainda, a esquemas de punição ou a procedimentos de extinção. É possível também a identificação de esquemas complexos de reforçamento formado pelos esquemas descritos anteriormente. É comum observar uma baixa freqüência de reforçamento positivo e eventos aversivos contingentes, de forma não-sistemática, aos comportamentos clinicamente relevantes da criança em seu ambiente natural. A inconsistência ou a não-sistematicidade dos esquemas de reforçamento fora da sessão terapêutica pode dificultar a ocorrência da generalização de estímulos. Baixas taxas de generalização podem também ser registradas nos casos em que se observam contingências antagônicas entre os settings terapêutico e natural, envolvendo, por exemplo, esquemas mult CRF EXT ou mult CRF Punição. Em outras palavras, quanto maior for a diferença entre as contingências de treino e de teste, isto é, entre as sessões terapêuticas, os procedimentos de intervenção implementados ou as contingências programadas pelo terapeuta e as contingências presentes no ambiente natural, seja em família ou na escola, menor será a possibilidade de extensão do repertório treinado para situações extraconsultório. Portanto, uma avaliação constante das contingências presentes no dia-a-dia da criança, certamente contribuirá para a efetividade do tratamento e para a promoção de generalização. Essa estratégia tem sido também apontada como fundamental em atividades de pesquisa: “Contingências sociais extra-experimentais raramente recebem atenção explícita nos relatos de pesquisa com sujeitos humanos”. (Pilgrim, 1998, p. 25). Um problema comumente citado na clínica infantil poderia ilustrar a discussão sobre a generalização de estímulos. É possível dizer que o zeitgeist, a partir da década de 1990 na clínica infantil, é o diagnóstico do Transtorno de Déficit de Atenção/Hiperatividade (TDAH), amplamente aplicado por pais e professores a partir de critérios intuitivos. Entretanto a utilização de critérios clínicos por profissionais especializados também apresenta problemas. Critérios clínicos têm sido utilizados de maneira inadequada ou, ainda, quando utilizados adequadamente, apresentam riscos de interpretação de falsos positivos, devido aos pontos de subjetividade na classificação do transtorno dentro de um continuum de normalidade. O TDAH é definido a partir dos critérios apresentados no Manual Diagnóstico e Estatístico de Transtornos Mentais (DSM-IV) e é considerado uma condição crônica (American Psychiatric Association, 1994). Uma variada etiologia tem sido apresentada para esse transtorno, com especial destaque para fatores neurológicos e genéticos, enquanto fatores ambientais e sociais não são considerados causais (Barkley, 1998). Crianças com diagnóstico de TDAH apresentam dificuldades de generalização de comportamentos sociais funcionais adquiridos no contexto de tratamento para outros contextos, após a suspensão de uma intervenção (Barkley, 1998). A análise das contingências a que essas crianças são expostas evidencia um contexto familiar, em geral, com mães mais diretivas, negativas, menos responsivas e que apresentam uma baixa freqüência de reforçamento positivo para os comportamentos das crianças. Problemas de interação na escola também são observados nessas crianças, havendo rejeição dos pares devido às suas dificuldades de comunicação (Barkley, 1998). O exemplo de crianças com diagnóstico de TDAH ilustra a inconsistência de conseqüências apresentadas para comportamentos no ambiente natural. As contingências extraconsultório mostram variabilidade e não-sistematicidade. Um segundo aspecto importante é a diferença significativa entre as conseqüências apresentadas para comportamentos-alvo no consultório e no ambiente natural. Um esquema similar a um mult CRF Punição ou mult CRF EXT, nos quais os componentes são formados pela interação com o terapeuta na clínica e com outras pessoas no ambiente natural, respectivamente, pode ser observado. ANÁLISE DO COMPORTAMENTO Portanto, resultados positivos do tratamento, incluindo a generalização de estímulos voltada para comportamentos sociais funcionais em diferentes contextos, podem ser maximizados pela utilização de uma abordagem funcional do problema. A atribuição de um diagnóstico de um transtorno crônico, sem cura, pode ter sérias implicações na atuação dos educadores. Explicações biológicas podem passar a substituir explicações comportamentais, o que, por sua vez, não contribui para uma visão dinâmica e questionadora de práticas educativas realmente efetivas para uma determinada criança. As explicações biológicas podem complementar, porém não substituem as explicações comportamentais (Cavalcante e Tourinho, 1998; Vasconcelos, 2001, 2002). Na abordagem analítico-comportamental, limites biológicos não podem ser considerados sinônimos de limites comportamentais (Roche e Barnes, 1997). Finalmente, dois conceitos adicionais podem ser úteis para a promoção da generalização dos efeitos positivos de uma intervenção: a integridade do tratamento e a satisfação do consumidor. A integridade do tratamento refere-se à precisão e à consistência da implementação de uma variável independente, conforme o planejado. A integridade de uma intervenção possibilita a obtenção de validade interna e de validade externa. Trata-se, no primeiro caso, da atribuição dos resultados obtidos às manipulações de variáveis implementadas pelo terapeuta; no segundo, trata-se da força de uma técnica, alcançada por uma história replicativa que evidencia a generalidade de uma relação funcional (Gresham, Gansle e Noell, 1993). Portanto, é fundamental a apresentação, nos estudos, de definições claras e completas, tanto do comportamento-alvo, a variável dependente, quanto das variáveis manipuladas, as variáveis independentes. Diferentes estimativas da integridade do tratamento são sugeridas por meio de avaliações constantes (Gresham et al., 1993). O terapeuta analítico-comportamental utiliza registros sistemáticos dos comportamentos-alvo e das variáveis independentes no decorrer de todo o processo terapêutico. Essas avaliações repetidas conferem a essa forma de interven- 153 ção clínica uma característica de autocorreção, isto é, a possibilidade de o terapeuta confirmar hipóteses junto ao cliente (relações entre o comportamento e eventos ambientais que parecem existir diante do relato verbal do cliente, por exemplo) e alterar parâmetros de sua intervenção programada. Portanto, não são apenas avaliações de sessões isoladas de linha de base ou de tratamento. Entretanto revisões de estudos nessa área evidenciam a necessidade de maiores investimentos em pesquisas voltadas para as medidas utilizadas (Gresham et al., 1993; Peterson, Homer e Wonderlich, 1982). Todas as áreas de intervenção na psicologia podem beneficiar-se da apresentação de altos índices de integridade do tratamento, e as dificuldades de generalização de comportamentos sociais funcionais para outros ambientes, após a retirada dos tratamentos, poderão ser mais sistematicamente analisadas a partir de altos índices de integridade dos tratamentos utilizados. Os resultados de uma intervenção clínica, incluindo a promoção da generalização, estão relacionados também a uma outra variável, a satisfação do consumidor, a qual tem sido apresentada, na clínica analítico-comportamental infantil, com diferentes conceitos: validade social (p. ex.: Gresham e Lambros, 1997), validade habilitativa (Hawkins, 1991) e a partir de classificações das mudanças de comportamento como proximais, intermediárias e distais (Fawcett, 1991). Essas classificações referem-se a resultados de uma intervenção, isto é, a mudanças positivas, respectivamente, nos comportamentos-alvo, nos comportamentos colaterais e em ambos os comportamentos, a longo prazo. Há necessidade de maiores investimentos nos campos conceitual e empírico nessa área de estudo. Segundo Gresham e Lambros (1997), os instrumentos de avaliação do comportamento do consumidor precisam de aprimoramento (o Capítulo 16 apresenta uma análise do comportamento do consumidor). A validade social refere-se à significância social dos objetivos da intervenção, à aceitabilidade dos procedimentos e à importância social dos efeitos produzidos pelo tratamento. 154 ABREU-RODRIGUES, RIBEIRO & COLS. Assim, ela abrange todas as fases do processo terapêutico: a) a fase inicial, fundamental para todo o processo, na qual será definido o problema; b) a fase intermediária de seleção, junto ao cliente, das estratégias ou procedimentos a serem implementados, assim como a implementação do tratamento; c) a fase final, com os resultados obtidos. A integridade da implementação de uma intervenção, isto é, a aplicação efetiva dos procedimentos pelo cliente, pode indicar a aceitabilidade dos procedimentos. Assim, a insatisfação de pais e de professores com os procedimentos de tratamento pode conduzir a intervenções de menor qualidade (Gresham e Lambros, 1997), o que, por sua vez, interferirá nos resultados de generalização alcançados. O modelo de análise do comportamento do consumidor elaborado por Foxall (2000) apresenta dois tipos de reforçamento: utilitário e informacional, os quais são fundamentais para a compreensão das diferentes classes de comportamento do consumidor. O reforçamento utilitário relaciona-se aos resultados ou benefícios obtidos no tratamento, e o reforçamento informacional ao feedback positivo de outras pessoas. O modelo da satisfação do consumidor apresentado por Foxall pode contribuir para avanços na análise desse aspecto na clínica psicológica infantil, na qual os clientes são a criança e seu(s) responsável(eis). Assim, pelo menos duas fontes de investigação devem ser consideradas, a mãe ou o pai, e a criança. A definição dos participantes do acompanhamento terapêutico dependerá de especificidades do problema-alvo e do grupo familiar. É historicamente recente a visão da criança como um indivíduo pleno de direitos (Mendez e Costa, 1994), e a terapia comportamental infantil, orientada pela filosofia do behaviorismo radical, traz inovações importantes, como a participação efetiva da criança (Conte e Regra, 2000). É adotada uma abordagem dinâmica, histórica dos processos comportamentais, os quais são multideterminados por fontes de con- trole filogenéticas, ontogenéticas e culturais. Essa abordagem funcional é contrária à uma visão de unilateralidade causal dos comportamentos de uma criança, considerando-se apenas a influência do ambiente sobre ela. A abordagem analítico-comportamental é relacional, o que significa dizer que o terapeuta está considerando as influências recíprocas entre o ambiente e a criança. Não são apenas os educadores que alteram os comportamentos da criança, ela também contribui de forma dinâmica no contexto em que interage. Pesquisas ilustram a contribuição efetiva da criança para a sobrevivência de sua família em grandes centros urbanos (p. ex.: Gomes, 1992). Portanto, a avaliação da satisfação do consumidor poderá conter análises sobre: a) a extensão dos efeitos terapêuticos para outras áreas na vida do cliente ou as mudanças em uma classe de respostas que influenciam positivamente outras classes (validade habilitativa); b) os reforços utilitários; c) os reforços informacionais. Os resultados de um tratamento serão definidos pelos custos e benefícios obtidos tanto pelos adultos diretamente envolvidos como pela criança. A clínica psicológica analítico-comportamental infantil proporciona ganhos ao adulto, responsável pela criança, diretamente envolvido no processo terapêutico. Ela promove o autoconhecimento dos pais no decorrer da análise dos comportamentos emitidos por uma criança (Rocha e Brandão, 1997). A utilização da análise funcional por todos os envolvidos, ao longo do processo terapêutico; as discussões dos direitos das crianças, de estratégias educativas, de suas possibilidades de aprendizagem, da importância de uma rotina de acompanhamento dos comportamentos de uma criança, da expressão de amor incondicional pelos pais (isto é, os comportamentos da criança podem ser aprovados ou desaprovados, o que é diferente de condicionar o amor dos pais a esses comportamentos, contribuindo, assim, para uma baixa auto-estima da criança) são ANÁLISE DO COMPORTAMENTO exemplos de ocasiões em que o terapeuta tem a oportunidade de modelar comportamentos funcionais e de rever conceitos que podem estar levando a insensibilidade dos educadores a reais conquistas ou comportamentos da criança. Assim, os benefícios têm sido registrados tanto para as crianças como para os adultos diretamente envolvidos, o que fortalece a interpretação da satisfação do consumidor a partir da criança e do adulto responsável. Dessa forma, a análise da satisfação do consumidor, envolvendo os objetivos, os procedimentos e os resultados de uma intervenção clínica, é necessária para todos os envolvidos no processo terapêutico para a obtenção de altos índices de integridade do tratamento (Vasconcelos, no prelo). Um pai ou um professor que não tenha compreendido ou valorizado alguns procedimentos propostos em um tratamento poderá não implementá-los ou fazêlo de maneira inconsistente, contruibuindo, assim, para a obtenção de resultados negativos de uma intervenção. A satisfação do consumidor e a integridade do tratamento são, portanto, dois aspectos que contribuem para a promoção da generalização dos resultados de um tratamento no contexto clínico. CONCLUSÃO A promoção da generalização deve constituir um dos objetivos dos analistas do comportamento no contexto de intervenção. A abordagem funcional no estudo da generalização destaca a importância de trabalhos empíricos voltados para a análise de variáveis que controlam a ocorrência desse fenômeno. Um aspecto fundamental é a utilização de termos precisos, com descrições completas das intervenções implementadas. Revisões recentes sobre o tema generalização de estímulos mostram que, em geral, as pesquisas focalizam algum tipo de comportamento social sem, contudo, apresentarem uma análise conceitual ou metodológica do tema (Osnes e Lieblein, 2002). A utilização do termo generalização de estímulos deve, portanto, incluir as variáveis potencialmente relevantes, presentes tanto no ambiente clínico como no ambiente natural. Defini- 155 ções claras e completas dos procedimentos de intervenção de ambas as variáveis, dependente e independente, contribuem para o desenvolvimento de estudos sistemáticos no contexto de intervenção. Os procedimentos de intervenção propostos por analistas do comportamento serão cada vez mais reconhecidos ao promoverem efetivamente a generalização de estímulos (Osnes e Lieblein, 2002). Não se pode apenas esperar que esse resultado ocorra, naturalmente, ao final do tratamento (Stokes e Baer, 1977; Stokes e Osnes, 1989). A otimização da generalização ocorre com a seleção de estímulos que estarão presentes durante todo o tratamento. Segundo Stokes e Baer (1977) e Stokes e Osnes (1989), é possível programar a generalização por meio de diferentes manipulações: a) outras crianças, adultos e terapeutas poderão interagir com a criança-alvo no ambiente terapêutico; b) tarefas presentes no dia-a-dia da criança poderão ser selecionadas; c) diferentes contextos (p. ex.: sessões fora do ambiente clínico) poderão ser programadas no decorrer do processo terapêutico, e esses contextos extraclínica para interação terapeuta-cliente serão selecionados de acordo com os objetivos do tratamento; d) utilização de automonitoramento, com um treino discriminativo voltado para os próprios comportamentos da criança, a auto-avalição; e) a repetição de testes e de treinos até que a generalização de estímulos seja observada. Essas manipulações envolvem algumas das variáveis que poderão garantir resultados positivos de generalização de estímulos ao final de um processo terapêutico. No contexto de intervenção, os estudos publicados sobre o tema generalização apresentam, em geral, as estratégias tecnológicas de Stokes e Baer (1977) e de Stokes e Osnes (1989) e são unânimes ao sugerir estudos sistemáticos da promoção da generalização. Investigações cujos esforços concentram-se no 156 ABREU-RODRIGUES, RIBEIRO & COLS. controle de variáveis potencialmente envolvidas na ocorrência de generalização devem ser consideradas como modelos para outras investigações. Um procedimento eficiente na produção de resultados positivos e esperados, mas que necessita ser utilizado ad infinitum, porque não se conhecem as variáveis responsáveis pela manutenção e pelo espalhamento desses resultados para outros contextos, pode dificultar avanços nessa ciência, assim como sua aceitação (Osnes e Lieblein, 2002). REFERÊNCIAS BIBLIOGRÁFICAS Alessi, G. (1987). Generative strategies and teaching for generalization. The Analysis of Verbal Behavior, 5, 15-27. American Psychiatric Association (1994). Diagnostic and statistical manual of mental disorders (4th ed.). Washington, DC: Author. Barkley, R. A. (1998). Attention-deficit hyperactivity disorder: A handbook for diagnosis and treatment. New York: Guilford. Barrett, J. E. (1984). Behavioural principles in psychopharmacology. Em D. J. Sanger e D. E. Blackman (Eds.), Aspects of psychopharmacology (p. 21-56). London: Methuen. Blackman, D. E.; Pellon, R. (1993). The contributions of B. F. Skinner to the interdisciplinary science of behavioral pharmacology. British Journal of Psychology, 84, 1-25. Brown, J. S.; Bilodeau, E. A.; Baron, M. R. (1951). Bidirectional gradients in the strength of a generalized voluntary response to stimuli on a visual spatial dimension. Journal of Experimental Psychology, 41, 52-61. Catania, A. C. (1975). The myth of self-reinforcement. Behaviorism, 3, 192-199. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. Souza et al. trads.). Porto Alegre: Artmed (Obra publicada originalmente em 1998). Cavalcante, S. N.; Tourinho, E. Z. (1998). Classificação e diagnóstico na clínica: Possibilidades de um modelo analítico-comportamental. Psicologia: Teoria e Pesquisa, 14, 139-147. Chandler, L. K.; Lubeck, R. C.; Fowler, S. A. (1992). Generalization and maintenance of preschool children’s social skills: A critical review and analysis. Journal of Applied Behavior Analysis, 25, 415-428. Conte, F. C. S.; Regra, J. A. G. (2000). A psicoterapia comportamental infantil: Novos aspectos. Em E. F. M. Silvares (Org.), Estudos de caso em psicologia clínica comportamental infantil: Vol. 1. (p. 79-136). Campinas, SP: Papirus. Cross, D. V.; Lane, H. L. (1962). On the discriminative control of concurrent responses: the relations among response frequency, latency, and topography in auditory generalization. Journal of the Experimental Analysis of Behavior, 5, 487-496. Donahoe, J. W.; Palmer, D. C. (1994). Learning and complex behavior. Needham Heights, MA: Allyn and Bacon. Dougher, M. J.; Markham, M. R. (1996). Stimulus classes and the untrained acquisition of stimulus functions. Em T. R. Zentall e P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 137-152). New York: Elsevier. Ducharme, D. E.; Holborn, S. W. (1997). Programming generalization of social skills in preschool children with hearing impairments. Journal of Applied Behavior Analysis, 30, 639-651. Edelstein, B. A. (1989). Generalization: Terminological, methodological and conceptual issues. Behavior Therapy, 20, 311-324. Falk, J. L. (1971). The origin and functions of adjunctive behavior. Animal Learning and Behavior, 5, 325-335. Farthing, G. W.; Hearst, E. (1968). Generalization gradients of inhibition after different amounts of training. Journal of the Experimental Analysis of Behavior, 11, 743-752. Fawcett, S. (1991). Social validity: A note on methodology. Journal of Applied Behavior Analysis, 24, 235-239. Fox, J. J.; McEvoy, M. A. (1993). Assessing and enhancing generalization and social validity of social-skills interventions with children and adolescents. Behavior Modification, 17, 339-366. Foxall, G. R. (2000). Consumer situation: An operant interpretation. Em J. C. Leslie e D. E. Blackman (Eds.), Experimental and applied analyses of human behavior (p. 293-312). Reno, NV: Context Press. Gimenes, L. S. (1985). Padrões de comportamento induzidos por contingências. Revista de Psicologia, 3, 79-85. Goldiamond, I. (1976). Alternate sets as a framework for behavioral formulation and research. Behaviorism, 3, 49-86. Gomes, J. V. (1992). Família e socialização. Psicologia, 3, 95-106. Gresham, F. M.; Gansle, K. A.; Noell, G. H. (1993). Treatment integrity in applied behavior analysis with children. Journal of Applied Behavior Analysis, 26, 257263. Gresham, F. M.; Lambros, K. M. (1997). Behavioral and functional assessment. Em T. S. Watson e F. M. Gresham (Eds.), Handbook of child behavior therapy (p. 3-22). New York: Plenum. Grusec, T. (1968). The peak shift in stimulus generalization: Equivalent effects of errors and noncontingent shock. Journal of the Experimental Analysis of Behavior, 11, 239-249. Guttman, N.; Kalish, H. I. (1956). Discriminability and stimulus generalization. Journal of Experimental Psychology, 51, 79-88. ANÁLISE DO COMPORTAMENTO Hanson, H. M.; Guttman, N. (1961). The use of a behavioral stimulant in the study of stimulus generalization. Journal of the Experimental Analysis of Behavior, 4, 209-212. Harzem, P.; Miles, T. R. (1978). Conceptual issues in operant behavior. New York: Wiley. Hawkins, R. (1991). Is social validity what we are interested in? Argument for a functional approach. Journal of Applied Behavior Analysis, 24, 205-213. Hearst, E.; Koresko, M. B.; Poppen, R. (1964). Stimulus generalization and the response-reinforcement contingency. Journal of the Experimental Analysis of Behavior, 7, 369-380. Honig, W. K. (1966). The role of discrimination training in the generalization of punishment. Journal of the Experimental Analysis of Behavior, 9, 377-384. Honig, W. K.; Urcuioli, P. J. (1981). The legacy of Guttman and Kalish (1956): 25 years of research on stimulus generalization. Journal of the Experimental Analysis of Behavior, 3, 405-445. Hughes, C.; Harmer, M. L.; Killian, D. J.; Niarhos, F. (1995). The effects of multiple-exemplar self-instructional training on high school students’ generalized conversational interactions. Journal of Applied Behavior Analysis, 28, 201-218. Hull, C. L. (1939). The problem of stimulus equivalence in behavior theory. Psychological Review, 46, 9-30. Keller, F. S.; Schoenfeld, W. N. (1968). Princípios de psicologia (C. M. Bori e R. Azzi, trads.). São Paulo: Herder (Obra publicada originalmente em 1950). Kendall, P. C. (1981). Assessing generalization and the single-subject strategies. Behavior Modification, 5, 307319. Klein, M.; Rilling, M. (1974). Generalization of freeoperant avoidance behavior in pigeons. Journal of the Experimental Analysis of Behavior, 21, 75-88. Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic psychotherapy. New York: Plenum. Lashley, K. S.; Wade, M. (1946). The pavlovian theory of generalization. Psychological Review, 53, 72-87. Mazur, J. E. (1998). Learning and Behavior. New Jersey: Prentice Hall. Mednick, S. A.; Freedman, J. L. (1960). Stimulus generalization. Psychological Bulletin, 57, 169-200. Mendez, E. G.; Costa, A. C. G. (1994). Das necessidades aos direitos. São Paulo: Malheiros. Migler, B.; Millenson, J. R. (1969). Analysis of response rates during stimulus generalization. Journal of the Experimental Analysis of Behavior, 12, 81-87. Millenson, J. R. (1975). Princípios de análise do comportamento (A. A. Souza; D. Rezende, trads.). Brasília: Coordenada (Obra publicada originalmente em 1967). Osnes, P. G.; Lieblein, T. (2002). An explicit technology of generalization. The Behavior Analyst Today, 3, 364-374. Peterson, L.; Homer, A.; Wonderlich, S. (1982). The integrity of independent variables in behavior analysis. Journal of Applied Behavior Analysis, 15, 477-492. 157 Pierrel, R. (1958). A generalization gradient for auditory intensity in the rat. Journal of the Experimental Analysis of Behavior, 1, 303-313. Pierrel, R.; Sherman, J. G. (1962). Generalization and discrimination as a function of the SD-SΔ intensity difference. Journal of the Experimental Analysis of Behavior, 5, 67-71. Pilgrim, C. (1998). The human subject. Em K. A. Lattal e M. Perone (Eds.), Handbook of research methods in human operant behavior (p. 15-44). New York: Plenum. Pilgrim, C.; Galizio, M. (1996). Stimulus equivalence: A class of correlations, or a correlation of classes? Em T. R. Zentall; P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 173-195). New York: Elsevier. Razran, G. (1949). Stimulus generalization of conditioned responses. Psychological Bulletin, 46, 337-365. Risley, T. (1964). Generalization gradients following two-response discrimination training. Journal of the Experimental Analysis of Behavior, 7, 199-204. Roberts, W. A. (1996). Stimulus generalization and hierarchical structure in categorization by animals. Em T. R. Zentall; P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 35-54). Amsterdam: Elsevier. Rocha, M. M.; Brandão, M. Z. S. (1997). A importância do autoconhecimento dos pais na análise e modificação de suas interações com os filhos. Em M. Delitti (Org.), Sobre comportamento e cognição: Vol. 2. A prática da análise do comportamento e da terapia cognitivocomportamental (p. 137-146). Santo André, SP: ARBytes. Roche, B.; Barnes, D. (1997). The behavior of organisms? The Psychological Record, 47, 597-618. Sherman, J. G.; Pierrel, R. (1961). Generalization of auditory intensity as a function of amount of discrimination training. Journal of the Experimental Analysis of Behavior, 4, 237-241. Sidman, M. (1994). Equivalence relations and behavior. A research story. Boston, MA: Authors Cooperative. Skinner, B. F. (1938). The behavior of organisms. New York: D. Appleton-Century. Skinner, B. F. (1999). Sobre o behaviorismo (M. P. Villalobos, trad.). São Paulo: Cultrix (Obra publicada originalmente em 1974). Skinner, B. F. (1998). Ciência e comportamento humano (J. C. Todorov e R. Azzi, trads.). São Paulo: Martins Fontes (Obra publicada originalmente em 1953). Slivka, R. M.; Honig, W. K. (1964). Stimulus generalization and inhibitory control. The stimulus generalization of punishment. Journal of the Experimental Analysis of Behavior, 7, 165. Stokes, T. F. (1992). Discrimination and generalization. Journal of Applied Behavior Analysis, 25, 429-432. Stokes, T. F.; Baer, D. M. (1977). An implicit technology of generalization. Journal of Applied Behavior Analysis, 10, 349-367. Stokes, T. F.; Osnes, P. G. (1989). An operant pursuit of generalization. Behavior Therapy, 20, 337-355. 158 ABREU-RODRIGUES, RIBEIRO & COLS. Terrace, H. S. (1966). Stimulus control. Em W. K. Honig (Ed.), Operant behavior: Areas of research and applications (p. 271-344). New Jersey: Prentice-Hall. Urcuioli, P. J. (1996). Acquired equivalences and mediated generalization in pigeon’s matching-tosample. Em T. R. Zentall e P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 55-70). Amsterdam: Elsevier. Vasconcelos, L. A. (1999). Radiação ionizante: Efeitos sobre a aquisição e o desempenho do comportamento operante. Tese de Doutorado não publicada, Universidade de Brasília, Brasília, DF. Vasconcelos, L. A. (2001). Terapia analítico-comportamental infantil: Alguns pontos para reflexão. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol 7. Expondo a variabilidade (p. 340-350). Santo André, SP: Esetec. Vasconcelos, L. A. (2002). Análise comportamental do transtorno de déficit de atenção e hiperatividade: Implicações para avaliação e tratamento. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 10. Contribuições para a construção da teoria do comportamento (p. 144154). Santo André, SP: Esetec. Vasconcelos, L. A. (no prelo). Integridade do tratamento e satisfação do consumidor na clínica analítico-com- portamental infantil. Em M. Z. S. Brandão e F. C. S. Conte (Orgs.), Sobre comportamento e cognição. Wacker, D. P.; Berg, W. K.; Choisser, L.; Smith, J. (1989). Evaluation of the generalized effects of a peer-training procedure with moderately retarded adolescents. Journal of Applied Behavior Analysis, 22, 261-273. Wasserman, E. A.; Bhatt, R. S. (1992). Conceptualization of natural and artificial stimuli by pigeons. Em W. K. Honig e J. G. Fetterman (Eds.), Cognitive aspects of stimulus control (p. 203-223). Hillsdale, NJ: Erlbaum. Weatherly, J. N.; Miller, K.; McDonald, T. W. (1999). Social influence as stimulus control. Behavior and Science, 29, 25-45. Winograd, E. (1965). Maintained generalization testing of conditioned suppression. Journal of the Experimental Analysis of Behavior, 8, 47-51. Yarczower, M.; Dickson, J. F.; Gollub, L. R. (1966). Some effects on generalization gradients of tandem schedules. Journal of the Experimental Analysis of Behavior, 9, 631639. Zentall, T. R. (1996). An analysis of stimulus class formation in animals. Em T. R. Zentall e P. M. Smeets (Eds.), Stimulus class formation in human and animals (p. 15-34). Amsterdam: Elsevier. Zentall, T. R.; Smeets, P. M. (Eds.) (1996). Stimulus class formation in human and animals. New York: Elsevier. ANÁLISE DO COMPORTAMENTO QUANTIFICAÇÃO DE ESCOLHAS E PREFERÊNCIAS 159 9 JOÃO CLAUDIO TODOROV ELENICE S. HANNA A todo momento tomamos decisões, fazemos escolhas e demonstramos preferências. Mesmo nos esquemas de reforçamento simples existem outras respostas possíveis de serem emitidas, concorrendo com a planejada, e reforços correspondentes (Herrnstein, 1961), que geralmente não são analisados. Escolher é a resposta a um entre dois ou mais estímulos acessíveis e preferir é passar mais tempo respondendo (Skinner, 1950), ou responder mais a um deles (Hanna, 1991). No entanto, se o interesse está nas relações organismo-ambiente, uma instância de resposta em si não diz nada. O fundamental é entender onde e quando escolha e preferência são observadas (Todorov, 1981). Os estudos sobre escolha e preferência em pesquisa básica de análise do comportamento utilizam contingências nas quais os reforços são programados como conseqüências de respostas diferentes emitidas em situações diferentes, simultâneas e independentes. Nessas contingências de escolha contínua, denominadas tecnicamente de esquemas concorrentes, duas ou mais respostas incompatíveis (devido à impossibilidade de emiti-las simultaneamente) são mantidas por diferentes esquemas de reforçamento. Quando os esquemas concorrentes são de intervalos variáveis (conc VI VI), dois esquemas de reforçamento de intervalo variável correspondem às duas alternativas disponíveis. Portanto, em cada alternativa, as respostas serão reforçadas após diferentes intervalos de tempo decorridos a partir da apresen- tação do último reforço. O tamanho do esquema VI corresponde à média dos diferentes intervalos utilizados. Os procedimentos de escolha contínua têm sido de grande utilidade para o avanço na quantificação da lei do efeito, ou seja, para quantificar os efeitos de reforçamento e punição sobre o comportamento (de Villiers, 1977). Quando organismos podem escolher repetidas vezes entre pelo menos duas fontes diferentes de reforços, a proporção de escolha de uma determinada fonte tende a igualar a proporção de reforços obtidos daquela fonte, seja no ambiente natural (Baum, 1974b), seja em condições experimentais (Baum, 1974a; 1979; Herrnstein, 1961; 1970). Serão apresentados neste capítulo as relações funcionais e os modelos matemáticos desenvolvidos para descrever o comportamento de escolha, em especial o denominado lei da igualação, e também serão discutidas sua generalidade em diferentes contextos e para o comportamento humano e sua utilidade para análises e situações aplicadas. LEI DA IGUALAÇÃO Herrnstein foi o primeiro a investigar a relação entre a distribuição do comportamento entre alternativas e a distribuição de estímulos reforçadores. No experimento original (Herrnstein, 1961), alguns pombos foram usados como sujeitos. No procedimento padrão, 160 ABREU-RODRIGUES, RIBEIRO & COLS. os animais são mantidos a 80% de seu peso, determinado em condições de abundância de alimento, têm água à vontade em suas gaiolas-viveiros individuais, mas obtêm alimentação principalmente por meio de seu trabalho nas sessões experimentais. Uma câmara experimental típica para estudos de condicionamento operante com pombos tem um painel de respostas em uma das paredes, com dois discos de plástico que podem ser vistos e alcançados através de orifícios circulares na parede de metal, situados aproximadamente à altura da cabeça do pássaro. Os discos podem ser transiluminados por luzes de diferentes cores por meio de um projetor controlado por circuitos eletromecânicos. Bicadas no disco com força de pelo menos 0,1 N abrem um relé e colocam em ação outro circuito eletromecânico: as respostas podem ser registradas em contadores, acionar um registrador cumulativo e, quando determinado pelo esquema de reforço escolhido pelo experimentador, acionar um comedouro que coloca alimento à disposição do pombo por um período de tempo que também depende do esquema escolhido pelo pesquisador. É possível registrar não somente as respostas emitidas em cada alternativa (R1 e R2), mas também o tempo que o sujeito gasta respondendo em cada disco (T1 e T2). Tipicamente, os pássaros respondem em uma alternativa por um curto período, mudam para o outro disco iluminado, respondem por outro curto período, voltam a mudar de disco, e assim por diante. Portanto, é possível medir as respostas de mudança, bem como o número de respostas consecutivas e o tempo gasto em um disco entre uma e outra resposta de mudança. Ao formular a Lei da Igualação (matching law), Herrnstein (1970) propôs que tanto as medidas de número relativo de respostas quanto de tempo relativo igualam exatamente o número de reforços obtidos em cada alternativa: C1/(C1 + C2) = R1/(R1 + R2) (1) T1/(T1 + T2) = R1/(R1 + R2) (2) Nessas equações C, T e R referem-se a medidas de freqüência do comportamento, de tempo e de suas conseqüências, respectivamen- te, e os números indicam as fontes alternativas de reforço. Quando cada bicada do sujeito experimental é seguida pela possibilidade de acesso ao alimento, a Equação 1 é supérflua, já que a igualdade entre os termos é determinada pelo esquema de reforço contínuo. Na Equação 2, as igualdades entre tempo e resposta podem não ser verificadas apenas quando o pássaro se sacia, e a distribuição de tempo entre respostas de mudança diferem da distribuição de respostas por incluir o tempo gasto em outras atividades na câmara experimental. O interesse gerado pelas Equações 1 e 2 decorre de sua aplicação a condições de reforço intermitente, quando o estímulo reforçador é apresentado apenas eventualmente e de acordo com regras especificadas no esquema de reforçamento (Ferster e Skinner, 1957). No experimento de Herrnstein (1961), cada disco de plástico estava associado a um esquema de reforçamento diferente a intervalos variáveis (VI), o qual estabelecia que uma resposta seria reforçada apenas quando passados t segundos, em média, desde a última apresentação do estímulo reforçador. Os esquemas eram independentes um do outro e simultâneos. Nessas condições, o experimentador controla a freqüência máxima de reforços que podem ser obtidos por sessão experimental, mas é o comportamento do sujeito que determina, até o limite da distribuição programada pelo experimentador, qual a proporção de reforços a ser obtida por meio das respostas em um determinado disco. Se o sujeito responde apenas em um disco, todas as respostas e todos os reforços estão associados a esse disco, e a Lei da Igualação é confirmada de maneira óbvia: a Equação 1 não pode ser negada. Se um esquema programa três vezes mais reforços do que o outro, e o sujeito distribui igualmente suas respostas entre as alternativas, a Lei é negada: a distribuição de respostas não iguala a distribuição de reforços obtidos. Essa distribuição de 50% das respostas a cada alternativa independentemente do número de reforços obtidos em cada esquema é mais freqüente do que o bom senso nos levaria a prever e ocorre por problemas específicos do procedimento experimental. Com pombos ANÁLISE DO COMPORTAMENTO como sujeitos, por exemplo, antes de começar um experimento é necessário treinar os pássaros para comer no comedouro e para bicar os discos, usando alimento como reforço e alguma técnica de modelagem da resposta (Keller e Schoenfeld, 1950; Skinner, 1953); normalmente, cada bicada é reforçada (esquema CRF). Na primeira sessão experimental com esquemas conc VI VI, os pombos tendem a alternar freqüentemente de um disco para o outro quando as respostas não são reforçadas – a extinção gera variabilidade no comportamento (Keller e Schoenfeld, 1950). Em vez de desempenhos independentes e concorrentes, é gerada uma cadeia simples: bicada no disco da esquerda, mudança para o disco da direita, bicada no disco da direita, mudança para o disco da esquerda; a sequência continua até a apresentação do estímulo reforçador – e a sequência reforçada tende a ser repetida. Herrnstein (1961) foi mais além, treinando explicitamente seus pombos na seqüência descrita antes de iniciar o experimento. Quando uma cadeia de alternações é estabelecida, os animais simplesmente não discriminam as fontes alternativas de reforçamento. Ele contornou o problema criado por si mesmo, programando um atraso de reforço para respostas de alternação (COD, do inglês changeover delay) – nenhuma resposta poderia ser reforçada antes de se passarem 1 s e meio desde a última resposta de alternação. O COD foi pensado por Herrnstein como uma penalidade para mudanças de esquema e como uma maneira de separar temporalmente as respostas emitidas em um esquema dos reforços obtidos em outro esquema. Quando um COD de pelo menos 3 s é usado, ou alguma outra conseqüência de respostas de mudança que impeça a formação de cadeias simples (cf. Baum, 1982; Boelens e Kop, 1983; Pliskoff e Fetterman, 1981; Todorov, 1971b; Todorov, Acuña-Santaella e Falcón-Sanguinetti, 1982; Todorov e Souza, 1978), a Equação 1 tende a descrever bem a relação entre comportamento e conseqüências em esquemas conc VI VI. Entretanto há na literatura uma quantidade razoável de dados experimentais para os quais a Equação 1 mostrou-se inadequada. Para trabalhar com esses 161 dados, Baum (1974a), estendendo uma proposta anterior (Baum e Rachlin, 1969), propôs a equação: C1/C2 = k (R1/R2)sR (3) ou, na forma logarítmica, log (C1/C2) = log k + sR log (R1/R2) (4) onde o parâmetro k é uma medida de viés, isto é, uma preferência por uma alternativa causada por variáveis outras que não a freqüência de reforços (cf. Cunha, 1988; Todorov, 1983; Todorov e Bigonha, 1982), e o parâmetro sR é uma medida da sensibilidade do comportamento à distribuição de reforços entre as alternativas (cf. Hanna, Blackman e Todorov, 1992; Todorov et al., 1983). No experimento original de Herrnstein (1961), por exemplo, tanto k quanto sR são aproximadamente 1,0, e a Equação 3 é reduzida à Equação 1. Por sua utilidade no estudo de desempenhos concorrentes nos mais diferentes procedimentos, a Equação 3 passou a ser conhecida como a Equação da Lei Generalizada de Igualação – Generalized Matching Law (Baum, 1974a; 1979). As Equações 3 e 4 têm-se mostrado extremamente úteis quando aplicadas a dados obtidos de várias espécies animais, incluindo o homem; como pombos (Herrnstein, 1961, 1970), ratos (Todorov et al., 1982), bovinos (Matthews e Temple, 1979), seres humanos (Borges, 2002; Logue et al., 1986). O interesse pelo trabalho de Herrnstein levou a desenvolvimentos teóricos que aproximaram ainda mais a psicologia experimental e a biologia, no contexto da teoria da evolução (cf. Logue, 1988). Presume-se que os organismos têm melhores chances de sobrevivência quando se comportam de maneira a maximizar, ao longo de um determinado período de tempo, a obtenção de reforços possíveis em uma dada situação (Rachlin, 1989; Rachlin et al., 1981). Em determinadas condições experimentais restritivas, os organismos podem não conseguir maximizar reforços e, ainda assim, igualar a distribuição de respostas e a distribuição de reforços obtidos (Herrnstein e Vaughan, 1980). 162 ABREU-RODRIGUES, RIBEIRO & COLS. Como geralmente a igualação resulta em maximização de reforços, os organismos tendem a igualar as distribuições de respostas e de reforços obtidos, alternando entre as fontes de reforço de modo a manter iguais as taxas locais de reforço. Portanto, a igualação seria um mecanismo simples, selecionado durante a evolução das espécies, que resulta em maximização de reforços a longo prazo (cf. Logue, 1988). Animais tenderiam a abandonar uma fonte de reforços sempre que a taxa local de obtenção de reforços diminuísse em relação a fontes alternativas. Normatização do procedimento experimental Relações funcionais entre comportamento e conseqüência não ocorrem no vácuo. A igualação entre distribuições de respostas e reforços pode ser observada em condições experimentais adequadas. O conhecimento dessas características de procedimento evoluiu ao longo da análise experimental do comportamento de escolha (Todorov, 1971a). Conseqüências da resposta de mudança Shull e Pliskoff (1967) investigaram o papel crítico exercido pela contingência de atraso de reforço para respostas de mudança (COD) no desempenho de pombos mantidos por esquemas conc VI VI. A preferência pelo esquema programando maior densidade de reforço aumenta com aumentos na duração do COD, mas, a partir de um certo ponto, aumentos no COD também alteram a distribuição de reforços obtidos, mantendo-se a igualdade entre distribuições de respostas e de reforços obtidos. Sem COD ou com CODs de curta duração, a distribuição de respostas tende a subigualar (undermatch) a distribuição de reforços obtidos. Baum (1974b) e de Villiers (1977) argumentam que isso acontece porque a freqüência de alternância é muito alta, e os dois esquemas não são percebidos como independentes, mas sim como uma única fonte de refor- ços para um único operante complexo – a cadeia de ir e voltar de uma alternativa para a outra. Com CODs mais longos (de pelo menos 3 s), por outro lado, os pássaros têm de permanecer por pelo menos 3 s respondendo em um esquema antes de mudar para outro, possibilitando, assim, o estabelecimento de controle discriminativo por cada esquema do par concorrente. Se o papel do COD é apenas o de diminuir a freqüência de respostas de mudança, outras conseqüências que produzam esse mesmo efeito devem também facilitar o treino de discriminação entre os dois esquemas. Todorov (1971b) demonstrou que a punição direta das respostas de mudança, seja por choques elétricos de curta duração, seja pela imposição de um timeout (suspensão discriminada da contingência de reforço – Todorov, 1971a), produz os mesmos efeitos que o COD na taxa de respostas de mudança e na distribuição de respostas e tempo entre os esquemas, sem afetar a distribuição de reforços obtidos. Todorov e colaboradores (1982) verificaram que a igualdade entre distribuições de respostas e de reforços pode ocorrer sem COD e sem punição contingente a respostas de mudança, desde que o operandum para mudanças seja claramente diferente daqueles usados para respostas reforçadas de acordo com os esquemas do par concorrente. Pliskoff, Cicerone e Nelson (1978) e Pliskoff e Fetterman (1981) usaram um procedimento no qual a mudança de esquemas ocorria depois de n respostas no disco de mudança (Findley, 1958). Quando a razão fixa para respostas de mudança é muito alta, pode ocorrer sobreigualação (overmatching), com a proporção de respostas no esquema de maior densidade de reforços maior do que a proporção de reforços obtidos naquele esquema – efeito também verificado com altas intensidades de punição para respostas de mudança (Todorov, 1971a; 1971b). Um efeito semelhante foi observado por Baum (1982) e por Boelens e Kop (1983) quando as respostas em cada esquema ocorriam em locais espacialmente mais separados. Em todos esses casos, a manipulação na conseqüência da resposta de mudança provoca alterações no tempo consecutivo de exposição a cada esquema, provavelmen- ANÁLISE DO COMPORTAMENTO te melhorando as condições de discriminabilidade (Hanna et al., 1992; Hanna, Todorov e Paula, 1985), como acontece com esquemas múltiplos de reforço (Todorov, 1972). Esse conjunto de estudos foi importante para resolver uma questão que intrigava muitos pesquisadores (Todorov, 1974; Todorov e Souza, 1978). Se a igualação resulta de um processo comportamental que ocorre normalmente no ambiente natural, experimentos que produzem dados que mostram o expoente da Equação 3 muito diferente de 1,0 devem ser vistos como desvios de um desempenho característico. Por outro lado, a Lei de Igualação não teria nenhum significado especial se a igualdade entre distribuições fosse obtida somente em condições experimentais muito restritas (Boelens e Kop, 1983; Pliskoff e Fetterman, 1981). Esses experimentos mostraram, em seu conjunto, que a igualação pode ser obtida com ou sem um COD, desde que o procedimento utilizado resulte em uma separação espacial e/ou temporal de respostas na presença de um esquema de reforços obtidos no outro esquema do par concorrente. Apesar de ser quase um procedimento padrão, o uso do COD acarreta subprodutos indesejáveis quando comparado a outros procedimentos possíveis (Todorov, 1982; Todorov e Ramirez, 1981). História experimental dos sujeitos Uma das vantagens do uso de animais na psicologia experimental é a possibilidade de conhecimento e de controle sobre a história de vida dos sujeitos experimentais. Todorov e colaboradores (1983) demonstraram que parte da variabilidade encontrada na literatura sobre o valor do expoente da Equação 3 devese ao uso de animais com experiência anterior em problemas semelhantes. Em alguns países, pombos são caros e difíceis de ser encontrados e costumam ser utilizados como sujeitos em sucessivos experimentos. Quanto maior a experiência dos pombos com esquemas concorrentes, menor o expoente que mede a sensibilidade do comportamento a mudanças na distribuição de reforços entre os esquemas; ou seja, o comportamento de escolha dos pássaros 163 torna-se cada vez menos sensível. Mesmo com animais experimentalmente ingênuos, o efeito da experiência manifesta-se quando o experimentador programa muitas condições experimentais. Não há informações sobre um efeito semelhante em outros animais. Ratos vivem menos e seres humanos são mais ariscos (Borges, 2002; Neves, 1989). O experimentador fica satisfeito quando consegue estudar o mesmo rato durante dois anos e o mesmo aluno universitário por duas semanas. Critérios de estabilidade Em um experimento típico com esquemas conc VI VI, o mesmo par de esquemas permanece em vigor em sucessivas sessões experimentais diárias até que o desempenho estabilize-se na situação. Quando, por exemplo, o esquema da esquerda programa três vezes mais reforços do que o esquema da direita, os sujeitos costumam distribuir as respostas entre os esquemas no início da primeira sessão experimental. Gradualmente, nas sessões seguintes, a concentração de respostas no disco da esquerda aumenta. Considera-se que a estabilidade do desempenho foi alcançada quando não há mais diferença significativa entre as distribuições de respostas em sessões consecutivas. Não há, entretanto, consenso sobre qual critério de estabilidade deveria ser tomado como padrão. A variabilidade dos critérios explica parte da variabilidade encontrada no valor do expoente da Equação 3. Todorov e colaboradores (1983) demonstraram que o valor do expoente tende a ser mais próximo de 1,0 quanto maior for o número de sessões por condição experimental. Preferência viciada: viés causado pelo tipo de esquema Depois do trabalho de Shull e Pliskoff (1967), as primeiras críticas ao trabalho de Herrnstein vieram de pesquisadores que investigaram o desempenho concorrente usando outros esquemas que não os esquemas VI. Com esquemas concorrentes de razão fixa e intervalo 164 ABREU-RODRIGUES, RIBEIRO & COLS. variável (conc FR VI), o desempenho característico não pode ser adequadamente descrito pela Equação 1. É gerado um forte viés na resposta em favor do esquema FR, o que é compreensível: em esquemas de razão, a freqüência de reforços depende da freqüência de respostas – quanto mais rápido o animal responde maior o número de reforços obtidos. Apesar dessa preferência viciada pelo esquema de razão, a sensibilidade do comportamento a mudanças na razão de reforços obtidos entre os esquemas é a mesma encontrada em experimentos com dois esquemas VI (Bacotti, 1977; Cunha, 1988; Todorov e Hackradt, 1980; 1981; Todorov et al., 1982). Características adequadas de procedimento A relação entre distribuição de respostas ou de tempo gasto respondendo em esquemas concorrentes e a distribuição de reforços obtidos nesses esquemas é adequadamente observada quando algumas características essenciais de procedimento e de análise de dados são seguidas. O procedimento deve ser tal que garanta o estabelecimento de controle de estímulos de cada esquema do par concorrente sobre a resposta a ele associada (Baum, 1982; Pliskoff et al., 1978; Todorov, 1971a; 1971b). A diferença entre os valores da variável independente em condições experimentais sucessivas deve ser grande – valores semelhantes levam a dificuldades no estabelecimento do controle discriminativo e podem provocar viés em favor de uma das alternativas (Todorov, 1982). O critério de estabilidade deve ser estrito e assegurar suficiente número de sessões por condição experimental (Todorov et al., 1983). Extensão para outros parâmetros do estímulo reforçador Magnitude do estímulo reforçador A transformação logarítmica da equação da igualação facilitou o estudo de outros parâmetros do estímulo reforçador. Por exemplo, Neuringer (1967) havia proposto uma exten- são da equação original de Herrnstein (1961) para situações nas quais tanto a freqüência como a magnitude (duração do acesso ao alimento cada vez que a resposta era reforçada) dos estímulos reforçadores alternativos variassem. Neuringer propôs uma simples regra multiplicativa para relacionar a distribuição de respostas à distribuição dos efeitos combinados de freqüência e duração do reforço: C1/C2 = (R1A1/R2A2) (5) onde 5 A é a duração do estímulo reforçador. Entretanto Schneider (1973) e Todorov (1973), independentemente, demonstraram que, em situações de escolha nas quais tanto a freqüência como a magnitude dos estímulos reforçadores variam, a freqüência é mais importante do que a magnitude: Log (C1/C2) = log k + sR log (R1/R2) + sA log (A1/A2) (6) onde os símbolos são os mesmos das equações anteriores e sA é o expoente que mede a sensibilidade do comportamento a alterações na magnitude de reforço, seja em termos de duração de acesso ao alimento para pombos (Oscós e Todorov, 1978; Todorov, 1973; Todorov, Hanna e Bittencourt de Sá, 1984), seja em termos de número de pelotas de alimento para ratos (Schneider, 1973). Nos experimentos citados, o expoente da Equação 5 para freqüência de reforço (sR) foi próximo de 1,0 e o expoente para magnitude (sA) ao redor de 0,5. Atraso de reforço No ambiente natural, nem sempre a conseqüência de um comportamento é imediata à emissão da resposta. É comum que um certo tempo decorra entre a resposta reforçada e a apresentação do estímulo reforçador (atraso de reforço). A história da análise experimental dos efeitos das alterações na duração do atraso de reforço é longa (cf. Azzi et al., 1964). Chung e Herrnstein (1967) estudaram os efeitos das variações na duração do atraso de re- ANÁLISE DO COMPORTAMENTO forço em esquemas conc VI VI e concluíram que o princípio da igualação aplicava-se também aos dados de seu experimento: C1/C2 = [1/(1 + D1)]/[1/(1 + D2)] 165 Rodriguez e Logue (1986) usaram outra variante ao manipularem os valores de duração e atraso e de atraso de reforço mantendo constantes e iguais as freqüências de reforços: (7) log (C1/C2) = log k + sA log (A1/A2) + sD log (D2/D1) (10) onde D é a duração do atraso. Williams e Fantino (1978), entretanto, reanalisaram os dados de Chung e Herrnstein (1967) usando outra equação: log (C1/C2) = log k + sD log (D2/D1) (8) onde sD é a sensibilidade do comportamento a variações no atraso de reforço. A reanálise dos dados mostrou que no experimento de Chung e Herrnstein (1967) o valor de sD na Equação 8 foi diferente para atrasos curtos e para atrasos mais longos – logo, sD não seria uma constante independente do valor absoluto do atraso de reforço. Freqüência, magnitude e atraso do estímulo reforçador Dificuldades na aplicação do princípio de igualação para atraso de reforço em esquemas concorrentes já haviam sido apontadas anteriormente (p. ex.: MacEween, 1972; Squires e Fantino, 1971). Entretanto Logue e colaboradores (1986) têm publicado dados que mostram a aplicabilidade desse princípio para situações em que freqüência, quantidade (magnitude) e atraso de reforço são sistematicamente variados na seguinte equação: log (C1/C2) = log k + sR log (R1/R2) + sA log (A1/A2) + sD log (D2/D1) (9) A Equação 9 é a equação generalizada de igualação proposta por Baum (1974b) em sua forma mais ampla. Quando os esquemas alternativos programam reforços de mesma duração e atraso, a Equação 9 é reduzida à Equação 4. Quando apenas os atrasos são iguais, ela é reduzida à Equação 6. Quando as magnitudes e freqüências são iguais e os atrasos são diferentes, a Equação 9 é reduzida à Equação 8. valores de sA e sD ao redor de 0,5 foram obtidos e confirmados em um experimento posterior (Chavarro e Logue, 1988, Experimento 2). Em suma, a Equação 9 – a equação generalizada de igualação (Baum, 1974b, 1979, 1983) – tem-se mostrado adequada para descrever a relação entre o comportamento de escolha e suas conseqüências. Dados experimentais têm mostrado (p. ex.: Rodriguez e Logue, 1986; Schneider, 1973; Todorov, 1973) que organismos, em situação de escolha, são mais sensíveis a variações na freqüência relativa de reforços do que a variações em magnitude relativa ou atraso relativo – um princípio não previsto por teorias que afirmam que os indivíduos tendem a distribuir suas respostas para maximizar os reforços disponíveis (p. ex.: Logue, 1988; Rachlin et al., 1981; Rachlin et al., 1986). O PRINCÍPIO DA RELATIVIDADE NA EQUAÇÃO DA IGUALAÇÃO Todas as equações apresentadas até agora envolvem relações entre razões. O pressuposto de que ocorre igualdade entre as medidas relativas de comportamento e os parâmetros do estímulo reforçador até recentemente não foi questionado. Herrnstein (1970) foi convincente quanto à freqüência de reforço: valores absolutos seriam irrelevantes. A razão entre respostas iguala a razão entre reforços para quaisquer valores absolutos desses números. Literalmente centenas de relatos experimentais têm sido publicados nos últimos 40 anos, todos direta ou indiretamente apoiando o princípio da relatividade. Recentemente, entretanto, esse princípio tem sido questionado para valores relativos tanto de freqüência quanto de magnitude e atraso de reforço (Alsop e 166 ABREU-RODRIGUES, RIBEIRO & COLS. Davison, 1988; Alsop e Elliffe, 1988; Davison, 1988; Davison e Hogsden, 1984; Dunn, 1990; Logue e Chavarro, 1987). Novos dados foram apresentados, e experimentos anteriores foram revistos na defesa da noção de que a sensibilidade do comportamento a parâmetros relativos do estímulo reforçador varia com mudanças nos valores absolutos desses parâmetros. Logue e Chavarro (1987) estudaram o comportamento de pombos em esquemas concorrentes nos quais os valores relativos de freqüência, de magnitude e de atraso de reforço foram mantidos constantes, e seus valores absolutos foram manipulados em três experimentos. Os autores concluíram que os dados de seus experimentos mostram uma violação do princípio da relatividade para os três parâmetros do estímulo reforçador. Alsop e Elliffe (1988), Alsop e Davison (1988), Davison (1988) e Dunn (1990) afirmaram que seus dados corroboravam as observações de Logue e Chavarro (1987). Inúmeros trabalhos mais recentes, contudo, colocam em dúvida as conclusões de Alsop e Elliffe (1988), de Alsop e Davison (1988), de Davison (1988), de Dunn (1990) e de Logue e Chavarro (1987), questionando seus procedimentos experimentais, reanalisando seus dados e produzindo novos dados com procedimentos corretos (Todorov, 1991a; 1991b; 1991c; 1991d; 1991e; Todorov, Coelho e Beckert, 1993). Com relação ao atraso de reforço, por exemplo, Todorov (1991e) argumenta que o problema talvez esteja no viés do experimentador: Desde Chung e Herrnstein (1967) a questão tem sido vista como se envolvesse um parâmetro do estímulo reforçador. Outra possibilidade envolve uma visão molar da situação de escolha. Organismos podem distribuir o tempo entre alternativas de acordo com a distribuição de reforços entre elas, mesmo quando o experimentador interfere com essa distribuição ao impor diferentes períodos de atraso de reforço. Denotando por tl o tempo livremente gasto respondendo em uma alternativa e tf o tempo imposto pela contingência de atraso, o tempo total gasto pelo sujeito experimental nessa alternativa (T) será: Tt = tl + tf (11) A relação entre a distribuição do tempo total e a distribuição de reforços entre as alternativas 1 e 2 seria: log (Tt1/Tt2) = log k + sR log (R1+R2) (12) que é a mesma Equação 2 com uma nova definição de tempo aplicada a esquemas concorrentes encadeados (Todorov, 1991f, p. 310). No procedimento tradicional de esquemas concorrentes encadeados (Autor, 1969), no elo inicial opera um conc VI VI. As respostas em um dos esquemas são consequenciadas pela mudança de estímulos (luzes dos discos) que sinaliza a entrada no elo terminal correspondente, e as respostas no elo terminal são seguidas pelo reforço primário. Uma vez no elo terminal, apenas uma alternativa está disponível, e o elo de escolha inicial somente é restabelecido após a liberação do reforço. O objetivo original da utilização do procedimento de esquemas concorrentes encadeados era o de se estudar o efeito de reforçadores condicionados (Ferster e Skinner, 1957; Kelleher e Gollub, 1962), já que nesse procedimento as escolhas no elo inicial são seguidas por reforçadores condicionados (estímulos que sinalizam os elos terminais). Com a descoberta de relações ordenadas entre a distribuição de respostas no elo inicial e reforços obtidos no elo terminal (Autor, 1969), e com o crescente interesse em avaliar o desconto no valor do reforçamento produzido pela distância entre a escolha e a liberação dos reforços primários, o objetivo inicial foi perdido. Além disso, na forma original de programar concorrentes encadeados, a distribuição dos reforços condicionados é equivalente à dos reforços primários, o que impede a avaliação dos efeitos independentes de cada variável. Todorov e colaboradores (2003) propuseram a retomada da questão do peso relativo de reforçadores primários e condicionados na determinação do comportamento em situação de escolha. Para isso, foi adicionada ao procedimento tradicional de esquemas concorrentes encadeados uma chave de resposta no elo terminal que possibilitava o retorno ao elo inicial, suspendendo o elo terminal em vigor. Nesse novo procedimento, a distribuição ANÁLISE DO COMPORTAMENTO de reforços primários obtidos no elo terminal diferencia-se da distribuição de reforços condicionados obtidos no elo inicial quando ocorrem respostas na chave de retorno, permitindo o teste da equação: log (C1/C2) = log K + sR log (R1/R2) + sr log (r1/r2) (13) onde r indica o número de reforçadores condicionados e sr a sensibilidade do comportamento à distribuição de reforçadores condicionados. Só é possível uma análise a partir da Equação 13 se ocorrerem respostas de retorno, tornando as taxas de reforçamento primário e condicionado diferentes. Entretanto, observou-se uma taxa de respostas de retorno muito próxima a zero para todos os sujeitos e, portanto, um procedimento mais adequado para o estudo de tais relações necessita ser desenvolvido. IGUALAÇÃO E COMPORTAMENTO HUMANO Com o aumento do número de estudos sobre escolha, cresceu também o interesse pela avaliação da generalidade do fenômeno para o comportamento humano (ver revisão de Bradshaw e Szabadi, 1988; Pierce e Epling, 1983) e das possíveis aplicações em ambiente natural (p. ex.: McDowell, 1988; Pierce e Epling, 1995). Quanto à generalidade do fenômeno para o comportamento humano em uma situação experimental, existem discrepâncias na literatura sobre a adequação da lei generalizada da igualação para descrever a escolha de participantes humanos adultos. Enquanto em alguns estudos foram relatados resultados semelhantes aos encontrados com outros animais (p. ex.: Baum, 1975; Bradshaw, Szabadi e Bevan, 1976; 1979; Buskist e Miller, 1981; Conger e Killeen, 1974; Savastano e Fantino, 1994), em outros foram encontrados grandes desvios da igualação (p. ex.: Navarick e Chellsen, 1983; Oscar-Berman et al., 1980; Pierce, Epling e Greer, 1981). Kraft e Baum (2001) demonstraram a generalidade da igualação para o comportamen- 167 to social humano ao estudarem a escolha de cartões coloridos que davam direito a prêmios em dinheiro ao grupo. Os autores observaram que os grupos escolheram os cartões azuis e vermelhos na mesma razão de pontos que estavam associados aos cartões. Horne e Lowe (1993; ver também Lowe e Horne, 1985) questionaram a adequação do modelo para descrever o comportamento humano, relatando que o desempenho de escolha de muitos participantes dos seis experimentos realizados por eles foi pobremente descrito pela equação de igualação. As variáveis manipuladas nos estudos foram COD, dicas ordinais relacionadas às freqüências de reforços programadas e/ou instruções que descreviam as relações ordinais entre os estímulos correlacionados aos esquemas e às freqüências programadas de reforços. Para metade dos participantes, a Equação 4 descreveu 80% ou mais da variação do comportamento de escolha. A ênfase dos autores, entretanto, foi dada ao desempenho do restante dos participantes que não confirmaram a relação de igualação e ao desempenho de dois participantes que se conheciam e conversaram sobre o experimento, tendo um deles modificado suas escolhas de uma sessão para a outra após ter sido informado de como o companheiro fazia as suas escolhas. Horne e Lowe afirmaram que a aquisição do comportamento verbal modifica o controle comportamental, sendo as regras geradas pelos próprios participantes determinantes do desempenho que muitas vezes difere daquele predito pela igualação (p. ex.: Logue et al., 1986; Lowe e Horne, 1985). Note que uma explicação semelhante (utilizando a mediação verbal) tem sido utilizada pelos mesmos autores para explicar o fenômeno de equivalência de estímulos, conforme descrito no Capítulo 14. Preocupados também com as diferenças entre os resultados de estudos que utilizaram animais infra-humanos e daqueles que utilizaram humanos, Takahashi e Iwamoto (1986) avaliaram a influência (a) do uso de instruções sobre a independência dos esquemas concorrentes, (b) da exposição anterior dos participantes a esquemas simples e (c) da utilização de estímulos exteroceptivos diferentes, 168 ABREU-RODRIGUES, RIBEIRO & COLS. correlacionados a cada componente do par concorrente sobre a escolha humana. Vinte e oito participantes foram divididos em 8 grupos, utilizando-se em cada grupo instrução (I), e/ou exposição anterior a esquemas simples (E), e/ou estímulos exteroceptivos diferentes correlacionados a cada esquema do par concorrente (SD). Os oito grupos (Controle, I, E, SD, IE, ISD, ESD e IESD) foram expostos à fase de linha de base, à fase experimental (na qual era inserido o procedimento especial) e, logo após, retornaram à linha de base. Segundo os autores, apenas o Grupo IESD mostrou variações sistemáticas das razões de escolha com as razões de reforços e sensibilidade relativamente alta do comportamento de escolha à distribuição de reforços (expoente sR da Equação 3) para três dos quatro participantes na fase experimental. Como a diferença entre a fase experimental e o retorno à linha de base para esses participantes foi apenas a retirada dos estímulos discriminativos correlacionados (já que a instrução e a experiência anterior não podem ser revertidas) e como a sensibilidade do comportamento não se manteve, Takahashi e Iwamoto sugeriram que estes estímulos são necessários (mas não suficientes) para produzir sensibilidade às manipulações de razões de reforços. Além das variáveis apontadas por Takahashi e Iwamoto (1986) como responsáveis pelos resultados discrepantes, outros aspectos metodológicos têm sido considerados. Em geral, os estudos com humanos realizam poucas sessões em cada condição experimental e, portanto, os resultados analisados referem-se a desempenhos em estado de transição. Evidências empíricas têm demonstrado que a sensibilidade da escolha à distribuição de reforços (Equação 2) aumenta com o aumento no número de sessões em cada condição (Hanna et al., 1992; Todorov et al., 1983), sendo a igualação um modelo descritivo do comportamento em estado estável. É importante considerar também que os estudos com humanos adultos geralmente utilizam como conseqüência das escolhas pontos que são trocados por dinheiro ao final da sessão; em função disso, cabe questionar: a) o valor reforçador dessa conseqüência para diferentes participantes; b) a adequação da análise da contingência como esquemas concorrentes simples. No primeiro caso, diferentemente da operação de privação que é realizada com animais para garantir o valor reforçador do alimento ou da água, com humanos não existe garantia de que os pontos são os reforçadores para todos os participantes. Esse argumento é reforçado pelo maior número de evidências a favor da igualação com humanos quando reforçadores incondicionados são utilizados, como, por exemplo, terminar um som alto (Solnick et al., 1980). No segundo caso, questiona-se o fato de se analisar de forma equivalente a contingência que libera reforçadores primários (alimento para pombos) e a que programa reforçadores condicionados de segunda ordem (pontos), que serão trocados por dinheiro apenas no final da sessão, o qual por sua vez será trocado por outros reforçadores condicionados ou primários no ambiente natural. Diversas evidências empíricas com animais infra-humanos têm mostrado que a Equação 3, desenvolvida para concorrentes simples, não descreve adequadamente a escolha sob concorrentes encadeados, devendo ser incluídos no modelo aspectos adicionais da contingência (compare as Equações 3 e 13 como exemplo, mas existem diversos modelos matemáticos desenvolvidos para descrever o desempenho em concorrentes encadeados). O desempenho de escolha de humanos adultos em situação experimental, em resumo, tem apresentado uma variabilidade intersujeitos em diferentes estudos: existem evidências a favor e contra a generalidade da igualação para descrever a distribuição de respostas ou do tempo alocado. Conclusões finais são, no entanto, dificultadas pelas diferenças metodológicas geralmente existentes nos estudos com humanos e entre os estudos com humanos e outros animais. A discussão de algumas das importantes variáveis a serem consideradas foi apresentada e pode explicar pelo menos parte das discrepâncias encontra- ANÁLISE DO COMPORTAMENTO das nos resultados com animais infra-humanos e humanos. APLICAÇÕES DA RELAÇÃO DE IGUALAÇÃO Um dos relatos que confirma a adequação da relação de igualação para descrever o comportamento humano em um ambiente natural é bastante recente (Symons et al., 2003) e replica estudos anteriores (p. ex.: Carr e McDowell, 1980; McDowell, 1981). Esse estudo foi realizado com um homem de 36 anos com diagnóstico de autismo e retardo mental profundo, que batia a mão na cabeça ou nas pernas com força. Os comportamentos de automutilação e de comunicação apropriada foram analisados em relação à freqüência de interações com os profissionais (repreensão, dica, elogio e contato físico), as quais seguiam esses comportamentos. A freqüência relativa de automutilação decresceu com o aumento da freqüência relativa de reforçamento de comunicações apropriadas, conforme a predição da relação de igualação. O comportamento de atletas, quando escolhem entre diferentes tipos de jogadas, é um contexto interessante para avaliar a relação de igualação. A predição é de que, por exemplo, a proporção de arremessos de 3 pontos por jogadores de basquete deve igualar a taxa relativa de cestas de 3 pontos, ou seja, o total de cestas de 3 pontos dividido pelas cestas de 2 e 3 pontos. Vollmer e Bourret (2000) avaliaram essa predição da igualação e comprovaram que, para os 14 jogadores que jogaram mais tempo, a distribuição de arremessos de 2 e 3 pontos na temporada universitária de basquete igualou às cestas realizadas de 2 e 3 pontos. A aplicação e a divulgação dos princípios comportamentais básicos têm enfatizado que, para aumentar a freqüência de um comportamento desejável, deve-se apresentar uma conseqüência reforçadora e, para diminuir ou para terminar um comportamento indesejável, a extinção ou a punição deve ser utilizada. Entretanto a análise comportamental aplicada pode ampliar as alternativas de intervenção ao 169 considerar os comportamentos e as conseqüências que concorrem com o comportamento-alvo de um indivíduo. Essa forma de análise entende que o tempo ou o esforço despendido em alguém ou em alguma situação é determinado pelas conseqüências dessa escolha em relação ao contexto de reforçamento total que o indivíduo obtém. Considerando-se que em um determinado período de tempo um indivíduo pode emitir uma quantidade finita de respostas e que a distribuição das respostas será proporcional à distribuição de reforços obtidos nas diversas alternativas disponíveis, é possível predizer aumento em um comportamento “desejável” não só quando os reforços do comportamento alvo forem aumentados, mas também quando reforços de comportamentos concorrentes forem reduzidos e uma diminuição em um comportamento “indesejável” não só quando os reforços do comportamento-alvo forem suspensos, mas também quando reforços de comportamentos concorrentes forem ampliados. Essas alternativas de intervenção são especialmente interessantes quando as conseqüências do comportamento-alvo são dificilmente modificadas – terapeuta, pais, professores não têm controle sobre a sua apresentação –, como no caso de reforçamento automático. Estendendo-se a igualação para os outros parâmetros de reforçamento, pode-se ampliar ainda mais as possibilidades de intervenção para mudanças na magnitude e na imediaticidade relativas do reforçador. Tomaremos como exemplo uma criança com dificuldade de concentrar sua atenção em tarefas escolares e que, muitas vezes, tira notas ruins devido à baixa freqüência de se engajar em tais tarefas. O procedimento mais comum utilizado pela escola é a adição de repreensão pelo professor ao comportamento indesejado do aluno. De acordo com a análise baseada na Equação 3, pode-se formular a hipótese de que a distribuição do comportamento do aluno reflete o valor relativo que as tarefas acadêmicas têm para ele. A repreensão da professora não adiciona reforçamento às tarefas acadêmicas e muito menos reduz os reforçamentos para comportamentos alternativos 170 ABREU-RODRIGUES, RIBEIRO & COLS. (p. ex.: conversar, brincar), portanto a predição é de que o comportamento do aluno não se modificará. Suponhamos que a repreensão seja realmente um estímulo aversivo para a criança; pode-se, então, pensar que, nesse caso, o valor reforçador das conseqüências para outras respostas seria reduzido e o aluno passaria a prestar mais atenção. É comum, entretanto, em uma sala de aula com muitos alunos que o comportamento indesejável seja conseqüenciado pelo professor apenas esporadicamente, e a possibilidade de punição passe a ser discriminada pela correlação com o olhar do professor. Na ausência dos estímulos discriminativos para a contingência que inclui repreensão, nenhuma mudança de comportamento é esperada. Se o professor, por outro lado, aumentasse o reforçamento para realizar tarefas acadêmicas (p. ex.: adequando a dificuldade da tarefa às condições da criança, criando formas para que o sucesso seja enfatizado, utilizando reforçadores naturais) ou diminuísse as fontes de reforçamento alternativos (p. ex.: tirando os brinquedos ou os coleguinhas “reforçadores” do ângulo de visão da criança), estaria aumentando o valor relativo das conseqüências do comportamento desejável e, portanto, esperar-se-ia um aumento das respostas nas tarefas acadêmicas. Note que a análise a partir da noção de igualação implica necessariamente que o valor reforçador das conseqüências seja definido pelos reforços obtidos e não pelos reforços programados. No exemplo em questão, portanto, se se trata de uma criança que não consegue aprender com a metodologia adotada, seu comportamento dificilmente será bem-sucedido, mesmo que a professora esteja decidida a, por exemplo, elogiar o empenho dela freqüentemente. Nesse caso, a mudança inicial dependerá também do replanejamento das tarefas de forma individualizada. Vários estudos confirmam as predições de aumento ou de diminuição no comportamento-alvo de estudantes quando a freqüência de reforçamento para algum outro comportamento é modificada na direção oposta (p. ex.: Ayllon, Layman e Kandel, 1975; Ayllon e Roberts, 1974; Kirby e Shields, 1972). Outros exemplos de aplicação em situação natural são apresentados no Capítulo 10 deste livro, que analisa o autocontrole como um tipo especial de comportamento de escolha. A relevância do tema para a aplicação não deve ser negligenciada pelo psicólogo que trabalha em contextos diferentes daquele no qual ocorre o comportamento-alvo do cliente. Se no consultório clínico a ênfase é dada ao comportamento-alvo, ele certamente saberá muito pouco sobre o valor relativo do reforçamento, e sua intervenção será limitada pelo desconhecimento de fatores determinantes. A aplicação do princípio de igualação a cada caso não é uma tarefa simples e possui limites metodológicos, conforme alerta Borrero e Vollmer (2002). Em seção anterior já explicitamos as condições necessárias para que a igualação ocorra em situações controladas (p. ex.: contingência para resposta de mudança, conc VI VI, comportamento estável). Essas condições devem ser lembradas também em uma análise funcional de fenômenos que ocorrem em situação natural, pois serão fatores limitantes também para a sua aplicação. CONCLUSÃO A Lei da Igualação e seu desenvolvimento contribuíram muito para a formalização de relações organismo-ambiente na análise do comportamento. Ao se trabalhar com a noção de escolha, ampliou-se o foco da análise das conseqüências de uma resposta para o contexto de reforçamento, que inclui as conseqüências de respostas concorrentes. Com essa mudança, novos fenômenos foram descobertos, e interpretações diferentes foram desenvolvidas. A relação de igualação, originalmente descrita no comportamento de pombos, tem sido generalizada para diferentes espécies, comportamentos e contextos diferentes. Entretanto o modelo já apresenta várias evidências de desvios (principalmente no comportamento humano) e os dois parâmetros livres da Equação 3 (definidos como constantes empíricas) variam em função de diversos fatores (p. ex.: história experimental, número de sessões, tipo de esquema, tamanho do COD, estímulos discriminativos). Isto sugere que o modelo não é completo, apesar de sua utilidade como instrumen- ANÁLISE DO COMPORTAMENTO to para analisar e descrever um conjunto de relações freqüentemente encontradas no laboratório. Em decorrência disso, modelos matemáticos diferentes têm sido propostos (p. ex.: Killeen, 1982; Killeen e Fantino, 1990), mas nenhum deles é, ao mesmo tempo, tão simples e tão geral. Vários estudos com humanos têm confirmado a possibilidade de aplicação e exemplificado de que forma essa ferramenta de análise pode ser útil em contextos clínicos, esportivos e escolares, com diversos outros ainda necessitando ser explorados. A pesquisa básica avançou muito nesse assunto nas últimas décadas. A aplicação desse conhecimento é um acontecimento relativamente recente e com evidências de sucesso. No Brasil, nossa contribuição tem sido significativa no que se refere à pesquisa básica, mas estudos sobre a aplicação desse conhecimento ainda são escassos. REFERÊNCIAS BIBLIOGRÁFICAS Alsop, B.; Davison, M. (1988). Concurrent-chain performance: Effects of absolute and relative terminal-link entry frequency. Journal of the Experimental Analysis of Behavior, 49, 351-365. Alsop, B.; Elliffe, D. (1988). Concurrent-schedule performance: Effects of relative and overall reinforcer rate. Journal of the Experimental Analysis of Behavior, 49, 21-36. Autor, S. M. (1969). The strength of conditioned reinforcers as a function of frequency and probability of reinforcement. In D. P. Hendry (Ed.), Conditioned reinforcement (p. 127-162). Homewood, IL: Dorsey Press. Ayllon, T.; Layman, D.; Kandel, H. (1975). A behavioraleducational alternative to drug control of hyperactive children. Journal of Applied Behavior Analysis, 8, 137146. Ayllon, T.; Roberts, M. (1974). Eliminating discipline problems by strengthening academic performance. Journal of Applied Behavior Analysis, 7, 71-76. Azzi, R.; Fix, D. S. R.; Keller, F. S.; Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. Bacotti, A. V. (1977). Matching under concurrent fixedratio, variable-interval schedules of food presentation. Journal of the Experimental Analysis of Behavior, 27, 171-182. Baum, W. M. (1974a). Choice in free-ranging wild pigeons. Science, 185, 78-79. 171 Baum, W. M. (1974b). On two types of deviation from the matching law: Bias and undermatching. Journal of the Experimental Analysis of Behavior, 22, 231-242. Baum, W. M. (1975). Time allocation in human vigilance. Journal of the Experimental Analysis of Behavior, 23, 45-53. Baum, W. M. (1979). Matching, undermatching, and overmatching in studies of choice. Journal of the Experimental Analysis of Behavior, 32, 269-281. Baum, W. M. (1982). Choice, changeover and travel. Journal of the Experimental Analysis of Behavior, 38, 35-49. Baum, W. M. (1983). Matching, statistics, and common sense. Journal of the Experimental Analysis of Behavior, 39, 499-501. Baum, W. M.; Rachlin, H. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior, 12, 861-874. Boelens, H.; Kop, P. F. M. (1983). Concurrent schedules: Spatial separation of response alternatives. Journal of the Experimental Analysis of Behavior, 40, 35-45. Borges, F. S. (2002). Comportamento de escolha em humanos: Um estudo da diferença entre dizer e fazer. Dissertação de Mestrado não publicada, Universidade Católica de Goiás, Goiânia, GO. Borrero, J. C.; Vollmer, T. R. (2002). An application of the matching law to severe problem behavior. Journal of Applied Behavior Analysis, 35, 13-27. Bradshaw, C. M.; Szabadi, E. (1988). Quantitative analysis of human operant behavior. Em G. Darvey e D. Cullen (Eds.), Human operant conditioning and behavior modification (p. 225-259). Chichester, Sussex: Wiley. Bradshaw, C. M.; Szabadi, E.; Bevan, P. (1976). Behavior of humans in variable-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 26, 135-141. Bradshaw, C. M.; Szabadi, E.; Bevan, P. (1979). The effect of punishment on free-operant choice behavior in humans. Journal of the Experimental Analysis of Behavior, 31, 71-81. Buskist, W. F.; Miller, H. L.; Jr. (1981). Concurrent operant performances in humans: Matching when food is the reinforcer. Psychological Record, 31, 95-100. Carr, E. G.; McDowell, J. J. (1980). Social control of self-injurious behavior of organic etiology. Behavior Therapy, 11, 402-409. Chavarro, A.; Logue, A. W. (1988). Sensitivity to amount and delay of reinforcement: Effects of different types of concurrent variable-interval schedules. The Psychological Record, 38, 421-435. Chung, S. H.; Herrnstein, R. J. (1967). Choice and delay of reinforcement. Journal of the Experimental Analysis of Behavior, 10, 67-74. Conger, R.; Killeen, P. (1974). Use of concurrent operants in small group research: A demonstration. Pacific Sociological Review, 17, 399-416. Cunha, R. N. (1988). Análise das equações de Baum e Davison: Esquemas de tempo e razão. Dissertação de 172 ABREU-RODRIGUES, RIBEIRO & COLS. Mestrado não publicada, Universidade de Brasília, Brasília, DF. Davison, M. (1988). Concurrent schedules: Interaction of reinforcer frequency and reinforcer duration. Journal of the Experimental Analysis of Behavior, 49, 339-349. Davison, M.; Hogsden, I. (1984). Concurrent variableinterval schedule performance: Fixed versus mixed reinforcer durations. Journal of the Experimental Analysis of Behavior, 41, 169-182. de Villiers, P. A. (1977). Choice in concurrent schedules and a quantitative formulation of the law of effect. Em W. K. Honig; J. E. R. Staddon (Orgs.), Handbook of operant behavior (p. 233-287). Englewood Cliffs, NJ: Prentice Hall. Dunn, R. (1990). Timeout from concurrent schedules. Journal of the Experimental Analysis of Behavior, 53, 163-174. Ferster, C. B.; Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, 123-144. Hanna, E. S. (1991). Behavior analysis of complex learning: Some determinants of choice. Tese de Doutorado não publicada, University of Wales, College of Cardiff, Cardiff, UK. Hanna, E. S.; Blackman, D. E.; Todorov, J. C. (1992). Stimulus effects on concurrent performance in transition. Journal of the Experimental Analysis of Behavior, 58, 335-347. Hanna, E. S.; Todorov, J. C.; Paula, S. M. A. (1985). Efeito da sinalização dos esquemas na sensibilidade do desempenho concorrente a variações nas proporções de reforços. Anais da XV Reunião Anual de Psicologia (p. 82). Ribeirão Preto, SP: SPRP. Herrnstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267272. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Herrnstein, R. J.; Vaughan, W. Jr. (1980). Melioration and behavioral allocation. Em J. E. R. Staddon (Ed.), Limits to action: The allocation of individual behavior (p. 143-176). New York: Academic Press. Horne, P. J.; Lowe, C. F. (1993). Determinants of human performance on concurrent schedules. Journal of the Experimental Analysis of Behavior, 59, 29-60. Kelleher, R. T.; Gollub, L. R. (1962). A review of positive conditioned reinforcement. Journal of the Experimental Analysis of Behavior, 5, 543-597. Keller, F. S.; Schoenfeld, W. N. (1950). Principles of psychology. New York: Appleton-Century-Crofts. Killeen, P. R. (1982). Incentive theory: II. Models for choice. Journal of the Experimental Analysis of Behavior, 38, 217-232. Killeen, P. R.; Fantino, E. (1990). Unification of models for choice between delayed reinforcers. Journal of the Experimental Analysis of Behavior, 53, 189-200. Kirby, F.; Shields, F. (1972). Modification of arithmetic response rate and attending behavior in a seventh-grade student. Journal of Applied Behavior Analysis, 5, 79-84. Kraft, J. R.; Baum, W. M. (2001). Group choice: The ideal free distribution of human social behavior. Journal of the Experimental Analysis of Behavior, 76, 21-42. Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral and Brain Sciences, 11, 665-679. Logue, A. W.; Chavarro, A. (1987). The effect on choice of absolute and relative values of reinforcer delay, amount, and frequency. Journal of Experimental Psychology: Animal Behavior Processes, 13, 280-291. Logue, A. W.; Peña-Correal, T. E.; Rodriguez, M. L.; Kabela, E. (1986). Self-control in adult humans: Variation in positive reinforcer amount and delay. Journal of the Experimental Analysis of Behavior, 46, 159-173. Lowe, C. F.; Horne, P. J. (1985). On the generality of behavioural principles: Human choice and the matching law. Em C. F. Lowe, M. Richelle, D. E. Blackman e C. M. Bradshaw (Eds.), Behaviour Analysis and Contemporary Psychology (p. 97-115). Londres: Erlbaum. MacEween, D. (1972). The effects of terminal-link fixed-interval and variable-interval schedules on responding under concurrent chained schedules. Journal of the Experimental Analysis of Behavior, 18, 253-261. Matthews, L. R.; Temple, W. (1979). Concurrent schedule assessment of food preference in cows. Journal of the Experimental Analysis of Behavior, 32, 245-254. McDowell, J. J. (1981). On the validity and utility of Herrnstein’s hyperbola in applied behavior analysis. Em C. M. Bradshaw, E. Szabadi e C. F. Lowe (Eds.), Quantification of steady-state operant behaviour (p. 311324). Amsterdam: Elsevier/North-Holland. McDowell, J. J. (1988). Matching theory in natural human environments. The Behavior Analyst, 11, 95-109. Navarick, D. J.; Chellsen, J. (1983). Matching versus undermatching in the choice of humans. Behavior Analysis Letters, 3, 325-335. Neuringer, A. J. (1967). Effects of reinforcement magnitude on choice and rate of responding. Journal of the Experimental Analysis of Behavior, 10, 417-424. Neves, S. M. M. (1989). Comportamento de escolha em humanos: Influência de diferentes freqüências e magnitudes de reforço. Dissertação de Mestrado não publicada, Universidade de Brasília, Brasília, DF. Oscar-Berman, M.; Heyman, G. M.; Bonner, R. T.; Ryder, J. (1980). Human neuropsychology: Some differences between Korsakoff and normal operant performance. Psychological Research, 41, 235-247. Oscós, A.; Todorov, J. C. (1978). On frequency and magnitude of reinforcement in concurrent schedules. Revista Mexicana de Análisis de La Conducta, 4, 217-221. Pierce, W. D.; Epling, W. F. (1983). Choice, matching, and human behavior: A review of the literature. The Behavior Analyst, 6, 57-76. ANÁLISE DO COMPORTAMENTO Pierce, W. D.; Epling, W. F. (1995). The applied importance of research on the matching law. Journal of Applied Behavior Analysis, 28, 237-241. Pierce, W. D.; Epling, W. F.; Greer, S. M. (1981). Human communication and the matching law. Em C. M. Bradshaw, E. Szabadi e C. F. Lowe (Eds.), Quantification of steady-state operant behaviour (p. 345-348). Amsterdam: Elsevier/North Holland Biomedical Press. Pliskoff, S. S.; Fetterman, J. G. (1981). Undermatching and overmatching: The fixed-ratio changeover requirement. Journal of the Experimental Analysis of Behavior, 36, 21-27. Pliskoff, S. S.; Cicerone, R.; Nelson, T. D. (1978). Local response-rate constancy on concurrent variable-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 29, 431-446. Rachlin, H. (1989). Judgment, decision and choice. New York: Freeman. Rachlin, H.; Battalio, R.; Kagel, J. H.; Green, L. (1981). Maximization theory in behavioral psychology. The Behavioral and Brain Sciences, 4, 371-417. Rachlin, H.; Logue, A. W.; Gibbon, J.; Frankel, M. (1986). Cognition and behavior in studies of choice. Psychological Review, 93, 33-45. Rodriguez, M. L.; Logue, A. W. (1986). Independence of the amount and delay rations in the generalized matching law. Animal Learning and Behavior, 14, 29-37. Savastano, H. I.; Fantino, E. (1984). Human choice in concurrent ratio-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 61, 453-463. Schneider, J. W. (1973). Reinforcer effectiveness as a function of reinforcer rate and magnitude: A comparison of concurrent performances. Journal of the Experimental Analysis of Behavior, 20, 461-471. Shull, R. L.; Pliskoff, S. S. (1967). Changeover delay and concurrent schedules: Some effects on relative performance measures. Journal of the Experimental Analysis of Behavior, 10, 517-527. Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193-216. Skinner, B. F. (1953). Science and human behavior. New York: McMillan. Solnick, J. V.; Kannenberg, C. H.; Eckerman, D. A.; Walter, M. B. (1980). An experimental analysis of impulsivity and impulse control in humans. Learning and Motivation, 11, 61-77. Squires, N.; Fantino, E. (1971). A model for choice in simple concurrent and concurrent-chains schedules. Journal of the Experimental Analysis of Behavior, 15, 27-38. Symons, F. J.; Hoch, J.; Dahl, N. A.; McComas, J. J. (2003). Sequential and matching analyses of selfinjurious behavior: A case of overmatching in the natural environment. Journal of Applied Behavior Analysis, 36, 267-270. Takahashi, M.; Iwamoto, T. (1986). Human concurrent performances: The effects of experience, instructions, 173 and schedule-correlated stimuli. Journal of the Experimental Analysis of Behavior, 45, 257-267. Todorov, J. C. (1971a). Análise experimental do comportamento de escolha: Algumas considerações sobre método em psicologia. Ciência e Cultura, 23, 585-589. Todorov, J. C. (1971b). Concurrent performances: Effect of punishment contingent on the switching response. Journal of the Experimental Analysis of Behavior, 16, 51-62. Todorov, J. C. (1972). Component duration and relative response rates in multiple schedules. Journal of the Experimental Analysis of Behavior, 17, 45-49. Todorov, J. C. (1973). Interaction of frequency and magnitude of reinforcement on concurrent performances. Journal of the Experimental Analysis of Behavior, 19, 451-458. Todorov, J. C. (1974). Desempenhos concorrentes: Frequência de reforçamento e razão de respostas de mudança. Anais da IV Reunião Anual de Psicologia (p. 1). Ribeirão Preto, SP: SPRP. Todorov, J. C. (1982). Matching and bias in concurrent performances: Effects of asymmetrical changeover delays. Revista Mexicana de Análisis de La Conducta, 8, 39-45. Todorov, J. C. (1983). Estados de transição e estados transitórios. Anais da XIII Reunião Anual de Psicologia, 13, 327-342. Todorov, J. C. (1991a). Relações quantitativas entre medidas relativas de respostas e de atraso de reforço. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 1). Ribeirão Preto, SP: SBP. Todorov, J. C. (1991b). O pressuposto da relatividade na lei generalizada de igualação. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 2). Ribeirão Preto, SP: SBP. Todorov, J. C. (1991c). Efeitos de freqüências absoluta e relativa de reforços no desempenho concorrente: Uma re-análise dos dados de Alsop e Elliffe (1988). Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 3). Ribeirão Preto, SP: SBP. Todorov, J. C. (1991d). Efeitos da freqüência absoluta de reforços na relação entre preferência e magnitude relativa de reforços: Uma re-análise de Davison (1988). Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 4). Ribeirão Preto, SP: SBP. Todorov, J. C. (1991e). Sobre uma alegada violação do pressuposto da relatividade quando a magnitude de reforço varia em esquemas concorrentes. Resumos de Comunicações Científicas da XXI Reunião Anual de Psicologia (p. 5). Ribeirão Preto, SP: SBP. Todorov, J. C. (1991f). Trinta anos de matching law: Evolução na quantificação da lei do efeito. Anais da XXI Reunião Anual da Sociedade de Psicologia de Ribeirão Preto, 300-314. Todorov, J. C.; Acuña-Santaella, L. E.; Falcón-Sanguinetti, O. (1982). Concurrent procedures, changeover delay and the choice behavior of rats. Revista Mexicana de Análisis de la Conducta, 8, 133-144. Todorov, J. C.; Bigonha, V. A. (1982, outubro). Esquemas concorrentes: Viés provocado pela qualidade do es- 174 ABREU-RODRIGUES, RIBEIRO & COLS. quema. Trabalho apresentado na XII Reunião Anual da Sociedade de Psicologia de Ribeirão Preto, Ribeirão Preto, SP. Todorov, J. C.; Coelho, C.; Beckert, M. E. (1993). Efeito da freqüência absoluta de reforços em situação de escolha: Um teste do pressuposto da relatividade na Lei da Igualação. Psicologia: Teoria e Pesquisa, 9, 227242. Todorov, J. C.; Hackradt, S. X. (1980). Problemas na determinação de relações quantitativas em esquemas concorrentes intervalo variável – razão fixa. Anais da X Reunião Anual de Psicologia (p. 10). Ribeirão Preto, SP: SPRP. Todorov, J. C.; Hackradt, S. (1981). Esquemas concorrentes intervalo variável – razão fixa: Efeitos da qualidade e do intervalo entre reforços. Ciência e Cultura, 33, 812. Todorov, J. C.; Hanna, E. S.; Bittencourt de Sá, M. C. N. (1984). Frequency versus magnitude of reinforcement: New data with a different procedure. Journal of the Experimental Analysis of Behavior, 41, 157-167. Todorov, J. C.; Hanna, E. S.; Medeiros, C. A.; Coelho, C.; Seco, D. (2003). Escolha em esquemas concorrentes encadeados: Teste de um novo procedimento. Estudos: Vida e Saúde, Goiania, 30, 1097-1106. Todorov, J. C.; Oliveira-Castro, J. M.; Hackradt, S. X. (1982). Relaciones cuantitativas en programas concurrentes intervalo variable – razon fija: Preferencia como una función de los parametros del programa. Trabalho apresentado no VI Congresso Mexicano de Análise do Comportamento, México, DF. Todorov, J. C.; Oliveira-Castro, J. M.; Hanna, E. S.; Bittencourt de Sá, M. C. N.; Barreto, M. Q. (1983). Choice, experience, and the generalized matching law. Journal of the Experimental Analysis of Behavior, 40, 99-111. Todorov, J. C.; Ramirez, M. A. R. (1981). Delay of reinforcement for responses which end pauses: Effects on response rate. Revista Mexicana de Análisis de La Conducta, 7, 135-139. Todorov, J. C.; Souza, D. G. (1978). Minimum interchangeover intervals in concurrent schedules. Revista Mexicana de Análisis de la Conducta, 4, 17-28. Vollmer, T. R.; Bourret, J. (2000). An application of the matching law to evaluate the allocation of two- and three-point shots by college basketball players. Journal of Applied Behavior Analysis, 33, 137-150. Williams, B. A.; Fantino, E. (1978). Effects on choice of reinforcement delay and conditioned reinforcement. Journal of the Experimental Analysis of Behavior, 29, 77-86. ANÁLISE DO COMPORTAMENTO AUTOCONTROLE: UM CASO ESPECIAL DE COMPORTAMENTO DE ESCOLHA 175 10 ELENICE S. HANNA MICHELA RODRIGUES RIBEIRO O termo autocontrole é, muitas vezes, relacionado com traços de personalidade, com características inatas dos indivíduos ou com uma força interior que possibilita o controle de suas próprias ações. Esse uso do conceito contrasta com o fato de que uma mesma pessoa pode apresentar graus diferentes de autocontrole em situações diferentes e mostrar graus de autocontrole diferenciado em situações semelhantes, mas em etapas diversas da sua vida. As crianças geralmente são descritas como impulsivas. Muitos adultos, mesmo com vontade, não choram quando sentem desconforto, enquanto as crianças dificilmente ficam quietas quando se sentem incomodadas com algo. Quando “agimos com responsabilidade”, “para ser educado”, “para prevenir doenças” ou “para ser ecologicamente correto”, em geral, é possível que não estejamos fazendo “aquilo que mais desejaríamos naquele momento”, e sim pensando ou agindo em função das oportunidades futuras de ações e suas conseqüências. A importância desse fenômeno pela sua possível relação com a auto-regulação, com a preservação da espécie e do meio ambiente justificaria quaisquer esforços para explicitar melhor a influência do meio ambiente sobre a aquisição e a manutenção de formas de agir que possam ser chamadas de autocontrole (Hanna e Todorov, 2002). O estudo do autocontrole na análise experimental do comportamento está inserido na área de comportamento de escolha, sendo o estudo de Rachlin e Green (1972) sobre escolha com compromisso (commitment) um clássico que provavelmente inspirou muitos outros que o seguiram. Durante as décadas de 1970 e 1980, o comportamento de escolha e a quantificação da lei do efeito, com destaque para a relação de igualação (Baum, 1974; Herrnstein, 1970), dominaram o cenário da pesquisa básica. Uma das premissas que possivelmente explica essa concentração de esforços é a de que todo comportamento pode ser visto como um comportamento de escolha, ou que todo comportamento envolve escolha (Herrnstein, 1970; Todorov, 1971). Mesmo em um ambiente bastante simplificado, como em uma sala experimental, uma pessoa pode escolher entre pressionar uma tecla, coçar-se, virar-se ou dormir, entre outros. As conseqüências dessas respostas são cruciais para a determinação de preferências em determinados contextos (Mazur, 1986). Escolhas tais como pressionar uma tecla com o dedo indicador ou com o dedo médio podem ter conseqüências fugazes ou insignificantes, enquanto escolhas como tomar uma vacina ou prestar um concurso que define uma profissão podem ter conseqüências importantes e irreversíveis. A premissa de que todo comportamento pode ser analisado como uma escolha implica, portanto, afirmar que teorias e pesquisas sobre escolha podem ser consideradas como teorias ou pesquisas sobre o comportamento em geral. 176 ABREU-RODRIGUES, RIBEIRO & COLS. DEFINIÇÃO DO TEMA O trabalho de tradução de termos mentalistas em interações comportamento-ambiente de Skinner incluiu o termo autocontrole. No livro Ciência e comportamento humano (Skinner, 1953) um capítulo foi dedicado à discussão de que “O indivíduo freqüentemente passa a controlar parte do seu próprio comportamento quando uma resposta tem conseqüências conflitantes – quando leva a ambos os reforçamentos positivo e negativo” (p. 230). O “controle do próprio comportamento” ocorre quando um comportamento (autocontrole ou resposta controladora) tem como conseqüência a modificação de elementos de contingências que determinam comportamentos subseqüentes (resposta controlada). Em geral, chamamos de autocontrole quando a resposta controladora deliberadamente é emitida para reduzir impulsos. Nesse caso, é importante considerar a história individual dentro de uma comunidade que estabelece propriedades aversivas para o comportamento impulsivo e, portanto, respostas que reduzem a probabilidade desse comportamento podem ser fortalecidas. Apesar da contribuição conceitual de Skinner para a compreensão do autocontrole como um fenômeno natural, foi Rachlin (1970) quem introduziu o autocontrole no programa de pesquisa dos analistas experimentais do comportamento. Para Rachlin (p. 185): Autocontrole é na realidade uma designação incorreta para qualquer tipo de mudança autoinduzida, pois, embora padrões de comportamento possam vir de dentro de nós mesmos, no sentido de que eles foram adquiridos antes ou pouco depois do nascimento, sejam quais forem as causas que fizeram esses padrões aparecerem em um dado momento, devem vir das interações com o ambiente naquele momento. Dessa forma, autocontrole na realidade refere-se a certas formas de controle ambiental do comportamento. Rachlin (1970; ver também Rachlin e Green, 1972) define o autocontrole como a escolha de uma recompensa maior no futuro con- tra uma recompensa menor no presente. Na análise de Rachlin, portanto, o autocontrole envolve uma situação de escolha na qual as alternativas de resposta diferem quanto ao atraso e à magnitude do estímulo reforçador, sendo um reforçador maior e mais atrasado e o outro, menor e imediato (ou menos atrasado). Talvez a conseqüência mais importante da introdução do termo autocontrole na análise experimental tenha sido a de estabelecer como foco de pesquisa a escolha em situações de conflito. Em situações de escolha que diferem apenas no atraso, observa-se uma preferência pela alternativa com o menor atraso (p. ex.: Chung e Herrnstein, 1967). Naquelas que diferem apenas na magnitude do reforço, a preferência pela maior magnitude é observada (p. ex.: Catania, 1963). Quando as alternativas de esquemas concorrentes ou concorrentes encadeados combinam o maior reforçador com o maior atraso e o menor reforçador com o menor atraso, mesmo predições qualitativas não podem ser feitas. A situação é conflituosa no sentido de que cada uma das alternativas apresentadas para o sujeito possui características que seriam favorecidas em termos comportamentais se, em um dado momento, apenas uma variável tivesse sendo manipulada (Hanna, 1991). O atraso de reforçamento foi definido por Neuringer (1969) como o intervalo de tempo entre a resposta e o reforçamento para aquela resposta. Gentry e Marr (1980) sugeriram que o atraso de reforçamento deveria ser definido como um esquema de tempo fixo (FT) em vez de um parâmetro do reforçamento, analisando a contingência não mais como esquemas concorrentes simples, mas como esquemas concorrentes encadeados. Modelos de desempenhos sob esquemas concorrentes encadeados fornecem uma descrição melhor para os efeitos de contingências que incluem esses períodos do que modelos para esquemas concorrentes sem atraso. Na realidade, atraso de reforçamento tem sido usado como um termo genérico que descreve vários procedimentos que introduzem um período de tempo entre a resposta requerida e a ocorrência de reforçamento (Sizemore e Lattal, 1978). Como resultado disso, nos procedimen- ANÁLISE DO COMPORTAMENTO tos de escolha com atraso é difícil traçar uma linha entre esquemas concorrentes e concorrentes encadeados (Hanna, 1991). A segunda variável presente no paradigma do autocontrole é a magnitude de reforçamento. Magnitude de reforçamento é um termo que se refere a vários parâmetros do reforçamento: pesos ou tamanhos, número de unidades de pesos ou tamanhos iguais, duração de exposição, tempo de acesso ou concentração de um nutriente solúvel (Guttman, 1953). No caso de sujeitos humanos, a magnitude pode estar relacionada também ao número de pontos recebidos, às fichas, à quantidade de dinheiro ou ao tempo de acesso a um jogo ou vídeo (p. ex.: Darcheville, Rivière e Wearden, 1993; Millar e Navarick, 1984). A equivalência funcional desses diferentes aspectos de reforçamento tem sido questionada (Bonem e Crossman, 1988), e estudos adicionais são necessários para se chegar a uma conclusão sobre as evidências empíricas contraditórias. Embora a proposta inicial de Rachlin (1970) faça referência ao atraso e à magnitude de reforçamento, situações de conflito não são restritas a essas variáveis, e contingências semelhantes podem ser estudadas, covariandose inversamente quaisquer dois parâmetros de reforçamento com efeitos semelhantes sobre a escolha. Algumas situações desse tipo já foram investigadas, como probabilidade e magnitude, custo de resposta e magnitude, entre outros (p. ex.: Cole, 1990; Downey e Vuchinich, 1990; Grossbard e Mazur, 1986; Rachlin, Castrogiovanni e Cross, 1987). CONTRIBUIÇÕES DA PESQUISA BÁSICA O paradigma proposto por Rachlin (1970) trata o autocontrole como formas de comportamento sujeitas a influências ambientais, permitindo, assim, o estudo experimental desse fenômeno. Entre as variáveis que têm sido investigadas estão os parâmetros de reforçamento (atraso, probabilidade, freqüência, qualidade e magnitude), a privação, a economia alimentar e os aspectos de procedimento (forma de programar o esquema concorrente, es- 177 tímulos discriminativos e esvanecimento, para citar alguns). Ainda utilizando o atraso do reforçamento como base do autocontrole, o modelo de Mischel de atraso de gratificação (Mischel, Shoda e Rodriguez, 1989) tem mostrado uma correlação positiva entre atraso de gratificação e desempenho escolar, inteligência e habilidades sociais. No procedimento utilizado por Mischel e colaboradores, os participantes deviam escolher entre recompensas maiores e menores em situações reais ou hipotéticas. O participante permanecia em uma sala e era instruído a escolher entre esperar pelo retorno do experimentador para receber a recompensa maior ou chamá-lo para receber a recompensa menor. Os efeitos de outras variáveis como ausência ou presença da recompensa no momento da escolha (p. ex.: Mischel e Ebbesen, 1970; Mischel, Ebbesen e Zeiss, 1972), tipo de instrução (p. ex.: Mischel et al., 1989) também foram analisados em relação ao desempenho na tarefa de atraso de gratificação. Entre os vários achados relatados na literatura, aqueles gerados por manipulações nos valores relativos e absolutos dos atrasos de reforçamento e pelo procedimento de esvanecimento do atraso são os mais robustos e já foram objeto de replicações. Esses e outros resultados serão detalhados a seguir. No estudo clássico de Rachlin e Green (1972), foi utilizada a contingência, apresentada na Figura 10.1, com pombos, chamada de escolha com compromisso. No elo inicial do procedimento (esquemas concorrentes encadeados), foram programadas duas alternativas de respostas (chaves A e B), cada uma levando a um elo terminal diferente. Respostas em A produziam eventualmente as condições de estímulo para R1 e R2, enquanto respostas em B produziam apenas as condições de estímulo para R1. A emissão de R2 era seguida imediatamente por uma pequena quantidade de alimento, e a emissão de R1 era seguida por uma quantidade maior de alimento após um atraso, caracterizando a alternativa de autocontrole. No estudo de Rachlin e Green (1972), alguns pombos foram expostos a esquemas 178 ABREU-RODRIGUES, RIBEIRO & COLS. FIGURA 10.1 Diagrama da contingência de comprometimento utilizada por Rachlin e Green (1972). concorrentes com um único esquema de razão fixa (FR) 25 operando no elo inicial, ou seja, entradas no elo terminal ocorriam após a vigésima quinta resposta independentemente de qual chave havia sido bicada nas 24 respostas anteriores. Se a 25a resposta ocorresse na chave B, no elo terminal sinalizado pela iluminação de uma das chaves de resposta, determinada randomicamente em cada tentativa, era requerida uma única resposta nessa chave, seguida por 4 s de blackout e, então, por 4 s de acesso ao alimento (elo de compromisso com a alternativa de autocontrole). Se a vigésima quinta resposta ocorresse na chave A, no elo terminal sinalizado pela iluminação das duas chaves (elo de escolha), as aves podiam escolher entre 4 s de alimento atrasado por 4 s e 2 s de alimento apresentado imediatamente após a resposta seguidos por 6 s de blackout (período para igualar a freqüência de reforços programada para o elo de compromisso). Entre o elo inicial e os elos terminais foi programado um período (T) de blackout, o qual foi variado ao longo do experimento. Para T menor do que 4 s, os pombos quase que exclusivamente responderam na chave que levava ao elo terminal com escolha e, então, respondiam na alternativa com o reforçamento imediato. Entretanto, com valores de T maiores do que 4 s, a preferência pelo elo de compromisso desenvolveuse para três dos cinco pombos (inversão da preferência) e dois mostraram uma distribuição do responder entre as duas alternativas. Portanto, as escolhas relativas do elo de compromisso aumentaram conforme o aumento do valor de T. A generalidade do modelo foi confirmada por estudos posteriores que relataram resultados semelhantes: Ainslie (1974), com um procedimento de comprometimento diferente, no qual os operantes eram bicar ou não bicar; Ainslie e Herrnstein (1981) e Green e colaboradores (1981), com procedimentos de tentativas discretas, e Deluty (1981), com ratos e reforçamento negativo (ver também Logan, 1965; Fantino, 1966). Entretanto, quando os pombos podiam mudar sua escolha durante o atraso longo da alternativa de autocontrole, Logue e Peña-Correal (1984) observaram um aumento no número de reforços imediatos obtidos (ver também Green e Rachlin, 1996; Siegel e Rachlin, 1995). ANÁLISE DO COMPORTAMENTO De acordo com os resultados ora mencionados, a alternativa com o reforço maior e atrasado no elo terminal com escolha é sistematicamente excluída. Diversos estudos posteriores, com manipulações semelhantes dos valores relativos do atraso, utilizaram uma situação única de escolha, como a apresentada no elo de escolha da Figura 10.1 (p. ex.: Green e Snyderman, 1980; Logue e Peña-Correal, 1984; Logue et al., 1986; Ribeiro, 1999; Ribeiro e Hanna, 2000; Snyderman, 1983). Ao utilizar essa contingência de escolha simples, autocontrole refere-se a cada escolha pelo reforçamento maior atrasado ou à preferência por essa alternativa em escolhas repetidas. Com a adição de valores iguais aos atrasos de reforçamento das duas alternativas de resposta, observou-se também um aumento nas escolhas de autocontrole e inversão na preferência, replicando os resultados produzidos pelo aumento de T em Rachlin e Green (1972), sem utilizar a alternativa de compromisso. Além do efeito dos valores relativos do atraso de reforçamento descrito antes, observou-se também que aumentos nos valores absolutos dos atrasos, com a manutenção dos valores relativos, diminuem as escolhas relativas pela alternativa de autocontrole (Green e Snyderman, 1980; Ribeiro e Hanna, 2000; Snyderman, 1983), embora esse efeito possa ser minimizado, limitando-se à amplitude de 179 variação dos valores absolutos dos parâmetros de reforçamento (Logue, 1988). As primeiras tentativas de formalizar os efeitos dos valores relativos do reforçamento sobre o autocontrole (Ainslie, 1975; Rachlin, 1970) usaram gradientes de atraso hipotéticos, na forma de hipérbole, para ilustrar o fenômeno de inversão de preferência. A Figura 10.2 ilustra o modelo Rachlin-Ainslie, no qual se assume que cada uma das magnitudes de reforço gera um gradiente de valor de reforçamento que diminui com a distância temporal do estímulo reforçador. Na Figura 10.2, o reforçador menor gera o gradiente Gm, e o reforçador maior gera o gradiente GM. Y, I e X representam três momentos diferentes em que escolhas podem ocorrer com distância temporal diferente dos reforçadores, mantendo-se constantes as magnitudes dos reforçadores e a distância entre eles. O ponto onde os dois gradientes se cruzam (ponto de indiferença) ocorre no tempo I, quando os valores das alternativas são iguais e a predição é de que as escolhas dos sujeitos se distribuem de forma eqüitativa entre elas. Em qualquer ponto à esquerda de I (p. ex.: Ponto X), o valor do reforçamento da alternativa de autocontrole é maior do que o da alternativa de impulsividade e, portanto, o modelo prediz preferência para o reforçador maior e mais atrasado. Em qualquer ponto à direita do Ponto I (p. ex.: Ponto Y), o FIGURA 10.2 Gradientes hipotéticos de atraso para o estímulo reforçador de maior magnitude (GM) e para o de menor magnitude (Gm), de acordo com o modelo de Ainslie-Rachlin. 180 ABREU-RODRIGUES, RIBEIRO & COLS. gradiente da alternativa de autocontrole é mais baixo do que o gerado pela alternativa com o estímulo reforçador menor e, portanto, os organismos mudariam a preferência para a alternativa de impulsividade. O modelo pode ser exemplificado em uma situação de escolha, na qual Dona Maria deve decidir entre fazer uma poupança para comprar um carro ou manter gastos comprando roupas e guloseimas toda semana. O atraso para comprar o carro gera um gradiente semelhante ao representado pela curva GM, enquanto as miudezas que podem ser compradas imediatamente são representadas pela curva Gm. Quando a escolha da Dona Maria é realizada no ponto de ônibus e distante do momento de ir ao shopping, por exemplo, o mais provável é que ela decida por passar no banco para investir o dinheiro para comprar o carro (Ponto X). Por outro lado, se já estiver no shopping ou no supermercado, Dona Maria tenderia a gastar seu dinheiro em supérfluos (Ponto Y). O modelo também prediz pontos de indiferença diferentes com mudanças na distância temporal entre os dois reforçadores (imagine um dos gradientes sendo deslocado para a esquerda ou para a direita) ou com mudanças nos valores reais dos reforçadores (imagine um dos gradientes sendo deslocado para cima ou para baixo). Note, entretanto, que o formato das curvas que descrevem o declínio do valor do reforçamento como função do atraso (p. ex.: curvas mais agudas ou mais achatadas) é crucial para a precisão de qualquer predição e que tal formato pode variar mesmo com mudanças nas técnicas usadas para medir a relação entre escolha e valor do reforçamento (Ainslie, 1975). A complexidade do fenômeno parece ser uma das razões pelas quais modelos quantitativos de escolha no paradigma de autocontrole têm falhado para descrever com precisão os achados empíricos disponíveis. Um outro fator que pode aumentar escolhas de autocontrole refere-se a atividades desenvolvidas durante o período de espera (Mischel et al., 1972; Patterson e Mischel, 1975). Mischel e colaboradores (1972) observaram que as crianças esperavam mais pelo reforçamento de maior magnitude quando ti- nham a possibilidade de brincar durante o período de espera. Esses resultados foram replicados com pombos por Grosch e Neuringer (1981), ao adicionarem à situação de escolha uma alternativa de resposta que vigorava durante o atraso. A inclusão desses outros reforçadores durante o período de espera aumenta o valor relativo da alternativa de autocontrole possivelmente porque esses reforços se somam aos relacionados ao comportamento de autocontrole ou porque podem ter a função de reduzir o desconto que o atraso produziria se a alternativa adicional não estivesse presente. Um conjunto adicional de evidências empíricas sobre determinantes do autocontrole refere-se aos efeitos de história de reforçamento e ao papel dos estímulos discriminativos. Em estudos de autocontrole, diferenças individuais são encontradas nos resultados e quando condições de replicação são programadas, o desempenho prévio não é obtido. Conforme aponta Logue (1988), a variabilidade individual tem sido um problema para estudos quantitativos sobre autocontrole no laboratório, sugerindo que talvez a experiência passada seja responsável por parte dessa variabilidade. Alguns estudos já começaram a identificar as condições sob as quais a experiência anterior afeta a escolha no paradigma de autocontrole. A exposição a um procedimento de esvanecimento aditivo, no qual a diferença entre os atrasos de reforçamento das alternativas é introduzida gradualmente, favorece a preferência pela alternativa de autocontrole. Esse efeito de experiência ou de treino prévio foi primeiro demonstrado com pombos por Mazur e Logue (1978). Esse estudo comparou o desempenho de um Grupo Controle ao do Grupo Experimental. O Grupo Controle foi exposto à contingência de escolha no paradigma de autocontrole. O Grupo Experimental, inicialmente, escolheu entre alternativas diferindo na magnitude dos reforços que eram igualmente atrasados. O atraso para o estímulo reforçador menor foi gradualmente diminuído ao longo de um grande número de tentativas (cerca de 11 mil). Os sujeitos do Grupo Experimental escolheram a alternativa de autocontrole significativamente mais vezes do que os sujeitos do ANÁLISE DO COMPORTAMENTO Grupo Controle. Esses resultados foram replicados posteriormente por Logue e colaboradores (1984; ver também Logue e Mazur, 1981; Logue et al., 1987) em um estudo paramétrico com pombos e por Schweitzer e Sulzer-Azaroff (1988) com crianças. O efeito de experiência prévia sobre a escolha no paradigma de autocontrole foi confirmado por outros estudos (Eisenberger e Adornetto, 1986; Eisenberger e Masterson, 1987; Eisenberger, Masterson, e Lowman, 1982). Eisenberger e colaboradores concluíram que a exposição prévia a atrasos de reforçamento longos ou a tarefas que requerem muito esforço aumenta a tendência dos sujeitos (ratos ou crianças) ao autocontrole. Os efeitos generalizados de experiência prévia, encontrados pelo grupo de Eisenberger, colocam em dúvida a importância da manutenção dos estímulos discriminativos presentes na situação de treino para que um efeito robusto seja observado, já que, em seus estudos, o ambiente experimental durante o treino era diferente daquele onde o autocontrole era avaliado. Hanna (1991), por outro lado, observou que o efeito de história de reforçamento prévio foi observado apenas quando as condições de estímulos de treinos específicos eram mantidas no teste de autocontrole. Os experimentos conduzidos por Hanna (1991) utilizaram esquemas múltiplos durante a condição de treino, com componentes que diferiam no valor da magnitude e/ou do atraso de reforçamento. Em parte desses experimentos, as condições de estímulo de cada componente foram mantidas durante todas as sessões de treino, enquanto em outra parte as condições de estímulo dos dois componentes eram invertidas a cada sessão. Condições de teste em situação de autocontrole mostraram que a exposição aos treinos com estímulos discriminativos sistematicamente variados (e, portanto, irrelevantes) não alteraram o comportamento de escolha. O treino em esquemas múltiplos com estímulos discriminativos fixos, sinalizando atrasos diferentes, diminuiu temporariamente as escolhas na alternativa de autocontrole. Esse efeito de diminuição do número de escolhas que implica menor espera 181 pelo reforçador foi, no entanto, temporário, retornando o comportamento a níveis anteriores ao do treino, com a exposição continuada à situação de escolha. Em resumo, experiências com aumentos graduais do atraso de reforçamento e em condições com alto custo de resposta parecem aumentar as escolhas pela alternativa de autocontrole. Os efeitos dessas histórias de reforçamento, entretanto, não têm sido facilmente replicados e requerem estudos adicionais para ser possível identificar em que condições eles são observados. Apesar disso, os procedimentos de esvanecimento têm-se mostrado úteis quando aplicados a problemas de comportamento, como será descrito na próxima seção. PESQUISA APLICADA E ESPECULAÇÕES SOBRE A APLICAÇÃO Os estudos sobre autocontrole em contextos de pesquisa aplicada são realizados, em geral, com participantes que apresentam problemas de comportamento graves, autistas e com crianças com Transtorno de Déficit de Atenção/Hiperatividade. A seleção desses participantes, que apresentam freqüentemente repentes de agressividade e comportamentos mantidos por reforçamento imediato, pode contribuir para o desenvolvimento de programas educacionais que aumentem a qualidade de vida desses indivíduos. No caso específico de crianças com diagnóstico de hiperatividade, o conhecimento sobre esse tema é especialmente relevante, dado que um dos problemas presentes nesse transtorno é a diminuição da capacidade do controle de impulsos (Barkley, 1997; 2002), ou seja, a dificuldade em se engajar ou finalizar tarefas que requerem um período de espera relativamente longo. Os procedimentos de pesquisa na análise comportamental aplicada têm sido compostos de respostas e de reforços bastante diversificados. O indivíduo deve escolher entre alternativas com maior e menor atraso e esperar por reforços consumatórios (batata frita, pipoca, refrigerante, balas, biscoitos, etc.), sociais (atenção, elogios, etc.) ou outros (brinquedos, 182 ABREU-RODRIGUES, RIBEIRO & COLS. jogos, etc.). Entre os comportamentos medidos estão jogar, realizar atividades diárias incluídas em treino de higiene e cuidados pessoais ou respostas simples de escolha, como apontar e identificar. Em alguns estudos, o atraso foi substituído por tarefas com maior ou menor custo de resposta para dar acesso aos reforços de magnitude diferentes, como montar um quebra-cabeça (Nogueira, 2001) ou resolver problemas de matemática (Neef, Bicard, e Endo, 2001; Neef e Lutz, 2001). A seguir serão discutidos alguns estudos que utilizaram o procedimento de esvanecimento, modificaram algum parâmetro de reforçamento e incluíram uma alternativa de resposta para aumentar as escolhas pela alternativa de autocontrole. Dixon e colaboradores (1998) comprovaram o efeito do esvanecimento sobre o engajamento de adultos com atraso de desenvolvimento em comportamentos desejáveis (permanecer sentado, diminuir movimentos excessivos com os braços ou manipular adequadamente o material das atividades propostas pelo instrutor). Em uma condição inicial de linha de base, os participantes preferiram receber imediatamente o reforçador menor a receber o reforçador maior contingente à emissão de um comportamento desejável por um determinado tempo (alternativa esta que implicava atraso do reforçamento). O treino do autocontrole consistiu em, inicialmente, garantir a escolha do reforçador maior, retirando a exigência de trabalho e reintroduzindo-a por períodos progressivamente maiores ao longo do treino. Quando o participante escolhia engajar-se no comportamento-alvo pela duração determinada em pelo menos duas de três sessões, a duração definida como critério era aumentada na próxima sessão. Se o participante escolhesse a alternativa de impulsividade na primeira sessão com um novo critério, o aumento na duração requerida era reduzido à metade na sessão seguinte. Os três participantes mudaram o comportamento exibido na condição de linha de base, mostrando uma preferência pela alternativa de autocontrole ao final do treino. Mudanças no comportamento de autocontrole de crianças hiperativas, decorrentes de treino com esvanecimento, foram observadas por Neef e colaboradores (2001). O comportamento de três crianças com Transtorno de Déficit de Atenção/Hiperatividade em situações de conflito, cujas alternativas diferiam quanto ao atraso e à taxa ou qualidade de reforçamento foi investigado. Nas condições de linha de base, a situação de escolha poderia envolver, por exemplo, dois problemas de matemática, sendo que um deles liberava pontos em alta taxa (ou maior qualidade), mas com atraso, e o outro liberava pontos em uma taxa menor (ou menor qualidade) e imediatamente. O esvanecimento foi programado a partir do aumento gradual do atraso para a alternativa de maior qualidade de reforço para duas crianças e para a alternativa de maior taxa de reforçamento para a terceira criança. A avaliação inicial demonstrou que as crianças preferiram a alternativa associada ao menor atraso. Entretanto o treino de autocontrole com esvanecimento produziu inversão de preferência para os problemas de matemática que estavam associados ao maior atraso e à maior taxa de reforços ou aos reforços de maior qualidade. Alguns tratamentos médicos e psicológicos fazem uso de técnicas de esvanecimento. Os tratamentos de desintoxicação geralmente utilizam o que chamamos de esvanecimento subtrativo. O tratamento consiste na retirada gradual da substância tóxica presente no organismo do indivíduo, seja através da inclusão de drogas-antídoto ou da administração da droga utilizada pelo paciente em doses gradualmente menores. Esse é o caso, por exemplo, de adictos em nicotina, que utilizam adesivos ou chicletes que contêm nicotina para que o organismo adapte-se gradualmente com quantidades menores da substância até sua retirada completa. Antes de optar pelo tratamento, o adicto de nicotina se vê diante de uma difícil situação de escolha: fumar e sentir prazer, aliviando também os efeitos da ausência da substância no organismo e, em contrapartida, correr o risco de danos à saúde, perder parte do paladar e olfato, ter pigarro e ser criticado socialmente, ou não fumar e diminuir os riscos de danos à saúde, ser aceito socialmente e, no entanto, ANÁLISE DO COMPORTAMENTO sentir a síndrome de abstinência e, de uma certa forma, sofrer uma desorganização de seu repertório comportamental. Este último referese a uma série de comportamentos que estão relacionados ou encadeados ao comportamento de fumar e que o indivíduo deve deixar de realizá-los, como tomar café, mascar chicletes, manter cinzeiros limpos e sair para comprar o cigarro, entre outros. No momento em que o indivíduo engaja-se em um tratamento, somente a retirada da nicotina não será suficiente para o sucesso. Um bom tratamento deve também considerar essa “quebra” no repertório, permitindo a ocorrência de comportamentos substitutos ou incompatíveis com o de fumar. Em terapia sexual, algumas técnicas para tratamento de vaginismo, por exemplo, incluem exercícios de excitação e de exploração dos órgãos genitais da mulher pelo parceiro, de forma que, gradualmente, a mulher consiga obter prazer sem sentir dor. A queixa nesses casos é de que, devido à dor, a mulher opta por não manter relações sexuais, preferindo, por exemplo, a masturbação, que pode ser vista como a alternativa de menor magnitude de reforçamento. Essa situação de conflito envolve estimulação aversiva em vez de atraso de reforçamento e, portanto, o esvanecimento (aditivo) é feito com o aumento gradual do estímulo produtor de dor, à medida que a habituação se estabelece. Nesse sentido, o parceiro pode, em um dos primeiros exercícios, introduzir apenas a ponta do dedo mínimo na vagina até chegar ao ponto de, no decorrer do tratamento, ter uma relação sexual completa com penetração. A possibilidade de combinar o esvanecimento com outras técnicas pode tornar a ocorrência do comportamento de autocontrole mais provável e mais duradouro. O estudo de Dixon e Cummings (2001) utilizou o esvanecimento do atraso combinado à possibilidade de realizar uma tarefa durante o mesmo, com três crianças autistas. O treino de autocontrole foi introduzido em uma situação de escolha entre três alternativas: receber o menor reforço imediatamente; receber o maior reforço atrasado e esperar durante o atraso; e receber o maior reforço atrasado, mas ordenar cartões com figuras durante o atraso. Nas alternativas com 183 atraso, houve um aumento gradual do valor do atraso. Foi observado que o esvanecimento produziu um aumento da preferência pela alternativa de maior magnitude e a realização da tarefa durante o atraso diminuiu a ocorrência de comportamentos agressivos, como se morder e bater em si e nos outros. É interessante observar que o engajamento em uma tarefa permitia não só a diminuição da emissão de comportamentos indesejáveis, mas também a obtenção de acesso ao reforço de maior magnitude nessa situação de autocontrole (ver também Binder, Dixon e Ghezzi, 2000). Os resultados desses estudos corroboram achados anteriormente citados (Grosch e Neuringer, 1981; Mischel et al., 1972) e mostram que a simples inclusão de uma alternativa de resposta com reforçamento adicional durante o atraso aumenta a probabilidade de autocontrole. A oportunidade de crianças brincarem com brinquedos ou de pombos bicarem um disco sobressalente durante o atraso reduz o valor relativo do reforçamento da alternativa imediata e aumenta o da alternativa de autocontrole. Resultados semelhantes são observados em programas de reabilitação de criminosos nos presídios. Os programas geralmente citados como bem-sucedidos incluem atividades de trabalho e de lazer para os presidiários em vez de deixá-los ociosos. Nesse sentido, grosso modo, os presidiários estão diante da seguinte situação de escolha: a) esperar o tempo da pena passar; b) engajar-se em comportamentos que permitam uma possível fuga (p. ex.: conseguir armas ou instrumentos para cavar buracos) e, conseqüentemente, cometer novos delitos; c) trabalhar em oficinas ou em atividades promovidas pelo presídio. Nesta última alternativa, cumprir uma pena significa não só esperar o tempo passar, como sentir-se útil, produtivo, aprender uma profissão e, ainda, realizar uma atividade que pode ser remunerada e que pode permitir a diminuição da pena (em alguns casos, três dias trabalhados reduzem um dia na pena). Para 184 ABREU-RODRIGUES, RIBEIRO & COLS. qualquer uma das alternativas, o reforço será a liberdade, isto é, sair da prisão. Pensando um pouco mais sobre esse tema, pode-se dizer que muitos comportamentos criminosos poderiam não acontecer se o indivíduo tivesse optado pela alternativa de autocontrole. O que isso quer dizer quando pensamos em crimes? A alternativa de menor magnitude e imediata pode, nesses casos, ser denominada de comportamento criminoso, como em um momento de discussão, sacar de uma arma e atirar. Ou ver o filho desobedecer e espancá-lo. Ou ainda diante de uma mulher atraente, segurá-la e estuprá-la, dentre outros tantos casos. Uma análise mais completa de cada situação pode nos mostrar que sempre haverá, pelo menos, uma outra alternativa, que provavelmente oferecerá um reforço maior, mas que será liberado com atraso ou após uma resposta de alto custo. Em todos esses casos, padrões de respostas que mantêm a condição de liberdade do indivíduo seriam denominados de respostas de autocontrole. Na literatura de pesquisa com humanos encontramos poucos estudos que adotam o modelo de comprometimento proposto por Rachlin e Green (1972). Solnick e colaboradores (1980, Experimento 3) replicaram o estudo original de comprometimento com adultos humanos em uma situação de escolha com estimulação aversiva. Quinze participantes foram expostos a uma situação na qual eles poderiam escolher entre alternativas que lhes permitiam fugir de um som desagradável por um maior ou menor período de tempo, enquanto realizavam a tarefa de solucionar problemas de matemática. A alternativa de comprometimento dava acesso exclusivo ao tempo mais longo de som desligado. Da mesma forma que em Rachlin e Green, os resultados desse estudo demonstraram grande variabilidade individual, e apenas metade dos sujeitos escolheu a alternativa de comprometimento, sendo que ao não fazer tal escolha, em geral, os participantes preferiram a alternativa de menor magnitude. A situação de comprometimento proposta por Rachlin e Green (1972) é facilmente programada em um laboratório de pesquisa animal. Na contingência totalmente programada pelo experimentador, escolher a alternativa de comprometimento significa não ter mais a chance de mudar a escolha ou de ter acesso ao menor reforço. O ambiente programado pelo experimentador dá pouca chance para o animal engajar-se em outros comportamentos e nenhuma chance de ter outras fontes de alimento. Dessa forma, escolher a alternativa de comprometimento realmente é um compromisso com o maior reforço. Quando pensamos em situações naturais, especialmente com humanos adultos, esse comprometimento total raramente acontece. Há em geral formas alternativas de conseguir o reforço imediato mesmo depois de assumir o compromisso. Novamente o fumante é um bom exemplo. Ao se comprometer a parar de fumar não comprando cigarro naquela manhã, ele pede um cigarro a um colega ou mesmo a um desconhecido, fuma os tocos deixados no cinzeiro no dia anterior ou encontra alguma outra forma criativa para conseguir um cigarro, mesmo que isso lhe custe a credibilidade com a família e com os amigos. Rachlin (1995) afirmou que, no caso de humanos, o comprometimento muitas vezes ocorre com a programação de uma punição se o indivíduo escolher a alternativa de menor reforço. Isto é, o indivíduo escolhe a alternativa de maior reforço e se, durante o atraso, houver mudança na escolha, ele terá acesso ao menor reforço seguido por uma punição. Esse é o caso, por exemplo, do indivíduo que toma um medicamento que provoca náuseas e vômitos ao ingerir álcool. Um indivíduo que esteja em tratamento para parar de beber compromete-se a não beber, mas se, por acaso, ele cair em tentação, sofrerá as conseqüências desagradáveis produzidas pelo medicamento. Um outro exemplo diz respeito à restrição física promovida pela cirurgia de redução de estômago. Uma pessoa que se submete a tal cirurgia, o faz para comer menos e diminuir o peso. Essa é uma medida drástica para redução de peso e é um forte comprometimento. A pessoa, então, ao alimentar-se, deve comer lentamente e em pequenas porções. Comportar-se de forma diferente, isto é, comer rapidamente e uma grande quantidade geram punição, pois a pessoa sente náusea e dores de estômago. ANÁLISE DO COMPORTAMENTO Uma grande variedade de situações da vida diária oferece ao indivíduo a oportunidade de se comprometer com a alternativa de maior magnitude. Um casal que quer evitar a gravidez pode utilizar a pílula anticoncepcional ou outros métodos, ou ainda o marido pode submeter-se a uma vasectomia. O indivíduo que adere ao tratamento para diabete ou qualquer outra doença crônica está comprometendo-se a se manter saudável e ter acesso a todas as possibilidades que essa condição lhe traz. Fugir do tratamento, no caso do diabete, pode implicar sentir tonturas, mal-estar e outras conseqüências mais graves, como a cegueira ou a amputação de partes do corpo. Uma outra situação menos drástica, na qual também há comprometimento, é quando um indivíduo contrata um personal trainer para fazer ginástica. Essa provavelmente será uma forte garantia de fazer exercícios e manter-se em forma, pois, além de ser pago, o professor vai até a casa do aluno e cria contingências para que este cumpra a tarefa. No laboratório tomamos o cuidado para manter constantes os diversos aspectos que não são as chamadas variáveis independentes (manipuladas pelo experimentador). Entre elas muitas vezes está a topografia da resposta e a qualidade dos reforçadores. Essas escolhas simétricas permitem a quantificação das preferências que são estabelecidas pelas contingências. Muitas situações naturais, entretanto, envolvem respostas assimétricas e também reforços diferentes, mais semelhantes ao modelo de atraso de gratificação de Mischel e colaboradores (Mischel et al., 1972; Mischel et al., 1989). Dessa forma, o indivíduo que tem o carro cheio de lixo pode ter como alternativas jogar o lixo pela janela ou colocá-lo em um saco e esperar para colocá-lo em uma lixeira. Uma pessoa em uma conferência pode tapar o nariz e evitar um ataque de riso ou rir alto e sentir alívio. Essa diferença não inviabiliza, entretanto, que predições possam ser feitas quando se identifica variáveis funcionalmente semelhantes na situação natural àquelas estudadas no laboratório. Entretanto o controle experimental necessário na pesquisa é incompatível com a reprodução completa da situação natural em toda a sua complexidade. Dessa 185 forma, a aplicação dos resultados da pesquisa básica deve ser feita com cautela e intermediada por uma teoria. CONCLUSÃO O paradigma de autocontrole baseado na escolha entre reforços atrasados e de magnitudes diferentes tem se mostrado um modelo experimental útil para estudar o efeito de diversas variáveis relevantes sobre padrões comportamentais considerados impulsivos ou autocontrolados. Apesar disso, como o próprio nome sugere, ele é um modelo e, por isso, guarda apenas algumas semelhanças com o fenômeno em situação natural consideradas relevantes. Isso fica evidente quando se compara o modelo experimental ao modelo conceitual de autocontrole de Skinner (1953). Em sua proposta, o autor sugere diversas formas de autocontrole que o modelo de escolha contempla ou pode contemplar, como: o comportamento que produz ou retira os estímulos discriminativos de respostas impulsivas, como é o caso da escolha que implica compromisso na omissão da alternativa de impulsividade e o comportamento que aumenta ou diminui a probabilidade de reforços de respostas impulsivas (o procedimento de Rachlin e Green, proposto em 1972, reduz a probabilidade dessa alternativa a zero quando o elo de compromisso é escolhido). Ao mesmo tempo, o modelo de escolha parece não ser tão adequado quando a situação envolve a interação entre comportamentos operante e respondente. Skinner sugere que uma forma de autocontrole seria fazer algo para reduzir ou aumentar a intensidade de estímulos eliciadores, como quando tapamos o nariz para não espirrar durante um concerto de música clássica. A importância de se estudar experimentalmente fenômenos relevantes para compreender o autocontrole de maneira geral e os possíveis avanços para uma tecnologia comportamental aplicada a diversos comportamentos de preservação da saúde, meio ambiente, manutenção de equilíbrio social, entre outros, é certamente incontestável. Ao mudar de uma concepção que internaliza a causa por meio da 186 ABREU-RODRIGUES, RIBEIRO & COLS. noção de traço de personalidade ou de um homúnculo “guiador” para um modelo que identifica nas contingências de reforçamento presentes e passadas as explicações do comportamento, estamos acreditando em um futuro no qual os problemas atuais de saúde ou do meio ambiente poderão ser reduzidos. Para tanto, ainda é necessário um maior desenvolvimento do conhecimento sobre as variáveis que determinam nossas escolhas e um grande investimento na aplicação desses conhecimentos. NOTA DAS AUTORAS As autoras agradecem a contribuição de Rodolfo Nunes na confecção da Figura 10.1. REFERÊNCIAS BIBLIOGRÁFICAS Ainslie, G. (1974). Impulse control in pigeons. Journal of the Experimental Analysis of Behavior, 21, 485-489. Ainslie, G. (1975). Specious reward: A behavioral theory of impulsiveness and impulse control. Psychological Bulletin, 82, 463-496. Ainslie, G.; Herrnstein, R. J. (1981). Preference reversal and delayed reinforcement. Animal Learning e Behavior, 9, 476-482. Barkley, R. A. (1997). ADHD and the nature of selfcontrol. New York: Guilford Press. Barkley, R. A. (2002). Trantorno de déficit de atenção e hiperatividade (TDAH): Guia completo e autorizado para os pais, professores e profissionais da saúde (L. S. Roizman, trad.). Porto Alegre: Artmed (Obra publicada originalmente em 2000). Baum, W. M. (1974). On two types of deviation from matching: Bias and undermatching. Journal of the Experimental Analysis of Behavior, 22, 231-242. Binder, L. M.; Dixon, M. R.; Ghezzi, P. M. (2000). A procedure to teach self-control to children with attention deficit hyperacivity disorder. Journal of Applied Behavior Analysis, 33, 233-237. Bonem, M.; Crossman, E. K. (1988). Elucidating the effects of reinforcement magnitude. Psychological Bulletin, 104, 348-362. Catania, A. C. (1963). Concurrent performances: A baseline for the study of reinforcement magnitude. Journal of the Experimental Analysis of Behavior, 6, 299-300. Chung, S.; Herrnstein, R. J. (1967). Choice and delay of reinforcement. Journal of the Experimental Analysis of Behavior, 10, 67-74. Cole, M. R. (1990). Operant hoarding: A new paradigm for the study of self-control. Journal of the Experimental Analysis of Behavior, 53, 247-261. Darcheville, J. C.; Rivière, V.; Wearden, J. H. (1993). Fixed-interval performance and self-control in infants. Journal of the Experimental Analysis of Behavior, 60, 239-254. Deluty, M. Z. (1981). Self-control and impulsiveness involving short-term and long-term punishing events. In C. M. Bradshaw, E. Szabadi e C. F. Lowe (Eds.), Quantification of steady-state operant behaviour (p. 127-138). Amsterdam: Elsevier/North Holland Biomedical Press. Dixon, M. R.; Cummings, A. (2001). Self-control in children with autism: Response allocation during delays to reinforcement. Journal of Applied Behavior Analysis, 34, 491-495. Dixon, M. R.; Hayes, L. J.; Binder, L. M.; Manthey, S.; Sigman, C.; Zdanowski, D. M. (1998). Using a self-control training procedure to increase appropriate behavior. Journal of Applied Behavior Analysis, 31, 203-210. Downey, K. K.; Vuchinich, R. E. (1990, maio). Human impulsiveness in the laboratory: When not to use computers? Painel apresentado na 16th Annual Convention of the Association for Behavior Analysis, Nashville, Tennessee, USA. Eisenberger, R.; Adornetto, M. (1986). Generalized selfcontrol of delay and effort. Journal of Personality and Social Psychology, 51, 1020-1031. Eisenberger, R.; Masterson, F. A. (1987). Effects of prior learning and current motivation on self-control. In M. L. Commons, J. E. Mazur, J. A. Nevin e H. Rachlin (Eds.), Quantitative analyses of behavior: Vol. V. The effect of delay and of intervening events on reinforcement value (p. 267-282). Hillsdale, N.J: Erlbaum. Eisenberger, R.; Masterson, F. A.; Lowman, K. (1982). Effects of previous delay of reward, generalized effort, and deprivation on impulsiveness. Learning and Motivation, 13, 378-389. Fantino, E. (1966). Immediate reward followed by extinction vs. later reward without extinction. Psychonomic Science, 6, 233-234. Gentry, G. D.; Marr, M. J. (1980). Choice and reinforcement delay. Journal of the Experimental Analysis of Behavior, 33, 27-37. Green, L.; Rachlin, H. (1996). Commitment using punishment. Journal of the Experimental Analysis of Behavior, 65, 593-601. Green, L.; Snyderman, M. (1980). Choice between rewards differing in amount and delay: Toward a choice model of self-control. Journal of the Experimental Analysis of Behavior, 34, 135-147. Green, L.; Fisher, E. B. Jr.; Perlow, S.; Sherman, L. (1981). Preference reversal and self-control: Choice as a function of reward amount and delay. Behaviour Analysis Letters, 1, 43-51. Grosch, J.; Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35, 3-21. Grossbard, C. L.; Mazur, J. E. (1986). A comparison of delays and ratio requirements in self-control choice. Journal of the Experimental Analysis of Behavior, 45, 305-315. ANÁLISE DO COMPORTAMENTO Guttman, N. (1953). Operant conditioning, extinction, and periodic reinforcement in relation to concentration of sucrose used as reinforcing agent. Journal of Experimental Psychology, 46, 213-224. Hanna, E. S. (1991). Behaviour analysis of complex learning: Some determinants of choice. Tese de doutorado não publicada, University of Wales, College of Cardiff, Cardiff, UK. Hanna, E. S.; Todorov, J. C. (2002). Modelos de autocontrole na análise experimental do comportamento: Utilidade e crítica. Psicologia: Teoria e Pesquisa, 18, 337-343. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Logan, F. A. (1965). Decision making by rats: Delay versus amount of reward. Journal of Comparative and Physiological Psychology, 52, 1-12. Logue, A. W. (1988). Research on self-control: An integrating framework. Behavioral and Brain Sciences, 11, 665-679. Logue, A. W.; Mazur, J. E. (1981). Maintenance of selfcontrol acquired through a fading procedure: Followup on Mazur and Logue (1978). Behaviour Analysis Letters, 1, 131-137. Logue, A. W.; Peña-Correal, T. E. (1984). Responding during reinforcement delay in a self-control paradigm. Journal of the Experimental Analysis of Behavior, 41, 267-277. Logue, A. W.; Peña-Correal, T. E.; Rodriguez, M. L.; Kabela, E. (1986). Self-control in adult humans: Variation in positive reinforcer amount and delay. Journal of the Experimental Analysis of Behavior, 46, 159-173. Logue, A. W.; Rodriguez, M. L.; Peña-Correal, T. E.; Mauro, B. C. (1984). Choice in a self-control paradigm: Quantification of experience-based differences. Journal of the Experimental Analysis of Behavior, 13, 243-266. Logue, A. W.; Rodriguez, M. L.; Peña-Correal, T. E.; Mauro, B. C. (1987). Quantification of individual differences in self-control. In M. L. Commons, J. E. Mazur, J. A. Nevin e H. Rachlin (Eds.), Quantitative analyses of behavior: Vol. V. The effect of delay and of intervening events on reinforcement value (p. 245-265). Hillsdale, NJ: Erlbaum. Mazur, J. E. (1986). Fixed and variable ratios and delays: Further tests of an equivalence rule. Journal of Experimental Psychology, 12, 116-124. Mazur, J. E.; Logue, A. W. (1978). Choice in a “selfcontrol” paradigm: Effects of a fading procedure. Journal of the Experimental Analysis of Behavior, 30, 11-17. Millar, A.; Navarick, D. J. (1984). Self-control and choice in humans: Effects of video game playing as a positive reinforcer. Learning and Motivation, 15, 203-218. Mischel, W.; Ebbesen, E. B. (1970). Attention in delay of gratification. Journal of Personality and Social Psychology, 16, 329-337. Mischel, W.; Ebbesen, E. B.; Zeiss, A. (1972). Cognitive and attentional mechanisms in delay of gratification. Journal of Personality and Social Psychology, 21, 204-218. 187 Mischel, W.; Shoda, Y.; Rodriguez, M. L. (1989). Delay of gratification in children. Science, 244, 933-938. Neef, N. A.; Bicard, D. F.; Endo, S. (2001). Assessment of impulsivity and the development of self-control in students with attention deficit hyperactivity disorder. Journal of Applied Behavior Analysis, 34, 397-408. Neef, N. A.; Lutz, M. N. (2001). A brief computer-based assessment of reinforcer dimensions affecting choice. Journal of Applied Behavior Analysis, 34, 57-60. Neuringer, A. J. (1969). Delayed reinforcement versus reinforcement after a fixed interval. Journal of the Experimental Analysis of Behavior, 12, 373-383. Nogueira, I. S. (2001). Análise do comportamento de escolha entre tarefas de montagem de quebra-cabeças com crianças pré-escolares. Dissertação de mestrado não publicada, Universidade de Brasília, Brasília, DF. Patterson, C. J.; Mischel, W. (1975). Plans to resist distraction. Developmental Psychology, 11, 369-378. Rachlin, H. (1970). Modern behaviorism. San Francisco: Freeman. Rachlin, H. (1995). Self-control: Beyond commitment. Behavioral and Brain Sciences, 18, 109-159. Rachlin, H.; Castrogiovanni, A.; Cross, D. (1987). Probability and delay in commitment. Journal of the Experimental Analysis of Behavior, 48, 347-353. Rachlin, H.; Green, L. (1972). Commitment, choice, and self-control. Journal of the Experimental Analysis of Behavior, 17, 15-22. Ribeiro, M. R. (1999). Autocontrole em sistemas de economia alimentar aberto e fechado. Dissertação de Mestrado não publicada, Universidade de Brasília, Brasília, DF. Ribeiro, M. R.; Hanna, E. S. (2000, maio). Self-control in open and closed economies. Painel apresentado na 26th Annual Convention of the Association for Behavior Analysis, Washington, DC, USA. Schweitzer, J. B.; Sulzer-Azaroff, B. (1988). Selfcontrol: Teaching tolerance for delay in impulsive children. Journal of the Experimental Analysis of Behavior, 50, 173-186. Siegel, E.; Rachlin, H. (1995). Soft commitment: Selfcontrol achieved by response persistence. Journal of the Experimental Analysis of Behavior, 64, 117-128. Sizemore, O. J.; Lattal, K. A. (1978). Unsignalled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30, 169-175. Skinner, B. F. (1953). Science and human behavior. New York: MacMillan. Snyderman, M. (1983). Delay and amount of reward in a concurrent chain. Journal of the Experimental Analysis of Behavior, 39, 437-447. Solnick, J. V.; Kannenberg, C. H.; Eckerman, D. A.; Waller, M. B. (1980). An experimental analysis of impulsivity and impulse control in humans. Learning and Motivation, 11, 61-77. Todorov, J. C. (1971). Análise experimental do comportamento de escolha: Algumas considerações sobre método em psicologia. Ciência e Cultura, 23, 585-594. VARIABILIDADE COMPORTAMENTAL 11 JOSELE ABREU-RODRIGUES O selecionismo é um processo no qual elementos particulares são selecionados a partir de um conjunto variável de elementos. O modelo selecionista foi adotado por Darwin para explicar a evolução das espécies, e por Skinner, para descrever a evolução do comportamento (Skinner, 1989a, 1989b). Esses dois processos evolutivos apresentam aspectos similares. Primeiro, em ambos os casos, os mecanismos seletivos residem no ambiente, isto é, pressões seletivas no ambiente determinam não somente mudanças morfológicas nos indivíduos ao longo de gerações (contingências de sobrevivência), como também mudanças comportamentais no decorrer da vida de um indivíduo (contingências de reforçamento). Segundo, as contingências seletivas presentes em ambas as situações requerem variabilidade, quer seja em termos de características morfológicas, quer seja em termos de características comportamentais. Se a variabilidade é um requisito fundamental da seleção, torna-se, então, crucial identificar as fontes da variação. Em sua busca por relações ordenadas entre o comportamento e o ambiente, os pesquisadores têm enfatizado condições de estado estável, tratando a variabilidade como um aspecto indesejável de seu objeto de estudo ou como algo a ser controlado experimentalmente (Sidman, 1960). Embora o foco da pesquisa analítico-comportamental seja a compreensão de mecanismos seletivos, estudos sobre as condições controladoras da variabilidade comportamental também têm sido realizados, principalmente nos últimos 15 anos. Essas pesquisas têm demonstrado que a variabilidade comportamental pode ser mais do que o resultado de um controle experimental fraco. Ou seja, a literatura tem indicado que o nível de variação observado muda conforme as exigências das contingências de reforçamento: quando os reforços são contingentes à variabilidade, os organismos variam seu comportamento; quando os reforços são contingentes à estereotipia, os organismos repetem seu comportamento (p. ex.: Page e Neuringer, 1985). Neste capítulo será oferecido um panorama da literatura sobre a variabilidade comportamental, sendo enfatizados aspectos tais como a definição do conceito, os achados da pesquisa básica e aplicada, bem como serão apontadas algumas contribuições dessas pesquisas para o fenômeno da criatividade. DEFINIÇÃO Em uma análise do conceito de variabilidade comportamental, Hunziker e Moreno (2000) apontam que o critério básico para a ocorrência de variação é a existência de diferenças ou de mudanças entre unidades comportamentais de um universo determinado. As unidades seriam cada uma das instâncias do comportamento, e o universo seria o conjunto dessas unidades. A definição do que seria unidade e do que seria universo é arbitrária, pois depende de decisões do experimentador. Em um estudo que investiga a variabilidade dos 190 ABREU-RODRIGUES, RIBEIRO & COLS. desenhos de uma criança, por exemplo, a unidade poderia ser cada desenho feito, e o universo, todos os desenhos feitos na sessão ou, alternativamente, todos os desenhos feitos desde o início do experimento. Hunziker e Moreno (2000) definem variabilidade como uma propriedade do universo de comportamentos, ou seja, enquanto força, duração, latência e topografia são propriedades ou dimensões da unidade comportamental, a variação é uma propriedade ou dimensão do universo de unidades comportamentais, comparadas umas com as outras. Sendo assim, a análise da variabilidade corresponde à comparação de unidades comportamentais com algum referente; se houver diferença entre a unidade e o referente em relação à propriedade avaliada, fala-se em variação. Por exemplo, a propriedade de interesse pode ser o tempo entre respostas (IRT) e, nesse caso, fala-se em variação comportamental quando há diferenças entre os IRTs de um determinado universo. Da mesma forma, a propriedade de interesse pode ser a topografia de uma seqüência de respostas nas teclas esquerda (E) e direita (D) e, nessas situações, diz-se que há variação quando o número de respostas E e D e a sua ordem de ocorrência na seqüência diferem ao longo das seqüências do universo. A variabilidade comportamental pode tanto ser um subproduto de contingências de reforçamento como produzida diretamente por tais contingências. No primeiro caso, a variabilidade não é exigida para a liberação do reforço, mas é permitida; no segundo caso, o reforço é contingente à variação. Ambas as situações serão consideradas a seguir. CONTRIBUIÇÕES DA PESQUISA BÁSICA No início do condicionamento, o responder tipicamente é variável e ineficiente, mas, com o treino, aspectos particulares da classe de respostas tornam-se estereotipados e econômicos (Schwartz, 1980; Skinner, 1938). Essa organização do comportamento ao longo do processo seletivo parece sugerir que a estereotipia é um resultado inerente e inevitável das contingências de reforçamento. Tal conclu- são é desafiada, entretanto, por estudos que mostram que a variabilidade é observada mesmo em desempenhos estáveis. Tal variabilidade pode ser um subproduto de variáveis ambientais (p. ex.: intermitência do reforço e retirada do reforço) ou um produto direto de contingências de variação, que serão consideradas a seguir. Variabilidade induzida por esquemas de reforçamento Estudos sobre variabilidade têm enfatizado tanto as propriedades topográficas (p. ex.: localização da resposta) como as propriedades quantitativas (p. ex.: duração) da resposta. Antonitis (1951), por exemplo, ao investigar a topografia da resposta de focinhar ao longo de uma faixa horizontal que permitia 50 localizações diferentes da resposta, observou que o treino com reforçamento contínuo (CRF) gerou estereotipia, e que a extinção subseqüente gerou variabilidade na localização dessa resposta (ver também Stokes, 1995). Margulies (1961) obteve resultados similares, observando que respostas de pressão à barra de curta duração predominaram durante o treino com CRF, enquanto períodos de extinção foram acompanhados por variação na duração dessa resposta. Em um estudo mais recente, Morgan e Lee (1996) expuseram estudantes universitários a diversos esquemas de reforçamento diferencial de taxas baixas (DRL) ao longo de diferentes condições experimentais e, em seguida, à extinção. Foi observado que a extinção produziu mudanças freqüentes e abruptas nos IRTs de pressionar teclas, os quais assumiram valores não previamente reforçados durante os esquemas DRL (Lachter e Corey, 1982; Millenson, Hurwitz e Nixon, 1961; Notterman e Mintz, 1965; Skinner, 1938; Stebbins e Reynolds, 1964). Esses estudos indicam que o reforçamento contínuo e a ausência de reforçamento exercem efeitos contrários sobre a variabilidade comportamental e levantam a questão sobre se o reforçamento intermitente produziria níveis intermediários de variação. Schoenfeld (1968) argumentou que, em esquemas inter- ANÁLISE DO COMPORTAMENTO mitentes, os períodos de extinção após o reforço diminuem a probabilidade da resposta reforçada aos níveis observados para as demais respostas, aumentando, assim, a quantidade de respostas sobre as quais o reforço irá operar. Mudanças no esquema de reforçamento, de contínuo para intermitente, implicariam decréscimos na taxa de reforços (isto é, aumentos no período médio de extinção) e, conseqüentemente, aumentos correspondentes na variabilidade da resposta. Os efeitos do reforçamento intermitente sobre a variabilidade na topografia da resposta foram examinados por Eckerman e Lanson (1969). A variável dependente consistiu na localização da resposta de bicar um disco de pombos. No Experimento 2, foram utilizados o esquema CRF e diversos esquemas intermitentes ao longo das condições experimentais: intervalo fixo (FI 15 s) e intervalo randômico (RI 150 s, RI 75 s e RI 30 s). No Experimento 3, foram utilizados os esquemas CRF seguidos por um esquema de intervalo variável (VI 3 min). Conforme proposto por Schoenfeld (1968), os esquemas intermitentes geraram maior variabilidade na localização da resposta do que o esquema CRF (ver também Ferraro e Branch, 1968). Resultados comparáveis foram relatados com outras espécies, esquemas e dimensões da resposta. Eckerman e Vreeland (1973), por exemplo, investigaram o papel da intermitência do reforço com humanos. Os participantes eram solicitados a escrever a letra “X” em uma folha de papel. Após cada resposta, o experimentador fornecia um feedback indicando se a mesma estava correta ou incorreta. Os feedbacks positivos eram fornecidos de acordo com os esquemas CRF e razão variável (VR) 3, ou nunca eram fornecidos (extinção). O esquema CRF produziu maior variabilidade na localização da resposta do que a extinção, enquanto o esquema VR gerou níveis intermediários de variação. Stebbins e Lanson (1962) avaliaram o efeito da intermitência sobre a latência da resposta. Ratos foram treinados a manter uma barra pressionada na presença de uma luz; na presença de um tom, soltar a barra produzia reforços de acordo com o esquema CRF, com diversos esquemas intermitentes ou, então, não 191 produzia reforços. A variabilidade na latência da resposta de soltar a barra aumentou à medida que a probabilidade do reforço diminuiu de 100 para 0% (ver também Zimmerman, 1960). Finalmente, McSweeney (1974) investigou a variabilidade da taxa de respostas em um esquema concorrente VI 1 min VI 4 min ao longo das sessões experimentais, sendo observada uma relação inversa entre a variação da resposta e a taxa de reforços. Apesar dessas evidências, a literatura mostra que esquemas intermitentes nem sempre produzem maior variabilidade do que o esquema contínuo de reforçamento. Herrnstein (1961), por exemplo, avaliou a variabilidade da localização da resposta de bicar um disco durante os esquemas CRF e VI 3 min. Seus resultados, contrários à proposta de Schoenfeld (1968), indicaram que o esquema VI produziu mais estereotipia do que o esquema CRF. O autor argumentou que esquemas VI assemelham-se a múltiplos recondicionamentos, à medida que períodos de extinção são repetidamente seguidos pela ocorrência de reforços e, portanto, uma menor variabilidade deveria ser observada nesse esquema quando comparado ao esquema CRF. Boren, Moerschbaecher e Whyte (1978) observaram que esquemas intermitentes podem produzir níveis altos ou baixos de variabilidade, dependendo das características do esquema. Esses autores treinaram macacos a pressionar seis barras, sendo o grau de variabilidade indicado pela porcentagem de respostas na barra preferida e pelo número de respostas de mudança. Nos esquemas FR, o nível de variabilidade foi mais baixo do que aquele obtido com o esquema CRF e não diferiu nos diferentes valores utilizados (entre 5 e 300). Os esquemas FI, por outro lado, produziram níveis de variabilidade mais altos do que os esquemas FR e CRF, sendo também observada uma relação direta entre o nível de variação e o valor do intervalo (entre 0,5 e 4 min). Uma vez que os esquemas de razão e de intervalo apresentaram taxas de reforços comparáveis, os autores apontaram que a variabilidade não poderia ser explicada com base na intermitência do reforço. Boren e colaboradores explicaram, então, seus resultados a partir das 192 ABREU-RODRIGUES, RIBEIRO & COLS. diferenças nas propriedades particulares de cada esquema. Eles indicaram que, com esquemas FR, respostas de mudança aumentam o tempo entre reforços e, conseqüentemente, diminuem a taxa de reforços, enquanto pressionar rápida e exclusivamente apenas uma das barras permite a maximização dos reforços; uma resposta reforçada em uma das barras teria uma alta probabilidade de ser repetida, produzindo, assim, a estereotipia observada. Com esquemas FI, no entanto, respostas de mudança não afetam a taxa de reforços; se o animal muda de uma barra para outra no decorrer do intervalo, o reforço eventualmente será contingente a pressionar diferentes barras e, conseqüentemente, ocorrerá variação na resposta. Os estudos anteriormente mencionados avaliaram os efeitos da freqüência do reforço sobre a variabilidade de dimensões topográficas ou quantitativas de respostas operantes individuais. Outros experimentos, no entanto, têm analisado a variabilidade de padrões discretos de respostas. O estudo pioneiro foi conduzido por Vogel e Annau (1973), que usaram uma caixa experimental com uma matriz 4 x 4 de luzes e dois discos de respostas. No início da sessão, apenas a luz localizada no canto superior esquerdo da matriz estava iluminada. Pombos foram treinados para moverem essa luz até o canto inferior direito da matriz. Respostas em um disco moviam a luz para a direita, e respostas no outro disco moviam a luz para baixo. Dessa forma, três respostas em cada disco, emitidas em qualquer ordem, produziam um reforço, enquanto mais de três respostas em um dos discos iniciavam um blackout. Com esse procedimento, o reforço poderia ser produzido por 20 seqüências diferentes de respostas no disco direito (D) e no esquerdo (E). Os pombos emitiram seqüências reforçadas em mais de 80% das tentativas. Também foi observado um decréscimo no número de seqüências diferentes ao longo do treino de modo que cada pombo eventualmente apresentou uma seqüência dominante (DDDEEE ou EEEDDD). Schwartz (1980) apontou algumas vantagens no procedimento de Voguel e Annau (1973): o operante investigado é formado por respostas individuais e, portanto, facilmente mensurável, e uma vez que as contingências não requerem uma única seqüência de respostas, níveis altos de variabilidade podem ocorrer sem haver perda de reforços. Schwartz conduziu um experimento similar ao de Voguel e Annau. Uma matriz 5 x 5 de luzes foi utilizada de modo que quatro respostas em cada disco eram requeridas para a liberação do reforço e uma quinta resposta em um dos discos terminava a tentativa sem reforço. No Experimento 1, embora a contingência de reforço em vigor permitisse a emissão de 70 seqüências diferentes, cada pombo desenvolveu uma resposta estereotipada, caracterizada pela ocorrência de uma seqüência dominante (p. ex.: EEEEDDDD). No Experimento 2, a retirada do reforço aumentou a variabilidade dos padrões de respostas. Resultados similares foram subseqüentemente obtidos com humanos (Schwartz, 1982c). No arranjo experimental usado por Voguel e Annau (1973) e por Schwartz (1980; 1982c), a unidade de análise foi a seqüência de respostas, e não as respostas individuais (ver Schwartz, 1982b, para uma demonstração de que seqüências de respostas tornam-se unidades comportamentais funcionais), e as condições programadas incluíam tanto reforçamento contínuo como a ausência de reforçamento. O aumento e o decréscimo na estereotipia comportamental, produzidos por essas condições, respectivamente, estão em acordo com os resultados obtidos com respostas individuais sob condições similares (p. ex.: Antonitis, 1951; Eckerman e Lanson, 1969). Com relação à intermitência do reforço, Schwartz (1982b) conduziu um estudo em que seqüências corretas (isto é, seqüências que compreendiam exatamente quatro respostas em cada um dos discos) eram reforçadas de acordo com os esquemas CRF, FI 2 min ou FR 4. O grau de estereotipia produzidos pelos esquemas intermitentes foi comparável àquele gerado por esquemas CRF. Em um estudo subseqüente realizado com humanos, Schwartz (1982c, Experimentos 1 e 2) também não encontrou níveis mais altos de variabilidade comportamental sob esquemas intermitentes, tendo os esquemas CRF e razão randômica (RR) 2 gerado níveis baixos e similares de variação. ANÁLISE DO COMPORTAMENTO O papel da intermitência do reforço foi também investigado por Tatham, Wanchisen e Hineline (1993), os quais utilizaram o procedimento da matriz com humanos. A unidade comportamental consistiu em oito respostas de pressionar um botão, sem o limite de quatro respostas por operandum. Dessa forma, qualquer combinação de oito respostas (variando desde oito respostas no botão esquerdo até oito respostas no botão direito) moveria a luz para fora da matriz e poderia produzir o reforço de acordo com esquemas FR e VR com valores entre 1 e 8. Os resultados indicaram que ambos os esquemas produziram níveis semelhantes de variabilidade, os quais aumentaram em função dos aumentos nos valores da razão. Tatham e colaboradores apontaram duas razões para as discrepâncias entre seus resultados e aqueles obtidos nos estudos de Schwartz (1982b, 1982c). Primeiro, as contingências programadas no estudo deles permitiam a emissão de oito respostas em cada botão e, portanto, havia 256 seqüências possíveis; o estudo de Schwartz, por outro lado, exigia quatro respostas por disco, de modo que havia somente 70 seqüências possíveis. Esse limite de quatro respostas pode ter impedido o reforçamento de seqüências variadas de respostas. Segundo, no procedimento de Schwartz, a seqüência tinha, necessariamente, de terminar no canto inferior direito para ser reforçada, o que pode ter contribuído para a manutenção de um padrão único de respostas. A matriz de Tatham e colaboradores, no entanto, reforçava seqüências que terminavam em nove posições diferentes, encorajando, assim, a emissão de seqüências variadas. Esses estudos exemplificam a variabilidade comportamental produzida por esquemas de reforçamento. Reforçamento contínuo consistentemente diminui a variação na resposta, enquanto a extinção aumenta essa variação. Esquemas de reforçamento intermitente, entretanto, produzem resultados inconsistentes. Algumas vezes a variabilidade é uma função direta da taxa de reforços; outras vezes, o reforçamento intermitente produz níveis de variabilidade comparáveis àqueles observados com o esquema CRF. Diferenças nos procedimentos (p. ex.: dimensão da resposta, caracte- 193 rísticas físicas do ambiente experimental, arranjos dos esquemas, natureza da tarefa) podem explicar parte dessa divergência. Variabilidade sob controle operante Os resultados até agora discutidos apresentam duas características principais: a) diferentes níveis de variabilidade foram produzidos por diferentes esquemas de reforçamento, mais precisamente, por diferentes taxas de reforços; b) a variabilidade não foi requerida para o reforçamento, tendo ocorrido como um subproduto dos esquemas de reforçamento. Entretanto, uma vez que há muitos ambientes em que a variabilidade promove a adaptação do organismo às contingências vigentes (p. ex.: situações de resolução de problemas), os pesquisadores começaram a indagar se a variação na resposta poderia ser diretamente controlada por contingências de reforçamento. A questão que passou a nortear as pesquisas pode ser assim resumida: “A variabilidade comportamental é suscetível ao controle operante?”. Os estudos a seguir investigaram tal questão. Algumas questões metodológicas Pryor, Haag e O’Reilly (1969) reforçaram respostas originais de nadar em golfinhos. Os reforços eram liberados contingentes a qualquer movimento que não era caracteristicamente observado e que não tinha sido previamente reforçado. Uma grande variedade de respostas novas foi emitida, incluindo algumas que não são observadas comumente em golfinhos. Em um estudo com ratos, Schoenfeld, Harris e Farmer (1966) reforçaram respostas de pressionar um painel somente quando a resposta terminava com um IRT diferente daquele precedente. Dois IRTs sucessivos eram considerados diferentes quando faziam parte de classes 194 ABREU-RODRIGUES, RIBEIRO & COLS. de intervalos diferentes. O nível de variabilidade observado foi suficiente para atender a contingência em vigor sendo caracterizado por alternações regulares entre IRTs longos e curtos. Em um estudo similar, Blough (1966) produziu a variação por meio do reforçamento de respostas de bicar um disco que terminavam com os IRTs menos freqüentes. As distribuições de IRTs obtidas foram semelhantes às distribuições exponenciais que seriam esperadas com o uso de um gerador randômico de respostas. Bryant e Church (1974) geraram seqüências imprevisíveis de respostas em ratos. Quando os reforços eram contingentes à alternação entre dois operanda, a porcentagem de alternação aumentou ao longo das sessões; quando os reforços seguiram a alternação em 50% das tentativas, os animais desenvolveram preferência por uma das posições; finalmente, quando 75% das respostas alternadas e 25% das respostas repetidas eram reforçadas, um responder aparentemente randômico foi observado. No experimento de Shimp (1967), no qual os reforços eram contingentes à emissão da seqüência momentaneamente menos freqüente de quatro respostas, pombos mostraram uma repetição mínima de seqüências anteriormente emitidas. Neuringer (1986) ofereceu uma demonstração de comportamento randômico com humanos. Estudantes universitários foram solicitados a gerar seqüências de dois números, tão randomicamente quanto possível. Todos os participantes apresentaram seqüências quase randômicas, mas somente quando recebiam um feedback informando quão próximas suas seqüências estavam daquelas geradas randomicamente por um computador (ver também Lee, 1996; Neuringer e Voss, 1993). Os estudos mencionados nessa seção sugerem que o reforçamento contingente aumenta a variabilidade comportamental. Entretanto, conforme indicado por Schwartz (1980, 1982a, 1982c), as metodologias empregadas não eliminam a possibilidade da variabilidade observada ter sido induzida por diversos aspectos da situação experimental (p. ex.: intermitência do reforço) e, portanto, não indicam indubitavelmente que a variabilidade pode ser diretamente produzida pelo reforço contingente. Em uma série de experimentos, Schwartz obteve resultados conflitantes com a noção de controle operante da variação. O procedimento da matriz 5 x 5 foi utilizado para ensinar pombos a emitirem seqüências variadas de respostas. A exigência de quatro respostas por disco foi mantida com a adição de uma contingência que estabelecia que a seqüência de oito respostas só seria reforçada caso diferisse da seqüência imediatamente anterior (critério Lag 1). Embora a contingência exigisse pouca variabilidade (uma alternação entre duas seqüências seria suficiente), o número de seqüências diferentes não aumentou quando comparado com aquele obtido em condições prévias nas quais a variação não era requerida, mesmo que a repetição de seqüências tenha reduzido a porcentagem de reforços disponíveis para apenas 40% (Schwartz, 1980, Experimento 4, 1982a, Experimento 1). A partir desses resultados, Schwartz (1980, 1982a, 1982c) apontou que o reforço produz, necessariamente, uma estereotipia comportamental e que, portanto, a variabilidade não pode ser diretamente reforçada. É possível, entretanto, que a falha em produzir variação tenha sido decorrente de idiossincrasias do procedimento utilizado, e não de limitações do controle operante. Page e Neuringer (1985), por exemplo, argumentaram que a estereotipia obtida por Schwartz resultou da limitação de quatro respostas por operandum. Esses autores mostraram que um computador programado para gerar randomicamente seqüências de respostas, com a mesma limitação de quatro respostas por alternativa, produziu reforços em apenas 29% das tentativas, um valor menor do que aquele produzido pelos pombos do estudo de Schwartz (40%). Ao eliminar a exigência de quatro respostas por operandum, Page e Neuringer (1985) encontraram evidências de que a variabilidade poderia ser diretamente controlada pelo reforço. O Experimento 2 utilizou o procedimento da matriz 5 x 5 para comparar duas contingências de variabilidade. Na condição “variabilidade + limitação”, somente seqüências que continham exatamente quatro respostas em cada disco eram reforçadas. Na condição variabi- ANÁLISE DO COMPORTAMENTO lidade, oito respostas eram exigidas para a liberação do reforço, mas essas respostas podiam ser distribuídas de qualquer maneira entre os discos. Em ambas as condições, o critério de variação Lag 1 estava em vigor. A condição variabilidade + limitação gerou reforços em apenas 42% das tentativas, um resultado que contestou aquele obtido por Schwartz (1980, 1982a). Na condição variabilidade, por outro lado, 90% das tentativas produziram reforços. Morris (1987, 1989) argumentou que a variabilidade observada por Page e Neuringer (1985) resultou não somente da remoção da limitação de quatro respostas por operandum, mas também da redução do controle respondente. Page e Neuringer usaram um procedimento de tentativa discreta no qual cada resposta era seguida por um timeout (luzes do disco eram apagadas), enquanto Schwartz usou um procedimento de operante livre no qual os discos eram continuamente iluminados. Para investigar o papel do timeout, Morris utilizou os dois procedimentos para treinar pombos a emitirem seqüências de quatro respostas em dois discos (E e D) de acordo com o critério Lag 2 de variabilidade. O procedimento de operante livre gerou, quase que exclusivamente, seqüências EEEE ou DDDD, e somente 30% dos reforços disponíveis foram obtidos. O procedimento de tentativa discreta, por outro lado, produziu um nível substancial de variabilidade, sendo obtidos mais do que 70% dos reforços disponíveis. Morris sugeriu que a estereotipia observada no procedimento de operante livre resultou das propriedades eliciadoras condicionadas das luzes dos discos, um efeito que não ocorre no procedimento de tentativa discreta porque o timeout remove o estímulo eliciador e, assim, permite que a variação ocorra. Essa sugestão foi investigada em um experimento subseqüente (Morris, 1990), no qual alguns pombos foram expostos a saciação sob o procedimento de operante livre. As sessões de saciação terminavam somente após 60 min sem emissão de respostas. À medida que a saciação progredia, foi observado um aumento na porcentagem dos reforços obtidos como também na porcentagem de respostas de mudanças por oportunidade. Morris concluiu que o controle operante da variabilidade ocorreu 195 porque a saciação enfraqueceu as propriedades eliciadoras da luz do disco. Page e Neuringer (1985) forneceram evidências adicionais do controle operante da variabilidade. No Experimento 3, esses autores investigaram se a variabilidade na resposta seria afetada por manipulações no grau de variação exigido pela contingência de reforço. Alguns pombos foram treinados para bicar dois discos. A contingência de variação era similar à do experimento anterior, mas o critério lag foi gradualmente aumentado, ao longo das condições, de lag 5 (a seqüência tinha de diferir das cinco seqüências anteriores) até lag 50 (a seqüência tinha de diferir das 50 previamente emitidas). Aumentos no critério lag foram acompanhados por aumentos no grau de variação das seqüências, embora essa variação tenha decrescido quando o critério mudou de Lag 25 para Lag 50 (ver também Morris, 1989; Schwartz, 1982c, Experimento 6). Entretanto, uma vez que os acréscimos no critério lag foram acompanhados não somente por aumentos na variabilidade da resposta, mas também por decréscimos na freqüência de reforços, é possível que a variação obtida tenha resultado das alterações na intermitência do reforço e não do reforçamento diferencial de seqüências diferentes. Para contornar esse problema, Page e Neuringer (1985, Experimento 5) usaram um procedimento de acoplamento da freqüência de reforços. Inicialmente, pombos foram expostos a uma condição de variabilidade na qual estava em vigor o critério Lag 50. Em seguida, uma condição de acoplamento intrasujeito foi implementada. Nessa condição, o animal era exposto a uma distribuição de reforços por seqüência, similar àquela ocorrida na condição Lag 50 com uma única diferença: a variabilidade era permitida, mas não era exigida para a liberação do reforço. Foram observados níveis de variabilidade mais altos na condição Lag 50 do que na condição de acoplamento. Uma vez que a freqüência e o tempo entre reforços eram similares nas duas condições, diferenças no nível de variabilidade não poderiam ser atribuídas à intermitência do reforço, o que levou os autores a concluírem que os níveis mais altos de variabilidade 196 ABREU-RODRIGUES, RIBEIRO & COLS. na condição Lag 50 resultou do reforçamento contingente à variação (ver também Barba e Hunziker, 2002). Machado (1989) argumentou que, embora o acoplamento demonstre que o reforçamento contingente afeta a variabilidade comportamental, esse procedimento não isola adequadamente a influência da probabilidade do reforço. Mudanças no critério de variabilidade produzem mudanças correspondentes na probabilidade de reforço, de modo que é difícil avaliar se a variação comportamental observada resulta da contingência de variabilidade, da probabilidade do reforço ou da interação dessas duas variáveis. Segundo ele, o arranjo experimental deveria permitir um controle independente da contingência de variabilidade e da probabilidade do reforço, o que poderia ser alcançado por meio de esquemas percentis (Platt, 1973). No esquema percentil utilizado por Machado, a probabilidade total do reforço foi controlada, ajustando continuamente o critério de variabilidade de modo que a probabilidade de uma seqüência atingir o critério foi mantida constante ao longo da sessão. O critério de variabilidade correspondeu a um ponto percentil derivado da distribuição do nível de variabilidade que estava sendo obtido no momento. No Experimento 1, o critério de variabilidade (o percentil) foi manipulado, enquanto a probabilidade total do reforço foi mantida constante. Foi observado que a variação na resposta aumentou diretamente com o critério de variação. No Experimento 2, a probabilidade total do reforço foi manipulada, enquanto o critério de variabilidade foi mantido constante, sendo observado que as mudanças na probabilidade do reforço não foram acompanhadas por alterações sistemáticas na variação comportamental (Machado, 1992; ver também Barba, 2000, para uma análise comparativa dos diversos procedimentos utilizados para produzir variabilidade). A literatura apresenta controvérsias sobre o que é aprendido em contingências de variação. De acordo com a interpretação molar (p. ex.: Page e Neuringer, 1985), os organismos aprendem a emitir seqüências de res- postas diferentes daquelas anteriormente apresentadas. A interpretação molecular (p. ex.: Machado, 1997), no entanto, defende que os organismos aprendem a alternar as respostas de uma seqüência entre os operanda disponíveis. Em ambos os casos, o resultado seria um responder variado. Em uma tentativa de demonstrar que a variabilidade é apenas um subproduto do reforçamento das alternações, Machado comparou o reforçamento de seqüências variadas (critério lag-n) com o reforçamento diferencial da freqüência de alternações em pombos. Seus resultados foram inconclusivos, uma vez que, embora o reforçamento das alternações tenha gerado níveis altos de variabilidade, os mesmos foram inferiores àqueles observados sob o critério lag. Resultados similares foram obtidos por Barba e Hunziker (2002) em um estudo com ratos. Nesse experimento foi observado também que a variabilidade produzida pelo reforçamento diferencial da alternação foi transitória, ou seja, tendeu a diminuir no decorrer das sessões, ao contrário da variabilidade gerada pelo critério lag, que se manteve alta e estável durante todo o experimento. Resultados comparáveis foram obtidos por AbreuRodrigues, Hanna, Cruz, Matos e Delabrida (1997). Esses autores apontaram que, embora drogas amnésticas tenham aumentado o número de seqüências diferentes sob contingências que exigiam uma resposta estereotipada, nenhum efeito foi observado sobre o número de alternações por seqüência, sugerindo uma independência funcional entre seqüências diferentes e respostas de alternação (ver também Machado, 1993). Dessa forma, esses resultados, em conjunto, indicam que as respostas de alternação devem ser consideradas na avaliação da variabilidade comportamental, mas não permitem conclusões definitivas sobre a adequação das propostas molar e molecular. No máximo, esses dados sugerem que os dois processos, reforçamento de seqüências diferentes e de respostas de alternação, podem coexistir, embora ainda não esteja claro o grau de dependência (ou de independência) entre eles (Barba e Hunziker, 2002). ANÁLISE DO COMPORTAMENTO Controle de estímulos e resistência à mudança As propriedades operantes da variabilidade comportamental também têm sido demonstradas por procedimentos que envolvem o controle de estímulos. No estudo de Page e Neuringer (1985, Experimento 6), pombos foram treinados em um esquema múltiplo com dois componentes. No componente de variabilidade, sinalizado por uma luz verde, um critério Lag 5 estava em vigor; no componente de estereotipia, sinalizado por uma luz vermelha, os animais tinham de repetir uma seqüência específica de respostas. Os resultados mostraram uma resposta variada na presença da luz verde e uma resposta repetitiva na presença da luz vermelha. Inversões nas condições de estímulo foram acompanhadas por inversões correspondentes na resposta. Em um estudo mais recente, Denney e Neuringer (1998, Experimento 1) utilizaram um procedimento diferente para produzir variação. Em um dos componentes, os reforços dependiam da freqüência de cada seqüência, de modo que as seqüências mais infreqüentes (e menos recentes) tinham maior probabilidade de serem reforçadas; no outro componente, a freqüência de reforços era idêntica àquela do componente anterior, mas não havia exigência de variação (as seqüências eram reforçadas apesar de sua freqüência de emissão). O primeiro componente gerou níveis mais altos de variabilidade do que o segundo, sendo essa diferença mais pronunciada logo no início de cada componente, antes que as conseqüências da resposta fornecessem informações adicionais sobre a contingência em vigor. Quando os estímulos exteroceptivos foram retirados (Experimento 2), os níveis de variabilidade dos dois componentes convergiram, um efeito que não deveria ocorrer caso o próprio reforçamento estivesse sinalizando os componentes. Esses resultados, portanto, demonstraram que a variabilidade comportamental é sensível ao controle de estímulos. O controle discriminativo da variabilidade tem sido investigado também em situações que envolvem a administração de etanol. 197 McElroy e Neuringer (1990) examinaram essa questão por meio de um delineamento de grupo, enquanto Cohen, Neuringer e Rhodes (1990) utilizaram um delineamento intra-sujeito. Sob a contingência de variação, alguns ratos foram treinados a emitir seqüências de quatro respostas de acordo com um critério Lag 5; sob a contingência de repetição, o reforço era contingente à emissão de um única seqüência. Em ambos os estudos, a administração de etanol gerou aumentos na variabilidade durante a contingência de repetição, diminuindo, assim, a porcentagem de reforços obtidos, mas não exerceu efeitos sobre o grau de variabilidade durante a contingência de variação (ver também Crow, 1988). Em um estudo subseqüente, Neuringer (1991) examinou se manipulações no tempo entre as respostas da seqüência (IRT) afetariam a variabilidade comportamental. As contingências de variação e de repetição eram semelhantes àquelas descritas anteriormente, exceto que diferentes durações de IRT (entre 0 e 4 s) eram requeridas para o reforçamento. A variabilidade das seqüências aumentou com os aumentos no IRT em ambas as contingências, aumentando a porcentagem de reforços obtidos sob a contingência de variação e diminuindo os reforços sob a contingência de repetição. Neuringer sugeriu que cada resposta na seqüência provavelmente exerce um forte controle discriminativo sobre a resposta subseqüente em contingências de repetição, e que tal controle deve ser fraco, e desnecessário, em contingências de variação. Quando longos IRTs são exigidos, o controle discriminativo exercido por respostas anteriores é interrompido, originando uma maior variação na resposta sob a contingência de repetição. Esse autor também especulou que os efeitos do etanol sobre a variabilidade, obtido por Cohen e colaboradores (1990) e por McElroy e Neuringer (1990), pode ser resultado de interferências no controle discriminativo exercido pelas respostas da seqüência de repetição. Essa sugestão foi investigada por AbreuRodrigues, Hanna e colaboradores (1997). Nesse estudo, ratos receberam injeções de midazo- 198 ABREU-RODRIGUES, RIBEIRO & COLS. lam e pentilenotetrazol (PTZ), drogas que compartilham com o etanol uma propriedade farmacológica comum – prejudicam a memória. Os resultados foram similares àqueles obtidos com o etanol, ou seja, um aumento na variação durante a contingência de estereotipia e pouco ou nenhum efeito sob a contingência de variabilidade. Uma vez que o midazolam, o PTZ e o etanol produzem efeitos similares (isto é, aumentam a variação comportamental somente quando a resposta está supostamente sob o controle das respostas previamente emitidas) e uma vez que essas drogas apresentam propriedades amnésticas, é viável afirmar que esses dados apóiam a interpretação de interferência no controle discriminativo (Neuringer, 1991). Os estudos com drogas (Abreu-Rodrigues, Hanna et al.,1997; Cohen et al., 1990; McElroy e Neuringer, 1990), bem como aquele com manipulações no IRT (Neuringer, 1991), parecem sugerir que a resposta repetitiva é mais sensível a mudanças nas contingências do que a resposta variável. Essa questão foi avaliada sistematicamente por Doughty e Lattal (2001). Um esquema múltiplo com dois componentes encadeados foi utilizado. Esquemas VI idênticos operavam no elo inicial de cada componente. No elo terminal do componente de variação, o reforço era contingente à emissão de seqüências pouco freqüentes e pouco recentes; no elo terminal do componente de repetição, uma única seqüência produzia o reforço. As taxas de reforços eram similares nos dois elos terminais. Quando alimento livre era liberado no intervalo entre componentes, foi observado um decréscimo nas taxas de respostas nos elos iniciais e terminais, tanto do componente de variação quanto do de repetição, mas esse decréscimo foi mais acentuado no segundo. O estudo de Neuringer, Kornell e Olufs (2001) fornece dados similares. A extinção produziu aumentos mais acentuados nos níveis de variabilidade das seqüências previamente mantidas por contingências de repetição do que de variação, embora não tenha alterado a distribuição de freqüência das seqüências (a mais freqüente durante o reforçamento continuou sendo a mais freqüente durante a extinção). Esses resultados, portanto, confirmam aqueles obtidos anteriormente, ao demonstrarem que a variabilidade operante é mais resistente a mudanças nas contingências do que a repetição operante (ver Capítulo 4 para informações mais detalhadas sobre resistência a mudanças). Topografia da resposta Os efeitos de contingências de reforçamento sobre dimensões comportamentais (p. ex.: freqüência, probabilidade) são influenciados pela topografia da resposta. Se a variabilidade é suscetível ao reforçamento, então relações funcionais entre variabilidade e topografia também deveriam ser observadas. Essa questão foi investigada por Morgan e Neuringer (1990). Ratos foram treinados a gerar seqüências variáveis em três operanda diferentes – barra, disco e corrente – em três fases consecutivas. A variabilidade foi reforçada de acordo com o critério Lag 5. Os resultados mostraram que a variação nas seqüências foi afetada pela topografia da resposta: níveis altos de variabilidade foram observados com a resposta de pressionar a barra, níveis intermediários com a resposta de focinhar e níveis baixos com a resposta de puxar a corrente. Escolha entre repetição e variação A variabilidade comportamental também tem sido investigada no contexto de escolha. Quando organismos são treinados a escolher entre alternativas de respostas diferentes (p. ex.: respostas únicas no disco esquerdo versus respostas únicas no disco direito), a taxa relativa de respostas em uma alternativa muda diretamente com a taxa relativa de reforços naquela alternativa (Herrnstein, 1970). Se variabilidade é uma propriedade comportamental controlada por suas conseqüências, então a escolha entre seqüências variadas de respostas versus seqüências repetidas de respostas deveria ser similarmente influenciada pelas taxas de reforços para esses dois tipos de seqüências. Essa questão foi investigada por Neuringer (1992). Pombos foram treinados a variar ou a repetir seqüências de quatro respostas. Antes ANÁLISE DO COMPORTAMENTO da emissão de cada seqüência, o computador selecionava se a variação ou a repetição seria reforçada naquela tentativa. Quando a variação era selecionada, o reforço só ocorria se a seqüência diferisse das três últimas seqüências; quando a repetição era selecionada, o reforço só era liberado se a seqüência fosse igual a qualquer uma das três últimas. Caso a seqüência não atendesse o critério em vigor naquela tentativa, um timeout era iniciado, e a mesma contingência ficava em vigor até a liberação do reforço. A escolha entre variação e repetição era reforçada de acordo com diferentes probabilidades (entre 0,0 e 1,0) ao longo das condições. A porcentagem de seqüências que atendiam ao critério de variação aumentou com os aumentos na probabilidade de reforço para variação, o que foi interpretado por Neuringer como evidência de que a escolha entre variar e repetir seqüências de respostas é controlada pela probabilidade do reforço. O estudo de Neuringer (1992), no entanto, apresenta problemas no que se refere à mensuração da preferência. Em seu procedimento, a medida de preferência (razão entre as porcentagens de seqüências variadas e repetidas) não foi separada dos padrões de respostas produzidos pelo reforçamento direto dessas seqüências. Isto é, foi afirmado que o participante preferia variar quando a porcentagem de seqüências variadas era maior do que a de seqüências repetidas. Mas, uma vez que a porcentagem de seqüências variadas foi uma função direta da probabilidade de reforços para variação, é difícil indicar se a porcentagem mais alta de seqüências variadas representa acuradamente a escolha pela contingência de variação. Fantino (1977) observou que, em situações como essas, a preferência seria mais adequadamente avaliada por meio de esquemas concorrentes encadeados nos quais o comportamento de escolha é separado dos padrões de respostas que são diretamente reforçados (para descrições de esquemas concorrentes encadeados, consultar Catania, 1984; Mazur, 1991; para informações mais detalhadas sobre escolha, ver Capítulo 9). Essa sugestão foi adotada por AbreuRodrigues (1994) em um estudo em que alguns pombos foram expostos a um esquema 199 concorrente encadeado, no qual dois esquemas VI idênticos operavam nos elos iniciais, enquanto contingências de variação e repetição operavam nos elos terminais, ambas com taxas de reforços similares. Durante o elo terminal de variação, a seqüência era reforçada se diferisse de cada uma de n seqüências anteriores; durante o elo terminal de repetição, o reforço era contingente à emissão de uma seqüência específica (EDDD). O critério de variabilidade foi manipulado no elo terminal de variação de modo que, para ser reforçada, a seqüência tinha de atender ao critério Lag 1, Lag 5 e Lag 10 ao longo de três condições experimentais. A contingência de repetição gerou níveis baixos e constantes de variabilidade, enquanto a contingência de variação produziu níveis de variabilidade que aumentaram com os aumentos no critério lag. A preferência pela contingência de repetição aumentou diretamente com o critério lag, sugerindo que a escolha entre repetição e variação pode ser predita e controlada pelo grau de variabilidade comportamental exigido pela contingência de reforço (ver também Abreu-Rodrigues, Santos e Matos, 2004). Resultados comparáveis foram posteriormente obtidos com humanos (AbreuRodrigues, Bento et al., 1997). Estereotipia sob contingências de variação Os estudos de Abreu-Rodrigues (1994), Abreu-Rodrigues, Bento e colaboradores (1997) e Abreu-Rodrigues e colaboradores (2004) também apresentaram evidências de que, sob condições de variabilidade, humanos e não-humanos variam somente o mínimo necessário para atender as exigências da contingência. Por exemplo, sob o critério Lag 5, embora houvesse 16 seqüências possíveis, os pombos desenvolveram um conjunto estereotipado de seqüências de modo que, ao final do treino, estavam emitindo não mais do que oito seqüências diferentes. Essa estratégia comportamental foi denominada por Schwartz (1982c) de “estereotipia de segundo grau” (ver também Barrett, Deitz, Gaydos e Quinn, 1987; Reilly, 1993). Como explicar a ocorrência de estereotipia sob contingências de variação? Uma pri- 200 ABREU-RODRIGUES, RIBEIRO & COLS. meira possibilidade é considerar que a estereotipia pode refletir uma resposta eficiente à medida que o reforço é produzido com um gasto mínimo de energia. Sob contingências de variação, a eficiência pode corresponder à emissão apenas daquelas seqüências que contêm poucas mudanças entre chaves (EEEE em oposição a EDED). Hunziker, Caramori, da Silva e Barba (1998) apresentam algumas razões para esse efeito. Primeiro, eles sugerem que a resposta de alternação pode ser parte da seqüência de respostas de bicar (no caso de pombos). Isto é, seqüências sem respostas de alternação (p. ex.: DDDD) contêm somente quatro respostas de bicar; seqüências com três respostas de alternação (p. ex.: DEDE), por outro lado, compreendem sete respostas, quatro respostas de bicar e três respostas de alternação. Conseqüentemente, seqüências com poucas alternações seriam mais prováveis porque produzem maior densidade de reforços. Segundo, Hunziker e colaboradores argumentam que seqüências com menor número de alternações gastam menos tempo para serem emitidas e, assim, aumentam a taxa de reforços. Finalmente, esses autores defendem que a posição da resposta de alternação deve ser considerada, uma vez que as seqüências DEEE e DDDE, ambas com somente uma alternação, não são similarmente aprendidas, requerendo a segunda um treino mais longo (Cohen et al., 1990; Neuringer, 1993; Reid, 2002). Uma outra possibilidade é que a estereotipia de segundo grau resulte das propriedades seletivas do reforço, conforme sugerido por Schwartz (1982a), ou seja, considerando que o reforçamento produz repetição, não seria surpreendente observar a repetição sob contingências de variação. Entretanto a ocorrência de repetição irá depender da extensão em que é permitida pela contingência. Com contingências mais permissivas (p. ex.: Lag 1), as repetições são mais freqüentes; com contingências mais restritivas (p. ex.: Lag 10), por outro lado, as repetições implicariam perda de reforços e, conseqüentemente, são menos freqüentes (Abreu-Rodrigues, 1994; Abreu-Rodrigues, Bento et al., 1997; Abreu-Rodrigues et al., 2004). Cherot, Jones e Neuringer (1996) também encontraram evidências de que o reforçamento contingente à variabilidade gera estereotipia. Ratos e pombos foram expostos à contingências de variação (critério Lag 3) ou de repetição (a seqüência tinha de ser igual a uma das três últimas seqüências). Um esquema FR 4 foi sobreposto a cada uma dessas contingências de modo que o reforço era contingente à emissão de quatro seqüências corretas (que atendiam o critério de variação ou de repetição). Foi observado que a proximidade do reforço diminuiu o nível de variabilidade das seqüências, tornando a resposta menos acurada sob a contingência de variação (e mais acurada sob a contingência de repetição), sendo esse efeito observado tanto com reforços primários como com secundários. Neuringer (1993) manipulou diretamente o reforçamento simultâneo de variação e de repetição. Após a obtenção de uma linha de base estável sob um critério de variação Lag 5, contingências “sempre” e “nunca” foram sobrepostas à linha de base de variação, ou seja, a emissão de uma seqüência particular era sempre seguida pelo reforço, enquanto a emissão de uma outra seqüência específica nunca era reforçada, independentemente de essas seqüências atenderem ou não o critério lag. Durante a linha de base, as duas seqüências apresentaram freqüências similares; quando as contingências “sempre” e “nunca” foram adicionadas, a freqüência da seqüência “sempre” aumentou substancialmente enquanto a freqüência da seqüência “nunca” diminuiu (Experimento 1). O custo envolvido na emissão de uma seqüência também influencia a ocorrência de estereotipia sob contingências de variação. No estudo de Neuringer (1993, Experimentos 2 e 3), a freqüência de cada seqüência na linha de base foi considerada como um indicativo do grau de dificuldade daquela seqüência. Uma contingência “sempre” foi sobreposta à contingência de variação de modo que três seqüências (fácil, intermediária e difícil) foram sempre reforçadas em condições sucessivas do experimento. Os resultados mostraram que as propriedades seletivas do reforço variaram diretamente com o grau de dificuldade da se- ANÁLISE DO COMPORTAMENTO qüência: a freqüência da seqüência “fácil” aumentou mais do que a da seqüência “intermediária”, enquanto a freqüência da seqüência “difícil” permaneceu inalterada. Nos Experimentos 4 e 5, Neuringer demonstrou uma estratégia para aumentar a freqüência da seqüência “difícil”. Nesses experimentos, um esquema VI foi sobreposto à contingência de variação, ou seja, após a passagem de um intervalo variado de tempo, a primeira seqüência que atendesse o critério de variação era reforçada; a contingência “sempre” continuava em vigor para a seqüência “difícil”. Ao longo das sessões, o valor do VI foi alterado de 5 para 500 s. Essa retirada gradual do reforço para variação, acompanhada pelo reforçamento contínuo da seqüência “difícil”, produziu aumentos na freqüência dessa seqüência. O autor concluiu que o reforçamento simultâneo de variação e repetição consiste em uma estratégia eficaz para o treinamento de comportamentos improváveis ou difíceis de serem aprendidos (ver também Neuringer, Deiss e Olson, 2000). História de reforçamento A literatura apresenta uma série de estudos que apontam efeitos de variáveis históricas sobre a manutenção da variabilidade comportamental. Stokes e Balsam (2001, Experimento 2), por exemplo, expuseram estudantes universitários a uma contingência de variação em três momentos distintos do treino da resposta de mover uma luz da parte superior para a parte inferior de uma pirâmide. Para o Grupo I, um critério Lag 25 de variação foi implementado no primeiro bloco de 50 tentativas reforçadas; para o Grupo II, no segundo bloco; e para o Grupo III, no quarto bloco. Nos outros blocos a variação era permitida, mas não era exigida para o reforço. O Grupo Controle não foi exposto ao critério lag. O experimento foi finalizado após a obtenção de 350 reforços. Observou-se que a introdução do critério lag aumentou a variação dos “caminhos” empregados para percorrer a pirâmide. No entanto, na ausência do critério lag, a variabilidade 201 na resposta só se manteve para o Grupo II. Esses resultados sugerem que a manutenção da variabilidade é mais provável quando exigências de variação são implementadas nas fases iniciais da aprendizagem de uma nova tarefa e após a aprendizagem de rudimentos da tarefa (ver também Stokes, Mechner e Balsam, 1999). Outros estudos, no entanto, mostram que a manutenção de padrões variáveis pode ocorrer mesmo quando o treino já começa com a contingência de variação em vigor. No estudo de Stokes (1999), no qual foi utilizada uma matriz 6 x 6, estudantes universitários foram divididos em dois grupos. Para o Grupo I, a ordem de exposição às condições experimentais foi Lag 25, Lag 10, Lag 2 e ausência de exigência de variação. O Grupo II foi exposto à ordem inversa dessas condições. Para os dois grupos, o nível de variabilidade obtido correspondeu ao nível de variabilidade exigido ao longo das condições. Entretanto a apresentação do critério mais rigoroso, logo no início do experimento, gerou uma variação mais acentuada na resposta em todas as condições investigadas, quando comparada à exposição inicial com ausência do critério lag. Hunziker e colaboradores (1998) também obtiveram efeitos similares. Nesse estudo, ratos respondiam em duas chaves de acordo com um esquema FR 4 (reforços eram independentes da variação). Quando essa condição era precedida por uma condição com o critério lag 4 (reforços eram dependentes da variação), foram obtidos níveis mais altos de variabilidade do que na ausência dessa experiência prévia (cf. Saldana e Neuringer, 1998). Nos trabalhos de Hunziker e colaboradores (1998) e de Stokes (1999), a condição inicial compreendia ou uma exigência de variação ou a ausência dessa exigência. No estudo de Stokes e Harrison (2002), por outro lado, foram comparadas duas condições iniciais que exigiam variação, as quais se diferenciavam em termos do rigor do critério de variação. Foi observado que o critério mais rigoroso gerou níveis mais altos de variabilidade após a retirada da contingência de variação do que o critério menos rigoroso (ver também Abreu-Rodrigues, 1994; Abreu-Rodrigues, Bento et al., 1997; Abreu-Rodrigues et al., 202 ABREU-RODRIGUES, RIBEIRO & COLS. 2004). Em resumo, esses trabalhos sugerem que a manutenção da variabilidade é mais provável quando a exigência de variação ocorre no início da aprendizagem e, principalmente, quando níveis altos de variação são prontamente exigidos (consultar o Capítulo 3 para informações detalhadas sobre efeitos da história de reforçamento). Controle verbal Barrett e colaboradores (1987) investigaram a influência de contingências verbais e sociais sobre a variabilidade comportamental. Nesse estudo, estudantes universitários foram expostos à tarefa da matriz (5 x 5). Na primeira fase, qualquer seqüência de respostas produzia o reforço. Na segunda fase, os participantes recebiam uma instrução indicando que o reforço era contingente à emissão de um padrão variado de seqüências. Um critério Lag 10 estava em vigor nessa fase. A terceira fase consistiu em um retorno, não-sinalizado, às condições do início do experimento (Experimento 1) ou à extinção (Experimento 2). Metade dos participantes desempenhou a tarefa na presença do experimentador, e a outra metade, na ausência do experimentador. Todos os participantes apresentaram uma resposta estereotipada na primeira fase e, quando a instrução de variabilidade foi apresentada, todos passaram prontamente a emitir seqüências variadas. Na terceira fase foi observada uma manutenção da variabilidade para os participantes que desempenharam a tarefa com o experimentador, em ambos os experimentos; para os participantes que desempenharam a tarefa sozinhos, no entanto, ocorreu um decréscimo no nível de variação da resposta. Esses resultados indicam que o comportamento de seguir as instruções manteve-se após a mudança nas contingências em função do controle social exercido pelo experimentador. Em um trabalho subseqüente, Hunzinker Lee, Ferreira, da Silva e Caramori (2002, Experimento 2) forneceram informações adicionais sobre a sensibilidade da variação comportamental ao controle instrucional. Estudantes universitários foram divididos em dois grupos. Um grupo foi exposto a uma contingência de variação (VAR), na qual o reforço era contingente à emissão de seqüências pouco freqüentes e menos recentes; outro grupo foi exposto a uma contingência de acoplamento (ACO), na qual o reforço era liberado para qualquer seqüência, de modo que a freqüência média de reforços era idêntica àquela da contingência de variabilidade. Metade dos participantes de cada grupo recebeu uma instrução que descrevia a contingência de variação (VAR-V e ACOV) e a outra metade, uma instrução que descrevia a contingência de acoplamento (VAR-A e ACO-A). Dessa forma, para metade dos participantes a instrução era acurada (VAR-V e ACO-A) e, para a outra metade, inacurada (VAR-A e ACO-V). Os resultados mostraram que os participantes expostos à contingência de variação apresentaram níveis de variabilidade mais altos (e com menor diversidade entre participantes) que aqueles expostos à contingência de acoplamento, apesar do grau de acurácia das instruções. Instruções acuradas promoveram uma resposta mais apropriada às contingências em vigor, enquanto instruções inacuradas foram acompanhadas por níveis intermediários de variação. Esses resultados sugerem que o controle exercido pelas instruções dependeu da extensão em que o comportamento de seguir essas instruções era reforçado pela contingência em vigor (ver Capítulo 12 para informações detalhadas sobre controle instrucional). CONTRIBUIÇÕES DA PESQUISA APLICADA A variabilidade comportamental pode ser bastante desejável em situações como aquelas que envolvem resolução de problemas (p. ex.: aumentar a produtividade de uma empresa), atividades artísticas (p. ex.: compor uma melodia), atividades esportivas (p. ex.: iludir o adversário para marcar pontos no jogo), desempenhos acadêmicos (p. ex.: desenvolvimento de projetos de pesquisa), etc. Em outros casos, a variabilidade seria prejudicial ao indivíduo, e o esperado seria um comportamento preciso, exato, como, por exemplo, ao fazer ANÁLISE DO COMPORTAMENTO uma cirurgia com a utilização de raio laser, ao se apresentar em um teatro com um grupo de balé, ao trabalhar em uma linha de montagem (Stokes e Balsam, 2001). Assim, dependendo das exigências do ambiente, níveis diversos de variação comportamental tornam-se necessários. Apesar da relevância da variabilidade/ estereotipia comportamental para a adaptação dos indivíduos ao ambiente, a literatura analítico-comportamental apresenta um número bastante reduzido de estudos no contexto da pesquisa aplicada prioritariamente interessados nesse tópico. Em alguns desses estudos, os quais são descritos a seguir, a variabilidade foi induzida por meio de extinção ou diretamente produzida por meio de reforçamento explícito. Duker e van Lent (1991) utilizaram a extinção para aumentar a variabilidade na comunicação gestual de indivíduos portadores de necessidades especiais. Tem sido observado que, após serem treinados a usar espontaneamente um vocabulário relativamente amplo de gestos, esses indivíduos tendem a usar apenas uma pequena parte desse vocabulário. Durante a linha de base, a emissão de gestos espontâneos foi reforçada pela obtenção do objeto solicitado. Por exemplo, se o participante fazia um gesto solicitando um quebra-cabeça, a professora verbalizava “Muito bem, (nome do participante), eu quero o quebra-cabeça” e entregava o objeto. Durante a extinção, as solicitações gestuais mais freqüentes não foram seguidas pelo objeto. Para todos os outros gestos, continuavam em vigor a condições de reforçamento da linha de base. A extinção produziu um aumento na diversidade de gestos espontâneos, um efeito que se manteve mesmo após o retorno à linha de base. Lalli, Zanolli e Wohn (1994) também empregaram a extinção com o objetivo de promover a variação na topografia do comportamento de brincar com brinquedos. Durante a linha de base, foi observado que os participantes não brincavam com os brinquedos disponíveis (p. ex.: um avião e uma boneca). Na sessão de treino, o experimentador utilizou modelação e prompts físicos para ensinar uma topografia de resposta para cada brinquedo (p. ex.: movimentos horizontais com o avião e ali- 203 mentação da boneca). Em seguida, foram implementadas sessões de sondagem, durante as quais as topografias treinadas eram inicialmente reforçadas e, após três reforços, eram colocadas em extinção. O procedimento de reforçamento e extinção era repetido para cada topografia nova (não-treinada) que ocorresse durante a sessão de sondagem. Essa sessão era finalizada quando uma nova topografia não era observada por 60 s. Os resultados mostraram que a extinção resultou em um aumento substancial no número de topografias diferentes dos comportamentos de brincar com os brinquedos, um resultado comparável àquele obtido com animais (p. ex.: Antonitis, 1951; Stokes, 1995). Uma das primeiras pesquisas aplicadas em que a variabilidade foi explicitamente reforçada foi realizada por Goetz e Baer (1973). Considerando que brincar com blocos é comumente considerado como uma atividade pedagógica que contribui para os conceitos de espaço, forma, matemática, equilíbrio, etc., os autores argumentaram que, para atingir tais fins, era necessário que esse comportamento fosse emitido de forma variada. O objetivo do estudo, então, consistiu em avaliar uma metodologia para promover a variabilidade no comportamento em questão. Os participantes do estudo foram crianças que, ao brincarem com os blocos durante a linha de base, geraram um número pequeno de formas diferentes. Quando reforços sociais eram fornecidos sempre que a criança produzia uma forma diferente, ou seja, uma forma que ainda não tinha aparecido naquela sessão (“Muito bem, isto é diferente!”), aumentava o número de formas diferentes apresentadas. Quando reforços sociais eram contingentes à apresentação de formas já observadas naquela sessão (“Muito bem, você fez um [nome da forma] de novo!”), o número de formas diferentes por sessão decrescia. Ainda, o número de formas novas, isto é, formas nunca antes observadas (nas sessões anteriores), aumentou durante o reforço contingente a formas diferentes, mas não durante o reforço contingente à repetição de formas. Os autores concluíram que o procedimento foi efetivo na produção de variabilidade, mas apontaram que não era possível atribuir tal efei- 204 ABREU-RODRIGUES, RIBEIRO & COLS. to exclusivamente ao reforçamento, uma vez que os reforços verbais incluíam descrições do desempenho apropriado (diversidade ou similaridade). Lee, McComas e Jawor (2002) tentaram reduzir a estereotipia comportamental comumente apresentada por indivíduos autistas por meio do reforçamento direto da variação. Nesse estudo, a variável dependente consistiu na porcentagem de respostas variadas e apropriadas a questões sociais. Para a pergunta “O que você gosta de fazer?”, a resposta era considerada apropriada quando indicava uma atividade socialmente aceitável (p. ex.: “jogar boliche”). Durante a linha de base, o reforçamento diferencial de respostas apropriadas não produziu um comportamento verbal variado. Quando uma contingência Lag 1 (a resposta só era reforçada quando diferia, no conteúdo, da última resposta à mesma questão) foi sobreposta ao reforçamento diferencial, ocorreu um aumento substancial e sistemático na percentagem de respostas variadas e apropriadas, como também no número acumulado de novas respostas (nunca antes emitidas). A replicação de ambas as condições produziu resultados similares. Foi observada também a generalização da resposta variada para outros ambientes e para outras pessoas. Outra demonstração de que a variabilidade comportamental pode ser promovida em indivíduos com autismo foi fornecida por Miller e Neuringer (2000). Nesse estudo, três grupos de indivíduos (autistas, estudantes universitários e crianças sem diagnóstico de distúrbios físicos ou psicológicos) foram expostos a uma tarefa que consistia na emissão de seqüências de quatro respostas. Na condição de variação, os reforços eram contingentes à emissão de seqüências pouco freqüentes e recentes; na condição precedente e seguinte, os reforços eram liberados em uma taxa aproximadamente igual, mas eram independentes da ocorrência ou não de variação. Para todos os grupos, a introdução da contingência de variação aumentou o nível de variabilidade das seqüências que, por sua vez, manteve-se quando a exigência de variação foi retirada. Os participantes com autismo apresentaram níveis de variação mais baixos do que os demais participantes em todas as condições. Os autores concluíram que esses resultados sugerem que a estereotipia comportamental mostrada por autistas não é uma característica imutável do repertório desses indivíduos, mas sim o resultado da ausência de contingências de variação efetivas. Esses resultados, em conjunto com aqueles obtidos por Goetz e Baer (1973) e por Lee e colaboradores (2002), estendem para o contexto aplicado a noção de que a variabilidade pode ser controlada por reforço contingente. Miller e Neuringer (2000) apresentaram algumas vantagens do estabelecimento de contingências de variação em situações aplicadas. Primeiro, o reforçamento da variabilidade pode aumentar o repertório de respostas e, assim, facilitar o processo seletivo de comportamentos socialmente mais apropriados. Segundo, o reforçamento direto da variabilidade pode apresentar algumas vantagens em relação a outras estratégias para promover a variação. A variabilidade gerada pela extinção é transitória, enquanto a variação produzida pelo reforçamento direto pode manter-se por um longo tempo. O reforçamento diferencial de outros comportamentos (DRO), o reforçamento diferencial de taxas baixas (DRL) e o reforçamento não-contingente, também utilizados para diminuir estereotipias, podem gerar um comportamento supersticioso, da mesma forma que a extinção, DRL e reforçamento não-contingente podem produzir comportamentos agressivos. Ambos os efeitos não foram relatados até então com o reforçamento direto da variação. Em resumo, dada a importância da variabilidade para a evolução do comportamento, torna-se crítico para os analistas do comportamento determinar a natureza e as fontes da variação comportamental. Ao fazer isso, os pesquisadores têm indicado que a variabilidade pode tanto ser um subproduto de contingências de reforçamento (variabilidade induzida pelo esquema) quanto pode ser produzida e mantida diretamente por reforçamento contingente (variabilidade operante). Na discussão a seguir, será apontada brevemente a relevância dos estudos de variabilidade para o fenômeno da criatividade. ANÁLISE DO COMPORTAMENTO COMPORTAMENTO CRIATIVO E LIBERDADE DE ESCOLHA O que é um comportamento criativo? Winston e Baker (1985) apontam que o termo criatividade tem sido comumente identificado com diversidade/variabilidade e novidade/originalidade. Esses termos, por sua vez, podem ser multiplamente definidos. Um livro técnico, por exemplo, pode conter diversidade em termos da quantidade de tópicos abordados ou da quantidade de análises diferentes apresentadas para um mesmo tópico. Pode também ser considerado original porque é diferente de tudo aquilo que o autor fez antes ou porque apresenta análises nunca antes oferecidas naquela área de conhecimento. Diante disso, qual seria a dimensão relevante para considerar este livro um exemplo de comportamento criativo? Essa questão, ainda não resolvida na literatura pertinente, aponta para o fato de que a definição de criatividade deve considerar o contexto sociocultural em que o comportamento ocorre. Assim sendo, todo trabalho criativo envolve diversidade e originalidade, mas o contrário nem sempre é verdadeiro. Winston e Baker argumentam que, para um comportamento ser considerado criativo, é necessário também que ele seja apropriado, relevante, útil ou valioso de alguma forma, dentro de uma certa cultura e em um determinado momento no tempo. Dessa forma, o livro seria um exemplo de criatividade quando, além de apresentar algumas das (ou todas as) características mencionadas, fornecesse uma contribuição efetiva para o desenvolvimento da área de conhecimento. Embora a questão da qualidade seja a característica definidora da atividade criativa e mereça, por si só, ser alvo de investigações, discussões sobre o contexto sociocultural da criatividade fogem ao escopo deste capítulo. O objetivo aqui consiste em mostrar que as pesquisas sobre variabilidade lidam diretamente com a diversidade e com a originalidade do comportamento e, portanto, contribuem para a compreensão do fenômeno da criatividade. Assim, o termo comportamento criativo será empregado com base apenas nesses dois aspectos. 205 Conforme apontado no início deste capítulo, a ação seletiva do ambiente, em um nível filogenético ou ontogenético, requer a existência de um substrato de variabilidade. O reforçamento, por exemplo, enquanto um processo seletivo ontogenético, só é possível se houver variação comportamental. Diante dessa variação, a contingência de reforço seleciona algumas respostas (aquelas que produzem o reforço) em detrimento de outras (aquelas que não produzem o reforço) e, assim, algumas respostas têm sua probabilidade de ocorrência aumentada. Quando o ambiente muda, de modo que as respostas predominantes não são mais efetivas para produzir o reforço, outras respostas, previamente selecionadas em condições ambientais similares, passam a ser evocadas pelo ambiente modificado. Estímulos no novo ambiente que são similares àqueles do ambiente antigo produzem, então, combinações únicas de respostas. Quanto maior a variedade de respostas disponíveis no repertório comportamental de um indivíduo, maior o número de combinações possíveis (isto é, mais criativo é o comportamento). Essas novas combinações são submetidas a seleções adicionais, de modo que padrões progressivamente complexos e diversos de comportamento evoluem (Donahoe e Palmer, 1994; Shahan e Chase, 2002; Skinner, 1989a, 1989b). Dessa forma, a criatividade não implica que o comportamento ocorre no vácuo. O comportamento criativo resulta de uma história de seleção. Uma vez que o comportamento criativo resulta de uma história de seleção e que o processo seletivo ocorre mais prontamente quando há variação comportamental, parece relevante perguntar como a variabilidade comportamental poderia ser estabelecida. As pesquisas aqui descritas mostram que essa variedade de respostas pode ser produzida indiretamente por alguns aspectos do ambiente (p. ex.: extinção), mas também pode ser produzida diretamente pelo reforço contingente, de modo que quanto maior o grau de variação exigido, maior a variação comportamental obtida. Portanto, se o objetivo é encorajar a criatividade, estabelecer o reforçamento diferencial da variação é uma alternativa. Ou seja, no decorrer do processo de aprendizagem, o indiví- 206 ABREU-RODRIGUES, RIBEIRO & COLS. duo deve não somente aprender como fazer algo, mas também como fazer esse algo de maneiras diferentes; a diversidade das formas aprendidas dependerá das exigências estabelecidas pelo ambiente, e, quanto mais cedo essas exigências forem feitas, mais provável será a manutenção da variabilidade (Stokes, 2001). Em uma interessante análise do trabalho de Monet, Stokes (2001) argumenta que um processo intenso, prematuro e acelerado de aquisição juntamente com o reforço social e com uma auto-imposição contínua de exigências de variação foram responsáveis pelo caráter criativo de seus quadros. Mais especificamente, Stokes coloca que Monet aprendeu logo cedo a desenhar e a pintar e, em decorrência dos elogios e da atenção que seus trabalhos produziram, um alto nível de variação foi selecionado logo no início da aquisição de suas habilidades artísticas. Uma vez tendo adquirido essas habilidades, a manutenção da variação ocorreu, dentre outros aspectos, em função de critérios rigorosos de variabilidade autoimpostos. A variabilidade resultante era reforçadora à medida que permitia o alcance de metas, como também era reforçada pelo público, pelos críticos e pelos demais artistas. E, uma vez que sua obra tinha (e tem) valor cultural, pode ser considerada como um exemplo de criatividade. Contextos educacionais, nos quais comportamentos criativos são bastante desejáveis, podem beneficiar-se amplamente dos achados da pesquisa básica e aplicada aqui relatados. Considere um professor de literatura interessado em despertar o interesse por poesia em seus alunos. Como parte das atividades prescritas por esse professor, os alunos devem ler poesias e interpretá-las. Os critérios utilizados para avaliar essas interpretações podem ser cruciais para o desenvolvimento da criatividade literária do aluno. Por exemplo, o professor pode reforçar apenas aquelas interpretações que coincidem com as suas próprias e, assim, selecionar uma classe restrita de interpretações, ou pode reforçar interpretações alternativas, contribuindo, dessa forma, para o desenvolvimento de um repertório literário diverso e original. Caso essas interpretações alternativas se- jam ingênuas, errôneas ou incompletas, podese usar o procedimento de modelagem por aproximações sucessivas para promover interpretações qualitativamente sofisticadas. Os achados aqui relatados também apontam outros dois aspectos importantes. Primeiro, conforme apontam os estudos de Stokes (1999) e de Stokes e Balsam (2001), o professor deve não somente incentivar a apresentação de interpretações alternativas logo no início do curso, como também exigir um nível alto de diversidade e de originalidade, estratégias que contribuirão para a manutenção do comportamento criativo em situações posteriores (mesmo naquelas situações em que a criatividade não seja explicitamente exigida). O segundo aspecto, sugerido pelos estudos de AbreuRodrigues (1994), Abreu-Rodrigues, Bento e colaboradores (1997) e Abreu-Rodrigues e colaboradores (2003), refere-se ao rigor dos critérios utilizados. Ao estabelecer critérios de criatividade, o professor deve lembrar que, caso eles se tornem muito rigorosos e difíceis de ser alcançados, e caso haja uma alternativa mais fácil para obter os reforços (p. ex.: o aluno pode conseguir boas notas caso suas interpretações sejam corretas, embora não sejam diversas nem originais), é muito provável que o aluno se esquive da contingência de criatividade. Uma solução seria utilizar o reforço intermitente para as interpretações repetitivas e, ao mesmo tempo, reforçar continuamente a ocorrência de interpretações diversas e originais, conforme sugere Neuringer (1993). É importante assinalar que a contribuição da análise do comportamento para a compreensão da atividade criativa não se restringe aos estudos de variabilidade. Conforme discutido por Balsam, Deich, Ohyama e Stokes (1998) e por Shahan e Chase (2002), outros processos comportamentais são igualmente relevantes e devem também ser considerados, tais como: controle respondente, discriminação, generalização, aprendizagem de conceitos, abstração, equivalência de estímulos, redes relacionais, controle instrucional, imitação e modelação. O controle operante da variabilidade é relevante também para discussões sobre liberdade de escolha. Para os libertários, o termo ANÁLISE DO COMPORTAMENTO liberdade (ou “livre arbítrio”) refere-se à autodeterminação. Os indivíduos são livres à medida que seus comportamentos resultam de decisões tomadas por um agente interno. Para eles, as demandas externas ameaçariam a liberdade. Os analistas do comportamento, por outro lado, rejeitam a idéia do homem autônomo e argumentam que o evento controlador primário das escolhas de um indivíduo reside no ambiente. É a negligência em identificar as contingências controladoras que ameaça a liberdade de um indivíduo, não o controle em si (Skinner, 1971). Quando o controle é desconhecido, o contracontrole torna-se menos provável. Seria possível, então, advogar liberdade quando um indivíduo não pode alterar as condições de controle relevantes? Se o conceito de liberdade é identificado com a possibilidade de contracontrole, disponibilidade de alternativas comportamentais e comportamento de escolha dependente do ambiente, então a seleção da variabilidade certamente poderia promover a liberdade. Tentativas de libertar o homem do controle são enganosas; o ponto crítico é como libertar o homem de certas formas de controle. O controle torna-se problemático quando produz vantagens para os agentes controladores, mas não para o indivíduo controlado, uma situação que se torna mais aversiva quando somente algumas, ou nenhuma, alternativas de contracontrole estão disponíveis. Conforme argumentado por Abreu-Rodrigues (1994), por meio da produção de uma história variada de relações comportamento-ambiente é possível aumentar a diversidade de estratégias de contracontrole presentes no repertório de um indivíduo. Quanto maior a diversidade de alternativas, maior a chance de um contracontrole bem-sucedido. Conseqüentemente, a liberdade de escolha é maximizada. CONCLUSÃO O comportamento de organismos humanos e não-humanos apresenta, indubitavelmente, variação. Se essa variabilidade é uma característica intrínseca do comportamento (Neuringer, 1993) ou se é induzida por deter- 207 minados aspectos do ambiente (Wetherington, 1982), ainda não está claramente definido. Mas as pesquisas, tanto a básica como a aplicada, têm demonstrado sistematicamente que a variabilidade pode ser diretamente controlada por contingências de reforço. Uma vez que o ambiente é caracteristicamente mutável, a existência de um repertório comportamental variado sugere maiores chances de adaptação. Assim sendo, a possibilidade de prever e de controlar a variação comportamental implica a possibilidade de desenvolvimento de estratégias de intervenção que, ao promover um repertório comportamental diverso, original e criativo, estariam contribuindo para a ocorrência de processos adaptativos mais efetivos e eficazes os quais, em última instância, garantiriam a própria sobrevivência da espécie. REFERÊNCIAS BIBLIOGRÁFICAS Abreu-Rodrigues, J. (1994). Choosing between varying and repeating behavior. Does the degree of variability matter? Tese de Doutorado não publicada, West Virginia University, Morgantown, WV, USA. Abreu-Rodrigues, J.; Bento, L.; Matos, R.; Dias, A.; Viegas, R.; Delabrida, Z.; Santos, C. (maio, 1997). Choosing to repeat and vary in concurrente-chain schedules: II. The effects of variability contingencies with human subjects. Painel apresentado na 23rd Annual Convention of the Association for Behavior Analysis, Chicago, IL, USA. Abreu-Rodrigues, J.; Hanna, E. S.; Cruz, A. P.; Matos, R.; Delabrida, Z. (maio, 1997). Differential effects of midazolam on behavioral stereotypy and variability. Painel apresentado na 23rd Annual Convention of the Association for Behavior Analysis, Chicago, IL, USA. Abreu-Rodrigues, J.; Lattal, K. A.; Santos, C. V.; Matos, R. A. (2004). Variation, repetition, and choice. Manuscrito submetido à publicação. Antonitis, J. J. (1951). Response variability in the white rat during conditioning, extinction, and reconditioning. Journal of Experimental Psychology, 42, 273-281. Balsam, P. D.; Deich, J. D.; Ohyama, T.; Stokes, P. D. (1998). Origins of new behavior. Em W. T. O’Donohue (Ed.), Learning and behavior therapy (p. 403-420). Needham Heights, MA: Allyn e Bacon. Barba, L. S. (2000). Comportamento aleatório: Algumas considerações. Psicologia: Teoria e Pesquisa, 16, 269-277. Barba, L. S.; Hunziker, M. H. L. (2002). Variabilidade comportamental produzida por dois esquemas de reforçamento. Acta Comportamentalia, 10, 5-12. Barrett, D. H.; Deitz, S. M.; Gaydos, G. R.; Quinn, P. C. (1987). The effects of programmed contingencies and 208 ABREU-RODRIGUES, RIBEIRO & COLS. social conditions on response stereotypy with human subjects. The Psychological Record, 37, 489-505. Blough, D. S. (1966). The reinforcement of least-frequent interresponse times. Journal of the Experimental Analysis of Behavior, 9, 581-591. Boren, J. J.; Moerschbaecher, J. M.; Whyte, A. A. (1978). Variability of response location on fixed-ratio and fixed-interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 30, 63-67. Bryant, D.; Church, R. (1974). The determinants of random choice. Animal Learning and Behavior, 2, 245248. Catania, A. C. (1984). Learning. Englewood Cliffs, NJ: Prentice Hall. Cherot, C.; Jones, A.; Neuringer, A. (1996). Reinforced variability decreases with approaches to reinforcers. Journal of Experimental Psychology: Animal Behavior Processes, 22, 497-508. Cohen, L.; Neuringer, A.; Rhodes, D. (1990). Effects of ethanol on reinforced variations and repetitions by rats under a multiple schedule. Journal of the Experimental Analysis of Behavior, 54, 1-12. Crow, L. T. (1988). Alcohol effects on variabilitycontingent operant responding in the rat. Bulletin of the Psychonomic Society, 26, 126-128. Denney, J.; Neuringer, A. (1998). Behavioral variability is controlled by discriminative stimuli. Animal Learning and Behavior, 26, 154-162. Donahoe, J. W.; Palmer, D. C. (1994). Learning and complex behavior. Boston: Allyn and Bacon. Doughty, A. H.; Lattal, K. A. (2001). Resistance to change of operant variation and repetition. Journal of the Experimental Analysis of Behavior, 76, 195-215. Duker, P. C.; van Lent, C. (1991). Inducing variability in communicative gestures used by severely retarded individuals. Journal of Applied Behavior Analysis, 24, 379-386. Eckerman, D. A.; Lanson, R. N. (1969). Variability of response location for pigeons responding under continuous reinforcement, intermittent reinforcement, and extinction. Journal of the Experimental Analysis of Behavior, 12, 73-80. Eckerman, D. A.; Vreeland, R. (1973). Response variability for humans receiving continuous, intermittent, or no positive experimenter feedback. Bulletin of the Psychonomic Society, 2, 297-299. Fantino, E. (1977). Conditioned reinforcement: Choice and information. Em W. K. Honig; J. E. R. Staddon (Eds.), Handbook of operant behavior (p. 313-339). Englewood Cliffs, NJ: Prentice-Hall. Ferraro, D. P.; Branch, K. H. (1968). Variability of response location during regular and partial reinforcement. Psychological Reports, 23, 1023-1031. Goetz, E. M.; Baer, D. M. (1973). Social control of form diversity and the emergence of new forms in children’s blockbuilding. Journal of Applied Behavior Analysis, 6, 209-217. Herrnstein, R. J. (1961). Stereotypy and intermittent reinforcement. Science, 133, 2067-2069. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266. Hunziker, M. H. L.; Caramori, F. C.; da Silva, A. P.; Barba, L. S. (1998). Efeitos da história de reforçamento sobre a variabilidade comportamental. Psicologia: Teoria e Pesquisa, 14, 149-159. Hunziker, M. H. L.; Moreno, R. (2000). Análise da noção de variabilidade comportamental. Psicologia: Teoria e Pesquisa, 16, 135-143. Hunziker, M. H. L.; Lee, V. P. Q.; Ferreira, C. C.; da Silva, A. P.; Caramori, F. C. (2002). Variabilidade comportamental em humanos: Efeitos de regras e contingências. Psicologia: Teoria e Pesquisa, 18, 139-147. Lachter, G. D.; Corey, J. R. (1982). Variability of the duration of an operant. Behaviour Analysis Letters, 2, 97-102. Lalli, J. S.; Zanolli, K.; Wohn, T. (1994). Using extinction to promote response variability in toy play. Journal of Applied Behavior Analysis, 27, 735-736. Lee, V. L. (1996). Variability of human latencies wit,h and without a criterion for reinforcement. The Psychological Record, 46, 519-538. Lee, R.; McComas, J. J.; Jawor, J. (2002). The effects of differential and lag reinforcement schedules on varied responding by individuals with autism. Journal of Applied Behavior Analysis, 35, 391-402. Machado, A. (1989). Operant conditioning of behavioral variability using a percentile reinforcement schedule. Journal of the Experimental Analysis of Behavior, 52, 155-166. Machado, A. (1992). Behavioral variability and frequency-dependency selection. Journal of the Experimental Analysis of Behavior, 58, 241-263. Machado, A. (1993). Learning variable and stereotypical sequences of responses: Some data and a new model. Behavioural Processes, 30, 103-129. Machado, A. (1997). Increasing the variability of response sequences in pigeons by adjusting the frequency of switching between two keys. Journal of the Experimental Analysis of Behavior, 68, 1-25. Margulies, S. (1961). Response duration in operant level, regular reinforcement, and extinction. Journal of the Experimental Analysis of Behavior, 4, 317-321. Mazur, J. E. (1991). Choice. Em I. H. Iversen e K. A. Lattal (Eds.), Techniques in the behavioral and neural sciences: Vol. 6. Experimental analysis of behavior (p. 219-250). New York: Elsevier. McElroy, E.; Neuringer, A. (1990). Effects of alcohol on reinforced repetitions and reinforced variation in rats. Psychopharmacology, 102, 49-55. McSweeney, F. K. (1974). Variability of responding on a concurrent schedule as a function of body weight. Journal of the Experimental Analysis of Behavior, 21, 357-360. Miller, N.; Neuringer, A. (2000). Reinforcing variability in adolescents with autism. Journal of Applied Behavior Analysis, 33, 151-165. Millenson, J. R.; Hurwitz, H. M. B.; Nixon, W. L. B. (1961). Influence of reinforcement schedules on ANÁLISE DO COMPORTAMENTO response duration. Journal of the Experimental Analysis of Behavior, 4, 243-250. Morgan, D. L.; Lee, K. (1996). Extinction-induced response variability in humans. The Psychological Record, 46, 145-159. Morgan, L.; Neuringer, A. (1990). Behavioral variability as a function of response topography and reinforcement contingency. Animal Learning and Behavior, 18, 257-263. Morris, C. J. (1987). The operant conditioning of response variability: Free-operant versus discrete-response procedures. Journal of the Experimental Analysis of Behavior, 47, 273-277. Morris, C. J. (1989). The effects of lag value on the operant control of response variability under free-operant and discrete-response procedures. The Psychological Record, 39, 263-270. Morris, C. J. (1990). The effects of satiation on the operant control of response variability. The Psychological Record, 40, 105-112. Neuringer, A. (1986). Can people behave “randomly”?: The role of feedback. Journal of Experimental Psychology: General, 115, 62-75. Neuringer, A. (1991). Operant variability and repetition as functions of interresponse time. Journal of Experimental Psychology: Animal Behavior Processes, 17, 3-12. Neuringer, A. (1992). Choosing to vary and repeat. Psychological Science, 3, 246-250. Neuringer, A. (1993). Reinforced variation and selection. Animal Learning and Behavior, 21, 83-91. Neuringer, A.; Voss, C. (1993). Approximating chaotic behavior. Psychological Science, 4, 113-119. Neuringer, A.; Deiss, C.; Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111. Neuringer, A.; Kornell, N.; Olufs, M. (2001). Stability and variability in extinction. Journal of Experimental Psychology: Animal Behavior Processes, 27, 79-94. Notterman, J. M.; Mintz, P. E. (1965). Dynamics of response. New York: Willey. Page, S.; Neuringer, A. (1985). Variability is an operant. Journal of Experimental Psychology: Animal Behavior Processes, 11, 429-452. Platt, J. R. (1973). Percentile reinforcement: Paradigms for experimental analysis of response shaping. Em G. H. Bower (Ed.), The psychology of learning and motivation: Vol. 17. Advances in theory and research (p. 271-296). New York: Academic Press. Pryor, K. W.; Haag, R.; O’Reilly, J. (1969). The creative porpoise: Training for novel behavior. Journal of the Experimental Analysis of Behavior, 12, 653-661. Reid, A. K. (2002). Learning new response sequences. Behavioural Processes, 32, 147-161. Reilly, M. P. (1993). The effects of interresponse intervals on behavioral variability in humans. Dissertação de Mestrado não publicada, University of North Texas, Denton, TX, USA. Saldana, R. L.; Neuringer, A. (1998). Is instrumental variability abnormally high in children exhibiting ADHD 209 and aggressive behavior? Behavioural Brain Research, 94, 51-59. Schoenfeld, W. N. (1968). On the difference in resistance to extinction following regular and periodic reinforcement. Journal of the Experimental Analysis of Behavior, 11, 259-261. Schoenfeld, W. N.; Harris, A. H.; Farmer, J. (1966). Conditioning response variability. Psychological Reports, 19, 551-557. Schwartz, B. (1980). Development of complex, stereotyped behavior in pigeons. Journal of the Experimental Analysis of Behavior, 33, 153-166. Schwartz, B. (1982a). Failure to produce response variability with reinforcement. Journal of the Experimental Analysis of Behavior, 37, 171-181. Schwartz, B. (1982b). Interval and ratio reinforcement of a complex sequential operant in pigeons. Journal of the Experimental Analysis of Behavior, 37, 349-357. Schwartz, B. (1982c). Reinforcement-induced behavioral stereotypy: How not to teach people to discover rules. Journal of Experimental Psychology: General, 111, 23-59. Shahan, T. A.; Chase, P. N. (2002). Novelty, stimulus control, and operant variability. The Behavior Analyst, 25, 175-190. Shimp, C. P. (1967). Reinforcement of least-frequent sequences of choices. Journal of the Experimental Analysis of Behavior, 10, 57-65. Sidman, M. (1960). Tactics of scientific research. New York: Basic Books. Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York: Appleton-CenturyCrofts. Skinner, B. F. (1971). Beyond freedom and dignity. New York: Alfred A. Knopf. Skinner, B. F. (1989a). The phylogeny and ontogeny of behavior. Em A. C. Catania; S. Harnard (Eds.), The selection of behavior. The operant behaviorism of B. F. Skinner: Comments and consequences (p. 11-76). Cambridge: Cambridge University Press. Skinner, B. F. (1989b). Selection by consequences. Em A. C. Catania; S. Harnard (Eds.), The selection of behavior. The operant behaviorism of B. F. Skinner: Comments and consequences (p. 382-461). Cambridge: Cambridge University Press. Stebbins, W. C.; Lanson, R. N. (1962). Response latency as a function of reinforcement schedule. Journal of the Experimental Analysis of Behavior, 5, 299-304. Stebbins, W. C.; Reynolds, R. W. (1964). Note on changes in response latency following discrimination training in the monkey. Journal of the Experimental Analysis of Behavior, 7, 229-231. Stokes, P. D. (1995). Learned variability. Animal Learning and Behavior, 23, 164-176. Stokes, P. D. (1999). Learned variability levels: Implications for creativity. Creativity Research Journal, 12, 37-45. Stokes, P. D. (2001). Variability, constraints, and creativity. American Psychologist, 56, 355-359. 210 ABREU-RODRIGUES, RIBEIRO & COLS. Stokes, P. D.; Balsam, P. (2001). An optimal period for setting sustained variability levels. Psychonomic Bulletin and Review, 8, 177-184. Stokes, P. D.; Harrison, H. M. (2002). Constraints have different concurrent effects and aftereffects on variability. Journal of Experimental Psychology: General, 131, 552-566. Stokes, P. D.; Mechner, F.; Balsam, P. D. (1999). Effects of different acquisition procedures on response variability. Animal Learning and Behavior, 27, 28-41. Tatham, T. A.; Wanchisen, B. A.; Hineline, P. N. (1993). Effects of fixed and variable ratios on human behavioral variability. Journal of the Experimental Analysis of Behavior, 59, 349-359. Vogel, R.; Annau, Z. (1973). An operant discrimination task allowing variability of reinforced response patterning. Journal of the Experimental Analysis of Behavior, 20, 1-6. Wetherington, C. L. (1982). Is adjunctive behavior a third class of behavior? Neuroscience and Biobehavioral Reviews, 6, 329-350. Winston, A. S.; Baker, J. E. (1985). Behavior analysis studies of creativity: A critical review. The Behavior Analyst, 8, 191-205. Zimmerman, D. W. (1960). Intermittent reinforcement of discriminatively controlled responses and runs of responses. Journal of the Experimental Analysis of Behavior, 3, 83-91. ANÁLISE DO COMPORTAMENTO REGRAS E AUTO-REGRAS NO LABORATÓRIO E NA CLÍNICA 211 12 SONIA BEATRIZ MEYER Uma das grandes contribuições de Skinner (J. Michael, comunicação pessoal, 3 de abril de 1978) foi a distinção entre comportamentos modelados por contingências e comportamentos governados por regras ou, conforme Catania (1998/1999), comportamentos governados verbalmente. O comportamento modelado por contingências é aquele modelado e mantido diretamente por conseqüências relativamente imediatas. Já o comportamento governado por regras depende do comportamento verbal de outra pessoa (o falante), ou seja, está sob controle de antecedentes verbais que descrevem contingências (Baum, 1994/1999). Skinner (1974/1982) definiu como regra o estímulo discriminativo verbal que descreve uma contingência. O enunciado de regras tem a vantagem de poder substituir o procedimento de modelagem de uma resposta em seres humanos. Mas há diferenças importantes entre o comportamento governado por regras e o modelado por contingências. Skinner (1974/ 1982, p. 109-111) descreveu essas diferenças em seu livro Sobre o Behaviorismo: • Quanto à velocidade de aprendizagem, regras podem ser aprendidas mais rapidamente do que o comportamento modelado pelas contingências descritas pelas regras. • As regras tornam mais fácil o aproveitamento de semelhanças entre contingências, enquanto o processo de • • • • generalização pode prover uma resposta fraca. As regras têm valor quando as contingências são complexas, pouco claras ou quando não são muito efetivas, enquanto o comportamento modelado por contingências demanda maior tempo de aprendizagem, podendo nem mesmo ser aprendido sob tais contingências. Por meio das regras – da gramática e do dicionário – é possível aprender um novo idioma quando o indivíduo não foi exposto a uma comunidade verbal adequada, necessária para modelar a fala correta. A pessoa que segue instruções acata conselhos, atende advertências ou obedece a regras ou a leis, não se comporta da mesma maneira como aquela que foi exposta diretamente às contingências, porque a descrição de contingências nunca é completa ou exata (usualmente ela é simplificada para poder ser ensinada e compreendida mais facilmente), e as contingências que sustentam o comportamento descrito raramente se mantêm de forma perfeita. Os sentimentos associados ao comportamento governado por regras também são diferentes dos sentimentos associados ao comportamento modelado por contingências (mas os sentimentos não explicam as diferenças entre esses comportamentos). Há di- 212 ABREU-RODRIGUES, RIBEIRO & COLS. versas ocasiões em que o sentimento associado ao seguimento de regras é apenas o de medo de punição, enquanto aquele associado ao comportamento modelado pelas contingências consiste em alegria e em entusiasmo. • O controle exercido por orientações, conselhos, regras e leis é evidente, não é sutil; já o controle por contingências é bem menos evidente. Nesta última forma de controle é comum que a comunidade considere que o indivíduo tenha maior contribuição pessoal e mérito interno. Fazer o bem porque recebe o reforço social por ter feito o bem é considerado mais virtuoso do que fazer o bem porque a lei assim o determina. Já o indivíduo que realiza uma obra planejada pode sofrer das reservas associadas aos comportamentos emitidos de forma calculada. Skinner (1974/1982) analisou diversas formas de regras: a ordem descreve um ato e implica uma conseqüência aversiva; no aviso, as conseqüências aversivas não são organizadas pela pessoa que o emitiu; um conselho especifica um comportamento e implica conseqüências positivamente reforçadoras que não foram ideadas pelo conselheiro. Orientações englobam ordens, avisos e conselhos, sendo sua descrição abrangente: orientações descrevem o comportamento a ser executado e expõem ou implicam conseqüências. Depois de Skinner ter feito a distinção entre comportamento governado por regras e comportamento modelado por contingências, Hayes, em conjunto com outros pesquisadores (p. ex.: Hayes e Ju, 1998; Hayes, Zettle e Rosenfarb, 1989), fez uma nova distinção entre tipos de comportamentos governados por regras, destacando-se: aquiescência (em inglês pliance) e rastreamento (em inglês tracking). Um comportamento aquiescente seria aquele que essencialmente depende de contingências sociais (o reforço é contingente diretamente ao comportamento de fazer o que a regra diz); um comportamento de rastreamento depende essencialmente da correspondência entre a regra e os eventos ambientais. Uma norma, uma lei ou um costume controlam comportamentos de aquiescer; uma instrução ou uma descrição de um trajeto controlam comportamentos de rastrear. Ou seja, as conseqüências que mantêm o comportamento governado por regras são de dois tipos: a obediência à regra (aquiescência) é mantida por contingências sociais; a execução do comportamento especificado pela regra (rastreamento) é, em geral, um desempenho motor modelado por contingências naturais (Matos, 2001). Os seres humanos seguem não apenas as regras apresentadas por outros, como também formulam e seguem suas próprias regras. Quando estas são formuladas ou reformuladas pelo indivíduo cujo comportamento passam a controlar, dizemos que são auto-regras. Nesse caso, uma parte do repertório do indivíduo afeta outra parte deste repertório. As auto-regras podem ser explicitadas publicamente, ou podem ocorrer de forma encoberta quando o indivíduo pensa (Jonas, 1997). A distinção proposta por Skinner, entre o comportamento modelado por contingências e o governado por regras, foi submetida a estudos experimentais, e o corpo de conhecimentos resultante tem implicações diretas para trabalhos aplicados. O objetivo deste capítulo é verificar quais as contribuições da pesquisa básica e de que forma esse conhecimento teórico-experimental pode contribuir para uma das áreas de aplicação da psicologia, a clínica, além de analisar algumas contribuições da pesquisa clínica a respeito do uso de regras, de conselhos e de intervenções chamadas diretivas, incluindo os problemas de adesão ao tratamento e a chamada resistência em psicoterapia, assim como analisar qual processo de mudança – por regras ou por modelagem pelas contingências – é responsável pelas mudanças clínicas. CONTRIBUIÇÕES DA PESQUISA BÁSICA Para que um psicólogo clínico mantenhase a par tanto de pesquisas desenvolvidas em clínica quanto de pesquisa básica, é extremamente útil a tarefa realizada por colegas pesquisadores de prover à comunidade artigos de ANÁLISE DO COMPORTAMENTO revisão de literatura. Nesse sentido, vários artigos foram escritos para a comunidade de analistas do comportamento brasileiros nos atuais 10 livros da coleção Sobre Comportamento e Cognição, baseados nas apresentações feitas nas Reuniões Anuais da Associação Brasileira de Psicoterapia e Medicina Comportamental (ABPMC) (p. ex.: Albuquerque, 2001; Banaco, 1997; de Rose, 1997; Guedes, 1997; Jonas, 1997; Sanabio e Abreu-Rodrigues, 2002), na Revista Brasileira de Terapia Comportamental e Cognitiva (p. ex.: Matos, 2001; Simonassi, 1999) e em capítulos de outros livros (p. ex.: Abreu-Rodrigues e Sanabio, no prelo). As contribuições da pesquisa básica descritas a seguir foram baseadas nos artigos de revisão feitos por Abreu-Rodrigues e Sanabio (no prelo) e por Matos (2001). Na literatura de controle por regras, o termo instrução tem sido freqüentemente empregado como sinônimo de regra ou indicando maior especificidade (Abreu-Rodrigues e Sanabio, no prelo). Neste texto, seu uso não será diferenciado. Pesquisas básicas têm confirmado que regras facilitam a aquisição de novos comportamentos, principalmente quando as contingências são complexas, imprecisas ou aversivas. Entretanto um dos resultados mais salientes dessas pesquisas tem sido a constatação de que as regras podem produzir uma redução na sensibilidade comportamental às contingências (Madden, Chase e Joyce, 1998, citados em Abreu-Rodrigues e Sanabio, no prelo). O comportamento sensível seria aquele que muda sistematicamente diante de mudanças nas contingências de reforço. Assim, quando as contingências mudam e o comportamento não se altera, diz-se que o comportamento é insensível às contingências. Tal fenômeno foi observado em investigações sobre controle instrucional. Nesse tipo de investigação, criam-se situações experimentais em que as instruções para o desempenho podem ser coincidentes ou discrepantes com os esquemas de reforçamento em vigor. Tipicamente, quando há discrepância, os participantes apresentam desempenhos em acordo com as instruções recebidas e insensíveis aos esquemas de reforçamento (AbreuRodrigues e Sanabio, no prelo). 213 A redução na sensibilidade às contingências, entretanto, não pode ser considerada uma característica inerente ao controle instrucional, já que tal redução foi modulada por diversos aspectos, conforme indicado nos estudos experimentais revistos por Abreu-Rodrigues e Sanabio (no prelo). Um desses aspectos é a extensão com que os comportamentos gerados pela instrução entram em contato com a discrepância entre instrução e contingência atual. As autoras descreveram um experimento realizado por Galizio (1979) em que havia uma condição segundo a qual seguir as instruções não permitiria contato com a discrepância instruções-contingência, e uma outra condição segundo a qual esse contato ocorreria. A conclusão desse autor foi de que o contato com a discrepância instrução-esquema é necessário para a redução/eliminação do controle instrucional (ou aumento na sensibilidade comportamental), e não apenas a existência de tal discrepância. Outros estudos constataram o mesmo fenômeno (Buskist e Miller, 1986; Hayes et al., 1986, Experimento 1, citados em Abreu-Rodrigues e Sanabio, no prelo). Um segundo aspecto considerado por Abreu-Rodrigues e Sanabio (no prelo) ao analisarem a insensibilidade às contingências no comportamento governado por regras, foi o conteúdo das instruções. Vários estudos foram citados (Danforth et al., 1990; Dixon e Hayes, 1998; Otto, Torgrud e Holborn, 1999; Raia et al., 2000; Wulfert, et al., 1994), nos quais, quando as instruções especificavam com exatidão a tarefa, ocorreram respostas estereotipadas e insensibilidade comportamental. Já as instruções vagas favoreceram o desenvolvimento de controle pelas contingências. A variabilidade comportamental é um outro aspecto que afeta a sensibilidade às contingências. No estudo de LeFrancois, Chase e Joyce (1988), descrito por Abreu-Rodrigues e Sanabio (no prelo), os participantes que foram expostos a apenas uma instrução e um esquema de reforçamento ficaram sob controle instrucional, enquanto aqueles que receberam várias instruções e vários esquemas de reforçamento apresentaram sensibilidade a mudanças nas contingências. A diferença foi discutida em termos da presença de alternativas 214 ABREU-RODRIGUES, RIBEIRO & COLS. comportamentais promovidas pela exposição à instrução e a esquemas variados, o que favoreceria a sensibilidade às novas contingências. A densidade de reforços contingentes ao comportamento instruído também afeta a sensibilidade à mudança. No estudo de Newman, Buffington e Hemmes (1995, citado por AbreuRodrigues e Sanabio, no prelo), observou-se um controle instrucional quando o comportamento de seguir instruções sempre produzia reforços, tendo tal controle diminuído quando esse comportamento era reforçado apenas parcialmente e sido eliminado quando não havia reforços programados para seguir instruções. Esse resultado pode ser uma evidência adicional de que comportamento de seguir instruções é um operante mantido apenas quando reforçado. A história de reforçamento do comportamento de seguir instruções foi apontada como outra variável de controle da sensibilidade às contingências. No estudo de Martinez e Ribes (1996), descrito por Abreu-Rodrigues e Sanabio (no prelo), os participantes foram submetidos a uma condição experimental de seguimento de instrução falsa (que não descreviam acuradamente a relação resposta-conseqüência). Aqueles que haviam passado anteriormente pela condição de seguimento de instrução verdadeira seguiram muito mais as instruções falsas do que aqueles que não tiveram essa história prévia. A persistência do controle instrucional em situações em que o comportamento de seguir instruções ocorre mesmo quando há discrepância entre a instrução e a relação respostaconseqüência, e mesmo quando há contato com tal discrepância, tem sido atribuída à história de reforços sociais para correspondência entre instrução e comportamento (Hayes et al., 1986, citados em Abreu-Rodrigues e Sanabio, no prelo). Uma descrição não-experimental dos efeitos da história de vida foi apresentada por Matos (2001): quando uma pessoa é “deixada à vontade” ou é criada mais livremente “para se defender por si mesma”, ela desenvolve estratégias para discriminar mais rapidamente as contingências importantes para sua sobrevivência e, também, para discriminar mudanças nes- sas contingências. Uma pessoa a quem sempre foi dito o que fazer, a quem não foi dada a chance de entrar em contato com as contingências naturais, senão com suas descrições, torna-se especialmente dependente de contingências sociais, de regras sobre como agir. Se um indivíduo obedece sempre a instruções, as contingências naturais nunca terão oportunidade de atuar sobre seu comportamento. Se ele obedece a instruções, conseqüências agradáveis (sociais e naturais) podem ocorrer, e conseqüências aversivas são evitadas; se as desobedece, conseqüências aversivas ocorrem, contribuindo para aumentar o controle pela regra. A sensibilidade poderia ser, ainda, influenciada pelo grau de discriminabilidade das contingências em vigor. No estudo realizado em 1995, por Newman e colaboradores, citado por Abreu-Rodrigues e Sanabio (no prelo), os esquemas de reforçamento intermitente geraram insensibilidade, ao passo que o esquema de reforçamento contínuo produziu um desempenho sensível, havendo relação direta entre seguir instruções e densidade de reforços. Esse resultado poderia ser explicado pelo fato de que os esquemas intermitentes são mais dificilmente discrimináveis do que os esquemas contínuos. Conclusões similares sobre o grau de discriminabilidade das contingências foram apresentadas por Matos (2001): quando as regras são ambíguas, mas as contingências são simples, fáceis de serem discriminadas, as pessoas passam a agir de acordo com tais contingências; mas, se são complexas e o desempenho exigido é elaborado, os indivíduos podem apresentar um desempenho bastante variável inicialmente, até ficarem sob controle das contingências em vigor, ou até formularem autoregras a partir de suas experiências passadas com situações semelhantes. Estudos sobre controle verbal investigaram não somente os efeitos de estímulos verbais gerados por outra pessoa como também de estímulos verbais gerados pelo próprio indivíduo sobre seu comportamento não-verbal, ou seja, têm sido estudados os efeitos de autoinstruções. Uma das formas de estudá-las é verificar se há correspondência entre os com- ANÁLISE DO COMPORTAMENTO portamentos verbais e os não-verbais da mesma pessoa. Para conduzir tais estudos, os participantes são expostos a um determinado esquema de reforçamento e, durante ou após a sessão experimental, são questionados acerca de seus desempenhos não-verbais. Quando ocorre a correspondência entre o relato e o desempenho não-verbal, é comum a conclusão (apesar de questionável) de que o desempenho do participante estava sob o controle de auto-instruções formuladas durante o experimento (Abreu-Rodrigues e Sanabio, no prelo). Catania, Matthews e Shimoff (1982) estudaram os efeitos de relatos verbais modelados e instruídos sobre a resposta não-verbal. Os participantes deveriam trabalhar em um esquema múltiplo de razão (na chave da esquerda) e de intervalo (na chave da direita). Periodicamente deveriam completar a frase: “o modo de ganhar pontos na chave da esquerda/direita é ...”. No Grupo Instrução, os participantes recebiam dicas sobre o que escrever; no Grupo Modelagem, os participantes recebiam pontos pelas descrições. Quando os relatos foram modelados, houve uma correspondência entre os comportamentos de relatar e de pressionar a chave, mesmo na presença de discrepância entre os relatos e as contingências não-verbais programadas. Mas quando os relatos eram instruídos, seu controle foi inconsistente sobre o comportamento de pressionar a chave. Os autores concluíram que é mais provável que o comportamento verbal controle comportamentos não-verbais quando o primeiro é modelado (e não-instruído). Alguns estudos têm demonstrado que o controle verbal, tal como o observado no estudo de Catania e colaboradores (1982), só ocorre quando as contingências não-verbais em vigor não estão exercendo um controle discriminativo. Nos estudos em que havia contingências não-verbais consistentes e previsíveis, o comportamento verbal e o não-verbal foram controlados por suas respectivas contingências (Cerutti, 1991; Torgrud e Holborn, 1990, citados por Abreu-Rodrigues e Sanabio, no prelo). Já quando as contingências não-verbais programadas eram aleatórias e/ou incontroláveis, os relatos influenciaram o desempenho não- 215 verbal (Cerutti, 1991, citado por AbreuRodrigues e Sanabio, no prelo). A correspondência entre o dizer e o fazer também é influenciada por sua história de reforçamento. Após uma história de reforçamento de correspondência entre os comportamentos verbal e não-verbal, se um determinado tipo de relato é reforçado, a ação correspondente é observada; no caso de uma história de reforçamento de ausência de correspondência, o reforçamento de um relato pode não ser acompanhado de uma ação correspondente (Amorim, 2001, citado em Abreu-Rodrigues e Sanabio, no prelo). Uma comparação entre instruções, auto-instruções e ausência de instruções foi efetuada no estudo de Rosenfarb e colaboradores (1992), relatado por Abreu-Rodrigues e Sanabio (no prelo). Nesse estudo, três grupos foram formados: no Grupo Auto-Instruções, os participantes eram solicitados a relatarem a melhor forma de obter reforços; no Grupo Instruções Externas, eram apresentados os relatos gerados pelo primeiro grupo; e no Grupo Sem Instruções, os participantes nem foram solicitados a emitir relatos, nem recebiam relatos externos. Ao final da fase de aquisição, os Grupos Auto-Instruções e Instruções Externas apresentaram desempenhos mais apropriados aos esquemas em vigor do que o Grupo Sem Instruções; mas após uma fase de extinção, o Grupo Sem Instrução apresentou maior redução de respostas do que os outros dois grupos. As conclusões a que os autores chegaram foram de que: a) auto-instruções e instruções externas facilitam o controle exercido por contingências complexas; b) instruções e auto-instruções retardam o processo de extinção, ou seja, reduzem a sensibilidade à mudança; c) a formulação de instruções não é uma condição necessária para que as contingências exerçam o controle sobre o comportamento. Quanto à comparação entre instruções e auto-instruções, a conclusão foi de que seus efeitos são funcionalmente equivalentes, sen- 216 ABREU-RODRIGUES, RIBEIRO & COLS. do ambas mantidas por reforçamento da comunidade verbal. É importante considerar que quando há correspondência entre auto-relato e desempenho não-verbal é difícil afirmar se o desempenho não-verbal está sendo controlado pelo relato ou se as mesmas contingências controlam tanto a ação quanto a descrição da ação, sem que o relato participe da determinação da ação. É necessário cautela ao interpretar relações entre eventos privados e públicos. Algumas relações são possíveis (Abreu-Rodrigues e Sanabio, 2001): a) um evento ambiental observável produz o comportamento privado (neste caso, a auto-regra) e este, por meio de suas funções de estímulo, influencia o comportamento público (neste caso, o desempenho não-verbal); b) o comportamento público é afetado diretamente pelo evento ambiental, mas também é influenciado pelo comportamento privado produzido pelo mesmo evento ambiental; e c) o evento ambiental gera tanto o comportamento privado quanto o comportamento público, mas não há relação entre esses dois comportamentos. Uma outra consideração a ser levada em conta é a de que os relatos podem não ser tatos puros (Skinner, 1957), ou seja, serem determinados não apenas pelos estímulos que descrevem, mas também por outras variáveis ambientais. O relato de encobertos pode ser, por exemplo, uma forma de exprimir um sentimento, ou de se esquivar de um tema, ou mesmo uma forma de agredir o interlocutor ou de testar seu nível de aceitação ou de empatia (Delitti e Meyer, 1995). Conforme indicado por Abreu-Rodrigues e Sanabio (no prelo), as pesquisas têm indicado que vários fatores podem exercer influência sobre os auto-relatos: o limite de tempo para a resposta de escolha (Critchfield e Perone, 1990), o número de estímulos-modelo (Critchfield e Perone, 1993), o número de estímulos de comparação (Critchfield, 1993) e uma história de punição (Sanabio, 2000). Uma análise das contribuições da pesquisa básica indica que a insensibilidade às contingências de reforçamento não é efeito inevitável do seguimento de regras. Devem ser levados em consideração a densidade de refor- ços, o grau de contato com a discrepância entre instruções e contingências e o grau de discriminabilidade da contingência em vigor; a história de vida do indivíduo e o grau de variabilidade comportamental; o tipo de regra – se é modelada ou instruída e se descreve desempenho específico ou se é vaga. REGRAS E PSICOTERAPIA Na maioria das terapias em consultório com adultos, o terapeuta não tem controle direto sobre as contingências em vigor fora da sessão terapêutica, sendo a intervenção baseada em “conversas”. É, porém, essa conversa durante a sessão que ajuda o cliente a lidar com problemas enfrentados fora dali, no dia a dia (Kohlenberg, Tsai e Dougher, 1993). O entendimento dos processos de mudança contemplados em terapia pode ser auxiliado pelo conceito de controle por regras. No livro Recent Issues in the Analysis of Behavior (Questões Recentes na Análise Comportamental), Skinner (1989) afirmou que terapeutas comportamentais, em vez de organizarem novas contingências de reforçamento – tal como pode ser feito na escola, no lar, no local de trabalho ou no hospital –, fornecem conselhos na forma de ordens ou de descrição de contingências, ou seja, emitem regras. Também os terapeutas comportamentais cognitivos (p. ex.: Beck e Freeman, 1990/1993) descrevem sua própria atuação como diretiva, por exemplo, ao instruir seus clientes a realizarem diversas atividades fora do consultório. Matos (2001) analisou, de maneira similar, que a habilidade de lidar com o comportamento humano verbal é a grande arma dos terapeutas e a garantia de sucesso de suas práticas. Quando os terapeutas orientam seus clientes a respeito de algo, estão, muitas vezes, verbalizando regras, que podem ou não ser seguidas. Entretanto há debates sobre quais são os mecanismos responsáveis por mudanças ocorridas em psicoterapias. Pergunta-se se são as técnicas específicas ou as variáveis da relação terapêutica que propiciam os efeitos da terapia. Também tem sido questionado se mudanças comportamentais produzidas pela terapia ANÁLISE DO COMPORTAMENTO são modeladas por contingências da relação terapêutica ou se são governadas por novas regras produzidas na terapia (Meyer, 2001; Meyer e Vermes, 2001). Atualmente, a importância da relação terapêutica é um consenso para os terapeutas comportamentais, porém há diferenças quanto ao papel desempenhado por ela (Raue e Goldfried, 1994). Por um lado, alguns autores vêem o vínculo terapêutico como um meio para facilitar outros aspectos importantes do processo de mudança, o que levaria a um maior engajamento na terapia (Rangé, 1995; Shinohara, 2000). Por exemplo, para Cahill, Carrigan e Evans (1998), à medida que a relação se desenvolve e a terapia entra em uma fase de tratamento mais ativa, uma boa relação terapeuta-cliente torna o terapeuta mais eficaz, como um estímulo reforçador, e mais diretivo, o que, por sua vez, permitiria ao terapeuta ser consideravelmente mais influente em encorajar o cliente a tentar novas formas de pensamento e de ação. Por outro lado, há autores que atribuem ao relacionamento que ocorre em terapia o principal mecanismo de mudança do cliente. Para esses terapeutas comportamentais, a relação terapêutica é uma oportunidade para o cliente emitir comportamentos que lhe têm trazido problemas e, a partir da interação com o terapeuta, aprender formas mais efetivas de respostas, ou seja, o comportamento seria mais modelado pelas contingências da relação terapêutica do que governado por novas regras (Follette, Naugle, e Callaghan, 1996; Kohlenberg e Tsai, 1991/ 2001; Rosenfarb, 1992). Processos psicoterápicos aparentemente podem promover mudanças, quer por meio da alteração do controle por regras, quer da modelagem na relação terapêutica. O mais provável é que os dois tipos de procedimentos estejam envolvidos nos processos de mudança, em proporções diferentes, conforme o terapeuta e o cliente. A pesquisa de Zamignani (2001) fornece apoio à noção de que terapeutas comportamentais podem usar, para promover mudanças, tanto procedimentos de modelagem por conseqüências (reforçamento diferencial), como controle por regras (sugestão de alternativas de resposta para solução de problemas, 217 proposta de atividade incompatível com a resposta-queixa, recomendação de exposição e/ ou prevenção de respostas, ensino de procedimentos, solicitação de coleta de dados ou recomendação para o cliente alterar pensamentos ou sentimentos). Foram comparados os desempenhos verbais de dois terapeutas analistas do comportamento atendendo um cliente com, e um sem, o diagnóstico de Transtorno Obsessivo-Compulsivo (TOC). Constatou-se que um dos terapeutas apresentou um percentual elevado de verbalizações de aprovação para ambos os clientes, apresentando verbalizações de aconselhamento praticamente só com o cliente com TOC, o qual tinha dificuldade em iniciar respostas de forma espontânea. Já o outro terapeuta apresentou predominantemente verbalizações de aconselhamento e de explicação com ambos os clientes. O uso da orientação, como uma das formas de produzir mudanças por regras, pode ter vários determinantes: a abordagem teórica comportamental, que tem produzido intervenções bem-sucedidas com o uso de procedimentos padronizados envolvendo orientação; o cliente, que por vezes solicita conselhos; a experiência clínica, durante a qual pode ter havido reforço diferencial do emprego de estratégias diretivas; a história de vida pessoal, que poderia ter modelado, por exemplo, um estilo de interação pessoal mais controlador (Meyer e Donadone, 2002). Dois grandes grupos de variáveis serão analisados a seguir: a abordagem teórica e história de vida do cliente. Abordagem teórica Ao descrever diversas modalidades de terapia, autores como Frank e Frank (1993) e Garfield (1995) afirmam que as terapias comportamentais e cognitivas são diretivas e que nelas o terapeuta prescreve um programa terapêutico que compreende procedimentos específicos, guiando e encorajando os esforços do cliente nas sessões de tratamento e na vida diária. Por exemplo, terapeutas comportamentais podem dar instruções ao cliente de como relaxar, dar exercícios para serem praticados em casa, instruí-lo em como visualizar expe- 218 ABREU-RODRIGUES, RIBEIRO & COLS. riências particulares e ajudá-lo a construir uma hierarquia de situações temidas. O estudo de Ablon e Jones (2002) fornece alguns dados empíricos para essa concepção. Os autores utilizaram um instrumento de cem itens e analisaram o processo de interação terapeuta-cliente em 58 sessões de terapia cognitivo-comportamental para indivíduos deprimidos. Segundo eles, alguns dos itens mais característicos dessa forma de terapia (e que se relacionam ao controle por regras) foram: discussão freqüente sobre atividades e tarefas específicas para o cliente tentar fora da sessão, explicações e conselhos explícitos. Foi verificado que os clientes freqüentemente concordavam e aceitavam as colocações do terapeuta, não iniciavam muitos tópicos de conversa em sessão, além de cumprirem as solicitações feitas. A melhora foi associada, entre outros fatores, à obediência, à admiração ou à aprovação apresentada pelos clientes em relação a seus terapeutas, desejo de maior proximidade e aceitação de suas intervenções sem ambivalência ou suspeita. É possível inferir que os procedimentos adotados funcionaram como regras e que seus efeitos foram obtidos por meio do reforçamento social fornecido pelo terapeuta. Esse efeito seria uma forma de mais comportamento aquiescente e não de rastreamento (Hayes e Ju, 1998), ou seja, mais controlado por aprovação social do terapeuta do que pelas contingências naturais (fora da sessão) do comportamento instruído. Já terapias psicodinâmicas consideram que dar sugestões não seria uma atuação psicoterapêutica evocativa ou que propicie descobertas, objetivos que seriam alcançados por meio da auto-exploração e da busca de soluções pelo próprio cliente, estratégias que consideram mais intensas e desejáveis (Garfield, 1995). Corey (1983) afirmou ser freqüente haver clientes que, quando estão passando por um sofrimento, chegam à sessão de terapia buscando ou até exigindo um conselho inteligente para tomar uma decisão ou que o terapeuta resolva um problema por eles. Esse autor diz, no entanto, que a terapia não deve ser confundida com o ato de dar informação, orientação ou conselho. A tarefa do terapeuta consistiria em ajudar o cliente a descobrir suas próprias soluções e encontrar seu caminho, mas sem dizer como deveria fazê-lo. Miranda e Miranda (1993) descreveram a tarefa de orientar como o ato de avaliar com o cliente as alternativas de ações possíveis e facilitar a escolha de uma delas. À medida que o terapeuta atende, responde, personaliza e orienta, o cliente começa a se comportar de modo a promover sua própria mudança. Isso quer dizer que, explorada sua situação insatisfatória e compreendidas as várias peças dessa situação, o cliente muitas vezes elabora sozinho seu plano de ação, sem ajuda direta do terapeuta. Mas mesmo terapeutas não-comportamentais (Corey, 1983; Miranda e Miranda, 1993) consideram que há casos em que a orientação direta do terapeuta mostra-se necessária, por exemplo, quando o cliente não tem domínio da área, quando se encontra claramente em perigo de se prejudicar (como na ameaça de suicídio) ou de prejudicar outros, ou quando se vê por certo tempo incapacitado para fazer opções. Ainda assim, eles consideram que a decisão final sempre é do cliente. As afirmações de que o terapeuta comporta-se de forma a fazer com que o cliente encontre novas formas de ação “sem ajuda direta” (Garfield, 1995; Corey, 1983; Miranda e Miranda,1993) sugerem que a intervenção terapêutica baseia-se na modelagem direta do comportamento verbal, incluindo a modelagem de auto-regras (ver o Capítulo 13 para informações mais específicas sobre essa questão). Esse procedimento estaria em acordo com a sugestão de Catania (1998/1999) de que a mudança do comportamento verbal do indivíduo pode facilitar a mudança do comportamento não-verbal correspondente. Nessa forma de intervenção, o terapeuta modelaria o comportamento verbal do cliente em vez de instruí-lo diretamente. Com relação à análise de qual processo de mudança, de regras ou de modelagem pelas contingências é responsável pelas mudanças clínicas, não se deve perder de vista que mesmo que o processo descrito seja o de modelagem de auto-regras (modelagem dentro da sessão terapêutica), ainda assim a mudança produzida pela psicoterapia na vida di- ANÁLISE DO COMPORTAMENTO ária do cliente seria obtida primordialmente pela introdução ou pela alteração de regras, quer formuladas pelo terapeuta, quer pelo cliente. 219 que não o instruído e a importância ou magnitude da conseqüência prevista na regra. Ao contrário do aquiescer, o rastrear praticamente dispensa a figura do agente social (Matos, 2001). História de vida do cliente Problemas na formulação de auto-regras Para Hayes, Kohlenberg e Melancon (1989), muitas desordens clínicas envolvem problemas no controle verbal, como os quatro a seguir: a) problemas do cliente na formulação de auto-regras; b) probelmas nas regras aprendidas; c) problemas no não-seguimento de regras; d) problemas no seguimento excessivo de regras. Para entender os problemas no seguimento de regras é necessário analisar os controles envolvidos no aquiescer e no rastrear. Pelo menos cinco variáveis ou circunstâncias modulam o comportamento controlado por regras do tipo aquiescer de acordo com Zettle e Hayes (1982, citado em Matos, 2001): a) a habilidade ou a capacidade do agente social de monitorar o comportamento de seguir a regra; b) a habilidade ou a capacidade do agente social de realmente poder cumprir com as conseqüências previstas; c) a importância das conseqüências previstas ou a magnitude do reforço; d) a história de confiabilidade do agente social; e) a importância das conseqüências previstas para outros comportamentos que não seja o de seguir a regra. Já a regra tipo rastreamento é afetada por variáveis que influenciam a concordância da regra aos eventos (p. ex.: sua clareza, sua precisão, o fato de a regra ser completa ou incompleta), por variáveis que afetam a importância dessa concordância, das conseqüências existentes para outros comportamentos Formular auto-regras é um repertório importante, especialmente nos casos em que o comportamento gerador de problemas está sob um maior controle das contingências diretas e imediatas, como ocorre na impulsividade. Quando o repertório de seguimento de regras de uma pessoa não está bem desenvolvido, ela pode ser rotulada tanto como impulsiva quanto como preguiçosa, anti-social ou imoral (Hayes e Ju, 1998). De acordo com esses autores, as auto-regras introduzem novas formas de regulação social, propiciando maior resistência à extinção ou a conseqüências imediatas, e estas são características similares às do seguimento de regras enunciadas por outros. Desordens na formulação de auto-regras podem ocorrer pelo menos de duas maneiras básicas: a pessoa pode falhar na formulação de regras, quando seria vantajoso fazê-lo e a pessoa pode formular regras, mas o faz de maneira imprecisa ou não-realista. De acordo com Hayes e Ju (1998), a estratégia terapêutica mais acertada nesses casos pode ser a de ensinar a formulação de regras apropriada, ou seja, ensinar o cliente a colocar seu comportamento verbal sob controle direto dos eventos vivenciados e de suas conseqüências naturais. Problemas nas regras formuladas pelo grupo Muitas das regras que guiam nosso comportamento são aprendidas de outras pessoas. Problemas podem ocorrer nas práticas de formulação de regras da comunidade verbal em geral. Culturas particulares e subculturas podem falhar no desenvolvimento de regras adequadas ou podem desenvolver regras imprecisas. Por exemplo, uma subcultura religiosa pode desenvolver regras verbais sobre cura pela fé que proíba seus adeptos de procurarem aju- 220 ABREU-RODRIGUES, RIBEIRO & COLS. da médica para doenças que ameacem suas vidas. Similarmente, uma cultura pode deixar de dar qualquer orientação verbal sobre tópicos importantes de saúde (Hayes et al., 1989). Nessas situações, o terapeuta pode tanto procurar na cultura em questão uma melhor formulação de regras como colocar o comportamento do cliente em contato direto com as contingências naturais. Falha em seguir regras Formular regras vantajosas não é suficiente. É preciso também aprender a entendê-las e a segui-las. Sem um repertório de ambos os aspectos do seguimento de regras, padrões desordenados de comportamento são prováveis. Em certas circunstâncias é desejável que as regras compitam efetivamente com os efeitos destrutivos de algumas formas de controle imediato por contingências. Por exemplo, a regra “Não às drogas!” tem a intenção de estabelecer uma insensibilidade comportamental a determinadas contingências diretas. Entretanto, mesmo que um adolescente saiba que tomar drogas que viciam pode levá-lo a problemas extremamente indesejáveis, as contingências sociais imediatas (p. ex.: aceitação do grupo de amigos) e os efeitos imediatos da própria droga podem conduzi-lo a um padrão de vício. Sem um padrão suficientemente forte de seguimento de regras, é mais provável que a pessoa tenha seu comportamento controlado pelas contingências imediatas, mesmo o resultado sendo destrutivo (Hayes et al., 1989). Algumas das técnicas usadas com pessoas com transtornos de caráter ou impulsivas podem ser entendidas como uma tentativa de estabelecer um maior grau de seguimento de regras. Por exemplo, programas de tratamento em grupo para drogados são organizados em torno de regras de conduta claramente especificadas. A obediência às regras é promovida por meio de encontros em grupo, que enfocam o sucesso e as infrações dos membros do grupo. Esse controle social intenso pode ser entendido como uma tentativa de estabelecer aquiescência em relação às regras do progra- ma. Contingências sociais fortes e consistentes são dadas para o seguimento de ordens, possivelmente com a esperança de que surja um maior grau de insensibilidade a conseqüências indesejáveis e imediatas (Hayes et al., 1989). A adesão às regras também é freqüentemente conseguida com procedimentos similares em programas para emagrecimento, como o dos Vigilantes do Peso, e nos grupos anônimos, como o dos Alcoólatras Anônimos. Uma falha importante de seguimento de regras, que afeta o resultado de psicoterapias, é a chamada resistência do cliente. Alguns indivíduos que procuram ajuda profissional das mais diversas formas de psicoterapia rejeitam as orientações dadas por seus terapeutas. Esses clientes têm sido designados por terapeutas como opositores, reacionários, não-cumpridores, intratáveis, não-motivados, resistentes. O comportamento resistente e o colaborador podem ter vários determinantes. Um deles é a diretividade do terapeuta (incluindo conselhos, perguntas, interpretações, apoio). Beutler, Moleiro e Talebi (2002) realizaram uma revisão de 20 estudos que verificavam os efeitos diferenciais da diretividade do terapeuta, tendo em vista a resistência dos clientes. Foi constatado que 80% desses estudos demonstraram que as intervenções diretivas funcionaram melhor entre os clientes com baixo nível de resistência, enquanto as intervenções não-diretivas funcionaram melhor entre os clientes com graus mais altos de resistência, sugerindo que os efeitos da resistência podem ser circundados pelo uso de intervenções não-diretivas e autodirecionadas. As pesquisas que indicam uma forte correlação entre a resistência do cliente e um resultado negativo da terapia e/ou abandono desta e entre a resistência do cliente e comportamentos diretivos do terapeuta (Ablon e Jones, 2002; Beutler, Moleiro e Talebi, 2002; Bischoff e Tracey, 1995) sugerem que o uso de estratégias diretivas, tal como a orientação, não deveria estar vinculado apenas à linha teórica e à preferência do terapeuta, a história de seguimento de regras e instruções do cliente deve ser levada em consideração. Por exemplo, para clientes com uma história de dificuldades de seguimento de regras não se- ANÁLISE DO COMPORTAMENTO ria recomendado o uso de procedimentos muito estruturados. Outras considerações sobre a resistência do cliente a mudanças foram feitas por Guilhardi (2002) e sobre o manejo da resistência sob o enfoque analítico-comportamental por Cautilli e Connor (2000). Para esses autores, a resistência pode ser entendida e, portanto, trabalhada por meio de análise funcional. A resistência pode ser produzida por cinco problemas (Cautilli e Connor, 2000): 1. falta de motivação, ou seja, reforçamento insuficiente para executar a tarefa ou punição por executá-la, ou existência de demasiados obstáculos; 2. tempo insuficiente para praticar a habilidade antes de usá-la; 3. necessidade de mais ajuda para implementar a habilidade nas condições existentes; 4. a habilidade é uma exigência inédita, que a pessoa não precisou fazer antes; 5. a habilidade é complexa demais. Falhas no seguimento de regras têm sido também estudadas sob o tópico de adesão a tratamentos. Problemas de adesão ou de aderência têm sido uma preocupação de profissionais da saúde e de relevantes pesquisas. Malerbi (2000), ao analisar a questão da adesão aos tratamentos médicos, afirmou que o nível de adesão não aumentou muito durante os mais de 20 anos de estudos sobre o problema. A pesquisadora verificou, em levantamento bibliográfico, que o fator mais importante que afeta a adesão é a complexidade do tratamento, ou seja, quanto mais complexo o tratamento, menor a adesão. Seguimento excessivo de regras Quando a formulação e/ou seguimento de regras é muito forte, o comportamento pode ser descrito como obsessivo, ansioso, dependente, insensível ou rígido. Nesses casos, o ensino de formulação de regras ou o aumento 221 da insensibilidade às contingências diretas podem piorar o problema. Diminuir ou evitar o controle por regras seria a estratégia recomendada (Hayes e Ju, 1998). De fato, uma importante função da terapia tem sido a diminuição do controle exercido pelas regras, ou seja, do controle exercido pela aprovação social e o aumento correspondente do controle das contingências naturais e “genuínas”. O comportamento governado por regras nunca apreende de forma completa as sutilezas do comportamento controlado diretamente pela experiência. Dirigir um carro após a leitura de um livro a esse respeito não equivale a dirigir após haver dirigido por muitos meses. Interagir com membros do sexo oposto após receber algumas dicas de amigos não é o mesmo que a interação de um indivíduo socialmente experiente. Para diminuir o controle pelas regras, entretanto, não basta ter suficiente experiência. Algumas regras podem ser apoiadas de maneira generalizada pela comunidade verbal de tal forma que a experiência direta pode não sobrepujar os efeitos da regra. Há casos, de acordo com a pesquisa básica, nos quais o uso prévio da regra pode interferir no controle de experiências diretas de tal forma que os benefícios da experiência direta subseqüente são atenuados. Nesses casos, pode ser importante considerar o alerta dado por Matos (2001): se um comportamento foi instalado e está sendo mantido por conseqüências sociais, mesmo existindo conseqüências naturais colaterais, não será suficiente o terapeuta trabalhar com conseqüências naturais ao tentar eliminar um comportamento controlado por regras. Se for desejável modificar ou afetar um comportamento controlado por regras, pode ser preciso mudar a regra. Quando o controle por regras é indesejável, dois cursos terapêuticos parecem disponíveis: evitar controle verbal ou alterá-lo a fim de diminuir os efeitos de produção de insensibilidade. A terapia de aceitação e compromisso (ACT), proposta por Hayes, Strosahl e Wilson (1999), e a psicoterapia analítica funcional (FAP), proposta por Kohlenberg e Tsai (1991/2001), exemplificam essas estratégias terapêuticas. De acordo com as bases teóricas 222 ABREU-RODRIGUES, RIBEIRO & COLS. da ACT (Hayes et al., 1999), quando determinadas regras tornam o comportamento do indivíduo insensível às contingências naturais, elas podem adquirir uma autonomia funcional e podem tornar-se a causa presumida do comportamento problemático, de forma que a tentativa de eliminar essa causa por meio de outras regras pode piorar o problema. A ACT, então, atuaria para alterar o contexto em que as regras são formuladas, e não as regras em si (Hayes e Ju, 1998). Já na FAP, o terapeuta prioriza a modelagem direta dos comportamentos clinicamente relevantes que ocorrem na sessão. As reações genuínas do terapeuta ao comportamento do cliente reforçam, provavelmente, de maneira natural, melhoras à medida que elas ocorrem na sessão terapêutica. Por exemplo, em vez de instruir o cliente que procurou ajuda por problemas de intimidade em relacionamentos a realizar exercícios de comunicação com seu companheiro, o terapeuta pode reforçar melhoras nas respostas de retraimento que ocorrem na própria relação com o terapeuta (Kohlenberg e Tsai, 1991/2001). O único tipo de regra que é formalmente estimulado é o rastreamento, de modo que tanto o cliente quanto o terapeuta são encorajados a descrever verbalmente as contingências envolvidas em experiências vividas (Hayes et al., 1989). INVESTIGAÇÕES RECENTES E POSSIBILIDADES FUTURAS Apesar de terem sido detectadas diferenças de atuação do terapeuta em terapias de diferentes abordagens (p. ex.: Garfield, 1995), é possível que existam práticas comuns a uma cultura terapêutica que surgem da solução de problemas clínicos. As pesquisas deveriam procurar responder se os terapeutas comportamentais (tanto os denominados analíticocomportamentais quanto os cognitivo-comportamentais) utilizam a formulação de novas regras como mecanismo básico de mudança e se há diferenças quando estas são enunciadas pelo terapeuta ou pelo cliente (auto-regras), assim como se regras e auto-regras são realmente menos utilizadas por terapeutas de outras abordagens teóricas. Tais pesquisas já foram iniciadas. Meyer e Donadone (2002) estudaram o emprego da orientação por terapeutas comportamentais. O objetivo da pesquisa foi verificar se os terapeutas comportamentais experientes (isto é, os que já tiveram seus comportamentos terapêuticos modelados e não apenas instruídos por seus professores e supervisores) utilizam a estratégia de orientar seus clientes, qual a freqüência do uso desta estratégia e quais as formas dessas orientações. O estudo foi descritivo, procurando controlar parcialmente as variáveis “influência das características do cliente” ao solicitar três clientes para cada terapeuta, a “influência das características do terapeuta” ao selecionar três terapeutas da mesma abordagem teórica e a “influência das sessões” ao pedir três sessões por cliente. O número de clientes por terapeuta e de sessões por cliente foi diferente do planejado, mas permitiu a análise de tendências. Nesse estudo, a orientação foi entendida como uma descrição do comportamento a ser executado pelo cliente fora das sessões de terapia, com indicação explícita ou implícita das conseqüências desta ação. As seguintes subcategorias foram selecionadas para análise. Primeiro, orientação para a ação, isto é, orientações que indicavam diretamente de que forma o cliente deveria comportar-se no cotidiano. Segundo, a orientação para a reflexão, ou seja, indicações mais indiretas, aconselhando o cliente a refletir sobre determinado tema. E, terceiro, prescrição de tarefas, indicando tarefas terapêuticas para casa como parte de um procedimento estruturado. Pretendeu-se verificar ainda se, quando orientava, o terapeuta estava especificando o comportamento a ser emitido ou se dava orientações genéricas, uma vez que a literatura tem mostrado que principalmente a primeira destas formas pode produzir o efeito de “insensibilidade às contingências naturais” (p. ex.: Hayes e Ju, 1998). Os terapeutas variaram o número total de falas e o número de falas com orientação por sessão com todos os clientes. A flutuação de falas dos terapeutas não pareceu ser controlada por diferenças entre clientes, já que houve variações entre sessões de um mesmo cliente para todos os terapeutas. Para os três ANÁLISE DO COMPORTAMENTO terapeutas foi baixa a proporção de falas com orientação, indicando não ser esta uma estratégia muito usada por nenhum dos terapeutas comportamentais experientes. Observaram-se também grandes flutuações entre sessões e entre clientes de cada terapeuta quanto ao número de falas contendo orientação, não sendo estas, portanto, variáveis de controle relevantes. Quando os terapeutas usavam orientações, estas tendiam a ser específicas e poucas vezes genéricas. Quando orientou, o primeiro terapeuta indicou ações específicas a serem realizadas por seus clientes no cotidiano, na maioria das vezes; já o segundo terapeuta prescreveu tarefas, enquanto o terceiro terapeuta indicou tanto ações quanto reflexões para seus clientes. A prescrição de tarefas, tipo de orientação que mais se esperaria de terapeutas comportamentais, de acordo com a literatura, não ocorreu em todas as sessões, tampouco foi apresentada a todos os clientes. Apesar de o número de dados não ter sido suficiente para generalizações, aparentemente o comportamento de orientar não foi modelado pelos clientes destes terapeutas experientes. Mais pesquisas poderiam ser conduzidas para verificar a validade das conclusões. Em continuação a essa investigação, Donadone (2002) elaborou um projeto de pesquisa no qual parte do procedimento do estudo anterior será replicado, mas que contará também com a análise de auto-orientações, entendidas como uma descrição do comportamento, feita pelo cliente, a ser executado por ele mesmo fora da sessão, com descrição explícita ou implícita das conseqüências de suas ações. O estudo pretende comparar o emprego de orientações e o uso de estratégias para produzir auto-orientações, tanto por terapeutas comportamentais experientes quanto por terapeutas com pouca experiência. O interesse em estudar o uso de orientação por terapeutas iniciantes surgiu a partir de uma comparação não planejada: o treino em categorizar, realizado no estudo anterior, foi feito com transcrições de sessões de terapeutas em início de carreira, nas quais havia uma freqüência bem mais alta de orientações do que a encontrada com os terapeutas experientes. A diferença poderia ser explicada pe- 223 las afirmações de Banaco (1993), de Ferrari (1996) e de Alvarez (1999), de que terapeutas experientes encontram-se mais sob controle das contingências das sessões, enquanto terapeutas pouco experientes ficam mais sob controle de instruções, tendo dificuldades em discriminar contingências da relação terapêutica durante as sessões. O uso de orientação por terapeutas pouco experientes poderia estar relacionado ao seguimento de regras sobre “como proceder em terapia” e à ansiedade em produzir mudanças rápidas. Já os terapeutas experientes podem ter tido uma história de punição por parte de seus clientes quando usaram orientação, ou pelo menos foram reforçados diferencialmente ao utilizarem outras estratégias: pode ser difícil ser empático e orientar ao mesmo tempo. Pesquisas deveriam ser conduzidas para comparar o processo de manutenção das mudanças obtidas quando comportamentos foram instalados por procedimentos diferentes. Contingências naturais do comportamento instruído passam a modelar sua forma de emissão? Esse comportamento se extingue na ausência de reforçamento social? Uma outra questão a ser investigada refere-se ao efeito, na clínica, do emprego de orientações genéricas e específicas tanto com relação à insensibilidade às contingências naturais do comportamento (ou, em outras palavras, ao controle social ou ao controle direto pelas contingências) quanto ao seu seguimento ou não. É importante, também, procurar responder a questionamentos sobre que processos comportamentais são responsáveis pelas mudanças obtidas por meio da psicoterapia: alteração do controle por regras, modelagem na relação terapêutica, ambas, e, em caso positivo, em que proporção? E os resultados obtidos diferem em sua manutenção e generalização? Certamente, a cada pesquisa realizada, novas perguntas surgirão. CONCLUSÃO As razões do desenvolvimento do controle por regras relacionam-se com o fato de que os homens podem, utilizando descrições verbais, induzir uns aos outros – ou a si mesmos – 224 ABREU-RODRIGUES, RIBEIRO & COLS. a se comportarem de modo efetivo sem que haja necessidade de exposição, geralmente longa, às conseqüências descritas. Essa característica do comportamento governado por regras parece especialmente necessária quando as conseqüências produzidas pelo comportamento são muito atrasadas ou escassas, tornandose, portanto, ineficazes na modificação de comportamentos; ou ainda quando os comportamentos que seriam modelados pelas contingências em vigor são indesejáveis. As vantagens do controle por regras são justamente sua eficácia – rapidez com que se instala – e sua força (Skinner, 1974/1982). A desvantagem de seguir regras é evidenciada quando as contingências mudam e as regras não. Pode ocorrer a insensibilidade às contingências, ou seja, a nãoalteração do desempenho e a continuidade de emissão da resposta anteriormente necessária a sua produção. A terapia comportamental tem tido amplos reconhecimento e aceitação, especialmente com casos difíceis de transtornos psiquiátricos. Uma das vantagens apontadas é a rapidez com que os resultados são obtidos. E a rapidez da aprendizagem é uma das vantagens dos comportamentos governados por regras. É possível que o sucesso dos procedimentos usados nesses casos se devam, em parte, a essa vantagem do controle por regras. Outra forma de trabalho de terapeutas é o favorecimento do autoconhecimento de seus clientes, ou seja, a promoção da identificação e da descrição das prováveis contingências que controlam os comportamentos atuais e as que foram responsáveis por sua instalação no passado. As descrições de contingências, como vimos, são regras se elas controlarem o comportamento subseqüente. Assim, um comportamento modelado por contingências pode passar a ser, em parte, controlado por sua descrição, uma vez que a regra produzida pode facilitar o desempenho (Skinner, 1974/1982). Entretanto o mero fato de descrever as contingências não significa que estas necessariamente passem a participar do controle do comportamento descrito. Comportamentos não precisam de descrição para mudar. É possível, por exemplo, solucionar problemas sem a prévia descrição das contingências em vigor (Simonassi, 1999). Kohlenberg e Tsai (1991/2001) também analisaram a questão da influência do comportamento verbal sobre o não-verbal, ao falar dos papéis que os pensamentos podem ter, considerando essa influência uma relação entre respostas e não uma relação de causalidade, uma vez que na abordagem analíticocomportamental a explicação do comportamento é encontrada no ambiente. Esses autores definiram pensamento como tato (descrições) e mando (solicitações) a si mesmo e afirmaram que os três papéis dos pensamentos são: influenciar comportamentos subseqüentes; não influenciar comportamentos subseqüentes; contribuir para aumentar a força de um comportamento subseqüente modelado por contingências. O grau de controle exercido pelo pensamento sobre problemas clínicos estaria em um continuum. Abreu-Rodrigues e Sanabio (2001) também descreveram sete possíveis relações entre eventos privados e públicos, estando três delas descritas na discussão sobre correspondência entre auto-relato e desempenho não-verbal, no tópico “Contribuições da pesquisa básica” deste capítulo (p.212). Essas análises têm implicações para o tratamento, o qual deve ser diferente de acordo com o tipo de controle. Quando o pensamento ou o evento privado tem influência no problema do cliente, o procedimento indicado pode ser o de mudança dos pensamentos, ou seja, o procedimento é aplicado a um elo da cadeia comportamental, no qual são observadas mudanças. O terapeuta pode apresentar argumentos lógicos, questionamento das evidências e apresentação de instruções para mudança de crenças. No caso de o pensamento ou o evento privado não influenciar o comportamento subseqüente, o tratamento deve ser direcionado para mudar diretamente as ações do indivíduo que estão lhe causando problemas. Nessa situação, o terapeuta cria condições de expor o comportamento do cliente a reforçamento positivo na sessão de terapia e no ambiente natural, que poderia modelar e manter novos comportamentos (Kohlenberg e Tsai, 1991/2001). Alguns cuidados devem ser tomados ao empregar o conceito de governo por regras para explicar fenômenos que ocorrem na clínica. Não se deve confundir crenças, conceito usado ANÁLISE DO COMPORTAMENTO pelos terapeutas comportamentais cognitivos, com regras, apesar de existirem algumas semelhanças. Afirmar que um cliente possui uma crença, muitas vezes irracional, e que ela é responsável por comportamentos que causam problemas é usualmente uma afirmação sobre a probabilidade de comportamento (e não sobre o controle do comportamento por um estímulo discriminativo verbal que descreve uma contingência) e está baseada na observação de instâncias ou de relatos passados do comportamento (Costa, 2002). O termo “regra” é por vezes usado de maneira similar, isto é, indicando probabilidade de comportamentos, como nos alertou Baum (1994/1999), ao afirmar que não é correto afirmar que uma pessoa está seguindo uma regra quando se percebe algum tipo de regularidade no comportamento dela, prática comum entre alguns analistas clínicos do comportamento. Por exemplo, um terapeuta pode ter identificado em cliente um comportamento inadequado em relação à aproximação de mulheres e também uma história de punição para essa classe de ações. Não seria correto concluir que essa história levou-o ao desenvolvimento da regra “se eu for falar com alguma moça, vai dar tudo errado”, que teria, então, passado a controlar seu comportamento de esquiva social. Não há necessidade de supor que uma regra esteja controlando o comportamento: identificar contingências que atuaram na história de vida provavelmente é suficiente para entender a função deste comportamento. Uma outra consideração diz respeito ao problema que pode ocorrer ao se desenvolver uma avaliação funcional, de se atribuir a regras aprendidas ou a auto-regras o controle dos comportamentos que fizeram um indivíduo buscar ajuda psicológica. Por serem, pelo menos na maioria das vezes, comportamentos instalados há bastante tempo, certamente eles estão sendo mantidos por contingências. É possível que as contingências que mantenham o comportamento problemático sejam sociais, e que estejam mantendo comportamentos de seguimento de regras, mesmo que tais regras estejam em desacordo com as contingências diretas do comportamento especificado pela regra. Não se pode, contudo, dizer que se trata 225 de comportamento governado por regra, pois, segundo Albuquerque (2001, p. 139): Quando regras são discrepantes das contingências de reforço (isto é, quando a emissão do comportamento previamente especificado pela regra produz conseqüências que não correspondem às conseqüências descritas na própria regra), pode-se dizer que a emissão do comportamento previamente especificado pela regra é controlado pela regra, apenas antes que as conseqüências produzidas por esse comportamento (isto é, as conseqüências que contradizem a própria regra) exerçam algum efeito sobre ele. Depois disso, o comportamento observado passa a ser controlado pelas contingências de reforço. Novos comportamentos que surgem a partir da relação terapêutica podem, entretanto, ser governados por regras. Está implícito nas considerações anteriores o cuidado que se deve ter ao afirmar que um comportamento é insensível a contingências. A insensibilidade pode ocorrer com relação a algumas conseqüências diretas da ação instruída, mas não se pode dizer que o comportamento de seguir regras não é mantido por contingências (sociais). REFERÊNCIAS BIBLIOGRÁFICAS Ablon, J. S.; Jones, E. E. (2002). Psychotherapy process in the NIMH collaborative study of depression. Manuscrito não publicado. Abreu-Rodrigues, J.; Sanabio, E. T. (2001). Eventos privados em uma psicoterapia externalista: Causa, efeito ou nenhuma das alternativas? Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 206-216). Santo André, SP: ESETec. Abreu-Rodrigues, J.; Sanabio, E. T. (no prelo). Instruções e auto-instruções: Contribuições da pesquisa básica. Em C. N. de Abreu e H. J. Guilhardi (Orgs.), Manual prático de técnicas em psicoterapia comportamental, cognitiva e construtivista. São Paulo: Editora Roca. Albuquerque, L. C. (2001). Definições de regras. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 132-140). Santo André, SP: ESETec. Alvarez, L. F. (1999). Condições que facilitam o aprimoramento da prática clínica: Atribuições de psicoterapeutas comportamentais experientes e não experientes. Monografia não-publicada, Curso de Especia- 226 ABREU-RODRIGUES, RIBEIRO & COLS. lização em Psicologia Clínica, Universidade Estadual de Londrina, PR. Banaco, R. A. (1993). O impacto do atendimento sobre a pessoa do terapeuta. Temas em Psicologia, 2, 71-79. Banaco, R. A. (1997). Auto-regras e patologia comportamental. Em D. R. Zamignani (Org.), Sobre comportamento e cognição: Vol. 3. A aplicação da análise do comportamento e da terapia cognitivo-comportamental no hospital geral e nos transtornos psiquiátricos (p. 80-88). Santo André, SP: ARBytes. Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura (M. T. A. Silva, M. A. Matos e G. Y. Tomanari, trads.). Porto Alegre, RS: Artmed (Obra publicada originalmente em 1994). Beck, A.; Freeman, A. (1993). Terapia cognitiva dos transtornos de personalidade (A. E. Fillman, trad.). Porto Alegre: Artes Médicas (Obra publicada originalmente em 1990). Beutler, L. E.; Moleiro, C.; Talebi, H. (2002). Resistance in psychotherapy: What conclusions are supported by research. JCLP/In Session: Psychotherapy in Practice, 58, 207-217. Bischoff, M. M.; Tracey, T. J. C. (1995). Client resistance as predicted by therapist behavior: A study of sequential dependence. Journal of Counseling Psychology, 42, 487-495. Cahill, S. P.; Carrigan, M. H.; Evans, I. M. (1998). The relation between behavior theory and behavior therapy: Challenges and promises. Em J. J. Plaud; G. H. Eifert (Eds.), From behavior theory to behavior therapy (p. 294319). Boston: Allyn and Bacon. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. Souza et al.; trads). Porto Alegre, RS: Artmed (Obra publicada originalmente em 1998). Catania, A. C.; Matthews, B. A.; Shimoff, E. (1982). Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior, 38, 233-248. Cautilli, J.; Connor, L. S. (2000). Assisting the client/ consultee to do what is needed: A functional analysis of resistance and other forms of avoidance. The Behavior Analyst Today, 1, 37-42. Corey, G. (1983). Técnicas de aconselhamento e psicoterapia. Rio de Janeiro: Campus. Costa, N. (2002). Terapia analítico-comportamental: Dos fundamentos filosóficos à relação com o modelo cognitivista. Santo André, SP: ESETec. Delitti, M.; Meyer, S. B. (1995). O uso de encobertos na prática da terapia comportamental. Em B. Rangé (Org.), Psicoterapia comportamental e cognitiva de transtornos psiquiátricos (p. 269-274). Campinas, SP: Editorial Psy. de Rose, J. C. C. (1997). O relato verbal segundo a perspectiva da análise do comportamento: Contribuições conceituais e experimentais. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 148-164). Santo André, SP: ARBytes. Donadone, J. C. (2002). O uso da orientação por terapeutas comportamentais experientes e pouco experientes. Projeto de Dissertação de Mestrado financiado pela FAPESP. Ferrari, K. P. A. (1996). Aspectos do comportamento do terapeuta comportamental iniciante que podem dificultar a prática psicoterápica nessa abordagem. Anais da V Jornada da clínica de psicologia (p. 85-87). Belo Horizonte: PUC/Minas. Follette, W. C.; Naugle, A. E.; Callaghan, G.; M. (1996). A radical behavioral understanding of the therapeutic relationship in effecting change. Behavior Therapy, 27, 623-641. Frank, J. D.; Frank, J. B. (1993). Directive individual psychotherapies. Em J. D. Frank; J. B. Frank (Eds.), Persuasion and healing. A comparative study of psychotherapy (p. 212-241). Baltimore: The John Hopkins University Press. Garfield, S. L. (1995). Psychotherapy: An eclecticintegrative approach. New York: John Wiley e Sons. Guedes, M. L. (1997). O comportamento governado por regras na prática clínica. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 138-143). Santo André, SP: ARBytes. Guilhardi, H. J. (2002). A resistência do cliente a mudanças. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 9. Contribuições para a construção da teoria do comportamento (p. 133-156). Santo André, SP: ESETec. Hayes, S. C.; Ju, W. (1998). The applied implications or rule-governed behavior. Em W. O’Donohue (Ed.), Learning and behavior therapy (p. 374-391). Boston: Allyn and Bacon. Hayes, S. C.; Kohlenberg, B. S.; Melancon, S. M. (1989). Avoiding and altering rule-control as a strategy of clinical intervention. Em S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies, and instructional control (p. 359-385). New York: Plenum Press. Hayes, S. C.; Strosahl, K.; Wilson, K. G. (1999). Acceptance and commitment therapy: An experiential approach to behavior change. New York: Guilford Press. Hayes, S. C.; Zettle, R. D.; Rosenfarb, R. (1989). Rulefollowing. Em S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies, and instructional control (p. 191-220). New York: Plenum Press. Jonas, A. L. (1997). O que é auto-regra? Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 144147). Santo André, SP: ARBytes. Kohlenberg, R. J.; Tsai, M. (2001). Psicoterapia analítica funcional (F. Comte, M. Delliti, M. Z. Brandão, P. R. Oerdyk, R. R. Kerbauy, R. C. Wielenska, R. A. Banaco; R. Starling, trads.). Santo André, SP: ESETEc (Obra publicada originalmente em 1991). Kohlenberg, R. J.; Tsai, M.; Dougher, M. J. (1993). The dimensions of clinical behavior analysis. The Behavior Analyst, 16, 271-282. ANÁLISE DO COMPORTAMENTO Malerbi, F. E. K. (2000). Adesão ao tratamento. Em R. R. Kerbauy (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 148-155). Santo André, SP: SET. Matos, M. A. (2001). Comportamento governado por regras. Revista Brasileira de Terapia Comportamental e Cognitiva, III, 51-66. Meyer, S. B. (2001). A relação terapeuta-cliente é o principal meio de intervenção terapêutica? Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 8. Expondo a variabilidade (p. 95-98). Santo André, SP: ESETec. Meyer, S. B.; Donadone, J. (2002). O emprego da orientação por terapeutas comportamentais. Revista Brasileira de Terapia Comportamental e Cognitiva, IV, 79-90. Meyer, S. B.; Vermes, J. S. (2001). Relação terapêutica. Em B. Rangé (Org.), Psicoterapias cognitivo-comportamentais. Um diálogo com a psiquiatria (p. 101110). Porto Alegre, RS: Artmed. Miranda, C. F.; Miranda, M. L. (1993). Construindo a relação de ajuda. Belo Horizonte, MG: Crescer. Rangé, B. (1995). Relação terapêutica. Em B. Rangé (Org.), Psicoterapia comportamental e cognitiva de transtornos psiquiátricos (p. 43-61). Campinas: Workshopsy. Raue, P. J.; Goldfried, M. R. (1994). The therapeutic alliance in cognitive-behavior therapy. Em A. O. Horvath; L. Greenberg (Orgs.), The working alliance: Theory, research, and practice (p. 131-152). New York: John Wiley e Sons. 227 Rosenfarb, I. S. (1992). A behavior analytic interpretation of the therapeutic relationship. The Psychological Record, 42, 341-354. Sanabio, E.; Abreu-Rodrigues, J. (2002). Regras: Estímulos discriminativos ou estímulos alteradores de função? Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 9. Contribuições para a construção da teoria do comportamento (p. 114-119). Santo André, SP: ESETec. Shinohara, H. (2000). Relação terapêutica: o que sabemos sobre ela? Em R. R. Kerbauy (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 229-233). Santo André, SP: SET. Simonassi, L. E. (1999). Cognição: Contato com contingências e regras. Revista Brasileira de Terapia Comportamental e Cognitiva, I, 83-93. Skinner, B. F. (1957). Verbal behavior. New Jersey: Prentice-Hall. Skinner, B. F. (1982). Sobre o behaviorismo (M. P. Vilalobos, trad.). São Paulo: Cultrix (Obra publicada originalmente em 1974). Skinner, B. F. (1989). Recent issues in the analysis of behavior. Columbus: Merrill Publishing Company. Zamignani, D. R. (2001). Uma tentativa de caracterização da prática clínica do analista do comportamento no atendimento de clientes com e sem o diagnóstico de transtorno obsessivo-compulsivo. Dissertação de Mestrado não-publicada, Pontifícia Universidade Católica de São Paulo, São Paulo. CORRESPONDÊNCIA VERBAL/NÃO-VERBAL: PESQUISA BÁSICA E APLICAÇÕES NA CLÍNICA 13 MARCELO EMÍLIO BECKERT Questões do cotidiano devem encontrar respaldo em investigações científicas. Assim como as razões de o céu ser azul estarem na física e as da síndrome de Down estarem na biologia, a psicologia oferece uma contribuição enorme para o melhor entendimento do homem em interação com seu mundo. A mentira, a promessa não-cumprida, a negação, a omissão ou o uso da fala como recurso educacional e terapêutico são temas do cotidiano cuja compreensão é beneficiada pela investigação da relação entre o comportamento verbal e o não-verbal. Essa área de investigação tem sido denominada de correspondência verbal/não-verbal, correspondência dizerfazer (ou fazer-dizer) ou apenas correspondência. A relação entre o que é dito e feito (ou vice-versa) por uma mesma pessoa já é investigada há algum tempo. La Pierre (1934, citado em Lloyd, 1994) atravessou os Estados Unidos com um casal de chineses, visitando 250 estabelecimentos, entre restaurantes e hotéis. Posteriormente, enviou um questionário aos proprietários perguntando sobre a possibilidade de eles hospedarem/servirem um casal de chineses em suas propriedades. Quase 90% dos proprietários responderam que não receberiam o casal, apesar de já o terem feito, dando um exemplo de falta de correspondência. O primeiro estudo sobre correspondência na literatura analítico-comportamental foi realizado por Risley e Hart (1968), publicado no volume de inauguração do Journal of Applied Behavior Analysis (JABA). O objetivo desses autores era mais aplicado do que teórico. Eles queriam desenvolver um procedimento para produzir uma correspondência generalizada entre o dizer e o fazer, de forma que o fazer pudesse ser modificado apenas pelo reforço do dizer. Os autores, então, alternaram repetidas vezes os procedimentos de reforço da verbalização (contingente apenas ao dizer) e reforço da correspondência (contingente à correspondência fazer-dizer) com diferentes comportamentos não-verbais. Como conseqüência desse treino, as crianças apresentaram uma correspondência generalizada, de modo que o reforço de determinada verbalização passou a ser suficiente para aumentar a freqüência do fazer correspondente. Os autores sugeriram que, em vez de punir o comportamento verbal que não correspondesse ao comportamento não-verbal (ou vice-versa), a sociedade deveria estabelecer contingências de reforçamento favoráveis ao desenvolvimento da correspondência. A partir desse trabalho, surgiu uma nova linha de pesquisa na análise experimental do comportamento: a análise operante da correspondência entre comportamentos verbais e não-verbais. Essa análise levou a uma tecnologia de mudança de comportamento, conhecida por treino de correspondência (TC). O objetivo deste capítulo é a análise de questões metodológicas e teóricas derivadas de pesquisas básicas sobre correspondência. Serão também discutidas algumas implicações dos achados dessas pesquisas para o contexto aplicado, com ênfase no contexto clínico. 230 ABREU-RODRIGUES, RIBEIRO & COLS. CONTRIBUIÇÕES DA PESQUISA BÁSICA Tipos de Cadeia A abordagem analítico-comportamental trata o dizer e o fazer como duas classes de respostas distintas. O comportamento verbal é definido como um comportamento operante desenvolvido e mantido por reforçamento mediado por outra pessoa, o ouvinte (Skinner, 1957/1978). A investigação sobre o comportamento verbal na área analítico-comportamental teve seu grande boom na década de 1980. O aprimoramento metodológico e tecnológico e o surgimento de novas propostas conceituais contribuíram para isso. Uma conseqüência do maior investimento nessa área foi o fortalecimento da noção de que, em muitos contextos, o comportamento verbal exerce uma importante influência sobre o comportamento não-verbal. Ou seja, mudanças no dizer de um indivíduo podem facilitar a mudança no fazer. Catania (1998/1999, p. 272), por exemplo, define a palavra como “um meio de levar as pessoas a fazerem coisas”. Catania e colaboradores chegaram a propor a noção, para muitos controversa, de ser mais fácil mudar o comportamento humano modelando aquilo que alguém diz do que modelando diretamente aquilo que alguém faz (Catania, Matthews, e Shimoff, 1982; Catania, Matthews, e Shimoff, 1990). Nesse contexto, a investigação sobre as variáveis que justificariam (ou não) uma congruência entre dizer e fazer ganhou força. Analisando a literatura sobre correspondência, conclui-se que a pesquisa empírica oferece valiosos dados. O desafio é entender a complexidade que envolve o fenômeno da correspondência e buscar nos dados de pesquisa subsídios para melhor compreendê-la. Assim sendo, alguns aspectos da literatura em questão valem ser revisados: Os estudos sobre correspondência e controle verbal utilizam dois tipos de TC que se diferenciam em termos da seqüência comportamental treinada. No treino dizer-fazer, o reforço é liberado quando a pessoa verbaliza o comportamento não-verbal futuro e depois o emite. Já no treino fazer-dizer, o reforço é liberado quando a pessoa emite um comportamento não-verbal e só depois verbaliza sobre ele. O estudo de Israel e O”Leary (1973) foi pioneiro na investigação empírica das possíveis diferenças entre o treino das cadeias dizer-fazer e fazer-dizer. Nesse estudo, o comportamento não-verbal alvo consistiu na escolha de três brinquedos pré-selecionados pelos experimentadores dentre os 15 brinquedos disponíveis para as crianças. Foram realizados dois experimentos envolvendo três condições experimentais: linha de base, reforço da verbalização e TC. Durante a condição de linha de base, o reforço era sempre liberado, independente da natureza da verbalização e do(s) brinquedo(s) escolhido(s). Durante a condição de reforço da verbalização, a liberação do reforço foi contingente ao conteúdo do dizer relacionado a um dos três brinquedos-alvos (p. ex.: “eu vou brincar com o quebra-cabeça” para o grupo dizer-fazer, ou “eu brinquei com o quebra-cabeça” para o grupo fazer-dizer). Durante o treino de correspondência, a liberação do reforço foi contingente à correspondência entre dizer e fazer (p. ex.: a criança dizia “eu vou brincar com o quebracabeça” e o escolhia), ou entre fazer e dizer (p. ex.: a criança brincava com o quebra-cabeça e depois dizia “eu brinquei com o quebra-cabeça”). No Experimento 1, a correspondência dizer-fazer foi treinada antes da correspondência fazer-dizer; no Experimento 2, ocorreu o inverso. Os resultados indicaram que o reforço da verbalização produziu aumentos na freqüência do dizer, mas não foi suficiente para aumentar a freqüência do comportamento nãoverbal correspondente, um efeito só observado com a implementação do TC. Além disso, enquanto a correspondência dizer-fazer aumentou nos dois experimentos, a correspon- a) comparação entre os tipos de cadeia implementados no TC (dizer-fazer, fazer-dizer e dizer-fazer-dizer) e seus diferentes efeitos; b) aspectos metodológicos, enfatizando a questão do reforço de verbalização versus reforço de correspondência; c) aquisição, generalização e manutenção de comportamentos-alvo. ANÁLISE DO COMPORTAMENTO dência fazer-dizer só foi observada no Experimento 1 (depois do treino dizer-fazer). Um ponto a ser ressaltado nesse trabalho é a efetividade do TC dizer-fazer na produção de correspondência, o que tem sido corroborado por outros autores (p. ex.: Israel, 1973; Karoly e Dirks, 1977; Paniagua e Baer, 1982). Apesar de a pesquisa básica ter focalizado mais as seqüências fazer-dizer e dizer-fazer, há inúmeras possibilidades de arranjo das relações entre comportamento verbal e nãoverbal. Paniagua e Baer (1982) sugeriram que a correspondência seria mais adequadamente caracterizada por uma seqüência com os seguintes elos: promessa, comportamento intermediário, cumprimento da promessa e relato subseqüente sobre o cumprimento da promessa, ou seja, a seqüência dizer-fazer intermediário-fazer-dizer. Os comportamentos intermediários são aqueles que ocorrem entre o dizer e o fazer e favorecem a emissão do comportamento não-verbal alvo. Pelo menos em termos teóricos, essa sugestão faz sentido, considerando que, se o estímulo verbal participa do controle do comportamento não-verbal (Catania, 1998/1999; Deacon e Konarski, 1987; Guevremont, Osnes e Stokes, 1986a), então, um estímulo verbal anterior e outro posterior irão fortalecer essa situação de controle. Vale mencionar que essa seqüência aproxima-se da rotina típica de atendimento psicoterápico de muitos terapeutas analítico-comportamentais, conforme apontado por Beckert (2001; 2002a). O cliente, no final da sessão, descreve comportamentos a serem emitidos naquela semana, age no contexto fora da sessão e descreve os comportamentos emitidos na sessão seguinte. Ou seja, o cliente propõe-se a “fazer”, “faz” e depois relata o que “fez”, em uma seqüência comportamental similar àquela sugerida por Paniagua e Baer (1982), isto é, dizer-fazer-dizer. Em alguns casos, o terapeuta intervém com “tarefas para casa” (dica para o primeiro dizer, anterior ao fazer) e questionamento sobre a semana que passou (dica para o segundo dizer, posterior). Uma avaliação empírica dessa proposta foi realizada por Beckert (2000), que comparou o treino da cadeia dizer-fazer-dizer com as “tradicionais” cadeias dizer-fazer e fazer- 231 dizer. Treze crianças de 6 a 7 anos foram divididas em três grupos experimentais, de acordo com o TC que iriam receber. O comportamento não-verbal alvo, o mesmo para os três grupos, consistiu em uma resposta de autocontrole definida segundo o paradigma experimental de Rachlin (1970). De acordo com essa proposta, o autocontrole pode ser investigado por meio da escolha entre duas alternativas de reforço: um imediato com menor magnitude e outro mais atrasado com maior magnitude. O autocontrole, então, consiste na escolha do reforço mais atrasado com maior magnitude, enquanto o oposto define a impulsividade (ver Capítulo 10 para informações detalhadas sobre o autocontrole). No experimento, a apresentação de desenho animado foi utilizada como reforço. Os resultados apontaram uma similaridade nos TCs dizer-fazer (DF), fazer-dizer (FD) e dizer-fazer-dizer (DFD) no que se refere à aquisição de autocontrole. Entretanto o treino da seqüência dizer-fazer foi mais efetivo do que os demais na manutenção desse comportamento, avaliado com o retorno à linha de base. Um dado interessante foi que os participantes do Grupo Dizer-Fazer-Dizer apresentaram um desempenho mais semelhante àquele dos participantes do Grupo Fazer-Dizer do que àquele do Grupo Dizer-Fazer. Um ponto a ser considerado na análise dos resultados do Grupo Dizer-Fazer-Dizer refere-se ao controle de estímulos que prevalece nessa seqüência. Na seqüência dizer-fazer, o estímulo discriminativo seria verbal (“dizer”); na seqüência fazer-dizer, o estímulo discriminativo seria não-verbal (“fazer”). Na seqüência dizer-fazer-dizer, por sua vez, tanto o primeiro dizer quanto o fazer poderiam exercer um controle discriminativo sobre o comportamento subseqüente. Desse modo, o TC dizerfazer-dizer incluiria dois eventos com probabilidade de desenvolver funções de controle: o primeiro “dizer” e o “fazer”. Embora as condições de treino permitissem o condicionamento de ambos os eventos comportamentais, um deles poderia ter-se tornado um estímulo discriminativo mais efetivo do que o outro, em função de um fenômeno denominado sombreamento (overshadowing). É possível, portanto, 232 ABREU-RODRIGUES, RIBEIRO & COLS. que o “fazer” tenha sombreado o primeiro “dizer”, ou seja, que o “fazer” tenha adquirido funções discriminativas mais efetivas do que o primeiro “dizer”, principalmente se for considerado que os elos fazer-dizer ocorriam temporalmente mais próximos do reforço do que os elos dizer-fazer. Se, de fato, as funções discriminativas do primeiro “dizer” foram atenuadas pelas contingências de treino, seria esperado que a manutenção do comportamento de autocontrole para o Grupo DFD fosse inferior àquela apresentada pelo Grupo DF e próxima à do Grupo FD, o que foi realmente observado. De qualquer forma, não restam dúvidas de que a correspondência dizer-fazer-dizer é mais complexa do que as outras duas correspondências. Ainda resta saber se ela poderia também ser mais efetiva e sob que condições isso poderia acontecer. Em suma, a cadeia dizer-fazer é apontada como a mais eficaz na aquisição de correspondência e conseqüente aquisição de comportamentos-alvo. Entretanto a superioridade do TC dizer-fazer depende de certas características da metodologia empregada ou, mais especificamente, da contingência de reforço estabelecida para cada seqüência, conforme apontado por Paniagua e Baer (1982). Essas diferentes contingências serão apresentadas a seguir. Aspectos metodológicos A metodologia das investigações sobre correspondência tem compreendido, sistematicamente, três fases: linha de base, reforçamento da verbalização (RV) e reforçamento da correspondência verbal/não-verbal, o supracitado treino de correspondência (TC). Diferentes procedimentos, contudo, passaram a surgir, tanto na fase RV como na fase TC. Paniagua (1990), ao revisar os experimentos apresentados na literatura pertinente, apresentou uma proposta de sistematização da metodologia para a área, a qual compreendia dois procedimentos possíveis para a fase RV e cinco para a fase TC. A principal contribuição desse trabalho foi a apresentação de uma pro- posta de terminologia padrão para a área, haja vista que, até aquela data, cinco diferentes terminologias eram usadas para a fase RV, e mais de 13 para a fase TC. Na fase RV, o experimentador pergunta ao participante o que ele fez (treino fazer-dizer) ou o que irá fazer (treino dizer-fazer). O participante verbaliza, e o experimentador libera o reforço contingente à verbalização. Em ambas as seqüências, o reforçamento do dizer independe da ocorrência do comportamento não-verbal correspondente. Além disso, o reforço pode ser liberado imediatamente após o dizer ou depois de um período de tempo. Na condição de reforço imediato do dizer, em ambas as seqüências, o reforço é apresentado e liberado imediatamente após a verbalização. Esse procedimento foi utilizado nos estudos de Israel e O”Leary (1973) e de Risley e Hart (1968), mencionados anteriormente. Outros exemplos desse procedimento podem ser encontrados em Baer, Detrich e Weninger (1988), Guevremont e colaboradores (1986a, 1986b), Israel (1973), Paniagua e Baer (1982), e Rogers-Warren e Baer (1976). O reforço atrasado do dizer somente foi avaliado na seqüência dizer-fazer. Aqui, o participante emite o dizer, o reforço é apresentado, o participante emite o fazer, e só então o reforço é liberado (independentemente de ocorrer ou não correspondência). No estudo de Israel e O’Leary (1973), esse procedimento foi também utilizado, o mesmo ocorrendo nos estudos de Israel e Brown (1977) e Karoly e Dirks (1977). Baer e colaboradores (1984) compararam os dois tipos de reforço de verbalização (imediato e atrasado), não tendo sido encontradas diferenças entre esses procedimentos. A fase RV pode ser programada antes e/ ou depois da fase TC (p. ex.: Israel e Brown, 1977; Guevremont et al., 1986b). Essa última estratégia (RV após TC) possibilita o teste de generalização e/ou manutenção da correspondência, já que o reforço volta a ser contingente apenas à verbalização, independentemente da ocorrência ou não de correspondência. A ocorrência de correspondência nesta condição indica manutenção – no caso de emissão do ANÁLISE DO COMPORTAMENTO mesmo comportamento não-verbal – ou generalização – no caso de emissão de um comportamento não-verbal diferente daquele treinado no TC. Outras vezes, a condição RV não é sequer programada (Paniagua e Baer, 1982; Whitman et al., 1982) e, nesse caso, o experimentador usa prompts1 para promover o “dizer” necessário para a implementação do TC. Há ainda a possibilidade de prompts serem utilizados mesmo durante a fase RV. Na fase TC o reforço sempre é contingente à correspondência entre comportamento verbal e comportamento não-verbal. São cinco os procedimentos usados no TC: reforço da correspondência fazer-dizer, reforço da correspondência dizer-fazer, reforço iniciado pelo dizer, reforço imediato de comportamento intermediário e reforço iniciado por comportamentos intermediários. No procedimento mais simples, o experimentador libera o reforço imediatamente após a ocorrência da correspondência. O reforço da correspondência fazer-dizer é a única possibilidade para o TC da seqüência comportamento não-verbal – comportamento verbal (p. ex.: Israel, 1973; Israel e O”Leary, 1973; Paniagua e Baer, 1982; Ribeiro, 1989; Risley e Hart, 1968; Rogers-Warren e Baer, 1976). O TC da seqüência comportamento verbal – comportamento não-verbal, por outro lado, envolve quatro possibilidades. O procedimento mais comumente utilizado é o reforço da correspondência dizerfazer (Baer et al., 1984; 1988; Deacon e Konarski, 1987; Guevremont et al., 1986a, 1986b; Whitman et al., 1982). Há três outras alternativas possíveis para o TC dizer-fazer. No reforço iniciado pelo dizer, o reforço é apresentado depois do dizer, mas é liberado somente após o fazer, isso se o fazer 1O prompt (comando ou pergunta) é utilizado para “facilitar” a emissão da resposta verbal requisitada no TC (Paniagua, 1990). Em muitos experimentos de TC – de fato, na maioria – o experimentador faz uso de prompts que sinalizam a resposta verbal que o sujeito deve apresentar, como, por exemplo, o comando “diga que vai brincar com o dinossauro” ou a pergunta “com qual brinquedo você brincará hoje?” (por exemplo, Baer et al., 1988; Deacon e Konarski, 1987; Guevremont et al., 1986a; Karoly e Dirks, 1977). 233 corresponder ao dizer anterior (Israel, 1973; Israel e O”Leary, 1973; Karoly e Dirks, 1977; Paniagua e Baer, 1982). Esse procedimento também é chamado de “reforço de consumação futura”. Com essa metodologia, o participante poderá ter tanto o seu comportamento verbal reforçado (pela apresentação do reforço) como o comportamento não-verbal (com a liberação do reforço já apresentado). Os outros dois procedimentos incluem o reforçamento de comportamentos intermediários. No reforço imediato de comportamento intermediário, o reforço é liberado imediatamente depois de cada comportamento intermediário, sendo independente da ocorrência ou não do fazer, já que é emitido antes desse, mas dependente da ocorrência anterior da verbalização desejada. Não há reforço programado para o comportamento não-verbal alvo. Desse modo, a correspondência entre o dizer e os comportamentos intermediários é enfatizada. Em Paniagua e colaboradores (1982), o relato das crianças sobre o que iriam fazer (p. ex.: “vou pintar”) eram seguidos por alguns comportamentos intermediários p. ex.: pegar papel, pegar tintas, colocar o papel sobre a mesa), os quais eram imediatamente reforçados. O reforço iniciado por comportamentos intermediários é similar ao procedimento de reforço iniciado pelo dizer. Aqui, tokens são fornecidos após cada comportamento intermediário e imediatamente depois da emissão do último comportamento, podendo ser trocados. Nesse caso, diferentemente do reforçamento imediato de comportamento intermediário, descrito antes, são necessárias duas correspondências para a emissão do reforço: a primeira se dá entre o dizer e o comportamento intermediário, e a segunda, entre o dizer e o fazer, considerando a cadeia dizer-comportamento intermediário-fazer. Esse procedimento foi utilizado por Paniagua e Baer (1982). A efetividade dos procedimentos de reforço da correspondência fazer-dizer, reforço da correspondência dizer-fazer, reforço iniciado pelo dizer e reforço iniciado por comportamentos intermediários foi avaliada por Paniagua e Baer (1982). Os resultados indicaram que o 234 ABREU-RODRIGUES, RIBEIRO & COLS. reforço da correspondência dizer-fazer foi mais efetivo do que o reforço da correspondência fazer-dizer, e que o reforço iniciado pelo dizer e o reforço iniciado por comportamentos intermediários foram sempre superiores aos outros dois procedimentos, gerando maiores porcentagens de emissão dos comportamentos não-verbais-alvo. Em suma, a seqüência fazer-dizer permite apenas um procedimento, tanto na fase RV como na fase TC. A seqüência dizer-fazer, por sua vez, permite dois procedimentos na fase RV e quatro na fase TC, sendo muito mais flexível metodologicamente. Assim, conforme sugeriram Paniagua e Baer (1982), comparações entre essas seqüências devem levar em consideração as estratégias utilizadas na programação do reforço. No caso da cadeia dizer-fazer-dizer faltam mais pesquisas. Talvez essa cadeia possa ser interpretada como uma cadeia dizer-dizer, com o fazer sendo equivalente ao comportamento intermediário mencionado por Paniagua e Baer (1982). O reforçamento de comportamentos intermediários parece ser um recurso relevante para o estabelecimento de correspondência, uma vez considerado que dois dos procedimentos mencionados envolvem esse recurso. Esse aspecto é de especial interesse para os clínicos, considerando que, via de regra, o processo terapêutico visa à aquisição e à manutenção de comportamentos não-verbais-alvo (fazer), mas o terapeuta não tem contato direto com o ambiente natural do cliente, onde esses comportamentos são emitidos. Resta o contato com o dizer anterior e o posterior, em uma correspondência dizer-dizer. Particularidades e diferenças entre as fases RV e TC, no que se refere à aquisição, à generalização e à manutenção da correspondência e do comportamento não-verbal alvo serão tratadas a seguir. Aquisição, generalização e manutenção O TC é uma estratégia eficaz para aumentar a correspondência e, por conseqüência, a ocorrência do comportamento não-verbal alvo (p. ex.: Baer et al., 1988; Beckert, 2000; Deacon e Konarski, 1987; Guevremont et al., 1986a; Risley e Hart, 1968; Rogers-Warren e Baer, 1976). A aquisição da correspondência pode ser facilitada por algumas variáveis. Paniagua (1978) observou que a correspondência dizerfazer era estabelecida mais facilmente quando comportamentos intermediários eram reforçados (além da correspondência) do que quando apenas a correspondência era reforçada. Os papéis do feedback de correção do experimentador (p. ex.: Deacon e Konarski, 1987), do intervalo de tempo entre dizer e fazer, de viéses e preferências individuais também devem ser considerados (ver Lattal e Doepke, 2001). A literatura também indica que a fase RV não é efetiva para produzir correspondência e, conseqüentemente, fortalecer o comportamento não-verbal (Baer et al., 1984; Baer e Detrich, 1990; Karoly e Dirks, 1977). Entretanto os dados obtidos por Beckert (2000) indicam o contrário. Nesse estudo, o comportamento não-verbal alvo apresentou aumentos substanciais com a implementação da fase RV. A justificativa para essa divergência pode estar mais uma vez em algumas características metodológicas utilizadas em Beckert (2000), tais como o uso de apenas duas alternativas comportamentais, a possível história pré-experimental de reforçamento social da correspondência e a ausência de intervalo temporal entre a verbalização e a oportunidade de emissão do fazer, que ocorriam no mesmo ambiente experimental. Novas pesquisas são necessárias para um melhor entendimento do efeito dessas variáveis. A generalização e a manutenção são dois aspectos importantes na análise da aplicabilidade de qualquer procedimento. No que se refere ao TC, a generalização ocorre se, após o treino com alguns comportamentos, o “dizer” do participante controlar a emissão de comportamentos não-verbais que não foram diretamente treinados. A manutenção do fazer, por outro lado, será observada se o sujeito continuar a emitir o comportamento não-verbal mesmo depois do término do reforçamento contingente à correspondência (Baer et al., 1984), ou quando não houver oportunidade ANÁLISE DO COMPORTAMENTO para verbalização aberta (Karlan e Rusch, 1982). Já a manutenção da correspondência é observada em uma situação quando não existir reforçamento contingente à congruência entre dizer e fazer e, mesmo assim, ocorrer correspondência. Luciano, Herruzo e Barnes-Holmes (2001) encontraram transferência das funções de estímulo do dizer do contexto de treino para outros contextos, ou seja, a generalização da cadeia dizer-fazer com comportamento verbal simbólico (uso de um adesivo em uma folha de respostas), que também pode ser considerado comportamento verbal ou “dizer”. Os autores argumentaram que o sucesso na generalização da correspondência pode estar relacionado a algumas variáveis, tais como elementos comuns entre um ambiente e outro, presença ou não de experimentador e/ou prompt, ou da inclusão da fase RV. Estudos que avaliaram a manutenção indicaram ser possível manter correspondência apenas com reforçamento da verbalização (Baer et al., 1984; Paniagua e Black, 1990; Ward e Stare, 1990). Outros experimentos usaram com sucesso o reforço atrasado do dizer para programar a manutenção (p. ex.: Guevremont et al., 1986b; Whitman et al., 1982). A aplicação intermitente do TC, de forma a dificultar a discriminação da ocorrência (ou não) do reforço para a correspondência, também foi utilizada com sucesso na promoção da manutenção de correspondência (Baer et al., 1987; Karlan e Rusch, 1982). A manutenção do comportamento nãoverbal adquirido no TC, e não da correspondência, foi avaliada por Beckert (2000). Dos três tipos de TCs implementados, todos apresentaram uma diminuição na freqüência de emissão do fazer quando o dizer público não era mais requisitado. O comportamento dos participantes foi novamente avaliado de 4 a 7 dias depois. Os grupos fazer-dizer e dizer-fazer-dizer mantiveram a freqüência do comportamento-alvo anteriormente observada, enquanto o grupo dizer-fazer apresentou aumentos na freqüência do comportamento-alvo, a qual foi superior àquela emitida pelos demais grupos, apesar dos dias transcorridos. 235 QUESTÕES TEÓRICAS Mas como se dá a influência de uma classe de comportamentos sobre outra? Como o comportamento verbal de uma pessoa poderá influenciar a ocorrência de comportamentos não-verbais? Como o dizer interfere no fazer? Várias explicações a essas questões têm sido apresentadas. A psicologia do desenvolvimento e a psicologia cognitiva citam muito uma obra de Luria (1961), para quem o comportamento verbal de um indivíduo exerce funções regulatórias que se desenvolvem a partir de eventos cognitivos e neurológicos. Ou seja, Luria sugere que o comportamento verbal é parte dos processos mentais das crianças (e dos adultos) e que essa atividade mental pode controlar respostas motoras. A auto-regulação verbal foi utilizada, nos primeiros trabalhos da área, para explicar a correspondência (Israel, 1978; Israel e Brown, 1977; Israel e O”Leary, 1973). A análise skinneriana, por outro lado, lida com o comportamento verbal como um comportamento operante, em vez de atividade mental. O comportamento verbal controlando o comportamento não-verbal não é explicado por seu caráter verbal (qualquer comportamento pode gerar estímulos discriminativos que controlam qualquer outro comportamento), mas sim por contingências de reforçamento operando na correspondência entre o que as pessoas dizem sobre o que fazem e o que elas realmente fazem. Essas contingências podem facilmente operar na correspondência entre quaisquer tipos de comportamento, não sendo necessário que nenhum desses comportamentos seja verbal (ver Lattal e Doepke, 2001; Paniagua e Baer, 1988). Para alguns autores, a correspondência consiste em um exemplo de controle de estímulos (p. ex.: Guevremont et al., 1986a; Karlan e Rusch, 1982; Lattal e Doepke, 2001). Independentemente do tipo de cadeia treinada no TC, o reforço não é apresentado na ausência de correspondência. Correspondência, então, pode ser definida como um operante complexo em que elementos múltiplos devem ocorrer para que o comportamento seja reforçado (Lattal e Doepke, 2001). Assim sendo, tanto o 236 ABREU-RODRIGUES, RIBEIRO & COLS. TC dizer-fazer como o TC fazer-dizer permitem que o comportamento antecedente adquira funções discriminativas sobre o comportamento subseqüente. No entanto a avaliação empírica dessa sugestão esbarra ou em limitações metodológicas, como no controle do fazer por verbalizações encobertas, ou no fato de os procedimentos incluírem muitas possíveis variáveis de controle, como a utilização de prompts e de feedbacks do experimentador, ou do reforço contingente à correspondência, ou mesmo da interação entre duas ou mais dessas variáveis. A explicação por controle de estímulos é mais comumente encontrada em trabalhos que avaliaram a cadeia dizer-fazer. A função controladora do dizer, além de poder ser adquirida por meio de reforçamento diferencial, também pode ser adquirida a partir da transferência de funções observada entre membros de uma classe de equivalência (Hayes e Hayes, 1992; Sidman et al., 1989). Trabalhos empíricos têm demonstrado que quando novos estímulos entram em uma classe de equivalência, eles automaticamente adquirem as funções dos outros membros da classe que já estavam presentes (Gatch e Osborne, 1989; Hayes, Kohlenberg e Hayes, 1991; Kohlenberg, Hayes e Hayes, 1991). Dessa forma, estímulos verbais tornam-se equivalentes aos estímulos ou eventos não-verbais com os quais se relacionam e, assim, influenciam o comportamento posterior (Kohlenberg, Tsai e Dougher, 1993), facilitando a ocorrência de correspondência dizer-fazer. Um outro pano de fundo para o entendimento da correspondência é a proposta de análise funcional do comportamento verbal de Skinner (1957/1978), que distingue tipos diversos de operantes verbais com base nas relações existentes entre o comportamento e seus antecedentes e conseqüentes. Dentre os operantes verbais, dois são citados na literatura sobre correspondência – mando e tato –, enriquecendo a análise das relações de controle presentes na correspondência fazer-dizer (Ribeiro, 1989) e na correspondência dizer-fazer (Baer e Detrich, 1990). Nesse último estudo, por exemplo, prevaleceu a tese de que os comportamentos verbal e não-verbal poderiam es- tar sob o controle de contingências de reforçamento distintas: o dizer estaria sob o controle de contingências de reforçamento negativo (fuga), caracterizando um mando (talvez prevalecendo a regra “dizer o que o experimentador quer ouvir”, terminando uma possível contingência aversiva). O fazer, por sua vez, estaria sob o controle de contingências de reforçamento positivo que exigem correspondência entre o fazer e o dizer (contingência necessária para a liberação de reforço). Essa análise é consistente com as sugestões apresentadas por Ribeiro (1989). Os dois trabalhos complementam-se e fortalecem a proposta de que a relação entre dizer e fazer pode ser entendida em termos de tatos e de mandos. Outras explicações foram apresentadas, sugerindo que a correspondência seja tratada como uma cadeia de comportamentos que pode ser reforçada em qualquer ponto (ver Paniagua e Baer, 1982), como um caso de “dominância funcional” (ver Peréz, 2000) ou, ainda, como um exemplo de comportamento governado por regras (ver Catania et al., 1990; Deacon e Konarski, 1987; Ward e Stare, 1990), mais especificamente, como aquiescência (Zettle, 1990; ver Capítulo 12 para informações mais detalhadas sobre controle verbal). IMPLICAÇÕES PARA A APLICAÇÃO Talvez a principal contribuição das pesquisas na área de correspondência tenha sido a demonstração de que o fazer poderá ser mudado sem a necessidade de modificação direta das contingências que o mantém, sendo suficiente, em alguns casos, aplicar contingências de reforço ao dizer correspondente, em alguns momentos anterior e em outros posterior ao comportamento não-verbal alvo. É importante ressaltar que, apesar de o TC ser eficaz no aumento de determinados comportamentos não-verbais-alvo, ele é uma proposta para aumentar a correspondência, e não diretamente o fazer. Na maioria dos casos, o aumento do fazer-alvo é conseqüência do aumento da correspondência. Poucos arranjos de contingência possibilitam tanta flexibilidade de implementação ou ANÁLISE DO COMPORTAMENTO aplicabilidade como o TC, sobretudo na escolha do comportamento-alvo. Paniagua (1989) sugere que o TC pode ser empregado na prevenção e no tratamento da mentira em crianças, já que a metodologia envolvida é adequada ao processo natural de desenvolvimento da criança. O TC já foi usado em crianças para aumentar conversas familiares (Jewert e Clark, 1979), interações sociais (Rogers-Warren e Baer, 1976), uso de brinquedos predeterminados (Baer et al., 1984; 1988; Israel e Brown, 1977), seleção e consumo de alimentos nutritivos (Baer et al., 1987; Baer e Detrich, 1990), tarefas acadêmicas (Guevremont et al., 1986b; Merrett e Merrett, 1997) e comportamentos sociais, criativos e motores (Guevremont, Osnes e Stokes, 1988). O TC também se mostrou efetivo para controlar e prevenir comportamentos de hiperatividade (Paniagua e Black, 1990) e comportamentos de indisciplina em sala de aula (Anderson e Merrett, 1997) e para melhorar qualitativamente a escrita (Hopman e Glynn, 1989). Em termos de procedimento, há a possibilidade de o dizer ser emitido por meio do uso de estímulos visuais e da resposta de apontar. Whitman e colaboradores (1982) utilizaram pistas visuais (fotografias) para melhorar a postura corporal em adultos não-verbais com retardo, treinando a seqüência “apontarfazer” (conceitualmente ainda dizer-fazer). Baer e colaboradores (1987), Luciano e colaboradores (2001) e Ribeiro (1989) utilizaram pistas visuais e obtiveram bons resultados no aumento de comportamentos-alvo. O público-alvo também é abrangente, com possibilidade do uso de TC tanto com crianças sem problemas de desenvolvimento como com crianças com necessidades especiais envolvendo déficits verbais, retardos graves, mutismo seletivo, pacientes psiquiátricos ou portadores de transtornos de desenvolvimento (para detalhes ver Karlan e Rusch, 1982; Paniagua, 1982; 1989; Rogers-Warren e Baer, 1976; Tracey, Briddell e Wilson, 1974). Finalmente, o TC é uma estratégia bastante simples de ser implementada por pais e professores, apresentando a grande vantagem de ser uma intervenção não-punitiva. 237 Correspondência e terapia A interação verbal entre o terapeuta e o cliente é um fator crítico para a mudança terapêutica (de Rose, 1997; Ferster, 1972; 1979; Glenn, 1983; Hamilton, 1988; Rosenfarb, 1992). Deve-se ter o cuidado de se lembrar sempre de que a verbalização do cliente durante a sessão, na interação direta com o terapeuta, pode estar sob controle de outras variáveis que não sejam o comportamento nãoverbal fora do consultório. Apenas o reforçamento da verbalização específica do cliente, antes da oportunidade de emissão do comportamento não-verbal, não aumenta necessariamente a freqüência deste último comportamento. Muitas vezes, essa verbalização consiste em uma resposta de fuga de uma situação constrangedora, como revelar uma dificuldade que impeça a emissão do comportamento adequado. Então, nessa situação, o cliente diz “o que o terapeuta gostaria de ouvir”, recebendo o reforço social desejado (Ferster, 1972; 1979; Glenn, 1983; Hamilton, 1988; Kohlenberg e Tsai, 1991; Rosenfarb, 1992). Essa análise é consistente com dados apresentados que apontam a fase RV como pouco eficaz no aumento de correspondência. Assim, cabe ao terapeuta assumir o desafio de criar contingências de reforçamento que estabeleçam e que mantenham a correspondência (Beckert, 2001). Ferster (1979, p. 30) ressaltou esse papel do terapeuta, afirmando que a correspondência entre comportamento verbal e eventos externos “pode ser alvo de uma análise comportamental, sendo esta uma das incumbências mais importantes da terapia”. Outros trabalhos também ofereceram análises de como o reforçamento da correspondência pode afetar a vida do cliente fora do contexto clínico (Ferster, 1972; Hamilton, 1988; Hübner, 1999; Kohlenberg et al., 1993; Wilson e Blackledge, 2000). O TC parece ser importante para a aquisição de dois repertórios fundamentais para qualquer cliente: autoconhecimento e autocontrole. Apesar da grande complexidade e heterogeneidade das demandas apresentadas em consultório, a maioria dos casos clínicos requer o investimento no treino de auto-observação, o que pode oferecer melhores con- 238 ABREU-RODRIGUES, RIBEIRO & COLS. dições para o autoconhecimento, o que facilitaria a aquisição de autocontrole (Beckert, 2002a; ver Capítulo 10 para informações detalhadas sobre autocontrole). Em linguagem analítico-comportamental, se o cliente é capaz de dizer o que faz ou o que fez, identificando e descrevendo as variáveis das quais seu comportamento é função, estará apresentando autoconhecimento (Tourinho, 1995) – “fiz X e sei por que fiz X”. O treino da cadeia fazer-dizer é um treino de auto-tato e, como tal, poderá servir de instrumento para o estabelecimento de verbalizações mais fidedignas sobre o comportamento e suas variáveis de controle (isto é, autoconhecimento). O treinamento fazer-dizer também poderá ser útil na situação de supervisão clínica. Ao se estabelecer como audiência não-punitiva, o supervisor poderá prevenir a ocorrência de verbalizações do supervisionando cuja função seja muito mais a fuga ou a esquiva da resposta aversiva do supervisor do que o tatear sobre o que ocorreu na sessão de atendimento. Essa alternativa é válida para minimizar o risco da modelagem de discriminações errôneas, um trabalho análogo ao TC fazer-dizer do cliente (Beckert, 2002b). Já a aquisição de autocontrole encontra no treino da correspondência dizer-fazer um possível recurso (Abreu-Rodrigues e Beckert, no prelo). Esse TC poderá ser implementado com a expectativa de que o dizer anterior possa exercer um controle discriminativo sobre o fazer, facilitando a emissão deste. À medida que o cliente diz que vai fazer, estabelece contingências que tornarão o fazer desejado mais provável de acontecer e, assim, faz o que disse que iria fazer, apresentando autocontrole. Um homem que faz o que prometeu será provavelmente visto pela comunidade verbal como tendo controle sobre a própria vida. A proposta também se coaduna com a definição skinneriana de autocontrole, já que dizer e fazer são respostas emitidas pelo próprio cliente – a que controla e a que é controlada, respectivamente –, sendo que aquela (dizer) poderá afetar variáveis ambientais de forma a alterar a probabilidade desta (fazer). Ou seja, quando o próprio cliente diz o que vai fazer, ele estará “autogerenciando” as contingências que man- têm o comportamento. Dessa forma, o autoconhecimento relaciona-se à seqüência fazer-dizer, e o autocontrole à seqüência dizer-fazer (Beckert, 2002b). O TC também tem sido utilizado como recurso terapêutico auxiliar no tratamento da drogadição e na aquisição do comportamento de leitura. No primeiro caso, a implementação de um comportamento-alvo concorrente e incompatível com o consumo de Cannabis sativa (maconha) foi feita com auxílio do TC. Neste caso, o cliente escolheu a corrida de longa duração como o fazer-alvo (ver Beckert, 2001, para detalhes). No segundo caso, uma cliente focalizou a aquisição de uma rotina de leitura e de estudo como comportamento não-verbalalvo e, com o auxílio do TC, esse padrão comportamental foi fortalecido (ver AbreuRodrigues e Beckert, no prelo, para detalhes). Em ambos os casos, a cadeia dizer-fazer-dizer foi treinada nos moldes sugeridos por Beckert (2002a). A seguir, será apresentado um caso clínico que ilustra o procedimento de TC na terapia. Caso clínico O caso aqui apresentado assemelha-se, em alguns aspectos, ao de Ana (descrito em Abreu-Rodrigues e Beckert, no prelo). Bob (nome fictício), 27 anos, funcionário público, formado em administração, desejava aumentar suas horas de estudo a fim de ter melhores condições de aprovação em concursos públicos. O cliente relatou muitas dificuldades em estudar e ausência quase total do repertório de leitura. Cumpre mencionar que Bob recebeu de Ana a indicação do terapeuta e já chegou ao consultório com a expectativa de uma intervenção focal. Aqui serão apresentados os dados colhidos em 25 semanas de terapia em que o TC dizer-fazer-dizer foi implementado, ressaltando que o objetivo da terapia não se restringia apenas a aumentar a freqüência do comportamento de estudar (apesar da solicitação inicial do cliente). Aspectos como assertividade (sobretudo na relação com amigos e familiares), planejamento de metas e auto-estima – havia um forte histórico de punição – ANÁLISE DO COMPORTAMENTO também foram trabalhados no decorrer do tratamento. “Estudar” foi definido operacionalmente como leitura, síntese e/ou elaboração de fichas do material escolhido previamente. A intervenção objetivava uma melhora tanto quantitativa quanto qualitativa desse comportamento. A implementação do TC dizer-fazer-dizer foi realizada conforme a descrição a seguir. Bob estabelecia na sessão de terapia (que sempre ocorria às segundas-feiras) a meta da semana e a registrava em uma folha de controle (“esta semana estudarei pelo menos X horas”). A linha de base mostrou que Bob estudava entre 4 e 5 h semanais. Portanto, sua primeira meta semanal ficou em 4 h. A meta foi sendo aumentada gradativamente, sempre pelo próprio cliente. A cada dia, ele deveria escolher o material a ser trabalhado, registrando o tempo que ficava envolvido nessa atividade. O cronômetro era parado em cada interrupção ou intervalo. Na sessão seguinte, Bob relatava como havia sido seu desempenho na semana anterior, e uma nova meta era estabelecida (ver Figura 13.1). Ou seja, Bob verbalizava para o terapeuta o tempo de estudo total que ele atingiria na semana que se iniciava (dizer anterior ao fazer), registrava diariamente seu tempo de estudo, calculava o tempo total da semana e, na sessão seguinte, verbalizava a quantidade de tempo que, de fato, havia estudado (dizer posterior ao fazer, estabelecendo uma cadeia dizer-fazer-dizer, em caso de correspondência). Nenhuma punição foi programada, tendo o terapeuta implementado apenas reforçamento positivo para a corres- 239 pondência. É importante ressaltar que no procedimento padrão de TC, o objetivo é colocar o fazer sob controle do dizer, sendo a correspondência atingida quando ambos forem semelhantes. No caso em questão, o fazer superior ao verbalizado anteriormente não foi considerado como falta de correspondência, já que a meta era estabelecida em termos de “pelo menos tantas horas”. Isso foi feito porque, para o cliente, estudar a mais não era um problema ou algo indesejável. A questão da fidedignidade do relato verbal é uma das limitações para o uso do TC para fins clínicos. Sem acesso ao fazer que ocorre no ambiente natural do cliente (a não ser pelo relato do cliente), há o risco de o terapeuta estar, inadvertidamente, reforçando apenas a cadeia dizer-dizer. O uso concomitante de outras intervenções terapêuticas dá mais condições de o terapeuta assegurar-se da ocorrência ou não da correspondência. Registros de emissão do comportamento não-verbal no ambiente natural permitem a confrontação com o relato do cliente. Esses registros podem ser feitos pelo próprio cliente ou até por terceiros, aumentando ainda mais o controle. A escolha de um co-terapeuta também é uma prática interessante, principalmente no atendimento de crianças e adolescentes. Enfim, a associação de quaisquer correlatos públicos com o treino de correspondência aumenta a eficácia do tratamento (Beckert, 2001). A análise visual da Figura 13.1 revela uma tendência crescente no estabelecimento das metas, passando de 4 para 20 h semanais no decorrer das 25 semanas de treino. Na sexta, FIGURA 13.1 Tempo programado (meta) e tempo de estudo obtido em cada semana de terapia. 240 ABREU-RODRIGUES, RIBEIRO & COLS. sétima e oitava semanas, as metas não foram cumpridas, o que alertava para o risco de o procedimento tornar-se aversivo. Como o cliente poderia determinar a distribuição de suas horas de estudo semanais, houve, na oitava semana, 5 min de estudo em um dia e mais de 3 h em outro, sem que a meta fosse atingida. Uma estratégia auxiliar foi adicionada a partir da nona semana: Bob iria previamente estabelecer, além da meta semanal, também a diária. A meta diária era definida também na segunda-feira, tendo por objetivo auxiliá-lo na distribuição da meta semanal no decorrer dos dias daquela semana, sem que isso acarretasse uma maior sobrecarga em um determinado dia. Nem sempre havia um acréscimo no tempo estipulado. Algumas vezes, a meta de uma semana era repetida na seguinte, principalmente quando a meta semanal passada não havia sido cumprida. Isso ocorreu cinco vezes (semana 12, 14, 16, 18 e 19). O tempo total dedicado aos estudos acompanhou a tendência crescente das metas, chegando ao máximo de 21,5 h na semana 23. Férias de duas semanas entre a semana 19 e 20 interferiram nos resultados e fizeram com que a meta da semana 21 fosse mais baixa. Das 25 semanas avaliadas, Bob apresentou correspondência dizer-fazer-dizer em 15 semanas (60% dos casos): 12 semanas com rendimento superior ao estabelecido pela meta e três semanas com desempenho similar à meta. Nas primeiras quatro semanas foi avaliado apenas o aspecto quantitativo do comportamento-alvo em termos de horas estudadas. FIGURA 13.2 Auto-avaliação de produtividade. A avaliação, até aquele momento, feita pelo próprio cliente, foi satisfatória. A partir da quinta semana, foi introduzida uma avaliação qualitativa. Bob deveria, no final de cada dia de estudo, avaliar sua produtividade, considerando o material escolhido para leitura e o número de horas estudadas, em uma escala de 0 a 10. A Figura 13.2 apresenta a média semanal dessa auto-avaliação qualitativa de produtividade. Bob optou por atribuir o valor 10 àquela situação em que o rendimento tivesse ultrapassado sua expectativa. Assim, o esperado (por ele) seria apresentar uma produtividade entre os valores 6 e 8. Com um valor mínimo de 4 (semana 7) e máximo de 10 (semana 21), sua produtividade média nas 20 semanas foi de 7.09, considerada “realista e fidedigna” pelo cliente. Ressalte-se também que a própria avaliação de produtividade apresentou um padrão crescente da semana 5 à 12, mantendo-se estável em seguida, na faixa entre 7 e 8. O leitor poderá questionar a porcentagem média de correspondência de “apenas” 60% nessas 25 semanas (15 semanas com total de horas de estudo igual ou superior às metas préestabelecidas). Vale lembrar que o contexto provê justificativas para a aceitação desse valor como um indicativo de sucesso. O contexto inclui as contingências passadas e as presentes na vida do cliente, que irão definir se determinado comportamento representa progresso ou não. No caso de Bob, considerando a falta de repertório de leitura e os seus efeitos (“Não consigo sentar e ler... acho que nunca vou conseguir isso!”), os resultados ilustrados ANÁLISE DO COMPORTAMENTO nas Figuras 13.1 e 13.2 representam grandes conquistas para ele. Bob nunca teve uma rotina de estudo e, quando tentava estabelecê-la, ou se frustrava, ou não obtinha um rendimento satisfatório. Com a mudança comportamental (“peguei a ‘manha’ de estudar”, “ninguém acredita quando vê como eu estou estudando” ou “é incrível, mas eu estou começando a gostar desse negócio”), o terapeuta pode trabalhar várias outras áreas também ligadas à aquisição de respostas mais adaptativas e funcionais. A introdução da análise quantitativa e qualitativa foi considerada válida por dois motivos: os dados revelavam um aumento na média semanal de horas de estudo e a análise da produtividade em termos de valores absolutos e inferidos pelo próprio cliente pôde ser considerada como um treino fazer-dizer, o que serviu como implementação dos comportamentos de auto-observação, autodiscriminação (quando foi mais ou menos produtivo) e de autodescrição (já que tinha que relatar posteriormente), favorecendo a aquisição de autoconhecimento. Pode-se também dizer que o cliente passou a demonstrar maior autocontrole à medida que passou a cumprir as metas predefinidas, em uma cadeia dizer-fazer. A fidedignidade do relato do cliente na sessão é o maior problema para o uso do TC como instrumento terapêutico. Afinal, o terapeuta não está em contato direto com o ambiente natural em que o comportamento nãoverbal é emitido. Uma alternativa possível que pode amenizar o risco de verbalizações não-correspondentes é o uso de algumas estratégias auxiliares a fim de aumentar o controle sobre esses relatos (isto é, uso de correlatos públicos, utilização de co-terapeutas, registro de comportamentos públicos feito por terceiros). CONCLUSÃO Muitas variáveis ainda precisam ser melhor compreendidas nessa área, o que levanta a possibilidade (e a necessidade!) de pesquisas futuras. Alguns trabalhos preocuparam-se com o estudo de outras possíveis cadeias além da dizer-fazer e fazer-dizer. Isso será sempre 241 bem-vindo porque possibilitará uma melhor compreensão do papel funcional de cada elo da cadeia. Investigações adicionais da cadeia dizer-fazer-dizer, por exemplo, deveriam ser realizadas tendo em vista seu potencial como instrumento terapêutico. O contexto educacional é um ambiente bastante rico para a aplicação e, portanto, também há de ser estudada a possibilidade do uso do TC nesse ambiente. Lattal e Doepke (2001) ofereceram um exemplo de como é possível a ampliação dos recursos metodológicos na análise da cadeia dizer-fazer com pombos. Esses autores ressaltaram a viabilidade e a importância da pesquisa básica nessa área, recorrendo àquela que talvez seja a variável metodológica mais polêmica: o uso de sujeitos não-humanos no experimento. Com dados análogos àqueles apresentados nas pesquisas com humanos (superioridade do TC dizer-fazer), esse tipo de avaliação abre espaço para uma expansão nas possibilidades metodológicas. Nas considerações anteriormente feitas sobre a área de correspondência, destacam-se os seguintes aspectos: • A pesquisa empírica fornece subsídios indispensáveis para uma melhor compreensão do fenômeno. • Apesar de serem classes comportamentais distintas, dizer e fazer podem apresentar relação de influência mútua. • Dizer e fazer já são, por si só, comportamentos complexos. A correspondência, portanto, compreende dois universos multideterminados. Sua investigação não poderá furtar-se à premissa científica de tentar isolar variáveis relevantes e analisá-las isoladamente ou em interação com outras variáveis. O exercício de síntese dessas conclusões sempre será o desafio do estudioso. • O TC é uma estratégia eficaz na aquisição de correspondência e pode servir como instrumento para a aquisição de comportamentos não-verbaisalvo. • A área aplicada encontra no TC uma importante tecnologia para aquisição 242 ABREU-RODRIGUES, RIBEIRO & COLS. de comportamentos desejáveis. Cumpre ressaltar a grande plasticidade na programação do TC: diversas posições do “elo verbal” na cadeia treinada, reforço ou não de comportamentos intermediários, táticas diversas para facilitar a manutenção, recursos múltiplos para fortalecer o controle generalizado do dizer. Essa flexibilidade metodológica é de muita importância no contexto educacional e clínico, no qual profissionais (ou pais) poderão inovar e criar contingências que facilitem a emissão de um determinado comportamento desejado. • A relação custo-benefício é compensadora porque o profissional (ou pai) não precisa estar presente na ocasião para emissão do fazer-alvo. • O TC não é uma terapia, apesar de ser um recurso comprovadamente eficaz. Outras estratégias poderão ser acrescentadas à intervenção, como foi ilustrado no caso apresentado. A flexibilidade e a permeabilidade a essas adaptações são, talvez, a grande vantagem para seu uso na clínica, não somente para promover mudanças comportamentais no repertório do cliente, mas também para facilitar o treinamento e a supervisão de futuros terapeutas. REFERÊNCIAS BIBLIOGRÁFICAS Abreu-Rodrigues, J.; Beckert, M. E. (no prelo). Autocontrole: Pesquisa e aplicação. Em C. N. de Abreu e H. J. Guilhardi (Orgs.), Manual prático de técnicas em psicoterapia comportamental, cognitiva e construtivista. São Paulo: Roca. Anderson, V.; Merrett, F. (1997). The use of correspondence training in improving the in-class behavior of very troublesome secondary school children. Educational Psychology, 17, 313-328. Baer, R. A.; Blount, R. L.; Detrich, R.; Stokes, T. F. (1987). Using intermittent reinforcement to program maintenance of verbal-nonverbal correspondence. Journal of Applied Behavior Analysis, 20, 179-184. Baer, R. A.; Detrich, R. (1990). Tacting and manding in correspondence training: Effects of child selection of verbalization. Journal of the Experimental Analysis of Behavior, 54, 23-30. Baer, R. A.; Detrich, R.; Weninger, J. M. (1988). On the functional role of the verbalization in correspondence training procedures. Journal of Applied Behavior Analysis, 21, 345-356. Baer, R. A.; Willians, J. A.; Osnes, P. G.; Stokes, T. F. (1984). Delayed reinforcement as an indiscriminable contingency in verbal-nonverbal correspondence training. Journal of Applied Behavior Analysis, 17, 429-440. Beckert, M. E. (2000). Reforço de verbalização e treino de correspondência: Efeitos sobre o comportamento de autocontrole. Dissertação de mestrado não publicada, Universidade de Brasília, Brasília, DF. Beckert, M. E. (2001). A partir da queixa inicial, o que fazer? Correspondência verbal/não-verbal: Um desafio para o terapeuta. Em H. J. Guilhardi, M. B. B. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 7. Expondo a variabilidade (p. 217226). Santo André: ESETec. Beckert, M. E. (2002a). Correspondência: Quando o objetivo terapêutico é o “digo o que faço e faço o que digo”. Em H. J. Guilhardi, M. B. B. Madi, P. P. Queiroz; M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 9. Contribuições para a construção da teoria do comportamento (p. 183-194). Santo André: ESETec. Beckert, M. E. (2002b). Relação supervisor-supervisionando e a formação do terapeuta: Contribuições da psicoterapia analítica funcional (FAP). Em H. J. Guilhardi, M. B. B. Madi, P. P. Queiroz; M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 10. Contribuições para a construção da teoria do comportamento (p. 245-256). Santo André: ESETec. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (D. G. Souza et al.; trads.). Porto Alegre: Artes Médicas (Obra publicada originalmente em 1998). Catania, A. C.; Matthews, B. A.; Shimoff, E. (1982). Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior, 38, 233-248. Catania, A. C.; Matthews, B. A.; Shimoff, E. (1990). Properties of rule-governed behavior and their implications. Em D. E. Blackman e H. Lejeune (Orgs.), Behaviour analysis in theory and practice: Contributions and controversies (p. 215-230). London: LEA Publishers. Deacon, J. R.; Konarski, E. A. (1987). Correspondence training: An example of rule-governed behavior? Journal of Applied Behavior Analysis, 20, 391-400. de Rose, J. C. C. (1997). O relato verbal segundo a perspectiva da análise do comportamento: Contribuições conceituais e experimentais. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol 1. Aspectos teóricos, metodológicos e de formação em análise comportamental e terapia cognitivista (p. 148-163). São Paulo: Arbytes. Ferster, C. B. (1972). An experimental analysis of clinical phenomena. The Psychological Record, 22, 1-16. Ferster, C. B. (1979). A laboratory model of psychotherapy: The boundary between clinical practice and experimental psychology. Em P. Sjöden, S. Bates e W. S. Dockens (Orgs.), Trends in behavior therapy (p. 23-38). New York: Academic Press. ANÁLISE DO COMPORTAMENTO Gatch, M. B.; Osborne, J. G. (1989). Transfer of contextual stimulus functions via equivalence class development. Journal of the Experimental Analysis of Behavior, 51, 369-378. Glenn, S. (1983). Maladaptive functional relations in client verbal behavior. The Behavior Analyst, 6, 47-56. Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1986a). Preparation for effective self-regulation: The development of generalized verbal control. Journal of Applied Behavior Analysis, 19, 99-104. Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1986b). Programming maintenance after correspondence training with children. Journal of Applied Behavior Analysis, 19, 215-219. Guevremont, D. C.; Osnes, P. G.; Stokes, T. F. (1988). The functional role of preschooler’s verbalizations in the generalization of self-instructional training. Journal of Applied Behavior Analysis, 21, 45-55. Hamilton, S. A. (1988). Behavioral formulations of verbal behavior in psychotherapy. Clinical Psychology Review, 8, 181-193. Hayes, S. C.; Hayes, L. J. (1992). Verbal relations and the evolution of behavior analysis. American Psychologist, 47, 1383-1395. Hayes, S. C.; Kohlenberg, B. K.; Hayes, L. J. (1991). Transfer of consequential functions through simple and conditional equivalence classes. Journal of the Experimental Analysis of Behavior, 56, 119-137. Hopman, N.; Glynn, T. (1989). The effect of correspondence training on the rate of written expression of four low-achieving boys. Educational Psychology, 9, 197-213. Hübner, M. M. C. (1999). Conceituação do comportamento verbal e seu papel na terapia. Em R. A. Banaco (Org.), Sobre comportamento e cognição: Vol. 1. Aspectos teóricos, metodológicos e de formação em análise do comportamento e terapia cognitivista (p. 277-281). São Paulo: Arbytes. Israel, A. C. (1973). Developing correspondence between verbal and nonverbal behavior: Switching sequences. Psychological Reports, 32, 1111-1117. Israel, A. C. (1978). Some thoughts on correspondence between saying and doing. Journal of Applied Behavior Analysis, 11, 271-276. Israel, A. C.; Brown, M. S. (1977). Correspondence training, prior verbal training, and control of nonverbal behavior via control of verbal behavior. Journal of Applied Behavior Analysis, 10, 333-338. Israel, A. C.; O”Leary, K. D. (1973). Developing correspondence between children”s words and deeds. Child Development, 44, 575-581. Jewert, J.; Clark, H. B. (1979). Teaching preschoolers to use appropriate dinner time conversation: An analysis of generalization from school to home. Behavior Therapy, 10, 589-605. Karlan, G. R.; Rusch, F. R. (1982). Correspondence between saying and doing: Some thoughts on defining correspondence and future directions for application. Journal of Applied Behavior Analysis, 15, 151-162. 243 Karoly, P.; Dirks, M. J. (1977). Developing self-control in preschool children through correspondence training. Behavior Therapy, 8, 398-405. Kohlenberg, B. S.; Hayes, S. C.; Hayes, L. J. (1991). The transfer of contextual control over equivalence classes through equivalence classes: A possible model of social stereotyping. Journal of the Experimental Analysis of Behavior, 56, 505-518. Kohlenberg, R. J.; Tsai, M. (1991). Functional analytic psychotherapy: Creating intense and curative therapeutic relationship. New York: Plenum Press. Kohlenberg, R. J.; Tsai, M.; Dougher, M. J. (1993). The dimensions of clinical behavior analysis. The Behavior Analyst, 16, 271-282. Lattal, K. A.; Doepke, K. J. (2001). Correspondence as conditional stimulus control: Insights from experiments with pigeons. Journal of Applied Behavior Analysis, 34, 127-144. Lloyd, K. E. (1994). Do as I say, not as I do. The Behavior Analyst, 17, 131-144. Luciano, M. C.; Herruzo, J.; Barnes-Holmes, D. (2001). Generalization of say-do correspondence. The Psychological Record, 51, 111-130. Luria, A. R. (1961). The role of speech in the regulation of normal and abnormal behavior. New York: Liveright. Merrett, J.; Merrett, F. (1997). Correspondence training as a means of improving study skills. Educational Psychology, 17, 469-482. Paniagua, F. A. (1978). Efectos de las conductas intermedias sobre la correspondencia entre conducta verbal y no verbal. Em P. Speller (Ed.), Análisis de la conducta (p. 303-321). México: Trillas. Paniagua, F. A. (1989). Lying by children: Why children say one thing, do another? Psychological Reports, 64, 971-984. Paniagua, F. A. (1990). A procedural analysis of correspondence training techniques. The Behavior Analyst, 13, 107-119. Paniagua, F. A.; Baer, D. M. (1982). The analysis of correspondence training as a chain reinforceable at any point. Child Development, 53, 786-798. Paniagua, F. A.; Baer, D. M. (1988). Luria’s regulatory concept and its misplacement in verbal-nonverbal correspondence training. Psychological Reports, 62, 371378. Paniagua, F. A.; Black, S. A. (1990). Management and prevention of hyperactivity and conduct disorders in 810 year old boys through correspondence training procedures. Child e Family Behavior Therapy, 12, 23-56. Paniagua, F. A.; Stella, M. S.; Holt, W. J.; Baer, D. M.; Etzel, B. C. (1982). Training correspondence by reinforcing intermediate and verbal behavior. Child e Family Behavior Therapy, 4, 127-139. Peréz, M. E. R. (2000). Efecto del entrenamiento de la correspondencia decir-hacer, decir-describir y hacerdescribir sobre la adquisición, generalidad y mantenimiento de una tarea de discriminación condicional en humanos. Acta Comportamentalia, 8, 41-75. 244 ABREU-RODRIGUES, RIBEIRO & COLS. Rachlin, H.(1970). Modern behaviorism. San Francisco: Freeman. Ribeiro, A. F. (1989). Correspondence in children’s selfreport: Tacting and manding aspects. Journal of the Experimental Analysis of Behavior, 51, 361-367. Risley, T. R.; Hart, B. (1968). Developing correspondence between nonverbal and verbal behavior of preschool children. Journal of Applied Behavior Analysis, 11, 267-281. Rogers-Warren, A.; Baer, D. M. (1976). Correspondence between saying and doing: Teaching children to share and praise. Journal of Applied Behavior Analysis, 9, 335354. Rosenfarb, I. S. (1992). A behavior analytic interpretation of the therapeutic relationship. The Psychological Record, 42, 341-354. Sidman, M.; Wynne, C. K.; Maguire, R.; Barnes, T. (1989). Functional classes and equivalence relations. Journal of the Experimental Analysis of Behavior, 52, 261-274. Skinner, B. F. (1978). O comportamento verbal (M. P. Villalobos, trad.). São Paulo: Cultrix (Obra publicada originalmente em 1957). Tourinho, E. Z. (1995). O autoconhecimento na psicologia comportamental de B. F. Skinner. Belém, PA: Editora Universitária UFPA. Tracey, D. A.; Briddell, D. W.; Wilson, G. T. (1974). Generalization of verbal conditioning to verbal and nonverbal behavior: Group therapy with chronic psychiatric patients. Journal of Applied Behavior Analysis, 7, 391-402. Ward, W. D.; Stare, S. (1990). The role of subject verbalization in generalized correspondence. Journal of Applied Behavior Analysis, 23, 129-136. Whitman, J. A.; Scibak, J. W.; Butler, K. M.; Richter, R.; Johnson, M. R. (1982). Improving classroom behavior in mentally retarded children through correspondence training. Journal of Applied Behavior Analysis, 15, 545564. Wilson, K. G.; Blackledge, J. T. (2000). Recent developments in the behavioral analysis of language: Making sense of clinical phenomena. Em M. J. Dougher (Ed.), Clinical Behavior Analysis (p. 27-46). Reno, NV: Context Press. Zettle, R. D. (1990). Rule-governed behavior: A radical answer to the cognitive challenge. The Psychological Record, 40, 41-49. ANÁLISE DO COMPORTAMENTO EQUIVALÊNCIA DE ESTÍMULOS: CONCEITO, IMPLICAÇÕES E POSSIBILIDADES DE APLICAÇÃO 245 14 ALESSANDRA ROCHA DE ALBUQUERQUE RAQUEL MARIA DE MELO O conceito de equivalência de estímulos tem sido tratado na literatura como um tema de fundamental relevância, visto que instrumentaliza a análise do comportamento a lidar, de forma objetiva e sistemática, com repertórios comportamentais novos, complexos, que envolvem comportamentos simbólicos. O objetivo deste capítulo é definir e caracterizar a equivalência de estímulos, levantando algumas questões controvertidas sobre o tema, destacando os principais resultados apresentados pelas inúmeras pesquisas básicas sobre o mesmo, bem como a possibilidade de aplicação desses resultados nos contextos escolar e clínico. DEFININDO A EQUIVALÊNCIA DE ESTÍMULOS Pode-se afirmar que estímulos são equivalentes quando se tornam intercambiáveis, substituíveis uns pelos outros no controle do comportamento, ou seja, quando as funções adquiridas por um estímulo, no controle de um comportamento operante, são transferidas para outro estímulo. Dito de outro modo, para se falar de equivalência de estímulos, um comportamento operante comum deve ser controlado por estímulos diferentes. Essa definição de equivalência assemelha esse processo ao de generalização de estímulos. No entanto ambos são distintos na medida em que, na generalização, classes de estímulos que apresentam similaridade física entre si controlam um comportamento comum como, por exemplo, denominar de azul diferentes matizes dessa cor. Em equivalência de estímulos, os estímulos que compõem uma classe que controla um comportamento comum apresentam relações arbitrárias entre si, como, por exemplo, não fumar diante da frase “Proibido Fumar”, da imagem de um cigarro cortado por um “x” ou mesmo em um ambiente sem ventilação externa (sobre generalização de estímulos, ver Capítulo 8). As pesquisas sobre equivalência de estímulos (p. ex.: Fields et al., 1991; Jonson e Sidman, 1993; Sidman e Cresson, 1973), em geral, envolvem duas etapas fundamentais. Inicialmente, as discriminações condicionais entre estímulos são treinadas com o uso do procedimento de escolha de acordo com o modelo (do inglês matching to sample) e, posteriormente, avalia-se a emergência de novas relações condicionais, sem treino direto, envolvendo os mesmos estímulos. No procedimento de escolha de acordo com o modelo um estímulo, denominado estímulo modelo ou estímulo condicional, é apresentado juntamente com outros estímulos, denominados estímulos de escolha, estímulos discriminativos ou estímulos de comparação. Dado A1 como modelo e B1 e B2 como escolhas, a escolha de B1 e não de B2 será considerada correta. Do mesmo modo, dados A2 como modelo e B1 e B2 como escolhas, somente a escolha de B2 será considerada correta. 246 ABREU-RODRIGUES, RIBEIRO & COLS. Deve-se destacar que no procedimento de escolha de acordo com o modelo, que estabelece discriminações condicionais, contingências de quatro termos estão em vigor. Estas diferenciam-se das contingências de três termos, presentes em situações de discriminação simples, na medida em que um quarto elemento (o estímulo-modelo) estabelece qual contingência de três termos está funcionando. Por exemplo, tomando-se uma tarefa, comumente atribuída a crianças em fase escolar, de ligar conjuntos com diferentes quantidades de elementos a um número (Figura 14.1), a escolha do conjunto com dois elementos (estímulo de escolha) na presença do número 2 (estímulomodelo) seria considerada correta, e a escolha de conjuntos com um ou três elementos, diante do número 2, incorretas. Do mesmo modo, a escolha do conjunto com um elemento diante do número 1 e a escolha do conjunto com três elementos diante do número 3 seriam consideradas corretas. Deste modo, uma contingência de três termos – Conjunto com x elementos (estímulo de escolha): Escolha de um conjunto (resposta) → Reforço social (conseqüência) – está sob controle de um quarto elemento, o algarismo numérico (estímulo-modelo). Ou seja, o número apresentado como modelo determina qual de três contingências de três termos está em vigor, e a escolha do conjunto com um, dois ou três elementos poderá ser correta ou incorreta, dependendo do número apresentado como modelo. Essa situação, portanto, exemplifica uma contingência de 4 termos (estímulo-modelo: estímulo de escolha – resposta → conseqüência), que caracteriza situações de discriminação condicional em geral. A Figura 14.2 sistematiza, com base no exemplo apresentado na Figura 14.1, as três contingências de três termos possíveis nesta situação e a relação de condicionalidade de cada uma delas com os estímulos numéricos A1, A2 e A3. As contingências tríplices em negrito são as que produziriam o reforço na presença de cada um dos estímulos-modelo apresentados. O uso do termo equivalência de estímulos, na análise do comportamento, foi inicialmente proposto por Sidman (1971) e, posteriormente, redefinido por Sidman e Tailby (1982) que, ao utilizá-lo, apropriaram-se do termo como definido pela matemática, estabelecendo que estímulos podem ser considerados equivalentes quando apresentam três tipos de relações emergentes entre si: relações de reflexividade, simetria e transitividade. A reflexividade consiste em uma relação de identidade entre estímulos e pode ser exemplificada pela emergência das relações AA,1 BB e CC a partir do treino das discriminações condicionais AB e AC. Considerando estes treinos (AB e AC), a propriedade de simetria é exemplificada pela emergência de relações reversíveis entre os estímulos modelo-escolha; neste caso, as relações BA e CA são simétricas às relações AB e AC treinadas. Finalmente, a transitividade seria exemplificada pela emergência das relações BC e CB dado o treino AB e AC; ou seja, a emergência de relações entre estímulos que não foram diretamente relacionados um ao outro, mas que foram relacionados a um terceiro estímulo comum, caracterizam a transitividade. Dado que a relação transitiva CB consiste na reversão da relação transitiva BC e vice-versa, testes que avaliam a emergência destas relações são denominados de testes combinados de transitividade e simetria ou testes de equivalência. Para exemplificar as propriedades que caracterizam a equivalência de estímulos, a Figura 14.3 apresenta uma situação esquemática que representa dois treinos de escolha de acordo com o modelo e a emergência de três novas relações entre os estímulos envolvidos nos treinos. Três conjuntos de estímulos estão presentes na figura: o conjunto A, composto por conjuntos de um, dois ou três elementos; o conjunto B, composto pelos algarismos arábicos 1, 2 e 3; e o conjunto C, composto pelos algarismos romanos I, II e III. As linhas contínuas representam as relações condicionais diretamente treinadas, no caso as relações AB e AC, 1Esta é uma notação comum nas pesquisas sobre equivalência de estímulos. Letras maiúsculas representam conjuntos de estímulos, sendo que a primeira letra refere-se ao conjunto de estímulos utilizado como modelo e a segunda letra ao conjunto de estímulos utilizado como escolha. ANÁLISE DO COMPORTAMENTO B1 B1 A1 B2 1 A2 B2 B1 A3 B2 3 2 B3 247 B3 B3 FIGURA 14.1 Exemplos de três discriminações condicionais corretas envolvidas em uma tarefa de ligar um número à quantidade correspondente de elementos de um conjunto. FIGURA 14.2 Especificação das contingências de três termos definidas por cada um dos estímulos condicionais A1, A2 e A3. FIGURA 14.3 Representação esquemática das relações condicionais treinadas (linhas contínuas) e emergentes (linhas pontilhadas) envolvendo três conjuntos de estímulos: A (conjuntos de figuras), B (números arábicos) e C (algarismos romanos). Fora do retângulo central, são reapresentados os conjuntos A, B e C, e são indicadas relações de identidade entre os elementos de um mesmo conjunto por setas de duplo sentido. 248 ABREU-RODRIGUES, RIBEIRO & COLS. e as linhas pontilhadas representam as relações emergentes, simétricas, reflexivas e transitivas, conforme sinalizado na legenda da figura. As setas são sempre posicionadas no sentido do estímulo-modelo para o de escolha. A observação das três propriedades, por sua vez, permitiria afirmar que três classes de estímulos equivalentes foram formadas a partir dos dois treinos realizados, uma classe composta pelos algarismos 1, I e o conjunto de figuras com um único elemento; outra composta pelos algarismos 2, II e o conjunto de figuras com dois elementos e, a terceira, pelos algarismos 3, III e o conjunto de figuras com três elementos. PESQUISA BÁSICA EM EQUIVALÊNCIA DE ESTÍMULOS Como citado anteriormente, a primeira pesquisa sobre equivalência de estímulos foi desenvolvida por Sidman, em 1971. Nesta, um adolescente de 17 anos com microencefalia e sérios déficits de desenvolvimento foi exposto a um procedimento composto de duas fases de treino de escolha de acordo com o modelo, nas quais discriminações condicionais entre palavra ditada-palavra impressa e palavra ditadadesenho foram treinadas. Após os treinos, diferentes testes (nomeação de palavra impressa, pareamento palavra impressa-desenho e pareamento desenho-palavra impressa) foram realizados. Os resultados evidenciaram a emergência dos desempenhos testados após os treinos de escolha de acordo com o modelo. Em uma replicação sistemática desse experimento (Sidman e Cresson, 1973), realizada com duas crianças com síndrome de Down, os mesmos resultados foram obtidos e explicados com base na transferência das equivalências treinadas (palavra ditada-desenho e palavra ditada-palavra impressa) para a equivalência palavra impressa-desenho. No entanto, apenas em 1982, Sidman e Tailby realizaram uma pesquisa que levou à noção de equivalência como definida neste capítulo e que estabeleceu uma metodologia de investigação sobre o fenômeno, a qual envolve a realização de treinos de escolha de acor- do com o modelo e de testes que avaliam as três propriedades que caracterizam a equivalência de estímulos. Nesse trabalho, oito crianças, entre 5 e 7 anos de idade, foram expostas a três treinos de escolha de acordo com os modelos denominados AB, AC e DC, sendo o conjunto A composto de nomes ditados de letras gregas e os conjuntos B, C e D compostos de diferentes letras gregas impressas, cada um contendo três estímulos. Após os treinos, foi avaliada a emergência das relações condicionais DB, BD, AD, BC, CB (testes combinados de transitividade e simetria) e CD (teste de simetria), e a nomeação oral das letras gregas componentes dos conjuntos de estímulos B, C e D. Sidman e Tailby (1982) relataram a emergência de três classes equivalentes, compostas de quatro estímulos (A1B1C1D1, A2B2C2D2 e A3B3C3D3), para seis das oito crianças, e a emergência de três classes equivalentes, compostas de três estímulos (A1B1C1, A2B2C2 e A3B3C3), para as outras duas crianças, após a realização dos treinos de discriminação condicional citados. Desde as pesquisas iniciais de Sidman e colaboradores, muitos estudos sobre equivalência de estímulos, com diferentes populações, têm sido realizados. Pesquisas com crianças (p. ex.: Devany, Hayes e Nelson, 1986; Harrison e Green, 1990), com adolescentes (p. ex.: Bush, Sidman e de Rose, 1989; Fields et al., 1990; Gatch e Osborne, 1989), com adultos normais (p. ex.: Green, Sigurdardottir e Saunders, 1991; Imam, 2001; Wulfert e Hayes, 1988) e com portadores de necessidades especiais (p. ex.: Cowley, Green e Braunling-McMorrow, 1992; Dube et al., 1989; Melchiori, de Souza e de Rose, 2000) são encontradas na literatura. A diversidade de estímulos utilizados nas pesquisas também é grande: gustativos (p. ex.: Hayes, Tilley e Hayes, 1988), interoceptivos (p. ex.: DeGrandpre, Bickel e Higgins, 1992), visuais (p. ex.: Lazar, Davis-Lang e Sanches, 1984; Sidman e Tailby, 1982; Sigurdardottir, Green e Saunders, 1990), auditivos (p. ex.: Bush et al., 1989; Green, 1990; Sidman, Willson-Morris e Kirk, 1986), simples (p. ex.: Sidman e Tailby, 1982) e complexos (p. ex.: Markham e Dougher, 1993; Stromer, McIlvane e Serna, 1993; Stromer e Stromer, 1990a; Stromer e ANÁLISE DO COMPORTAMENTO Stromer, 1990b; Stromer e Stromer, 1992) são alguns exemplos. Os resultados apresentados, em geral, assemelham-se aos obtidos por Sidman e colaboradores, ou seja, a emergência de relações equivalentes entre estímulos ocorre a partir do treino de discriminações condicionais (p. ex.: Lynch e Cuvo, 1995; McDonagh, McIlvane e Stoddard, 1984; Saunders et al., 1988; Saunders, Wachter e Spradlin, 1988; Sidman, Kirk e Wilson-Moris, 1985). Algumas pesquisas, no entanto, não evidenciam a formação de classes equivalentes e apresentam a emergência de relações transitivas sem que relações simétricas tenham emergido (p. ex.: Sidman, 1992), o que sugere a independência das propriedades definidoras da equivalência. Resultados negativos em equivalência também têm sido apresentados com participantes com repertório verbal deficiente ou inexistente (p. ex.: Devany et al., 1986); contudo, esses resultados, muitas vezes são revertidos quando respostas de nomeação oral são treinadas (p. ex.: Eikeseth e Smith, 1992). Resultados desta natureza, juntamente com escassas e controvertidas evidências de equivalência com animais infra-humanos (p. ex.: McIntire, Cleary e Thompson, 1987; Schusterman, Kastak e Reichmuth, 1997) têm levado alguns autores a defender que a formação de classes equivalentes é dependente da nomeação dos estímulos. Essa proposição, longe de ser consensual entre os pesquisadores da área, tem gerado muitas discussões com relação à origem das relações de equivalência. Tais discussões podem ser agrupadas em duas correntes opostas que têm como principais representantes Sidman e Lowe. A diferença fundamental entre as explicações de Sidman e Lowe com relação à origem das relações de equivalência consiste na defesa, baseada em evidências experimentais, de que o comportamento verbal, ou mais especificamente, a nomeação oral dos estímulos, é ou não necessária para que ocorra a emergência de equivalência. Lowe e colaboradores (p. ex.: Dugdale e Lowe, 1990; Horne e Lowe, 1996) defendem que a equivalência de estímulos é mediada pela nomeação e que tal mediação pode se dar de diferentes maneiras: um nome comum para di- 249 ferentes estímulos os tornaria equivalentes, ou mesmo nomes diferentes, juntamente com a formulação de uma regra, poderiam mediar a emergência de equivalência. Sidman (1990), por outro lado, defende que: Nomes comuns podem certamente facilitar a formação de classes de estímulos equivalentes para humanos, mas se os nomes são necessários para a equivalência ainda não é certo... é razoável suspeitar que não são os nomes comuns que dão origem à equivalência, mas que a equivalência dá origem aos nomes comuns (p. 105-106).2 Um questionamento semelhante é apresentado com relação à mediação da equivalência por regras: “‘O que vem primeiro, as regras ou as relações de equivalência?’ Se as regras vêm primeiro, devemos então perguntar de onde elas vêm.” (p. 106).3 Evidências favoráveis e desfavoráveis ao papel mediador da nomeação na equivalência de estímulos podem ser apontadas (Dugdale e Lowe, 1990). Dentre as evidências desfavoráveis encontra-se a emergência de equivalência mesmo na ausência de nomeações consistentes dos estímulos. Dentre as evidências favoráveis encontram-se a falta de resultados inequívocos de equivalência com sujeitos infra-humanos e a inexistência de equivalência na ausência de nomeação dos estímulos, juntamente com a emergência de equivalência quando nomeações são ensinadas. Dugdale e Lowe (1990) criticam as evidências desfavoráveis à necessidade de nomeação para a emergência de relações equivalentes. Tais críticas se baseiam no fato de os experimentos que defendem a independência entre nomeação e equivalência se utilizarem exclusivamente de dados de sondas de nomea- 2Common names can surely facilitate the formation of stimulus classes for humans, but whether the names are necessary for equivalence is not certain ... its reasonable to suspect not that the common names gave rise to equivalence, but that equivalence gave rise to the common names. 3“What comes first, the rules or the equivalence relations?” If the rules comes first, we must ask where it came from. 250 ABREU-RODRIGUES, RIBEIRO & COLS. ção, realizadas ao término dos testes das propriedades da equivalência, sem se preocuparem em registrar nomeações espontâneas que podem ocorrer durante tais testes. Acredita-se que esse tipo de avaliação possa levar, equivocadamente, à conclusão de que os participantes não tenham dado nomes aos estímulos que se tornaram equivalentes, no entanto existem evidências de nomeação espontânea dos estímulos durante a realização de treinos e testes de escolha de acordo com o modelo sem que nomeações consistentes dos mesmos tenham ocorrido ao final dos testes de equivalência, quando sondas foram realizadas (p. ex.: Hird e Lowe, 1985, citados por Dugdale e Lowe, 1990). Sidman (1990) não só rejeita que a equivalência de estímulos tem origem na nomeação ou em regras, mas também que a mesma derive de outros processos básicos. Ele levanta a possibilidade de que a equivalência seja uma função fundamental do estímulo, derivada das contingências de quatro termos presentes em procedimentos de escolha de acordo com o modelo e que dão origem a discriminações condicionais, e afirma que (p. 111): Assim como a função condicionada do reforçamento aparece no nível da contingência de três termos, relações de equivalência aparecem no nível da contingência de quatro termos. E, assim como funções de estímulo de reforçamento, discriminação, reforçamento condicionado e discriminação condicional representam rudimentos não-analisáveis na descrição do comportamento, a equivalência poderia ainda representar outro rudimento.4 Tal proposição, no entanto, tem sido vista como precipitada, “cada vez mais estranha à tradição da análise do comportamento em geral” (Ribeiro, 1995, p. 63) e tem suscitado críticas tanto de caráter empírico como de cará4Just as the conditioned reinforcement function appears at the level of the three-term contingency, equivalence relations appear at the level of the fourterm contingency. And, just as the stimulus functions of reinforcement, discrimination, conditioned reinforcement and conditional discrimination represent unanalysable primitives in the description of behaviour, equivalence may represent yet another primitive. ter conceitual (p. ex.: Ribeiro, 1995; Saunders e Green, 1992). Sidman (1994) defende-se, dizendo que a pesquisa sobre equivalência de estímulos, apesar de ter introduzido o uso de novos termos na análise do comportamento (o que, em alguns momentos, foi visto como uma proposta de descartar antigos e consolidados termos e conceitos) é uma extensão natural da tradição skinneriana. Para ele: O objetivo maior do artigo Emergent Verbal Classes5 foi mostrar que a relação de equivalência, apesar de talvez ser um novo conceito..., era uma ampliação do mesmo tipo de análise de contingência que deu origem a conceitos relacionais básicos como estímulo, resposta, reforçamento, discriminação, reforçamento condicionado e generalizado e discriminação condicional (p. 324).6 Para finalizar, cabe destacar um outro conjunto de resultados proveniente de pesquisas básicas sobre equivalência de estímulos. Esses resultados indicam que novos estímulos podem ser inseridos em uma classe equivalente a partir do ensino de relações condicionais entre os novos estímulos e um dos membros da classe (p. ex.: de Rose et al., 1988; Lazar, 1977). A possibilidade de que as funções adquiridas por um dos estímulos da classe de equivalência transfiram-se para os outros membros, sem treino adicional, sugere uma explicação alternativa para a ocorrência de um mesmo comportamento diante de situações novas. Dougher e colaboradores (1994), após o ensino de relações condicionais envolvendo quatro conjuntos de estímulos visuais arbitrários (A, B, C e D), verificaram a emergência de duas classes 5Capítulo do livro Analysis and integration of behavioral units, editado por T. Thompson e M. D. Zeiler, publicado em 1986, cujo título completo é Funcional analysis of emergent verbal classes. 6A major aim of the Emergent Verbal Classes paper was to show that the equivalence relation, while perhaps a new behavioral concept..., was an outgrowth of the same kind of contingency analysis that had rise to basic relational concepts like stimulus, response, reinforcement, discrimination, conditioned and generalized reinforcement, and conditional discrimination. ANÁLISE DO COMPORTAMENTO de equivalência com quatro membros cada. A seguir, foi utilizado um procedimento de condicionamento respondente em que um dos elementos de uma classe foi emparelhado com um choque elétrico e um membro da outra classe foi apresentado na ausência do choque. Durante a apresentação dos demais membros das classes, foi observado que a resposta de condutividade da pele passou também a ser eliciada pelos outros membros da classe do estímulo emparelhado com o choque. Posteriormente, utilizando um procedimento similar, verificou-se que a função de extinção também era transferida para os demais membros da classe quando apenas um de seus elementos era apresentado em extinção (sem ser seguido por choque elétrico). Ao analisarem os resultados obtidos, os autores sugeriram que a equivalência de estímulos e a transferência de funções podem ser utilizadas para descrever o processo pelo qual respostas de medo passam a ocorrer na presença de novos estímulos que fazem parte de uma mesma classe. Além disso, apontaram a possibilidade de que os estímulos de uma determinada classe perdem as suas funções de eliciar respostas de medo quando apenas um estímulo é o alvo da intervenção ou tratamento. A transferência de funções não é, contudo, a única maneira pela qual novos estímulos podem ser incorporados a uma rede de relações. Novos estímulos podem ser incluídos em uma classe por generalização, em virtude de apresentarem similaridade física com os componentes da classe (Fields et al., 1991). Desta forma, a interação entre a equivalência de estímulos e a generalização pode produzir redes de relações maiores e mais complexas à medida que novos membros são inseridos a uma determinada classe de estímulos. APLICABILIDADE E IMPLICAÇÕES DO CONCEITO DE EQUIVALÊNCIA DE ESTÍMULOS A possibilidade de explicar o comportamento humano simbólico com base no paradigma de equivalência tem levado ao desenvolvimento de uma série de pesquisas que avaliam 251 a formação de classes equivalentes envolvendo comportamentos como ler, escrever, lidar com números, entre outros. Tais pesquisas têm gerado tecnologia e resultados passíveis de ser utilizados de modo eficaz em diferentes contextos. Apresentam-se, a seguir, algumas destas pesquisas e suas possibilidades de aplicação para explicar os repertórios de leitura e escrita, habilidades matemáticas e comportamentos comuns no contexto clínico. Leitura, escrita e equivalência de estímulos A leitura e a escrita podem ser analisadas como uma rede de repertórios verbais interligados, os quais podem ser adquiridos mediante procedimentos de escolha de acordo com o modelo (de Rose et al., 1989; Sidman, 1971). De acordo com essa proposta, considera-se que palavras ditadas, palavras impressas e seus respectivos referentes, por controlarem desempenhos verbais comuns (p. ex.: nomear e/ou escrever), fazem parte de uma classe de estímulos equivalentes, definida pelas propriedades de reflexividade, simetria e transitividade. A análise da leitura e da escrita como uma rede de relações permite a identificação dos desempenhos verbais já aprendidos e a seleção de uma quantidade mínima de relações que deverão ser ensinadas, a partir das quais novos desempenhos poderão emergir, caracterizando a presença de um repertório de leitura e escrita (p. ex.: Sidman, 1971; Sidman e Cresson, 1973; Sidman e Tailby, 1982). A demonstração de que relações simbólicas são aprendidas a partir de relações condicionais apresenta-se também como um modelo comportamental útil para a obtenção e a descrição da emergência de leitura com compreensão (de Rose, 1993; Hübner-D’Oliveira, 1990; Sidman, 1994). Além disso, tal concepção de leitura e escrita possibilita a identificação de relações que devem ser avaliadas e treinadas em estágios iniciais de aquisição desses repertórios, que consistem em pré ou co-requisitos para a aprendizagem dos mesmos e relacionam-se a estes apenas indiretamente (Hanna, Melo e Albuquerque, 1999; Sidman, 1977). 252 ABREU-RODRIGUES, RIBEIRO & COLS. A rede de repertórios verbais envolvida na leitura e na escrita é representada na Figura 14.4, que apresenta uma versão expandida do modelo proposto por Sidman (1971) para explicar o repertório de leitura. Nessa figura, são apresentadas diferentes relações condicionais entre estímulos, entre elas as relações condicionais que exemplificam as propriedades da equivalência de estímulos. Os retângulos representam os estímulos (figuras, palavras impressas e ditadas), e as elipses, as respostas (nomear, compor com anagramas e escrever). A seleção de uma figura correspondente a uma palavra ditada é representada pela relação AB, a qual é denominada de nomeação receptiva-auditiva de figura. A relação AC é denominada de leitura receptiva-auditiva e indica a escolha de uma palavra impressa correspondente a uma palavra ditada. As relações BC e CB indicam, respectivamente, a escolha de uma palavra impressa correspondente a um desenho e a escolha de um desenho correspondente a uma palavra impressa. Estas relações evidenciam as propriedades de transitividade e simetria e exemplificam a leitura com compreensão. A relação CD representa a nomeação oral de palavras (Sidman, 1971) e corresponde ao que Skinner (1957) denomina de comportamento textual. A relação BD é denominada de nomeação oral de figura. As demais relações representam o repertório de escrita: a relação CE representa o comportamento de escrever na presença de uma palavra impressa, o qual é denominado de cópia (Skinner, 1957). A relação AE indica a escrita diante de uma palavra ditada e caracteriza uma situação de ditado. A relação BE representa a escrita diante de uma figura, o que também pode ser denominado ditado mudo. A relação AF representa a construção com anagramas (partes da palavra, tais como letras ou sílabas) a partir de uma palavra ditada. A relação CF indica a construção com anagramas de uma palavra impressa, e a relação BF, a construção com anagramas diante de uma figura. FIGURA 14.4 Diagrama esquemático da rede de relações condicionais envolvidas nos repertórios de leitura e escrita (adaptação do diagrama proposto por Stromer, Mackay e Stoddard, 1992). ANÁLISE DO COMPORTAMENTO Para que a rede de relações esquematizada na Figura 14.4 represente os repertórios verbais de um indivíduo alfabetizado, é necessária a inclusão de palavras impressas e ditadas novas e de seus respectivos referentes. A leitura com compreensão e a escrita apenas de palavras utilizadas nos procedimentos de ensino não são suficientes para se afirmar que tais repertórios foram aprendidos de maneira fluente (de Rose et al., 1989; de Rose, Souza, Rossito e de Rose, 1992). Nesse sentido, a utilidade do paradigma de equivalência para explicar a aprendizagem de leitura e escrita tem sido defendida com moderação. Acredita-se que tal paradigma explique a leitura com compreensão, mas que apresente limitações para explicar a leitura generalizada. Esta pode ser explicada por processos complementares ao de equivalência de estímulos, como o que Skinner (1957) denominou de controle por unidades mínimas (Albuquerque, 2001; Albuquerque, 2002; Matos e Hübner-D´Oliveira, 1992; Rocha, 1996). O primeiro trabalho que evidenciou a emergência de leitura com compreensão, explicitada por desempenhos de escolha de acordo com o modelo envolvendo desenhos e palavras impressas, bem como por desempenhos de nomeação oral de palavras impressas, foi realizado por Sidman (1971). Nele, um adolescente com microencefalia, que já era capaz de selecionar figuras correspondentes a nomes ditados (relação AB) e de nomear figuras (relação BD), após ter sido exposto a uma situação de ensino de relações condicionais entre palavras ditadas e palavras escritas (relação AC), aprendeu a nomear 20 palavras e, também, a selecionar figuras correspondentes a palavras impressas e palavras impressas correspondentes a figuras apresentadas como modelo (relações BC e CB), o que seria um indicador de leitura com compreensão. A emergência desses desempenhos demonstra, portanto, a formação de classes de estímulos equivalentes envolvendo a palavra ditada (A), a figura ou o referente (B) e a palavra impressa (C) (Sidman, 1994; Sidman e Cresson, 1973; Sidman e Tailby, 1982). Esses resultados foram replicados e expandidos por vários outros estudos que, além 253 de evidenciarem a emergência de leitura com compreensão, estabeleceram a inter-relação entre esse desempenho verbal e desempenhos de escrita, não investigados na pesquisa original de Sidman (1971). Alguns desses estudos mostraram que o ensino do desempenho de montar palavras a partir de suas letras, ou seja, a construção com anagramas (relação CF), está relacionado à emergência de novas relações condicionais envolvendo as palavras impressas montadas e também à emergência de nomeação das mesmas (p. ex.: Aiello, 1995; de Rose, de Souza e Hanna, 1996; Mackay, 1985; Mackay e Sidman, 1984). A demonstração de que a composição com anagramas está relacionada à emergência da nomeação de palavras sugere uma inter-relação entre leitura e escrita, embora estes desempenhos possam ser adquiridos independentemente (p. ex.: Lee e Pegler, 1982; Skinner, 1957). Utilizando como referência o paradigma de equivalência de estímulos, de Rose e colaboradores (1996) elaboraram um programa, para o ensino de leitura, destinado a crianças com história de fracasso escolar na 1ª série do ensino fundamental. O programa consistia em ensinar os desempenhos de escolha de palavras impressas correspondentes a palavras ditadas (relação AC) e a construção com anagramas de palavras impressas apresentadas como modelo (relação CF). Foram utilizadas 51 palavras dissílabas e trissílabas, classificadas como substantivos concretos, facilmente representáveis por figuras, e compostas, em sua maioria, por sílabas do tipo vogal-consoante (p. ex.: bolo, tomate, apito). Os testes de equivalência mostraram que as crianças aprenderam, sem treino direto, a selecionar palavras impressas correspondentes a figuras e vice-versa e a ler as palavras impressas. Além disso, observou-se também a leitura de novas palavras, diferentes das que foram utilizadas nos treinos, formadas pela recombinação de sílabas ou fonemas das palavras treinadas, o que evidencia a emergência de um desempenho de leitura generalizada. Por exemplo, após o treino com as palavras tatu, selo e bolo era solicitada a leitura das palavras lobo e lata. Ao longo do programa, a leitura de palavras novas aumentou gradualmente para cinco das sete 254 ABREU-RODRIGUES, RIBEIRO & COLS. crianças. Assim, os autores concluíram que a exposição a um maior número de palavras de treino e, conseqüentemente, a uma maior variabilidade de sílabas e fonemas ocupando diferentes posições, produz melhoras na nomeação de palavras novas. Esses desempenhos são coerentes com a sugestão de Skinner (1957) de que controle por unidades menores – sílabas, grafemas e fonemas componentes das palavras – pode ser adquirido quando uma unidade maior, ou seja, a palavra como um todo, é correlacionada com o reforço. Com base nos resultados acumulados até o momento, têm-se, portanto, evidências claras e inequívocas da emergência de relações equivalentes com a formação de classes envolvendo palavras ditadas, palavras impressas e seus referentes, quando pelo menos dois treinos de discriminação condicional são realizados. Tais evidências apresentam ao menos duas implicações práticas fundamentais: primeiro, considerando-se a emergência de leitura com compreensão demonstrada pelas pesquisas sobre equivalência de estímulos em oposição à grande proporção de fracasso na aprendizagem de leitura apresentada, por exemplo, pelas escolas brasileiras7 e norte-americanas,8 acredita-se que a metodologia utilizada nessas pesquisas possa vir a respaldar o desenvolvimento de métodos alternativos de ensino para indivíduos que fracassam com os procedimentos utilizados tradicionalmente (p. ex.: de Rose et al., 1996; de Rose et al., 1989; Melchiori, de Souza e de Rose, 1992; Melchiori et al., 2000). Uma segunda implicação reside no fato de que as pesquisas sobre equivalência mos- 7De acordo com os dados do MEC/INEP (2003), 4,2% da população entre 10 e 14 anos de idade e 13,6% acima dos 14 anos são analfabetos. Apesar de o tempo médio de permanência dos que ingressam na escola ser superior a 8 anos – tempo suficiente para a conclusão do ensino fundamental – apenas dois terços desses alunos concluem o ensino fundamental. 8Segundo Adams (1996), o nível de leitura dos estudantes norte-americanos está abaixo da média apresentada pelos países industrializados. De cada cinco adultos, um é analfabeto funcional, e a habilidade de leitura avançada vem decrescendo ao longo dos anos. tram que, a partir do ensino direto de poucas relações condicionais, pode haver a ampliação de repertórios comportamentais, sem a necessidade de que situações de ensino adicionais sejam estruturadas. Sendo assim, a emergência de relações condicionais não-treinadas evidencia uma situação econômica para o processo de ensino, o que poderia, em uma época em que a rapidez é quase que uma exigência e é confundida com eficiência, colaborar para o ensino de repertórios de leitura e escrita com maior agilidade. As classes de equivalência que envolvem palavras ditadas, palavras impressas e seus respectivos referentes têm sido apontadas como a base para a compreensão de um dos aspectos essenciais da linguagem: o significado (de Rose, 1993; Sidman, 1990; 1994). De acordo com o paradigma de equivalência, o significado de uma palavra corresponderia à classe de estímulos à qual a palavra se tornou equivalente. Essa concepção de significado está relacionada com a noção de que as palavras possuem uma referência simbólica, ou seja, se referem a coisas, a eventos, a ações ou a qualidades (Sidman, 1994). Considerando essa perspectiva, a palavra impressa silêncio, por exemplo, apresenta relação de equivalência com uma classe de estímulos que inclui vários elementos (p. ex.: palavra ditada, uma representação pictórica, um gesto). Essa classe de estímulos seria, portanto, o seu significado. Dessa forma, ao entrarmos em uma biblioteca e nos depararmos com uma placa de silêncio, podemos mudar o toque do celular para o modo silencioso e conversar apenas sussurrando com um colega de grupo. Como diferentes estímulos participam dessa classe de equivalência, os mesmos comportamentos podem ocorrer na presença de outros estímulos, tais como a solicitação de silêncio por parte de um funcionário da biblioteca (“Silêncio, por favor!”), ou um gesto. Essa noção de significado possibilita a compreensão da linguagem (Sidman, 1990). Sentenças nunca antes ouvidas podem ser compreendidas, desde que as palavras que as compõem façam parte de classes de equivalência com objetos, seres ou eventos. Tais classes devem ser anteriormente formadas a partir de ANÁLISE DO COMPORTAMENTO uma história de reforçamento no contexto de discriminações condicionais. Como apontado anteriormente, em uma classe de equivalência as funções adquiridas por um estímulo são transferidas para os outros elementos. Entretanto Sidman (1992) ressalta que as palavras impressas não adquirem todas as funções dos objetos ou dos eventos que fazem parte de uma mesma classe. Assim, uma pessoa não interrompe a leitura oral de um texto quando lê a palavra silêncio nem tenta beber a palavra impressa água. Isso ocorre porque a relação de equivalência entre uma determinada palavra impressa, objetos e ações está sob o controle contextual, os seja, a classe de equivalência a que uma determinada palavra pertence irá mudar dependendo do estímulo contextual presente. A biblioteca e o texto definem, portanto, a qual (ou quais) ação (ou ações) a palavra silêncio é equivalente (p. ex.: Bush et al., 1989; de Rose, 1993). Finalmente, pode-se afirmar que o paradigma de equivalência de estímulos e a especificação dos repertórios verbais envolvidos na leitura e escrita podem ser úteis tanto para o professor como para outros profissionais (pedagogo, psicólogo, etc.) que atendem crianças com história de fracasso escolar. A utilização desse paradigma possibilita a caracterização do repertório inicial da criança, a identificação das habilidades que precisam ser ensinadas e a seleção das atividades que podem ser desenvolvidas para complementar os métodos utilizados em sala de aula (Aiello, 1995; Melo, Hanna e Jesus, 2002; Stromer, Mackay e Stoddard, 1992). Habilidades matemáticas e equivalência de estímulos O paradigma de equivalência de estímulos também tem-se mostrado útil para a análise e para o ensino de relações entre conjuntos de estímulos arbitrários, ou entre estímulos e respostas, que se constituem em habilidades básicas para a compreensão de habilidades matemáticas. De maneira similar à descrição das relações envolvidas na leitura e escrita, previamente apresentada, a aquisição de habilidades 255 matemáticas também pode ser representada por uma rede de relações condicionais derivada do diagrama original proposto por Sidman (1971). Entretanto, comparativamente aos estudos sobre leitura e escrita, as investigações sobre repertórios matemáticos têm sido realizadas em menor proporção na análise do comportamento (p. ex.: Carmo, 2002; Prado, 1995; Santos, 1996). Considerando o conceito de número,9 diferentes relações condicionais entre estímulos e entre estímulos e respostas podem ser identificadas (p. ex.: Prado, 1995; Prado e de Rose, 1999), as quais são representadas no diagrama apresentado na Figura 14.5. Os retângulos ilustram conjuntos de estímulos (A, B e C), a elipse representa a resposta de nomear (D), e as setas, que vão sempre do estímulo-modelo para o de comparação ou resposta, indicam relações condicionais. A relação AB refere-se à escolha de um numeral impresso correspondente a um número ditado. A escolha de um conjunto de itens contendo a quantidade de elementos correspondente a um número ditado é representada pela relação AC. A relação BC indica a escolha de um conjunto de itens com a quantidade de elementos especificada pelo numeral impresso apresentado como modelo. O desempenho simétrico a este, a escolha do numeral correspondente à quantidade de elementos do conjunto de itens apresentado como modelo, é representada pela relação CB. A relação BD refere-se à nomeação oral de um determinado numeral impresso. A relação CD representa a nomeação da quantidade de elementos de um conjunto de itens. As relações BB e CC indicam a escolha de estímulos idênticos aos estí9De acordo com a proposta de Keller e Schoenfeld (1950/1974), conceito é a denominação utilizada para se referir a um tipo especial de comportamento que envolve generalização intraclasse e discriminação interclasses de estímulos. Dessa forma, seria mais adequado utilizar o termo comportamento conceitual numérico. Enquanto o termo conceito está associado a processos mentais, comportamento conceitual faz referência às relações de controle de estímulos, estabelecidas a partir de uma história de reforçamento. Ao longo do texto, o termo conceito será utilizado para se referir a um comportamento específico. 256 ABREU-RODRIGUES, RIBEIRO & COLS. B Numeral impresso A D Nomeação Número ditado C Conjunto FIGURA 14.5 Diagrama esquemático da rede de relações que compõem o conceito de número (adaptado do diagrama de Prado, 1995). mulos-modelo (numeral impresso-numeral impresso e conjuntos de itens-conjuntos de itens) e são representadas por setas que partem e retornam ao mesmo retângulo. Outras relações entre estímulos e desempenhos também podem fazer parte desta rede que descreve o conceito de número, tais como ordenar numerais ou conjuntos de itens em seqüência crescente ou decrescente e separar a quantidade de itens de um conjunto correspondente a um numeral impresso (Carmo, 2000; 2002; Prado, 2002). Utilizando como referência o paradigma de rede de relações, Prado (1995) analisou o conceito de número em crianças de 4 a 8 anos a partir de desempenhos em diferentes tarefas de discriminação condicional: nomeação de numerais (de 1 a 9); contagem de conjuntos inteiros; emparelhamento de número ditados com conjuntos, de conjuntos com números, de números com conjuntos e de conjuntos com conjuntos. Os resultados mostraram diferenças quanto ao domínio das relações condicionais que compõem o conceito de número. Por exemplo, algumas crianças eram capazes de contar os elementos de um conjunto, mas não relacionavam a quantidade obtida com o numeral correspondente. A análise do repertório de cada criança possibilitou a identificação das habilidades matemáticas já dominadas, de for- ma integral ou parcial, e das que deveriam ser ensinadas. Conforme apontado pelo autor, tais informações podem subsidiar a elaboração de estratégias de ensino individualizado que visem a facilitar a emergência de novas relações e ao fortalecimento das que foram parcialmente aprendidas. Lynch e Cuvo (1995) avaliaram a eficácia do paradigma de equivalência de estímulos para ensinar relações entre números fracionários (como1/5), decimais (como 0,2) e representações pictográficas a sete estudantes com idades entre 12 e 13 anos, que apresentavam dificuldade na resolução de problemas com frações e com números decimais. Foram ensinadas relações condicionais entre números fracionários impressos e suas representações pictóricas (AB) e entre representações pictóricas de frações e suas correspondentes formas decimais (BC). Os testes de equivalência mostraram a emergência de relações entre frações e números decimais correspondentes (AC) e entre números decimais e as respectivas frações (CA). Essa demonstração indicou que cada fração, número decimal e a sua representação pictórica formavam uma classe de estímulos equivalentes. Em um outro estudo desenvolvido com frações (Santos, 1996), foi demonstrado que o paradigma de equivalência de es- ANÁLISE DO COMPORTAMENTO tímulos é eficaz para a formação de classes de frações matematicamente equivalentes (como 1/3 e 3/9), a partir do treino de discriminações condicionais entre representações pictóricas e frações e entre frações e frações. Entretanto, nesse estudo, assim como no de Lynch e Cuvo (1995), a generalização para novos elementos das classes formadas mostrou-se limitada e, quando ocorria, a porcentagem de acerto tendia a ser baixa e variável entre os participantes. Considerando-se os poucos estudos já realizados e previamente descritos, relacionando o desenvolvimento de repertórios matemáticos e equivalência de estímulos, observa-se que esses têm se concentrado em investigar desempenhos que são básicos para a aprendizagem de conceitos matemáticos mais complexos e que, em geral, estão associados com história de fracasso nas primeiras séries do ensino fundamental. Com base nesses estudos (de forma semelhante às implicações apontadas na análise dos resultados obtidos até o momento em pesquisas que relacionam equivalência de estímulos e aprendizagem de leitura e escrita), as evidências de formação de classes equivalentes envolvendo algarismos numéricos, frações e conjuntos de itens, entre outros, sugerem a possibilidade de análise do repertório individual, a definição e elaboração de procedimentos de ensino de conceitos matemáticos de forma econômica. A economia citada, no entanto, restringe-se a uma ampliação da rede de relações envolvendo estímulos presentes durante as situações de treinos de discriminação condicional e apontam limitações do paradigma de equivalência para explicar o surgimento de novas relações de equivalência com estímulos não utilizados nos treinos de discriminação condicional. Assim sendo, pode-se reafirmar que a utilidade do paradigma de equivalência para explicar a aprendizagem de repertórios matemáticos deve ser vista com parcimônia e que a explicação de repertórios desta natureza, em níveis básicos e avançados de complexidade, exige referência a outros processos básicos, como por exemplo, a discriminação e a generalização. 257 Contribuições da equivalência de estímulos para a explicação de repertórios comportamentais relevantes no contexto clínico Toda intervenção terapêutica de base analítico-comportamental tem como ponto de partida a realização de uma avaliação detalhada das relações funcionais que envolvem o comportamento-alvo da intervenção. Analisar funcionalmente um comportamento implica concebê-lo como parte de uma contingência de três termos, identificando as situações ou estímulos diante dos quais o comportamento ocorre e as conseqüências que este produz no meio (no comportamento de outras pessoas ou no ambiente físico) (Meyer, 1997). Entretanto tem-se defendido que uma melhor compreensão do processo de aquisição e manutenção de comportamentos de interesse no contexto clínico poderia ser obtida a partir de análises tanto de contingências de três termos como também de contingências de quatro termos (de Rose, 1993; DeGrandpre e Bickel, 1993; Tierney e Bracken, 1998), que descrevem situações de discriminações condicionais e constituem a base da formação de classes de estímulos equivalentes. Partindo dessa proposição, algumas pesquisas (p. ex.: Barnes et al., 1996; DeGrandpre et al., 1992) têm investigado a formação de classes equivalentes envolvendo estímulos e comportamentos comuns no contexto clínico. Um exemplo que merece ser citado é o trabalho de DeGrandpre e colaboradores (DeGrandpre e Bickel, 1993; DeGrandpre et al., 1992), que utiliza o paradigma de equivalência como referencial para a compreensão da etiologia, manutenção e tratamento do consumo de drogas e se caracteriza como uma alternativa às explicações que se fundamentam em modelos de condicionamento respondente. Esses pesquisadores identificam duas condições determinantes para o desenvolvimento da dependência de drogas: o aumento na quantidade de estímulos que passam a controlar o consumo de drogas, os quais podem ser de diferentes modalidades – interoceptivos (estímulos resultantes do efeito da droga) e exteroceptivos (estímulos visuais disponíveis quando o con- 258 ABREU-RODRIGUES, RIBEIRO & COLS. sumo ocorre) e a diminuição na probabilidade de ocorrência de comportamentos não-relacionados com a droga na presença dos mesmos estímulos. Essa proposição foi testada experimentalmente no estudo realizado por DeGrandpre e colaboradores (1992) em que quatro participantes adultos foram expostos a treinos de discriminação condicional envolvendo estímulos de diferentes modalidades: interoceptivos (A1 e A2) e exteroceptivos (B1, B2, C1, C2, D1 e D2). Inicialmente foi realizado o treino AB, que ensinou os participantes a responderem na presença de estímulos visuais diferentes (B1 e B2) quando estavam sob efeito de uma droga (cápsulas de Trizolan, A1) ou não (cápsulas de um placebo, A2). Posteriormente, foram treinadas as relações BC e BD, sendo que os conjuntos C e D eram compostos, cada um, por dois estímulos visuais. Foram realizados testes para avaliar a emergência de novas relações e estes demonstraram a formação de duas classes de estímulos equivalentes, formadas, respectivamente, pelos estímulos A1B1C1D1 e A2B2C2D2. Os resultados mostraram que os estímulos interoceptivos resultantes do efeito da droga (A1 e A2) e os estímulos exteroceptivos visuais (estímulos dos conjuntos B, C e D) passaram a controlar um mesmo comportamento. Essas evidências fornecem informações adicionais para a compreensão do processo de expansão da classe de estímulos diante da qual comportamentos relacionados com a dependência de drogas, como usar e procurar por drogas, ocorrem. A identificação de tal classe de estímulos pode fundamentar a elaboração de procedimentos de intervenção que se destinem a priorizar o reforçamento de comportamentos alternativos e não-correlacionados com a droga em contextos ou em situações-estímulo que, anteriormente, controlavam o uso e a aquisição de drogas (DeGranpre e Bickel, 1993). Uma outra contribuição dos estudos sobre a equivalência de estímulos para a área clínica refere-se à investigação de processos comportamentais relacionados com a aprendizagem do comportamento denominado de autoconceito. Considerando esse paradigma, o autoconceito poderia ser descrito por uma rede de relações condicionais entre estímulos arbitrários, sendo que todos os estímulos estariam relacionados direta ou indiretamente com o nome da pessoa ou com palavras de auto-referência (p. ex.: eu e mim). Tais relações seriam estabelecidas e mantidas a partir de interações da própria pessoa com a comunidade verbal (Barnes et al., 1996; Dymond e Barnes, 1994). Dessa forma, o paradigma de equivalência apresenta-se como uma alternativa para explicar a aquisição do comportamento de rotular, ou de categorizar a si mesmo, e a emergência de outras relações condicionais envolvendo o nome da pessoa. No decorrer das interações verbais estabelecidas no contexto escolar, é possível que autoconceitos acadêmicos desenvolvam-se a partir da aquisição de relações entre o nome da criança e as frases avaliativas sobre o seu desempenho acadêmico (p. ex.: João apresenta dificuldade para aprender). É também possível que outras relações sejam aprendidas, relacionando palavras tais como lento e incapaz com a frase anterior (p. ex.: A dificuldade para aprender é comum em pessoas lentas e incapazes). Como resultado, a criança pode passar a se perceber como lenta e incapaz, mesmo que em nenhum momento tenha ocorrido o reforçamento da relação entre o seu nome e as palavras lento e incapaz (cf. Barnes et al., 1996). Ao investigar o autoconceito acadêmico a partir do paradigma de equivalência, Barnes e colaboradores (1996) ensinaram a dois grupos de crianças (com e sem retardo mental) duas relações condicionais: entre palavras sem sentido (CUG, ZID) e rótulos relativos ao desempenho acadêmico (hábil e lento), e entre palavras sem sentido e nomes de pessoas (nome do próprio participante e nome fictício). Posteriormente, foram realizados testes a fim de verificar se os dois grupos eram capazes de relacionar os rótulos com os respectivos nomes. As crianças que apresentavam retardo mental falharam nos testes de equivalência, o que foi evidenciado pelo maior número de erros nas tentativas em que o desempenho correto consistia em relacionar o próprio nome com a palavra hábil. Nessas tentativas, as crianças com retardo mental escolhiam, sistematicamente, a palavra lento diante do próprio ANÁLISE DO COMPORTAMENTO nome, apresentando um desempenho discriminativo diferente do treinado na pesquisa. Segundo os autores, a ocorrência de seleções do próprio nome na presença da palavra lento e da palavra lento na presença do próprio nome sugerem que relações de equivalência previamente aprendidas, no ambiente natural, continuaram exercendo controle sobre o comportamento dessas crianças na situação experimental, apesar de divergirem do treino das relações condicionais realizado durante o estudo. Considerando-se esses resultados juntamente com as evidências de transferência de funções de estímulos (p. ex.: de Rose et al., 1988; Lazar, 1977) apresentadas anteriormente, pode-se supor que o ensino de uma relação entre lento e incompetente poderia ser suficiente para a palavra incompetente tornar-se também associada a incapaz, embora tal relação não tenha sido diretamente ensinada. À medida que a classe é expandida, novas relações emergem e, portanto, mais palavras estariam sendo associadas ao nome próprio da pessoa. Tais considerações sobre a formação e a expansão de classes de estímulos podem ser úteis para a compreensão de problemas clínicos assim como para a definição de estratégias de intervenção. Como apontado por de Rose (1993, p. 298), os procedimentos terapêuticos serão efetivos apenas se resultarem na destruição da rede de relações que mantém o problema. Caso algumas relações permaneçam intactas, “as relações isoladas suprimidas através da terapia podem emergir novamente. Isso pode acontecer, por exemplo, quando o cliente retorna ao ambiente no qual o problema costumava se manifestar”. Cabe ainda destacar que os resultados obtidos por Barnes e colaboradores (1996) confirmam as observações de outros estudos (como os de Pilgrim e Gallizio, 1990; 1995; Watt et al., 1991), que demonstram que as redes de equivalências previamente estabelecidas tendem a ser estáveis e resistentes a mudanças. Tal característica poderia explicar a persistência de problemas clínicos (como uso de drogas, autoconceito negativo, fobias) mesmo após a realização de procedimentos de intervenção. No entanto é possível que o ensino de novas e 259 diversificadas relações envolvendo os estímulos que anteriormente estavam associados ao comportamento-alvo da intervenção terapêutica e estímulos e/ou respostas não-relacionados ao comportamento-problema seja capaz de alterar redes de relações persistentes que caracterizam problemas clínicos, como a dependência química, alterações emocionais e o autoconceito. CONCLUSÃO A introdução de novos conceitos em qualquer área científica é sempre cercada de controvérsias e especulações, o que implica a necessidade de realização de investigações exaustivas na busca de evidências que os sustentem ou os refutem. O conceito de equivalência de estímulos, como um conceito relativamente novo na análise do comportamento, tem gerado discussões e pesquisas importantes tanto no âmbito básico quanto no aplicado. Uma das questões básicas mais discutidas e que ainda carece de respostas conclusivas refere-se à origem das relações de equivalência e ao papel da nomeação/regra no estabelecimento de classes equivalentes. Essa discussão tem sido mantida, em grande parte, pela ausência de evidências inequívocas de equivalência com animais infra-humanos, o que aponta para a necessidade de investigações adicionais. Apesar das controvérsias ainda existentes no que diz respeito ao conceito de equivalência, ou talvez até mesmo em função dessas controvérsias, muitas pesquisas sobre o tema têm sido realizadas, e resultados sistemáticos têm sido produzidos. A metodologia de investigação dessas pesquisas, bem como seus resultados, têm apontado sugestões relevantes para a condução de novas pesquisas básicas e aplicadas, para o desenvolvimento de estratégias de ensino de repertórios diversos, em diferentes contextos – educacional e clínico – e para explicar comportamentos humanos complexos e simbólicos. Tal possibilidade, em especial a de explicar linguagem e significado, é apontada por Sidman (1994) como seu principal interesse no estudo da equivalência de estímulos. De acordo com o paradigma de equi- 260 ABREU-RODRIGUES, RIBEIRO & COLS. valência, as palavras possuem uma referência simbólica, visto que pertencem a uma classe de estímulos equivalentes composta por seus referentes. O paradigma de equivalência, além de fornecer uma explicação adicional para a compreensão de comportamentos simbólicos, em especial da linguagem, constitui-se também como uma alternativa às explicações baseadas em contingências de três termos e generalização, as quais apresentam claras limitações para a compreensão da novidade, da produtividade e da criatividade do comportamento humano na ausência de estratégias diretas de ensino (de Rose, 1993). Enquanto a generalização explica a novidade comportamental diante de classes de estímulos que apresentam semelhança física entre si, o paradigma de equivalência vai além e consegue explicar a novidade na ausência de semelhança física entre os estímulos, ou seja, explica a novidade comportamental diante de classes de estímulos que apresentam relações arbitrárias entre seus elementos (a respeito de comportamentos novos, ver também o Capítulo 8). O controle de um comportamento comum por uma classe arbitrária de estímulos relaciona-se também à aprendizagem de conceitos. Em análise do comportamento, a aprendizagem de conceitos corresponde à formação de classes de estímulos. As classes de equivalência são exemplos de classes de estímulos10 constituídas por elementos que apresentam entre si relações condicionais que satisfazem as propriedades de reflexividade, simetria e transitividade. Dessa forma, a noção de equivalência de estímulos contribui para a compreensão do tema conceitos, tradicionalmente estudado pela Psicologia Cognitiva, propiciando um referencial conceitual e metodológico adicional para investigar processos de aquisição de comportamentos conceituais com sujeitos humanos e 10Deve-se mencionar, entretanto, que não há consenso quanto a categorização das classes de equivalência como um tipo especial de classe funcional ou uma classe à parte (Catania, 1992; Danahoe e Palmer, 1994; de Rose, 1993). infra-humanos (para uma revisão, ver Zentall e Smeets, 1996). Com relação às contribuições para a elaboração de estratégias de ensino, a pesquisa sobre equivalência de estímulos tem levado ao desenvolvimento de procedimentos de avaliação e à produção de repertórios comportamentais complexos, dentre eles o de leitura, de escrita e de conceitos matemáticos. A análise de tais repertórios como uma rede de relações caracteriza-se como uma alternativa para identificar relações condicionais que o aluno já domina e as que precisam ser ensinadas e/ ou fortalecidas. As redes de relações podem, portanto, ser utilizadas como um recurso para a detecção de necessidades individuais de aprendizagem e para a obtenção de informações com vistas à elaboração e à implementação de estratégias individualizadas de ensino. A verificação de que o ensino de algumas, em geral poucas, relações condicionais produz a emergência de várias outras, ampliando sobremaneira o repertório do aprendiz, evidencia a possibilidade de utilização de procedimentos derivados dos estudos de equivalência para o desenvolvimento de tecnologias alternativas de ensino. Além de propiciar economia no número de desempenhos que deverão ser ensinados, a especificação da rede de relações condicionais que descreve um repertório complexo possibilita a escolha das relações que deverão ser ensinadas, considerando-se as que já foram aprendidas, o que pode resultar na aceleração do processo de aprendizagem. Outras características desses procedimentos podem estar associadas com a sua efetividade em comparação com os métodos tradicionais de ensino utilizados durante o processo de alfabetização e de ensino de habilidades matemáticas, tais como o ensino programado de apenas um desempenho de cada vez, a elaboração de procedimentos de ensino para atender as necessidades de aprendizagem de cada aluno e a utilização freqüente de reforçadores positivos. Apesar de os resultados das pesquisas sobre equivalência sugerirem aplicações em diferentes contextos, tal possibilidade não tem sido efetivamente concretizada. Procedimentos alternativos de ensino de repertórios acadêmicos têm sido elaborados, quase que prio- ANÁLISE DO COMPORTAMENTO ritariamente, no nível de pesquisas, sendo que dessa forma apenas uma pequena porcentagem de crianças que fracassa nas séries iniciais é beneficiada por tais métodos de ensino. Além disso, a divulgação de tal conhecimento, para professores e em disciplinas de cursos de licenciatura, é muito precária. Sendo assim, faz-se necessária a realização de investigações sobre as adaptações dos procedimentos derivados das pesquisas que obtiveram sucesso no ensino de repertórios acadêmicos ao contexto de sala de aula, assim como em relação ao planejamento e confecção de livros e materiais didáticos. No contexto clínico, análises funcionais em termos de contingências de três termos podem não ser suficientes para explicar a aquisição e a manutenção de determinados comportamentos. A equivalência é uma alternativa para analisar a história de desenvolvimento e manutenção de certos problemas clínicos, tais como o uso de drogas, o autoconceito negativo e as fobias. Quando se considera que os diferentes estímulos, diante dos quais os comportamentos-alvo de intervenções terapêuticas ocorrem, constituem uma classe de equivalência, é possível compreender o controle que eles exercem sobre o comportamento do cliente. A análise de classes equivalentes poderia, conseqüentemente, subsidiar a elaboração de estratégias de intervenção para ensinar novas relações condicionais entre os estímulos que compõem a classe relacionada com o comportamento-alvo, o que poderia destituir a rede de relações condicionais responsável pela manutenção do comportamento em questão. Os resultados dos estudos sobre equivalência sugerem que análises funcionais de repertórios relevantes no contexto clínico, ou dos comportamentos em geral, devem levar em consideração o controle que estímulos condicionais podem exercer sobre o comportamento operante descrito por contingências de três termos e a possibilidade de que contingências de quatro termos estejam também sob controle de outros estímulos contextuais. Tais considerações apontam para a necessidade de análises funcionais mais amplas, uma vez que análises precisas não só resultam em melhor compreensão do processo de aquisição e manutenção de um determinado comportamento, como 261 também na possibilidade de intervenções mais eficazes. Os trabalhos iniciais de Sidman e colaboradores suscitaram uma multiplicidade de estudos sobre o fenômeno da equivalência de estímulos. As sugestões a respeito do potencial de aplicação da equivalência de estímulos têm sido confirmadas, por estudos experimentais, para a compreensão de temas tradicionalmente investigados pela psicologia cognitiva, tais como linguagem, significado e conceitos. Os procedimentos utilizados por tais estudos, bem como os resultados obtidos, apontam contribuições promissoras para a elaboração de metodologias de ensino de repertórios complexos e de estratégias de intervenção nos contextos escolar e clínico. Há a necessidade, ainda, de investigações adicionais a respeito de variáveis de procedimentos de treino que resultem no desenvolvimento de repertórios sob controle de unidades mínimas e na generalização de desempenhos previamente ensinados, diante de novos estímulos e em contextos nãoexperimentais. As controvérsias que se mantêm quanto à origem da equivalência de estímulos e o papel da nomeação devem ser consideradas como desafios para a condução de investigações futuras sobre questões conceituais e metodológicas. REFERÊNCIAS BIBLIOGRÁFICAS Adams, M. J. (1996). Beginning to read: Thinking and learning about print. Cambridge: Bradford. Aiello, A. L. R. (1995). Efeitos de um procedimento de resposta construída sobre a rede de relações de equivalência envolvida na leitura e escrita em crianças com história de fracasso escolar. Tese de Doutorado não publicada, Universidade de São Paulo, São Paulo, SP. Albuquerque, A. R. (2001). Controle comportamental por símbolos compostos: Manipulação da similaridade entre estímulos discriminativos e do número de recombinações treinadas. Tese de Doutorado não publicada, Universidade de Brasília, Brasília, DF. Albuquerque, A. R. (2002). Uma análise conceitual de “leitura com compreensão”: Traçando paralelos entre a proposta de Sidman e o uso cotidiano do termo. Texto didático (organizado) – Série Psicologia (p. 23-39). Brasília: Editora Universa. Barnes, D.; Lawlor, H.; Smeets, P. M.; Roche, B. (1996). Stimulus equivalence and academic self-concept among mildly mentally handicapped and nonhandicapped children. The Psychological Record, 46, 87-107. 262 ABREU-RODRIGUES, RIBEIRO & COLS. Bush, K. M.; Sidman, M.; de Rose, T. (1989). Contextual control of emergent equivalence relations. Journal of the Experimental Analysis of Behavior, 51, 29-45. Carmo, J. S. (2000). O conceito de número como rede de relações. Em R. R. Kerbauy (Org.), Sobre comportamento e cognição: Vol. 5. Conceitos, pesquisa e aplicação, a ênfase no ensinar, na emoção e no questionamento clínico (p. 97-113). Santo André: SET. Carmo, J. S. (2002). Definições operacionais de habilidades matemáticas elementares. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 9. Contribuições para a construção da teoria do comportamento (p. 181191). Santo André: ESETec. Catania, A. C. (1992). Learning. Englewood Cliffs, NJ: Prentice Hall. Cowley, B. J.; Green, G.; Braunling-McMorrow, D. (1992). Using stimulus equivalence procedures to teach name-face matching to adults with brain injuries. Journal of Applied Behavior Analysis, 25, 461-475. Danahoe, J. W.; Palmer, D. C. (1994). Learning and complex behavior. Boston: Allyn and Bacon. de Rose, J. C. (1993). Classes de estímulos: Implicações para uma análise comportamental da cognição. Psicologia: Teoria e Pesquisa, 9, 283-303. de Rose, J. C.; de Souza, D. G.; Hanna, E. S. (1996). Teaching reading and spelling: Exclusion and stimulus equivalence. Journal of Applied Behavior Analysis, 29, 451-469. de Rose, J. C.; McIlvane, W. J.; Dube, W. V.; Galpin, V. C.; Stoddard, L. T. (1988). Emergent simple discrimination established by indirect relation to differential consequences. Journal of the Experimental Analysis of Behavior, 50, 1-20. de Rose, J. C.; Souza, D. G.; Rossito, A. L.; de Rose, T. M. S. (1989). Equivalência de estímulos e generalização de leitura após história de fracasso escolar. Psicologia: Teoria e Pesquisa, 5, 325-346. de Rose, J. C.; Souza, D. G.; Rossito, A. L.; de Rose, T. M. S. (1992). Stimulus equivalence and generalization in reading after matching to sample by exclusion. Em S. C. Hayes e L. J. Hayes (Orgs.), Understanding verbal relations: The second and third international institutes on verbal relations (p. 69-82). Reno, NV: Context Press. DeGrandpre, R. J.; Bickel, W. K. (1993). Stimulus control and drug dependence. The Psychological Record, 43, 651-666. DeGrandpre, R. J.; Bickel, W. K.; Higgins, S. T. (1992). Emergent equivalence relations between interoceptive (drug) and exteroceptive (visual) stimuli. Journal of the Experimental Analysis of Behavior, 58, 9-18. Devany, J. M.; Hayes, S. C.; Nelson, R. O. (1986). Equivalence class formation in language-able and languagedisabled children. Journal of the Experimental Analysis of Behavior, 46, 243-257. Dougher, M. J.; Augustson, E.; Markham, M. R.; Greenway, D. E.; Wulfert, E. (1994). The transfer of respondent eliciting and extinction functions through stimulus equivalence classes. Journal of the Experimental Analysis of Behavior, 62, 331-351. Dube, W. V.; McIlvane, W. J.; Maguire, R. W.; Mackay, H. A.; Stoddard, L. T. (1989). Stimulus class formation and stimulus-reinforcer relations. Journal of the Experimental Analysis of Behavior, 51, 65-76. Dugdale, N.; Lowe, C. F. (1990). Naming and stimulus equivalence. Em D. E. Blackman e H. Lejeune (Orgs.), Behavior analysis in theory and practice: Contributions and controversies (p. 113-137). London, UK: Lawrence Erlbaum Associates. Dymond, S.; Barnes, D. (1994). A transfer of self-discrimination response functions through equivalence relations. Journal of the Experimental Analysis of Behavior, 62, 251-267. Eikeseth, S.; Smith, T. (1992). The development of functional and equivalence classes in high-functioning autistic children: The role of naming. Journal of the Experimental Analysis of Behavior, 58, 123-133. Fields, L.; Adams, B. J.; Verhave, T.; Newman, S. (1990). The effects of nodality on the formation of equivalence classes. Journal of the Experimental Analysis of Behavior, 53, 345-358. Fields, L.; Reeve, K. F.; Adams, B. J.; Verhave, T. (1991). Stimulus generalization and equivalence classes. A model for natural categories. Journal of the Experimental Analysis of Behavior, 55, 305-312. Gatch, M. B.; Osborne, J. G. (1989). Transfer of contextual stimulus function via equivalence class development. Journal of the Experimental Analysis of Behavior, 51, 369-378. Green, G. (1990). Differences in development of visual and auditory-visual equivalence relation. American Journal of Mental Retardation, 3, 260-270. Green, G.; Sigurdardottir, Z. G.; Saunders, R. R. (1991). The role of instructions in the transfer of ordinal functions through equivalence classes. Journal of the Experimental Analysis of Behavior, 55, 287-304. Hanna, E. S.; Melo, R. M.; Albuquerque, A. R. (1999). Desenvolvimento infantil e alfabetização. Em M. G. T. Paz; A. Tamayo (Orgs.), Escola, saúde e trabalho: Estudos psicológicos (pp.71-100). Brasília: Editora UnB. Harrison, R. J.; Green, G. (1990). Development of conditional and equivalence relations without differential consequences. Journal of the Experimental Analysis of Behavior, 54, 225-237. Hayes, L. J.; Tilley, K. J.; Hayes, S. C. (1988). Extending equivalence class membership to gustatory stimuli. The Psychologial Record, 38, 473-482. Horne, P. J.; Lowe, C. F. (1996). On the origins of naming and other symbolic behavior. Journal of the Experimental Analysis of Behavior, 65, 185-241. Hübner-D’Oliveira, M. M. (1990). Estudos em relações de equivalência: Uma contribuição do controle por unidades mínimas na aprendizagem de leitura com pré-escolares. Tese de Doutorado não publicada, Universidade de São Paulo, São Paulo, SP. Imam, A. A. (2001). Speed contingencies, number of stimulus presentations, and the nodality effect in equivalence class formation. Journal of the Experimental Analysis of Behavior, 76, 265-288. ANÁLISE DO COMPORTAMENTO Jonson, C.; Sidman, M (1993). Conditional discrimination and equivalence relations: Control by negative stimuli. Journal of the Experimental Analysis of Behavior, 59, 333-347. Keller, F. S.; Schoenfeld, W. N. (1974). Princípios de psicologia: Um texto sistemático na ciência do comportamento (C. M. Bori e R. Azzi, trads.). São Paulo: EPU (Obra publicada originalmente em 1950). Lazar, R. (1977). Extending sequence-class membership with matching to sample. Journal of the Experimental Analysis of Behavior, 27, 381-304. Lazar, R.; Davis-Lang, D.; Sanches, L. (1984). The formation of visual stimulus equivalences in children. Journal of the Experimental Analysis of Behavior, 41, 251-260. Lee, V. L.; Pegler, A. M. (1982). Effects on spelling of training children to read. Journal of the Experimental Analysis of Behavior, 37, 311-322. Lynch, D. C.; Cuvo, A. (1995). Stimulus equivalence instruction of fraction-decimal relations. Journal of Applied Behavior Analysis, 28, 115-126. Mackay, H. A. (1985). Stimulus equivalence in rudimentary reading and spelling. Analysis and Intervention in Developmental Disabilities, 5, 373-387. Mackay, H. A.; Sidman, M. (1984). Teaching new behavior via equivalence relations. Em P. H. Brooks, R. Sperber e C. MacCauley (Orgs.), Learning and cognition in mentally retarded (p. 493-513). Hillsdale, NJ: Erlbaum. Markham, M. R.; Dougher, M. J. (1993). Compound stimuli in emergent stimulus relations: Extending the scope of stimulus equivalence. Journal of the Experimental Analysis of Behavior, 60, 529-542. Matos, M. A.; Hübner-D´Oliveira, M. M. (1992). Equivalence relations and reading. Em S. C. Hayes e L. J. Hayes (Orgs.), Understanding verbal relations: The second and third international institutes on verbal relations (p. 83-94). Reno, NV: Context Press. McDonagh, E. C.; McIlvane, W. J.; Stoddard, L. T. (1984). Teaching coin equivalences via matching to sample. Applied Research in Mental Retardation, 5, 177-197. McIntire, K. D.; Cleary, J.; Thompson, T. (1987). Conditional relations by monkeys: Reflexivity, symmetry, and transitivity. Journal of the Experimental Analysis of Behavior, 47, 279-287. Melchiori, L. E.; de Souza, D. G.; de Rose, J. C. (1992). Aprendizagem de leitura através de um procedimento de discriminação sem erros (exclusão): Uma replicação com pré-escolares. Psicologia: Teoria e Pesquisa, 8, 101-111. Melchiori, L. E.; de Souza, D, G.; de Rose, J. C. (2000). Reading, equivalence, and recombination of units: A replication with students with different learning histories. Journal of Applied Behavior Analysis, 33, 97-100. Melo, R. M.; Hanna, E. S.; Jesus, P. S. (2002, setembro). Equivalência de estímulos e estratégias de intervenção para crianças com dificuldades na aquisição de leitura e escrita. Trabalho apresentado no XI Encontro da Associação Brasileira de Psicoterapia e Medicina Comportamental, Londrina, Paraná. Meyer, S. B. (1997). O conceito de análise funcional. Em: M. Delitti (Org.), Sobre comportamento e cognição: 263 Vol. 2. A prática da análise do comportamento e da terapia cognitivo-comportamental (p. 31-36). Santo André: ARBytes. Ministério da Educação, Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (2003). Mapa do analfabetismo no Brasil. Disponível na Internet no endereço http://www.inep.gov.br/estatisticas/analfabetismo/. Pilgrim, C.; Galizio, M. (1990). Relations between baseline contingencies and equivalence probe performances. Journal of the Experimental Analysis of Behavior, 54, 213-224. Pilgrim, C.; Galizio, M. (1995). Reversal of baseline relations and stimulus equivalence: I. Adults. Journal of the Experimental Analysis of Behavior, 63, 225-238. Prado, P. S. T. (1995). O conceito de número: Uma análise com base no paradigma de rede de relações. Dissertação de Mestrado não publicada, Universidade Federal de São Carlos, São Carlos, SP. Prado, P. S. T. (2002). Pode o paradigma de equivalência fundamentar uma compreensão comportamental do conceito de número? Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre comportamento e cognição: Vol. 10. Contribuições para a construção da teoria do comportamento (p. 271-280). Santo André: ESETec. Prado, P. S. T.; de Rose, J. C. (1999). Conceito de número: Uma contribuição da análise comportamental da cognição. Psicologia: Teoria e Pesquisa, 15, 227-235. Ribeiro, A. F. (1995). Relações de equivalência: Um novo princípio? Temas em Psicologia, 3, 59-64. Rocha, A. M. (1996). Variação da composição dos estímulos treinados e desenvolvimento de controle por unidades textuais mínimas. Dissertação de Mestrado não publicada, Universidade de Brasília, Brasília, DF. Santos, A. C. G. (1996). Aprendizagem do conceito de proporção e o paradigma de equivalência de estímulos. Dissertação de Mestrado não publicada, Universidade de Brasília, Brasília, DF. Saunders, R. R.; Green, G. (1992). The nonequivalence of behavioral and mathematical equivalence. Journal of the Experimental Analysis of Behavior, 57, 227-241. Saunders, R. R.; Saunders, K. J.; Kirby, K. C.; Spradlin, J. E. (1988). The merger and development of equivalence classes by unreinforced conditional selection of comparison stimuli. Journal of the Experimental Analysis of Behavior, 50, 145-162. Saunders, R. R.; Wachter, K. W. J.; Spradlin, J. E. (1988). Establishing auditory stimulus control over an eightmember equivalence class via conditional discrimination procedures. Journal of the Experimental Analysis of Behavior, 49, 95-115. Schusterman, R. J.; Kastak, D.; Reichmuth, C. J. (1997). What’s in a name? Equivalence by any other name would smell as sweet. Journal of the Experimental Analysis of Behavior, 68, 252-258. Sidman, M. (1971). Reading and auditory-visual equivalences. Journal of Speech and Hearing Research, 14, 4-13. Sidman, M. (1977). Teaching some basic prerequisites for reading. Em P. Mittler (Org.), Research to practice in 264 ABREU-RODRIGUES, RIBEIRO & COLS. mental retardation: Vol. 2. Education and training (p. 353-360). Baltimore, MD: University Park Press. Sidman, M. (1990). Equivalence relations: Where do they come from? Em D. E. Blackman e H. Lejeune (Orgs.), Behavior analysis in theory and practice: Contributions and controversies (p. 93-112).). London, UK: Lawrence Erlbaum Associates. Sidman, M. (1992). Equivalence relations: Some basic considerations. Em S. C. Hayes e L. J. Hayes (Orgs.), Understanding verbal relations: The second and third international institutes on verbal relations (p. 15-27). Reno, NV: Context Press. Sidman, M. (1994). Equivalence relations and behavior: A research history. Boston, MA: Authors Cooperative. Sidman, M.; Cresson, O. (1973). Reading and crossmodal transfer of stimulus equivalences in severe retardation. American Journal of Mental Deficiency, 77, 515-523. Sidman, M.; Kirk, B.; Willson-Morris, M. (1985). Sixmember stimulus classes generated by conditionaldiscrimination procedures. Journal of the Experimental Analysis of Behavior, 43, 21-42. Sidman, M.; Tailby, W. (1982). Conditional discrimination vs matching-to-sample: An expansion of the testing paradigm. Journal of the Experimental Analysis of Behavior, 37, 5-22. Sidman, M.; Willson-Morris, M.; Kirk, B. (1986). Matching-to-sample procedures and the development of equivalence relations: The role of naming. Analysis and Intervention in Developmental Disabilities, 6, 1-19. Sigurdardottir, Z. G.; Green, G.; Saunders, R. R. (1990). Equivalence classes generated by sequence training. Journal of the Experimental Analysis of Behavior, 53, 47-63. Skinner, B. F. (1957). Verbal behavior. Englewood Cliffs, NJ: Prentice-Hall. Stromer, R. Mackay, H. A.; Stoddard, L. T. (1992). Classroom applications of stimulus equivalence technology. Journal of Behavioral Education, 2, 225-256. Stromer, R.; McIlvane, W. J.; Serna, R. W. (1993). Complex stimulus control and equivalence. The Psychological Record, 43, 585-598. Stromer, R.; Stromer, J. B. (1990a). The formation of arbitrary stimulus classes in matching to complex samples. The Psychological Record, 40, 51-66. Stromer, R.; Stromer, J. B. (1990b). Matching to complex samples: Further study of arbitrary stimulus classes. The Psychological Record, 40, 505-516. Stromer, R.; Stromer, J. B. (1992). Formation of arbitrary stimulus classes in matching to complex samples: Supplementary data. Perceptual and Motor Skills, 75, 505-506. Tierney, K.; Bracken, M. (1998). Stimulus equivalence and behavior therapy. Em O’Donohue, W. (Org.), Learning and behavior therapy (p. 392-402). Boston: Allyn e Bacon. Watt, A.; Keenan, M.; Barnes, D.; Cairns, E. (1991). Social categorization and stimulus equivalence. The Psychological Record, 41, 33-50. Wulfert, E.; Hayes, S. C. (1988). Transfer of a conditional ordering response through conditional equivalence classes. Journal of the Experimental Analysis of Behavior, 50, 125-144. Zentall, T. R.; Smeets, P. M. (1996). Stimulus class formation in humans and animals. Amsterdam: Elsevier Science B. V. ANÁLISE DO COMPORTAMENTO COMPORTAMENTO SOCIAL: COOPERAÇÃO, COMPETIÇÃO E TRABALHO INDIVIDUAL 265 15 ANA KARINA CURADO RANGEL DE-FARIAS A Psicologia tem sido marcada por uma divergência de explicações ou de atribuições de causalidade, divergência esta que pode ser ilustrada pelos estudos desenvolvidos por psicólogos sociais em comparação com estudos desenvolvidos por analistas do comportamento. Os estudos realizados na área de Psicologia Social têm privilegiado abordagens internalistas ou mediacionais, explicando o comportamento de indivíduos em grupo com base em variáveis intrínsecas aos indivíduos, tais como variáveis emocionais e/ou intelectuais, e características de personalidade (Lana, 1994). Essa prática é refletida na definição comumente apontada para Psicologia Social (Atkinson et al., 1995, p. 554): A Psicologia Social é o estudo de como as pessoas percebem, pensam e se sentem sobre seu mundo social e como interagem e influenciam umas às outras. Como formamos impressões sobre outras pessoas, interpretamos seus comportamentos ou inferimos seus motivos? Como nossas crenças e atitudes sociais são formadas e mudadas? O que determina com quem simpatizamos ou antipatizamos? Como respondemos a diferentes espécies de influência social? Como os grupos de indivíduos tomam decisões? Como o preconceito e os conflitos entre grupos podem ser reduzidos? Assim, crenças, expectativas e atitudes estariam entre as causas dos comportamentos publicamente observáveis. A atribuição de causalidade determina o modo pelo qual os cientistas investigarão seu objeto de estudo. Doise (2002) refere-se a três tipos de pesquisadores em Psicologia Social: contrucionistas radicais, analistas do discurso e cognitivistas sociais. Os dois primeiros demonstram uma clara recusa à utilização de quantificação e variáveis experimentais. Os cognitivistas sociais, por sua vez, fazem uso de quantificação e de experimentação, explicando o comportamento com base em estruturas cognitivas, tais como “esquemas inferenciais” (Lana, 1994). Doise (2002), portanto, não engloba os analistas do comportamento como pesquisadores em Psicologia Social. Isso pode decorrer de uma crítica freqüente, segundo a qual a Análise Experimental do Comportamento (AEC) explicaria apenas fenômenos simples, não abarcando a complexidade inerente aos fenômenos sociais. Essa complexidade dever-se-ia, em parte, às características intrínsecas dos objetos sociais. Entretanto Guerin (1994) aponta que não há nada de intrinsecamente diferente entre objetos sociais e não-sociais: os primeiros seriam mais dinâmicos e interativos apenas devido às contingências ambientais das quais fazem parte. Desse modo, a abordagem analítico-comportamental explica o comportamento social por meio de uma análise funcional das contingências de reforçamento e punição às quais os indivíduos estão expostos. Em outras palavras, a AEC investiga relações organismo-ambiente, incluindo-se aqui não somente os comportamentos individuais aprendidos por meio de exposição direta às contingências, instruções verbais ou modelação, mas também os comportamentos emitidos pelos indivíduos 266 ABREU-RODRIGUES, RIBEIRO & COLS. em grupo (Costa, 2000; Guerin, 1992; Matos, 1997; Todorov, 1989). Contingências sociais são caracterizadas pela dinamicidade e pela flexibilidade tendo em vista que: a) as interações sociais são breves; b) as conseqüências liberadas durante essas interações mudam freqüentemente (p. ex.: pessoas diferentes conseqüenciarão diferentemente um mesmo comportamento); c) a mera presença de um novo organismo pode modificá-las; d) várias contingências estão disponíveis simultaneamente; e) são mais freqüentemente de quatro ou cinco termos (ampliando o nível de exigência sobre a análise dos estímulos antecedentes ao comportamento). Portanto, a diferença entre contingências sociais e não-sociais seria de quantidade ou complexidade, e não de qualidade. O fato de o reforço social ser um processo usualmente intermitente e generalizado, o que dificulta sua observação, não significa que o comportamento social deva-se a fatores distintos daqueles investigados pelos analistas do comportamento (Guerin, 1992; Schmitt, 1984). A Psicologia Social tem enfatizado o estudo do contexto em que o comportamento social ocorre (variáveis antecedentes), denominando-o de variáveis informativas, em detrimento do estudo dos efeitos das conseqüências desse comportamento. Atkinson e colaboradores (1995), por exemplo, afirmam ser necessário entender o poder da situação (antecedente) e a interpretação da situação (variável cognitiva) para se conhecer os determinantes do comportamento social. Esse poder da situação e a denominada influência social poderiam ser entendidos como controle de estímulos e, desse modo, os métodos de observação e de análise de dados utilizados por analistas do comportamento seriam de grande valia ao estudo do comportamento social (Guerin, 1994; Weatherly, Miller e McDonald, 1999). Quando psicólogos sociais referem-se às conseqüências, denominam-nas de influências normativas, dando um menor valor explicativo às mesmas. Estudos típicos da Psicologia Social, que consistem em breves episódios de observação e, muitas vezes, utilizam-se de jogos invariáveis (aqueles que aceitam apenas uma resposta como correta), não conseguem analisar satisfatoriamente os efeitos que as conseqüências sociais generalizadas (p. ex.:, aprovação e afeto, atenção e contato, crítica e rejeição) têm sobre a probabilidade futura de emissão dos comportamentos e, por isso, mascaram o verdadeiro valor explicativo do ambiente externo (Guerin, 1994; Shaw, 1976). O que é necessário, segundo Guerin (1992; 1994), é o desenvolvimento de metodologias que possibilitem uma análise mais exaustiva das variáveis controladoras do comportamento social, demonstrando o papel das conseqüências ambientais na seleção e na manutenção desses comportamentos (ver também Vollmer e Hackenberg, 2001). A AEC estaria em uma posição privilegiada para realizar esse estudo, tendo em vista que seus métodos permitem o reconhecimento e a modificação das conseqüências ambientais. Este capítulo não tem por objetivo realizar uma análise exaustiva sobre a Psicologia Social tal como se apresenta atualmente, mas apresentar uma análise de alguns fenômenos sociais a partir do modelo analítico-comportamental. Portanto, apresentará a definição proposta por analistas do comportamento para o comportamento social, a metodologia utilizada e alguns estudos desenvolvidos na área, concluindo com uma discussão acerca das vantagens da utilização da Análise Experimental do Comportamento (tanto em nível filosófico e teórico quanto no que se refere à realização de experimentos controlados em laboratório) para a Psicologia Social. DEFINIÇÃO DE COMPORTAMENTO SOCIAL Os analistas do comportamento apontam que o contato dos organismos com seu ambiente pode ser estabelecido de forma direta (quando o organismo atua sobre o ambiente e obtém conseqüências diretas dessa ação, como, ANÁLISE DO COMPORTAMENTO por exemplo, ao se levantar e fechar uma janela) ou por meio de uma mediação realizada pelo comportamento de outro organismo (como, por exemplo, quando o indivíduo pede para que outra pessoa feche a janela e tem como conseqüência a janela fechada). Essa mediação caracteriza o comportamento como social (Skinner, 1957/1978; Vargas, 1988). O comportamento social é, então, definido como uma situação na qual a emissão e/ou o reforçamento do comportamento de um organismo depende, ao menos parcialmente, do comportamento de outro(s) organismo(s). O comportamento de um organismo pode, portanto, funcionar como operação estabelecedora, estímulo discriminativo e/ou estímulo reforçador para o comportamento de outro organismo (Baum, 1994/1999; Buskist e Morgan, 1987; Guerin, 1994; Hake e Vukelich, 1972; Hake, Vukelich e Olvera, 1975; Keller e Schoenfeld, 1950/ 1971; Schmitt, 1984; Skinner, 1953/1989). Nas interações sociais que objetivam a execução de tarefas (como a elaboração de um projeto de pesquisa), diversos tipos de relações podem ser observados entre os indivíduos participantes, incluindo relações de cooperação e de competição. Relações cooperativas são caracterizadas por “reforçamento mútuo”, de modo que todos os indivíduos recebem reforços se o desempenho do grupo atingir um critério específico. Os reforços podem ser liberados de forma eqüitativa ou não-eqüitativa entre os membros do grupo. Assim, dois professores podem trabalhar juntos na elaboração de um projeto de pesquisa, sendo ambos beneficiados (similarmente ou não) caso o projeto seja aprovado pela agência de fomento. No caso de relações competitivas, a distribuição de reforços é desigual e excludente, dependendo do desempenho relativo dos indivíduos, isto é, a liberação de reforços para um indivíduo limita ou mesmo anula a obtenção de reforços pelos demais indivíduos. Desse modo, os mesmos dois professores podem optar por escreverem um projeto de pesquisa separadamente, sendo que apenas um deles receberá o financiamento – aquele cujo projeto for tido como mais relevante e/ou tenha sido entregue primeiramente. Nas contingências descritas, os reforços são interdependentes, ou seja, os reforços ob- 267 tidos por um indivíduo são, ao menos parcialmente, dependentes do comportamento de outro indivíduo, no entanto os indivíduos, muitas vezes, podem optar por um trabalho individual. No exemplo anteriormente utilizado, cada professor escreveria seu projeto e receberia seu próprio financiamento, independentemente do financiamento para os demais projetos. Nesse caso, há uma independência de respostas e reforços entre os organismos: todos os organismos que alcancem o critério preestabelecido para reforçamento terão seus comportamentos reforçados (Buskist e Morgan, 1987; Hake e Vukelich, 1972, 1973; Schmitt, 1984; 1987; 1998). Schmitt (1987) e Shimoff e Matthews (1975) apontam que a escolha entre alternativas de cooperação, competição e trabalho individual é típica em nosso dia-a-dia, ou seja, um indivíduo muitas vezes pode optar por realizar uma determinada tarefa de forma dependente ou independente. Cabe, então, ao analista do comportamento investigar as variáveis ambientais que influenciam essa escolha. Algumas dessas variáveis serão discutidas a seguir. CONTRIBUIÇÕES DA PESQUISA BÁSICA Estudos realizados pela AEC têm demonstrado que o comportamento social, assim como o comportamento individual, é determinado por variáveis ambientais. Dentre as variáveis que afetam a escolha entre cooperar, competir e trabalhar individualmente, pode-se citar a magnitude do reforço (p. ex.: Mithaug, 1969), a história de exposição a esquemas de reforçamento (Buskist e Morgan, 1987; Mithaug, 1969), a possibilidade de retirar reforços do parceiro e/ou o risco de perder os reforços acumulados (Schmitt, 1976; 1984; 1987; Schmitt e Marwell, 1971a; 1971b; 1972), o sucesso ou fracasso na competição (Schmitt, 1976; 1987), o custo da resposta (Hake e Vukelich, 1973; Hake, Olvera, e Bell, 1975; Olvera e Hake, 1976; Schmitt, 1976), o uso de instruções referentes ao contexto social (Abreu-Rodrigues, Natalino e Aló, 2002; Buskist et al., 1984; Buskist e Morgan, 1987; de Farias, 2001; Dougherty e 268 ABREU-RODRIGUES, RIBEIRO & COLS. Cherek, 1994; Matthews, 1979), e a iniqüidade entre os reforços obtidos pelos participantes (Abreu-Rodrigues et al., 2002; de-Farias, 2001; Dougherty e Cherek, 1994; Matthews, 1977; 1979; Schmitt e Marwell, 1972; Schmitt, 1998; Shimoff e Matthews, 1975; Weingold e Webster, 1964). A seguir, serão apresentadas algumas investigações sobre os efeitos dessas variáveis de controle sobre a escolha entre contingências sociais, com o intuito de ilustrar a determinação ambiental do comportamento social. Magnitude do reforço Um dos primeiros estudos sobre escolha entre contingência de cooperação e contingência individual foi realizado por Mithaug (1969). Doze crianças, divididas em grupos de três, tinham a tarefa de pressionar as teclas de um piano, a qual podia ser executada cooperativa ou individualmente. Na contingência de cooperação, o reforço (pontos) era liberado sempre que uma determinada tecla era pressionada pelos três membros do grupo, com um tempo entre respostas igual ou inferior a meio segundo; na contingência individual, o reforço poderia ser obtido separadamente por cada membro da tríade, caso este pressionasse a tecla correta. Os participantes foram instruídos de que sua tarefa consistia em acumular pontos, pressionando qualquer tecla o mais rápido possível e quantas vezes fosse necessário para completar a tentativa. O Experimento 1 compreendia duas condições, apresentadas de acordo com um delineamento ABA. Na condição A, a magnitude do reforço era a mesma para as respostas cooperativa e individual (razão 1:1) e, na condição B, era 10 vezes maior para a resposta cooperativa em relação à resposta individual (razão 10:1). Os resultados indicaram preferência pela tarefa individual, apesar das manipulações na magnitude do reforço (ver também Mithaug e Burgess, 1967; 1968). O Experimento 2 investigou a possibilidade de que uma diferença mais acentuada na magnitude do reforço para cada alternativa e um maior tempo de exposição a essa diferença contribuíssem para aumentar a preferência pela cooperação. Todos os grupos foram inicialmente expostos à Condição A, em que a magnitude do reforço para a resposta cooperativa era 100 vezes maior do que para a resposta individual (razão 100:1). Em seguida, os grupos foram expostos à Condição B, em que as magnitudes eram iguais (razão 1:1) e, depois, retornaram à Condição A. Os resultados mostraram que, na Condição A, os participantes inicialmente preferiam a situação individual, mas, com a exposição prolongada às diferentes magnitudes, mudavam sua preferência para cooperação. Na condição B, a preferência pela contingência individual foi restabelecida, porém, na reapresentação da Condição A, os participantes prontamente passaram a preferir a alternativa de cooperação. História de reforçamento A história de exposição a esquemas de reforçamento pode ser apontada como outra variável que afeta o desempenho dos indivíduos, como foi demonstrado nos experimentos subseqüentes desenvolvidos por Mithaug (1969). O autor efetuou manipulações adicionais na razão da magnitude do reforço para cooperação em relação ao trabalho individual (100:1, 50:1, 25:1, 10:1, 5:1, 3:1, 1:1). Essas razões foram apresentadas, inicialmente, em ordem decrescente e, em seguida, em ordem aleatória, ou vice-versa. Os resultados indicaram que a ordem de apresentação das razões afetou a escolha entre o trabalho cooperativo e o individual. Quando os participantes foram expostos à seqüência decrescente de razões, uma preferência pela tarefa de cooperação foi observada para todos os valores, com exceção de 3:1 e 1:1. Quando as razões foram apresentadas randomicamente, resultados diferentes foram obtidos: se os participantes tinham sido expostos previamente à seqüência decrescente, a preferência por cooperação, anteriormente observada, era mantida; mas, se os participantes não tinham experiência prévia com a ordem decrescente de razões, era observada a preferência pela tarefa individual para todas as razões utilizadas (mesmo com 100:1). O ANÁLISE DO COMPORTAMENTO autor concluiu que o controle discriminativo exercido por contingências de trabalho cooperativo e individual pode ser estabelecido mais prontamente quando diferentes razões de reforços são apresentadas em ordem decrescente do que em ordem randômica. Essa variável também foi investigada com relação ao comportamento competitivo. No estudo desenvolvido por Buskist e Morgan (1987), os indivíduos foram expostos a esquemas de intervalo fixo (FI), nos quais o reforço era contingente à primeira resposta emitida após a passagem do intervalo. No Experimento 1, dois pares de participantes foram individualmente treinados em três diferentes valores de intervalo (FI 30, 60 e 90 s, sinalizados por diferentes estímulos luminosos) e, então, expostos a um esquema FI competitivo, no qual apenas o primeiro participante a responder ao final do intervalo recebia o reforço. Os participantes eram informados da mudança na contingência por meio de instruções na tela do computador. A mudança para o esquema competitivo produziu aumentos na taxa de respostas, apesar da freqüência de reforços. O objetivo do Experimento 2 (Buskist e Morgan, 1987) foi o de verificar se a história de exposição a diferentes esquemas de reforçamento afetaria os resultados obtidos no primeiro experimento. Quatro novos pares de participantes foram inicialmente treinados em um esquema FI 30 s não-competitivo, sendo posteriormente expostos a um esquema FI 30 s competitivo (quando o aumento na taxa foi novamente observado). Em seguida, dois pares foram expostos a um esquema de razão fixa (FR 50) não-competitivo (ou seja, os reforços seriam liberados independentemente para cada participante do par após a 50a resposta) e dois outros pares foram expostos a um esquema de reforçamento diferencial de taxas baixas (DRL 10 s) não-competitivo (ou seja, os reforços seriam liberados independentemente para cada participante do par se a resposta ocorresse 10 s após a emissão da resposta anterior). Por fim, esses quatro pares retornaram ao esquema FI 30 s competitivo. Os resultados indicaram um efeito da história de reforçamento em esquemas alternativos: os participantes treinados no esquema FR apresentaram um aumento na taxa 269 de respostas nas primeiras tentativas da segunda exposição ao esquema competitivo em relação à primeira exposição; já os participantes treinados no esquema DRL ap