Universidade Católica de Goiás Pró-Reitoria de Pós-Graduação e Pesquisa Mestrado em Psicologia Efeitos de Arranjos Experimentais sobre a Sensibilidade/Insensibilidade a Esquemas de Reforçamento Sandra de Araújo Álvares Goiânia Março de 2006 ii Universidade Católica de Goiás Pró-Reitoria de Pós-Graduação e Pesquisa Mestrado em Psicologia Efeitos de Arranjos Experimentais sobre a Sensibilidade/Insensibilidade a Esquemas de Reforçamento Sandra de Araújo Álvares Dissertação apresentada ao Curso de Mestrado em Psicologia da Universidade Católica de Goiás como requisito parcial à obtenção do grau de Mestre em Psicologia. Orientador: Prof. Dr. Lorismário Ernesto Simonassi Goiânia Março de 2006 iii Agradecimentos Ao professor Lorismário, por ter-me aceito como orientanda e pelas prestimosas contribuições a esse trabalho. Aos professores Sônia Mello e Dwain Santee pelas contribuições apontadas durante o momento de qualificação. Aos professores Carla Paracampo, Sônia Mello e Lauro Lalini por terem aceito participar da Banca de Defesa. Ao professor Márcio Barreto, por quem terei eterna gratidão pela confiança em mim depositada e pelo importante apoio para o início da minha carreira em docência. Ao professor Luc Vandenbergh, por quem tenho o mais profundo respeito e admiração. Agradeço-lhe pela compreensão quanto às mudanças de decisão que tomei ao longo do curso de mestrado. A todos os professores do curso de graduação em Psicologia e do Mestrado em Psicologia da UCG que contribuíram para meu crescimento profissional e pessoal. Aos participantes do presente trabalho. À amiga e companheira Michele, a quem agradeço pelos momentos de desabafo e descontração. Ao meu amado sobrinho Gustavo, sempre fonte de esperança e alegria. Ao meu amor, José Ramos, pelo apoio, paciência e carinho nos momentos difíceis. Especialmente a meus pais, sem os quais a realização desse grande sonho não seria possível. Devo a eles toda minha formação! iv Resumo Vários são os aspectos apontados como passíveis de influenciarem a sensibilidade de desempenhos humanos a esquemas de reforçamento. A fim de avaliar alguns desses aspectos, o presente estudo submeteu participantes à tarefa de tocar um círculo central que aparecia na tela do computador de acordo com um esquema de RF (Razão Fixa) ou DRL (Reforçamento Diferencial de Baixas Taxas). Cada esquema vigorava por três minutos; a troca entre eles não era sinalizada e nem instruída. Respostas corretas produziam pontos trocáveis por dinheiro. O Experimento 1 teve por objetivo verificar se o arranjo de conseqüências aversivas (perda de pontos) para comportamentos inconsistentes com o esquema em vigor resultaria em aumento da sensibilidade comportamental a tal esquema. Para tanto, seis participantes foram submetidos a quatro fases experimentais: A (RF 18), B (DRL 6 seg.), C (RF 18) e D (DRL 6 seg. + punição). Os resultados sugeriram que aspectos relacionados a um fortalecimento das contingências em vigor – representado no presente experimento pela inserção da punição na fase D – devem ser considerados como relevantes em uma discussão sobre sensibilidade/insensibilidade comportamental. O Experimento 2 objetivou verificar se a exposição prévia a uma condição que favorecesse o contato com o esquema em vigor seria suficiente para estabelecer responder adequado em uma fase posterior, com sinais claros de discriminação do esquema em vigor. Quatro participantes foram submetidos às seguintes fases experimentais: A (RF 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.). Os resultados evidenciaram que os desempenhos sensíveis atingidos durante a fase D, mantiveram-se durante a fase F, demonstrando os efeitos da punição não só em gerar ou intensificar padrões sensíveis de desempenho aos esquemas programados, como também, em manter tais padrões em situações posteriores e similares. Palavras-chave: controle instrucional, desempenho, esquemas de reforçamento, insensibilidade, sensibilidade, punição. v Abstract Various aspects are pointed out as possible influences on human sensibility to performance on reinforcement schedules. This study evaluates some of these aspects by submitting participants to a the task of touching a circle that appeared on a computed screen, according to a Fixed Ratio (FR) or a Low-rate Differential Reinforcement (LDR) reinforcement schedule. Each schedule was effective for three minutes and the change between them was neither signaled nor instructed. Correct responses produced points that could be exchanged for money. Experiment 1 verified if the arrangement of aversive consequences (loss of points) to behaviors inconsistent with the schedule would result in an increase in behavioral sensibility to this schedule. Six subjects were submitted to four experimental phases: A (FR 18), B (LDR 6 sec.), C (FR 18) and D (LDR 6 sec. + punishment). The results suggest that aspects pertaining to the strengthening of ongoing contingencies – here represented by the insertion of punishment in phase D – should be considered relevant in the discussion about behavioral sensibility/insensibility. Experiment 2 verified if the previous exposure to one condition that favors the contact with the ongoing schedule would be sufficient to establish adequate responding in a latter phase with clear signs of discrimination of the ongoing phase. Four participants ere submitted to the following phases: A (RF 18), B (LDR 6 sec.), C (FR 18), D (LDR 6 sec + punishment), E (FR 18) and F (LDR 6 sec.). Results show that the sensitive performances affected during phase D were sustained during phase F, showing that punishment not only generated sensitive performance patterns in relation to the programmed schedules, but also in maintaining such patterns in latter similar situations. Keywords: instructional control, performance, reinforcement schedules, insensitivity, sensitivity, punishment. vi Lista de Figuras Figura 1 – Tela apresentada ao participante para respostas............................................ 40 Figura 2 – Médias do número de respostas das três últimas sessões das fases experimentais A (RF 18), B (DRL 6 seg.), C (RF 18) e D (DRL 6 seg. + punição) para os participantes P1, P2, P3, P4, P5 e P6 ................................................................ 56 Figura 3 – Médias do número de respostas das três últimas sessões das fases experimentais A (RF 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.) para os participantes P7, P8, P9 e P10 ................................. 78 vii Lista de Tabelas Tabela 1 – Fases experimentais, esquema de reforçamento, conseqüenciação de respostas e número de sessões aos quais cada participante foi submetido durante o Experimento 1 ................................................................................................................ 39 Tabela 2 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P1 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 44 Tabela 3 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P2 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 46 Tabela 4 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P3 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 48 Tabela 5 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P4 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 50 Tabela 6 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P5 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 52 Tabela 7 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P6 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 53 viii Tabela 8 – Fases experimentais, esquema de reforçamento, conseqüenciação de respostas e número de sessões aos quais cada participante foi submetido durante o Experimento 2 ................................................................................................................ 69 Tabela 9 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P7 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 70 Tabela 10 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P8 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 72 Tabela 11 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P9 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto............................................................ 74 Tabela 12 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P10 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto....................................................... 76 ix Sumário Resumo .......................................................................................................................... iv Abstract......................................................................................................................... v Lista de Figuras ............................................................................................................ vi Lista de Tabelas............................................................................................................ vii Introdução..................................................................................................................... 01 1.1. Grau de contato com a contingência em vigor............................................... 04 1.2. Persistência do controle instrucional mesmo diante do contato com discrepância entre instruções e o desempenho............................................... 08 1.3. Conteúdo das instruções................................................................................ 14 1.4. Variabilidade comportamental ...................................................................... 16 1.5. História de reforçamento............................................................................... 19 1.6. Efeitos de relatos verbais modelados ou instruídos sobre o responder não verbal.............................................................................................................. 21 1.7. Aumento do controle discriminativo das contingências programadas.......... 23 1.8. Grau de discriminabilidade dos esquemas em vigor..................................... 27 1.9. Auto-regras.................................................................................................... 31 Objetivos ....................................................................................................................... 34 Método........................................................................................................................... 36 Experimento I........................................................................................................ 36 Participantes ................................................................................................. 36 Equipamentos............................................................................................... 36 Procedimentos .............................................................................................. 37 Resultados .................................................................................................... 43 Discussão ..................................................................................................... 64 Experimento II ...................................................................................................... 67 Participantes ................................................................................................. 67 Equipamentos............................................................................................... 67 Procedimentos .............................................................................................. 67 Resultados .................................................................................................... 69 Discussão ..................................................................................................... 82 Discussão Geral ............................................................................................................ 85 Referências Bibliográficas ........................................................................................... 90 Anexo 1 – Termo de Consentimento Livre e Esclarecido......................................... 101 1 Introdução Regras foram definidas por Skinner (1966, 1969) como estímulos discriminativos especificadores de contingências, isto é, estímulos que podem especificar o comportamento a ser emitido, as condições sob as quais deve ocorrer e suas prováveis conseqüências (Ver também as posições de Albuquerque, 2001; Catania, 1989; Glenn, 1987; Kerr & Keenan, 1997; Schlinger & Blakely, 1987). O comportamento controlado por esse tipo de descrição é conhecido como comportamento governado por regras. Já o comportamento estabelecido e mantido pelas conseqüências naturais do ambiente é definido como comportamento modelado por contingências. Dessa forma, tanto regras quanto contingências podem ser eficazes em estabelecer novos padrões comportamentais, a despeito de representarem variáveis controladoras distintas. Tem sido confirmado por diversos estudos de pesquisa básica que as regras podem facilitar a aquisição de novos comportamentos, principalmente quando as contingências são fracas, complexas, ambíguas ou imprecisas (Baum, 1999; Castanheira, 2001; Catania, Shimoff & Matthews, 1989; Matos, 2001; Nico, 1999; Paracampo, 1991), antes mesmo que tais comportamentos mantenham contato com suas conseqüências imediatas (Albuquerque, de Souza, Matos & Paracampo, 2003). No entanto, um dos resultados mais proeminentes e polêmicos de tais pesquisas tem sido a constatação de que as regras podem levar a uma rejeição das contingências programadas, isto é, levar a uma redução na sensibilidade comportamental às contingências (Kaufman, Baron & Kopp, 1966; Madden, Chase & Joyce, 1998; Meyer, 2005; Skinner, 1969). Este último resultado é interpretado por alguns autores como uma limitação do controle por reforçamento em humanos. 2 O comportamento sensível seria aquele que muda sistematicamente acompanhando mudanças nas contingências de reforço, isto é, se o comportamento muda sempre que a contingência muda, então o comportamento é considerado como sensível às suas conseqüências. Por outro lado, se o comportamento persiste a despeito de mudanças nas contingências, então o comportamento é considerado insensível às suas conseqüências (Catania, Matthews & Shimoff, 1982; Dermer & Rodgers, 1997; Galizio, 1979; Hackenberg & Joker, 1994; Hayes, Brownstein, Haas & Greenway, 1986a; Hayes, Brownstein, Zettle, Rosenfarb & Korn, 1986b; Kaufman, Baron & Kopp, 1966; Madden, Chase & Joyce, 1998; Matthews, Catania & Shimoff, 1985; Matthews, Shimoff, Catania & Sagvolden, 1977; Shimoff, Catania & Matthews, 1981; Shimoff, Matthews & Catania, 1986; Torgrud & Holborn, 1990). Tal definição de sensibilidade é, portanto, baseada em uma comparação intra-sujeito (Madden, Chase & Joyce, 1998). Considerando que só se pode ter certeza de que o comportamento é controlado por regras ou contingências quando essas variáveis são contrastadas (Catania, Matthews & Shimoff, 1990), um procedimento muito utilizado para avaliar o controle exercido por regras sobre o comportamento humano consiste, em geral, em apresentar ao participante uma instrução que descreve o desempenho apropriado a um determinado esquema de reforçamento e, em seguida, expor o participante ao esquema descrito na instrução. Passado um certo tempo realizando a tarefa (como, por exemplo, pressionar uma chave e obter pontos trocáveis por dinheiro), o esquema é alterado sem que nenhuma informação adicional seja fornecida ao participante. Observa-se, então, se após a mudança do esquema, o participante muda seu padrão de respostas acompanhando as mudanças nas contingências programadas, ou se mantém o padrão anteriormente estabelecido via instrução. No primeiro caso, 3 diz-se que o comportamento é controlado pelas contingências, e no segundo, que é controlado por regras (Albuquerque, 1998; Baron & Galizio, 1983). Enquanto alguns pesquisadores argumentam que as instruções tornam o responder do sujeito insensível às contingências do esquema (Harzem, Lowe, & Bagshaw, 1978) e que a insensibilidade seria uma característica definidora das instruções (Matthews e cols., 1977; Shimoff e cols., 1981), outros estudos sugerem que o controle instrucional é uma função de sua correlação com as contingências de reforçamento (Ayllon & Azrin, 1964; Buskist & Miller, 1986; Danforth, Chase, Dolan & Joyce, 1990; Galizio, 1979), com contingências fracas (Cerutti, 1989), ou com falta de controle pelas contingências (Torgrud & Holborn, 1990) e, ainda, que as instruções seriam seguidas a menos que o responder do sujeito contactasse com contingências incongruentes (Albuquerque, Paracampo & Albuquerque, 2004; Baron & Galizio, 1983; Buskist & Miller, 1986; Galizio, 1979; Paracampo, Albuquerque & Fontes, 1993; Weiner, 1970). Esses estudos, em conjunto com aqueles que têm investigado os efeitos de auto-regras (Catania e cols., 1989; Perone, 1988; Pouthas, Droit, Jacquet & Wearden, 1990; Rosenfarb, Newland, Brannon & Howey, 1992; Shimoff, 1986) têm contribuído para identificar algumas das variáveis envolvidas na sensibilidade do comportamento não verbal humano às contingências de reforçamento. O que se observa recentemente é que vários estudos vêm apontando para o fato de que a redução na sensibilidade comportamental às contingências em vigor não pode e nem deve ser considerada uma característica inerente do controle instrucional, visto que tal redução pode ser ocasionada por uma série de aspectos variados. 4 Serão apresentados na seqüência, alguns estudos que apontam variáveis outras, além do controle instrucional, que devem ser consideradas numa discussão mais precisa sobre sensibilidade/insensibilidade comportamental. As variáveis destacadas são parcialmente baseadas na descrição feita por Abreu-Rodrigues e Sanabio (no prelo) e consistem numa discussão sobre 1) grau de contato com a contingência em vigor; 2) persistência do controle instrucional mesmo diante do contato com a discrepância entre instruções e desempenhos; 3) conteúdos das instruções; 4) variabilidade comportamental; 5) história de reforçamento; 6) efeitos de relatos verbais modelados ou instruídos sobre o responder não verbal; 7) aumento do controle discriminativo das contingências programadas; 8) grau de discriminabilidade dos esquemas em vigor e 9) auto-regras. 1.1. Grau de contato com a contingência em vigor Galizio (1979) defendia a idéia de que se instruções fossem apresentadas em um ambiente experimental onde levassem a perda de reforçamento, então uma eliminação do seguir instruções deveria ocorrer. A pesquisa desenvolvida por esse autor consistiu em uma tentativa de examinar essa predição usando uma linha-debase de esquiva com perda de dinheiro como evento aversivo. No Experimento 1 o papel de instruções acuradas foi avaliado. Para tanto, desempenhos gerados por um esquema múltiplo simples foram comparados com desempenhos quando instruções acuradas foram acrescentadas. Seis estudantes universitários participaram. O aparato experimental consistiu em uma mesa contendo um painel vertical com uma alavanca manipulável e um arranjo de seis luzes coloridas. A luz verde da esquerda indicava quando uma sessão estava em progresso e a luz vermelha da direita servia como um sinal de perda de 5 dinheiro. As outras quatro luzes eram âmbar e serviam como estímulos discriminativo e instrucional para os componentes do esquema múltiplo. Havia a possibilidade de se colocar um rótulo com instrução (“10 seg”, “30 seg”, “60 seg” ou “SEM PERDA”) acima de cada uma dessas quatro luzes. A resposta de esquiva consistia em girar a alavanca 45º para a direita a fim de adiar a apresentação da luz vermelha. O esquema completo era composto de três esquemas de esquiva de 12,5 minutos, cada um com um intervalo de perda de resposta diferente (10, 30 ou 60 segundos), e um quarto componente de 12,5 minutos no qual nenhuma perda foi programada. Quatro dos seis sujeitos foram inicialmente expostos aos esquemas sem nenhuma instrução. Na fase seguinte do experimento, rótulos com instruções foram adicionados aos esquemas múltiplos. Na última fase, as luzes e os componentes foram misturados e os rótulos com instruções retirados. O procedimento para os dois sujeitos restantes foi o mesmo, exceto que foram inicialmente expostos a uma condição com instruções adicionadas aos esquemas múltiplos. Posteriormente, os estímulos foram misturados e as instruções retiradas. Os resultados da primeira fase envolvendo os quatro sujeitos mostraram que, sem instruções, somente um sujeito foi capaz de discriminar dentre os quatro componentes do esquema múltiplo. Quando os rótulos com instruções foram adicionados, os três sujeitos que não haviam previamente demonstrado controle discriminativo completo passaram a discriminar dentre os componentes do esquema total. Para dois dos três sujeitos que foram submetidos à última fase, pôde-se verificar que suas taxas de respostas permaneceram praticamente idênticas em relação à fase anterior. No entanto, um dos sujeitos pareceu inalterado pela 6 exposição prévia às instruções, pois, após estas terem sido retiradas, suas taxas retornaram àquelas observadas na exposição inicial. Os outros dois sujeitos que foram primeiramente treinados com instruções e só posteriormente foram submetidos à condição de nenhuma instrução permitiram uma análise adicional dos efeitos destas. Já na fase com instruções a aquisição da resposta de esquiva foi rápida e o controle instrucional desenvolveu-se para os dois sujeitos. Quando na fase posterior os esquemas tiveram suas posições trocadas e as instruções foram retiradas, somente um dos sujeitos adquiriu rapidamente as novas discriminações, enquanto o outro sujeito demonstrou estar sob controle exclusivo de instruções. De uma forma geral, pode-se afirmar que as instruções que especificavam qual responder afetava a liberação de perdas foram suficientes para induzir esquiva regular quase que imediatamente para todos os sujeitos. Esses resultados mostram pobre controle de esquemas sem instruções e taxas mais diferenciadas quando as mesmas são adicionadas, ilustrando, dessa forma, o controle que as instruções podem exercer sob o comportamento operante humano (ver também Ayllon & Azrin, 1964; Danforth, Chase, Dolan & Joyce, 1990; Vaughan, 1985, Experimento I, para uma análise dos efeitos facilitadores das instruções no processo de aquisição de novos repertórios). O Experimento 2 avaliou os efeitos de instruções imprecisas. Os sujeitos foram estudados sob condições onde o comportamento evocado por instruções imprecisas levava a uma perda programada (condição contato) ou a nenhuma conseqüência aversiva (condição sem contato). Na condição sem contato, o esquema completo do Experimento 1 foi transformado em um esquema sem perdas em todos os quatro componentes, embora 7 os estímulos discriminativos (luzes) e instrucionais (rótulos) tenham permanecido os mesmos. As instruções eram inacuradas sob essas condições, mas os sujeitos que continuaram a segui-las não entraram em contato com a discrepância. Já na condição contato, um esquema de esquiva com um intervalo de perda de resposta de 10 segundos foi programado para todos os quatro componentes. Neste caso, o seguir instruções levava a perdas. Participaram quatro sujeitos que já haviam participado do Experimento 1. O procedimento foi iniciado com a última condição do Experimento 1, mantendo a contingência de esquiva com os quatro componentes de 10, 30, 60 segundos e sem perda com suas respectivas instruções acuradas. Após essa fase seguiu-se a condição sem contato onde a programação de perdas foi retirada, mas as luzes e os rótulos permaneceram como na fase anterior. Posteriormente, a condição contato foi introduzida envolvendo a mesma seqüência de luzes e rótulos que a condição sem contato, mas cada um dos quatro componentes estava em um esquema de esquiva com um intervalo de perda de resposta de 10 segundos. Finalmente, os sujeitos foram retornados à condição sem contato, onde todos os componentes não levavam a perdas. Os resultados mostraram que na primeira condição onde as instruções eram precisas (última condição do Experimento 1), o controle instrucional foi rapidamente restabelecido. Na condição posterior (sem contato) onde nenhuma perda foi programada, os sujeitos permaneceram sob o controle instrucional da fase anterior. No entanto, na condição contato, onde um intervalo de perda de 10 segundos estava em vigor para os quatro componentes, houve uma imediata quebra do controle instrucional para todos os sujeitos, demonstrando que o responder passou a ficar sob controle do esquema de esquiva programado e não das instruções. Durante a segunda 8 exposição à condição sem contato, o seguir instruções não reapareceu em qualquer sujeito. Nessa fase, os dados de três dos quatro sujeitos declinaram apropriadamente para o esquema sem perda, enquanto que um dos sujeitos manteve seu desempenho em taxas altas e indiferenciadas como na condição precedente (contato), demonstrando um não ajustamento ao esquema sem perda. Esses resultados, tomados em conjunto, mostram o papel do contato com a discrepância instrução-esquema em enfraquecer o controle instrucional. Galizio (1979) reafirma que o contato com a discrepância é necessário para a eliminação do seguir instruções, não simplesmente a existência de tal discrepância. O seguir instruções seria, dessa forma, controlado por suas conseqüências. Buskist e Miller (1986) e DeGrandpre e Buskist (1991) concordam com Galizio (1979) ao afirmarem que, ao contrário do que propõem alguns estudos, são as contingências que podem ofuscar as instruções se estas últimas contradizem as primeiras. Formas puras de controle instrucional seriam um resultado de instruções imprecisas junto com falhas em contactar com alguns aspectos das contingências, isto é, o estímulo instrucional pode minimizar os efeitos das contingências quando as instruções são imprecisas e o comportamento dos sujeitos não estabelece contato com as contingências em vigor. 1.2. Persistência do controle instrucional mesmo diante do contato com discrepância entre instruções e o desempenho Alguns autores apontam para o fato de que o seguir instruções pode ocorrer mesmo naquelas situações em que ocorre contato com a discrepância entre a instrução e o desempenho. 9 Shimoff e cols. (1981) afirmam que os desempenhos instruídos insensíveis são normalmente caracterizados por taxas altas e constantes de responder. Diante desses achados, os autores questionam se taxas baixas também não poderiam estar relacionadas à insensibilidade a contingências. Avaliar tal possibilidade seria importante na visão desses autores, visto que, constatada sua validade, os efeitos de instruções deveriam ser avaliados também com desempenhos de baixas taxas. Dessa forma, os dois experimentos realizados por Shimoff e cols. (1981) examinaram a sensibilidade do responder de baixas taxas, as quais foram mantidas por esquemas de intervalo variável (VI) ou razão variável (VR) com a superposição de uma contingência de reforçamento diferencial de baixas taxas (DRL). Somente respostas que terminassem com intervalos entre respostas mais longos do que aqueles especificados pela contingência de DRL foram válidas para produzir pontos que valiam dinheiro. A sensibilidade foi testada pelo relaxamento da contingência de DRL, visto que, após tal manipulação experimental, esperava-se que o responder aumentasse, demonstrando assim, sensibilidade às contingências. Estudantes universitários pressionavam uma chave de telégrafo que, de acordo com o esquema em vigor, acendia uma luz na presença da qual a pressão de um botão produzia pontos posteriormente trocáveis por dinheiro. Pressionar a chave em taxas baixas foi uma resposta estabilizada para alguns estudantes através de modelagem e para outros por demonstração associada a instruções escritas (Matthews e cols., 1977). No experimento 1, taxas baixas foram estabilizadas pela combinação de uma contingência de DRL 3s com um esquema de VI, e a sensibilidade foi avaliada pelo término da contingência de DRL. Com esta mudança, no entanto, taxas de respostas aumentadas não aumentariam correspondentemente o ganho de pontos. 10 De acordo com a análise dos resultados obtidos, quando o responder foi estabilizado por modelagem, a remoção da contingência de DRL aumentou as taxas de respostas para seis dos sete sujeitos com taxas altas o suficiente para contactar com as contingências. Já quando o responder foi mantido por instruções, somente quatro de dez sujeitos demonstraram aumento nas taxas. No Experimento 2 o responder foi mantido por um esquema de VR com uma contingência de DRL 4s subseqüentemente reduzida para DRL 1s. Esse experimento enfocou a questão de se taxas de responder instruído permaneceriam baixas ainda quando taxas altas aumentariam o ganho de pontos. A insensibilidade seria demonstrada, portanto, quando baixas taxas fossem mantidas sob condições nas quais taxas altas aumentariam o ganho de pontos. O material e o procedimento utilizados foram semelhantes àqueles descritos no Experimento 1. Os resultados permitiram constatar que as taxas de resposta para quatro dos seis sujeitos com respostas modeladas aumentaram após a redução da contingência de DRL, mas quando as respostas foram instruídas, as taxas não aumentaram (cinco casos) ou tiveram uma pequena redução (três casos). Ambos os experimentos mostraram que respostas de baixas taxas estabilizadas por modelagem são geralmente sensíveis a alterações nas contingências, ao passo que as instruções podem produzir um responder de baixas taxas insensível às mesmas contingências até quando o aumento nas taxas de respostas – e o conseqüente contato com às contingências – é positivamente correlacionado com ganho de pontos (Ver também Dixon, 2000; Dixon, Hayes & Aban, 2000; Mattews e cols., 1977; Raia, Shillingford, Miller, Baier, 2000, Experimento 1). 11 O enfoque dado por Galizio (1979) à questão da insensibilidade implica que o responder em altas taxas gerado por instruções freqüentemente exclui contato com as contingências. Uma visão alternativa proposta por Shimoff e cols. (1981) na discussão dos experimentos descritos é a de que o responder insensível pode assim permanecer a despeito do contato com as contingências, visto que, os sujeitos continuaram a se comportar de acordo com as instruções recebidas ainda que tal responder implicasse numa diminuição do ganho de pontos. Ao contrário do que propõe Galizio (1979), afirmam que a insensibilidade induzida por instruções não seria limitada a desempenhos que excluem contato com as contingências, pois mesmo quando tal contato existe, a insensibilidade pode se manter, conforme demonstrado no Experimento 2. Hayes e cols. (1986b) preocuparam-se com a questão de que é possível que um comportamento aparentemente sensível a um esquema, se estabilizado por uma regra, possa ser uma instância de seguimento da regra, não um desempenho controlado pelo esquema. Um procedimento muito utilizado para avaliar a sensibilidade a contingências programadas tem sido desenvolver um responder em estado estável em um dado esquema e então, alterar o esquema ou os parâmetros deste. Uma segunda alternativa envolve o uso de esquemas múltiplos. Hayes e cols. (1986b) realizaram um estudo para examinar o grau de conformidade entre esses dois tipos de avaliação de sensibilidade a esquemas, nas situações em que as instruções dadas estavam ou não de acordo com o esquema de reforçamento prevalente. Participaram 55 estudantes universitários cuja tarefa consistia em mover um sinal positivo (+) que aparecia no canto superior esquerdo de uma matriz 5x5 projetada na tela de um computador para o canto inferior direito através da 12 manipulação de dois botões que eram sinalizados pelas luzes amarela e azul. Os sujeitos foram divididos randomicamente em 4 grupos: “Instrução mínima”, “Instrução responda lentamente”, “Instrução responda rapidamente” ou “Instrução precisa”. No grupo de “Instrução mínima”, nenhuma instrução adicional foi fornecida; no grupo “Instrução responda lentamente”, os participantes recebiam a instrução adicional de que a melhor forma de pressionar os botões era lentamente; no grupo “Instrução responda rapidamente”, a instrução adicional indicava aos participantes que deveriam pressionar rapidamente e no grupo “Instrução precisa” as relações entre os estímulos sinalizadores e a velocidade de pressão aos botões foram precisamente expressas. Na fase de treino (sessões 1 e 2), a mudança do sinal positivo estava sob controle do esquema MULT DRL 6s FR 18. Os esquemas se alternavam a cada 2 minutos. Na fase de extinção (sessão 3) o sinal não se movia, independente dos padrões de resposta e nenhum ponto era ganho. Cada sessão durou 32 minutos. Os resultados sugeriram uma relação entre sensibilidade ao esquema múltiplo e sensibilidade à extinção, mas tal relação manteve-se somente quando o responder diferencial no esquema múltiplo não ocorreu diretamente devido a uma regra fornecida pelo experimentador. Os dados sugeriram ainda que a confiança em formas de padrões de respostas, mais do que em suas variáveis de controle, pode levar a uma categorização incorreta do tipo de responder. Os autores concluem que o mero responder diferencial que se apresenta dentro dos padrões de um determinado esquema não é suficiente para definir o comportamento como sensível ao esquema. Isto porque, somente aquele comportamento que se mostra realmente sensível às mudanças nas contingências poderia ser considerado como verdadeiramente sensível às contingências. Dessa 13 forma, a interpretação de qualquer medida de sensibilidade em humanos deveria ser baseada na possibilidade de fontes verbais estarem controlando o comportamento em questão. Daí a proposta de uso do termo criado por Hayes e cols. (1986b), “sensibilidade aparente ao esquema”, como aplicável àquelas situações onde os humanos apresentam padrões comportamentais que somente parecem sensíveis ao esquema em vigor, mas que na verdade não o são (Ver também Shimoff e cols., 1986, para uma explicação sobre “pseudosensibilidade”). Com base nos resultados desse experimento, Hayes e cols. (1986b), assim como Shimoff e cols. (1981) (Ver também Albuquerque e cols., 2003, Experimento 1; Kaufman e cols., 1966), questionaram dados experimentais segundo os quais regras produzem insensibilidade a esquemas programados de reforçamento porque elas excluem contato efetivo com esses esquemas (Galizio, 1979), visto que, se tal informação estivesse correta, teria que ser explicado porque o contato com a extinção em um componente do esquema múltiplo ou na fase de extinção deste experimento não constituiu contato efetivo com os esquemas. Hayes e cols. (1986b) questionaram ainda dados segundo os quais a insensibilidade seria vista como uma propriedade definidora do controle instrucional (Shimoff e cols., 1981), pois, se assim o fosse, teria que ser explicado porque alguns sujeitos na condição de “Instrução precisa” mostraram efeitos de extinção a despeito da exposição a um suposto controle pela regra. Segundo Hayes e cols. (1986b) os dados parecem melhor interpretados em termos de uma interação entre dois tipos distintos de responder: comportamento modelado por contingência e comportamento governado por regra (Ver Otto, Torgrud & Holborn, 1999, para uma análise diferenciada de tais dados baseada na “teoria do bloqueio operante”, p. 665). O comportamento sensível a uma regra pode 14 ocorrer de forma idêntica àquele sensível ao esquema e, ainda assim, ser uma instância de seguimento de regra não controlada por conseqüências programadas. Portanto, o problema é o definir as bases funcionais para o comportamento em análise. Em relação aos estudos abordados, torna-se necessário destacar diferenças nos tipos de conseqüências programadas para seguir regras. No estudo de Galizio (1979), seguir regras discrepantes dos esquemas produzia perda de pontos trocáveis por dinheiro. Já nos estudos de Hayes e cols. (1986b) e Shimoff e cols. (1981), o seguimento de regras apenas não produzia tantos pontos quanto poderia produzir, caso mudasse acompanhando as mudanças nas contingências programadas. Tal constatação sugere que a manutenção ou não do seguimento de regras depende, em parte, dos tipos de conseqüências produzidas pelo comportamento de seguir regras (Albuquerque, 1998). 1.3. Conteúdo das instruções Outra variável apontada como passível de influenciar o grau de contato com as contingências em vigor é o conteúdo das instruções fornecidas. Tal questão vem sendo enfocada por vários autores (Braam & Malott, 1990; Buskist, Bennett & Miller, 1981; DeGrandpre & Buskist, 1991; Dixon & Hayes, 1998; Hojo, 2002; Newman, Buffington & Hemmes, 1995; Raia e cols., 2000; Schmitt, 1998). Ao discutirem as diferenças entre desempenhos humanos e infrahumanos em esquemas de FI, Buskist e cols. (1981) propõem um método alternativo para se produzir padrões típicos de FI em humanos. Dentro dessa perspectiva, o experimento por eles realizado foi delineado para testar se o emprego de restrições, tanto de 15 tempo quanto de taxa de respostas, nas instruções fornecidas aos participantes poderia induzir à sensibilidade em relação às contingências experimentais. O procedimento implicou, dentre outras resoluções, na formação de sete grupos que se diferenciavam pelo tipo de instrução recebida. Um grupo não recebeu nenhuma instrução adicional, dois grupos receberam instruções diferenciadas baseadas apenas nas taxas de respostas, dois grupos foram providos de instruções diferenciadas baseadas tanto no tempo quanto nas taxas de respostas, um grupo recebeu instruções baseadas apenas no tempo e um grupo recebeu instruções com referência ao tempo e a taxa de resposta, além de ter sido submetido a uma variação no esquema utilizado. Todos os sujeitos foram expostos a um esquema de FI 27s. Os resultados mostraram que quando o desempenho humano em FI foi modificado por instruções que envolviam restrições de tempo, de taxa de resposta ou ambas, emergiu uma variedade de padrões de respostas. Dentre os padrões detectados foi possível constatar que, a partir de instruções que comportem restrições de tempo e/ou comportamento, a sensibilidade humana a esquemas de FI pode ser atingida (Ver também Bentall, Lowe & Beasty, 1985; Harzem e cols., 1978, para uma discussão sobre variáveis envolvidas na sensibilidade humana a esquemas de FI). Preocupados com aspectos formais das regras que poderiam interferir no seguimento destas, Albuquerque e Ferreira (2001) investigaram se a extensão de uma regra, medida pelo número de diferentes respostas descritas, poderia interferir em seu seguimento. Os dados obtidos por esses autores sugerem que a extensão de uma regra pode interferir na probabilidade de que ela venha a ser seguida, no sentido de que, quanto maior a extensão de uma regra (isto é, quanto maior o número de diferentes 16 respostas descritas na regra) menor a probabilidade de que venha a ser seguida e, inversamente, quanto menor a extensão de uma regra, maior a possibilidade de que venha a ser seguida. Assim, concluem os autores, quando humanos são confrontados pela primeira vez com uma regra, eles podem ou não emitir o comportamento especificado, dependendo em parte do número de respostas especificado na regra, ou seja, da extensão desta. 1.4. Variabilidade comportamental Uma explicação para a freqüente insensibilidade do comportamento às contingências estabelecidas em situações experimentais pode estar na maneira como regras e contingências restringem a variabilidade do comportamento. Tal questão foi abordada por Joyce e Chase (1990). Em seus estudos esses autores destacam que uma das características mais marcantes do comportamento governado por regras é sua não alteração diante de mudanças nas contingências ambientais (Galizio, 1979; Matthews e cols., 1977; Shimoff e cols., 1981). Muitas pesquisas têm se concentrado justamente em identificar as variáveis responsáveis por tal insensibilidade às contingências (Galizio, 1979; Hayes e cols., 1986b; LeFrancois, Chase, & Joyce, 1988; Shimoff e cols., 1981; Shimoff e cols., 1986). Contudo, nenhum desses estudos, de acordo com Joyce e Chase (1990), tem avaliado a possibilidade de que a insensibilidade comportamental possa estar relacionada a uma falta de variabilidade produzida pelas regras manipuladas. Assim, os dois experimentos desenvolvidos por esses autores examinaram a relação entre variabilidade de resposta e sensibilidade às mudanças nas contingências de reforço. 17 No Experimento 1, dezenove participantes foram randomicamente distribuídos em 4 grupos: 1) Grupo Instrução Completa com Desempenho Estável; 2) Grupo Instrução Completa sem Desempenho Estável; 3) Grupo Instrução Incompleta com Desempenho Estável e 4) Grupo Instrução Incompleta sem Desempenho Estável. A diferença entre os grupos de Instrução Completa e Incompleta é que somente ao primeiro foi fornecida a informação adicional “Pressione o botão 40 vezes para cada ponto”. Nos grupos que exigiam desempenho estável os participantes foram submetidos a uma condição inicial de treino na qual o responder foi estabilizado sob um esquema de FR 40 e, posteriormente a essa fase, todos os grupos foram submetidos a sessões de teste onde um esquema de FR 40 era seguido por um esquema de FI 10s. Os resultados mostraram que para os grupos cujo responder foi completamente instruído e para o grupo de instrução incompleta que exigiu desempenhos estáveis, houve pouca variabilidade no momento da mudança dos esquemas e o responder dos participantes demonstrou-se insensível a tal mudança. Já para o grupo de instrução incompleta sem desempenho estável foi detectada maior variabilidade no momento da troca de esquemas, bem como, sensibilidade à nova contingência. Esse experimento sugere uma relação entre variabilidade do responder e sensibilidade do comportamento a mudanças nas contingências, visto que, uma vez que se tenha atingido um responder estável, seja por intermédio de exposição prolongada às contingências ou por instrução, este se torna insensível às alterações nos esquemas. No Experimento 2, seis sujeitos foram divididos em dois grupos: 1) Grupo Instrução Completa e 2) Grupo Instrução Incompleta, cujo diferencial consistiu no 18 fato de que o primeiro grupo recebeu instrução explícita para responder sob o esquema de RF 40 usado no Experimento 1. Após ambos os grupos terem atingido o critério de estabilidade para o esquema de FR 40, foi realizado um teste que não identificou sensibilidade às mudanças nas contingências. Foi então inserida uma instrução que especificava que um responder variável (ora baseado na quantidade de respostas, ora baseado na passagem do tempo) permitiria maior ganho de pontos com menos esforço. Os resultados indicaram que 5 dos 6 sujeitos mostraram aumento da variabilidade do responder após a introdução dessa instrução e todos os 6 participantes demonstraram sensibilidade à mudança na contingência. Os autores concluem afirmando que muitas variáveis são apontadas como responsáveis pela insensibilidade comportamental. Eles acreditam que para produzir comportamentos sensíveis às variações nas contingências, deve ocorrer uma variação tal que produza respostas alternativas que façam contato com as contingências, possibilitando assim o estabelecimento de um responder sensível. Esse estudo sugere que, além das variáveis inerentes aos procedimentos adotados para estabelecer comportamentos não verbais (como instrução e reforço diferencial), existem outras variáveis que podem afetar a sensibilidade de tais comportamentos, como, por exemplo, a variação comportamental gerada e estabelecida antes das mudanças nas contingências de reforço (Ver também a sugestão de Santos, Paracampo & Albuquerque, 2004, sobre como uma história de variação comportamental, gerada pela apresentação de diferentes instruções, pode interferir na sensibilidade do comportamento de seguir regras às mudanças nas contingências de reforço). 19 1.5. História de reforçamento Outra variável apontada como influente na questão da sensibilidade a contingências tem sido a história de reforçamento. Tal proposta é consistente com a colocação de Skinner (1974) de que regras são seguidas porque o comportamento de seguir regras foi reforçado no passado. Com o objetivo de determinar a relação entre a precisão de instruções e o grau de seguimento destas, bem como avaliar os efeitos da história de reforçamento sob o seguimento de instruções, DeGrandpre e Buskist (1991) elaboraram um experimento onde a variável independente consistiu na percentagem de instruções precisas fornecidas aos participantes. Estes foram submetidos a uma de quatro seqüências de condições, dependendo do grupo ao qual foram randomicamente distribuídos. Cada seqüência variou de acordo com o nível de precisão das instruções: 1) 100–50–0%, 2) 0–50– 100%, 3) 40–50–60%, 4) 60–50–40%. Os resultados indicaram que o seguimento de instruções esteve altamente correlacionado com o grau de precisão de cada condição (ver também Hayes e cols., 1986a, para uma análise de como a precisão das instruções pode afetar a natureza do contato feito com as contingências programadas). Indicaram ainda que os participantes apresentavam maior probabilidade de seguir instruções imprecisas quando já haviam sido submetidos a uma condição experimental anterior de seguimento de instruções precisas – o que indica que o controle instrucional foi determinado pela história de reforçamento dos sujeitos (Ver também o estudo de Albuquerque, Santos, Silva, Mendonça, Queiroz & Silva, 1993, sobre como o controle por uma história de reforço para o seguimento de uma regra correspondente com a contingência em vigor pode contribuir para manter o seguimento subseqüente de uma regra discrepante). 20 Abordando o mesmo tópico em questão, Wulfert, Greenway, Farkas, Hayes e Dougher (1994) chamam atenção para o fato de que diferenças individuais, que resultam de diferenças na história de condicionamento, poderiam influenciar na sensibilidade comportamental. Consideram que pessoas com uma longa história de seguir instruções podem aderir mais facilmente a regras, tanto em situações experimentais quanto em situações naturais, sendo, portanto, caracterizadas como indivíduos rígidos. No estudo realizado por esses autores fica evidenciada uma correlação entre alta rigidez comportamental – identificada a partir da utilização de um teste de rigidez – e insensibilidade aos esquemas programados: indivíduos com altos escores nos testes de rigidez demonstraram uma maior persistência de padrões comportamentais em uma situação de extinção. A principal contribuição desse estudo consistiu em demonstrar que diferenças individuais podem ser consideradas uma variável que afeta a sensibilidade do comportamento às contingências. Possivelmente, pessoas consideradas rígidas possuem uma longa história de punição contingente ao não seguimento de regras, demonstrando assim, forte tendência a seguir instruções. Segundo Hayes e cols. (1986b), é possível que as instruções continuem a afetar o responder por causa de uma longa história de conseqüências programadas para responder como especificado. Tal história poderia ser pouco afetada pelas conseqüências programadas dentro de um experimento breve (Ver também as exposições de Albuquerque, Matos, Souza & Paracampo, 2004; Dixon & Hayes, 1998; Harzem e cols., 1978; Martinez & Ribes, 1996; Reese, 1989; Vaughan, 1985, sobre como a experiência passada de um indivíduo pode afetar seu modo de agir em uma dada situação). De acordo com esta visão, o comportamento de seguir regras 21 estaria sob controle de duas fontes de variáveis distintas. Na primeira, uma regra é seguida devido a uma história passada de correspondência entre a regra e as contingências naturais. Na segunda, a regra é seguida por causa de uma história passada de reforçamento mediado socialmente para a correspondência entre a regra e o comportamento por ela especificado. 1.6. Efeitos de relatos verbais modelados ou instruídos sobre o responder não verbal O estudo desenvolvido por Catania e cols. (1982) objetivou verificar os efeitos de relatos verbais modelados ou instruídos sobre o responder não verbal. Dessa forma, os autores acreditavam que estariam estendendo a distinção entre comportamento governado por regras e comportamento governado por contingências do comportamento não verbal para o comportamento verbal. Trinta e seis estudantes universitários tinham como tarefa pressionar botões que ocasionalmente tornavam disponíveis pontos trocáveis por dinheiro. Luzes azuis acima dos botões estavam correlacionadas com um esquema MULT RR 20 RI 10s. Após a ocorrência dos dois componentes, o que caracterizava um ciclo completo de esquema de 3 minutos, os estudantes completavam sentenças como “A melhor forma de ganhar pontos com o botão da esquerda (direita) é...”. Em alguns casos, o ganho de pontos para os relatos verbais dependia do conteúdo da sentença. Dessa forma, modelagem e instrução foram utilizadas para estabilizar tal conteúdo. Em outros casos, o conteúdo das sentenças não tinha conseqüências diferenciais, isto é, pontos foram dados independentemente do conteúdo. Para o Grupo Modelagem os relatos verbais foram modelados, isto é, reforçados diferencialmente com pontos que poderiam variar de 0 a 3. Já o Grupo 22 Instrução recebeu instruções precisas sobre como as sentenças deveriam ser completadas: “Para ganhar o máximo de pontos nas sentenças, escreva ‘Pressione rápido’ (ou ‘devagar’) para o botão da esquerda e escreva ‘Pressione devagar’ (ou ‘rápido’) para o botão da direita”. Em geral, quando os relatos foram modelados, foi observada correspondência entre tais relatos e o comportamento não verbal de pressionar o botão, mesmo quando havia discrepância entre os relatos e as contingências que estavam vigorando e conseqüente diminuição no ganho de pontos. Já quando os relatos foram instruídos, geralmente eles corresponderam às instruções fornecidas, mas os efeitos sobre o pressionar foram variados: os relatos às vezes influenciaram, às vezes foram influenciados e outras vezes eram independentes do comportamento não verbal (ver também Matthews e cols., 1985; Pouthas e cols., 1990, para uma análise dos efeitos de descrições de desempenhos sob o responder não verbal). Segundo Catania e cols. (1982), tais achados sugerem que é mais provável que o comportamento verbal determine comportamentos não verbais subseqüentes quando o primeiro é modelado, do que quando é instruído. Afirmam ainda que é mais difícil estabilizar comportamento verbal modelado, mas uma vez estabilizado, seu controle será muito mais efetivo sob o comportamento não verbal do que o controle exercido pelo comportamento verbal instruído (Ver Cerutti, 1994, para um exame de como a concordância do comportamento não verbal com o verbal pode ser afetada por variáveis como a observação do desempenho do participante e a variabilidade na distribuição das conseqüências em um esquema). 23 1.7. Aumento do controle discriminativo das contingências programadas Os dados do estudo anterior de Catania e cols. (1982) não foram confirmados por Torgrud e Holborn (1990). Segundo esses autores, várias investigações (e.g., Catania e cols., 1982; Hayes e cols., 1986b; Matthews e cols., 1985) têm tentado criar uma interação oposta entre um esquema de reforçamento para uma resposta motora e um estímulo verbal especificador de taxas de respostas. Tipicamente, as taxas de respostas têm se conformado às descrições verbais instruídas ou modeladas e não aos esquemas utilizados, o que sugere que tais descrições poderiam exercer controle mais forte sobre uma resposta motora do que as contingências de reforçamento programadas para tal resposta. Torgrud e Holborn (1990) questionaram os resultados dessas pesquisas ao afirmarem que embora esses estudos prévios demonstrem controle verbal de taxas de respostas, eles o fazem sob condições específicas onde os esquemas utilizados são caracterizados por pobre controle discriminativo. Esses autores desenvolveram então um estudo numa tentativa de estender a literatura sobre as interações entre comportamento verbal e não verbal através da utilização de descrições verbais de taxas de respostas opostas a esquemas com controle discriminativo bem demonstrado. O maior diferencial em termos de procedimento adotado por esses autores foi, portanto, o aumento do controle discriminativo dos esquemas utilizados e a clara demonstração desse controle antes da introdução dos estímulos verbais (Ver também a discussão promovida por Otto e cols., 1999, a qual fornece suporte para uma apreciação do controle instrucional em termos de falhas em discriminar características relevantes dos esquemas). Foram utilizados esquemas de reforçamento (DRL e DRH) que permitiam que quantidades específicas de pontos fossem obtidas dependendo das taxas de 24 respostas emitidas em duas chaves. Taxas de respostas pré-determinadas pelos experimentadores produziam uma quantidade máxima de pontos em cada chave e, à medida que as taxas se distanciavam do valor crítico, a quantidade de pontos diminuía progressivamente. As taxas de respostas foram identificadas a partir de cinco categorias: muito devagar (1 a 5 respostas por intervalo de 5,5 segundos), devagar (6 a 10 respostas), média (11 a 15 respostas), rápida (16 a 20 respostas) e muito rápida (mais de 20 respostas). Após a apresentação de cada chave, os participantes deveriam preencher a sentença “A melhor forma de obter pontos na chave X é...”. Para tanto, cinco possíveis relatos eram disponibilizados para escolha: “pressionar muito devagar”, “pressionar devagar”, “pressionar em taxa média”, “pressionar rápido” ou “pressionar muito rápido”. Assim como ocorria com as taxas de respostas, a cada relato também eram atribuídos pontos que variavam dentro de uma escala de acordo com a precisão destes. Com base nesse delineamento, o Experimento 1 foi desenvolvido com quatro participantes e teve como objetivo verificar se o aumento do controle discriminativo dos esquemas utilizados resultaria em menor controle verbal das taxas de respostas. Os participantes foram modelados a apresentarem uma taxa média de respostas. Somente depois que os esquemas adquiriram controle sobre o desempenho dos participantes, os relatos foram solicitados. Na primeira fase do experimento, as contingências verbais permaneceram inalteradas: para a chave A, descrições de “pressione muito devagar”, e para a chave K, descrições de “pressione muito rápido” receberam o máximo de pontos. Já as contingências não verbais foram gradualmente modificadas até atingirem a condição de pressões muito rápidas para a chave A e pressões muito lentas para a chave K. Na segunda fase, as contingências não verbais permaneceram constantes, ao passo que as contingências verbais foram 25 gradualmente modificadas: para a chave que exigia taxa muito devagar, os relatos eram alterados até que “pressionar muito rápido” produzisse o máximo de pontos; para a chave que exigia taxa muito rápida, os relatos eram modificados até que o máximo de pontos fosse contingente a “pressionar muito devagar”. Os resultados mostraram que a escolha das descrições verbais não teve efeito sobre as taxas de pressão à chave, isto é, as contingências relacionadas às descrições verbais e aquelas relacionadas às pressões nas chaves controlaram suas respectivas classes de comportamentos sem interferência mútua. A partir desses resultados, ficou evidenciado, segundo os autores, as condições nas quais descrições verbais de taxas de respostas não controlam o responder não verbal na presença de esquemas opostos. A relação entre o desempenho não verbal e relatos verbais também foi investigada por Paracampo, Souza, Matos e Albuquerque (2001). Para tanto, expuseram vinte crianças, entre sete e oito anos de idade, a um procedimento de controle contextual de escolha segundo o modelo. As crianças foram distribuídas em três condições, sendo cada condição composta por três fases. Na Condição Reforço Diferencial (RD), os participantes foram expostos a instruções mínimas sobre como se comportar; na Condição Instrução (I) os participantes foram expostos a instruções precisas correspondentes às contingências em vigor na Fase 1, e na Condição Múltiplas Instruções (MI) foram expostos a três conjuntos de instruções diferentes (Passos 1, 2 e 3), de acordo com as contingências em vigor na Fase 1. Durante a Fase 1, os participantes deveriam escolher o estímulo comparação idêntico ao estímulo modelo na presença de uma luz verde e o estímulo de comparação oposto caso a luz vermelha estivesse acesa, nas Condições RD e CI. Essas contingências em vigor durante a Fase 1 eram revertidas na Fase 2 e restabelecidas na Fase 3. Na Fase 1 da Condição MI eram reforçadas as respostas de escolher o estímulo de comparação 26 igual ao modelo na presença da luz verde e o diferente na presença da luz amarela (Passo 1), escolher o igual na presença da luz amarela e o diferente na presença da luz vermelha (Passo 2), e escolher o igual na presença da luz verde e o diferente na presença da luz vermelha (Passo 3). Os Passos 1 e 2 foram compostos por uma única fase cada (Fase 1). As contingências em vigor no Passo 3 eram revertidas na Fase 2 e restabelecidas na Fase 3. As transições de fases não eram instruídas e nem sinalizadas. Perguntas a respeito do que os participantes deveriam fazer para ganhar pontos foram feitas ao longo de todas as fases. Os dados mostraram que os participantes da Condição RD conseguiram contactar a inversão das relações entre cores e o tipo de escolha, isto é demonstraram sensibilidade às mudanças nas contingências, mais eficientemente que os participantes das Condições I e MI, os quais continuaram seguindo a instrução apresentada na fase anterior, a despeito da discrepância entre instrução e contingência. Para os participantes das três condições foi constatada correspondência entre as respostas de escolha e os relatos. No entanto, para os participantes da Condição RD, tal correspondência indica que não somente as respostas de escolha, mas também os relatos estavam sob controle da contingência não verbal. Já para os participantes das Condições I e MI, a correspondência verbal – não verbal indica que os relatos, assim como as respostas de escolha, estavam sob controle das instruções. Os resultados também demonstraram que os participantes da Condição RD emitiram respostas de escolha precisas antes que relatos verbais corretos fossem observados, sugerindo dessa forma que, na ausência de conseqüenciação para o comportamento verbal, a contingência não verbal pode exercer funções controladoras sobre este comportamento. Esses resultados indicam que a correspondência entre os comportamentos não verbal e verbal pode ser controlada 27 por diferentes variáveis (Ver também Ribes & Rodrigues, 2001, para uma análise das possíveis relações entre instruções, relatos e desempenhos não verbais). 1.8. Grau de discriminabilidade dos esquemas em vigor Outro conjunto de variáveis importantes na investigação da sensibilidade às mudanças de contingências envolve os esquemas de reforçamento. Nessa linha de raciocínio, Newman, Hemmes, Buffington & Andreopoulos (1994) chamam atenção para o fato de que boa parte dos estudos empíricos sobre insensibilidade geralmente fazem uso de esquemas de reforçamento intermitentes (e. g., Matthews e cols., 1985; Shimoff e cols., 1981; Shimoff e cols., 1986; Hayes e cols., 1986a; Hayes e cols., 1986b). Fazendo uma análise crítica do experimento anteriormente citado de DeGrandpre e Buskist (1991), Newman e cols. (1995) hipotetizam que a variável crítica que possibilitou os resultados obtidos nesse experimento foi a natureza contínua do esquema de reforçamento utilizado e não a precisão ou imprecisão das instruções fornecidas. Essa hipótese é baseada na concepção de que a insensibilidade pode ser causada por uma falha em contactar de forma efetiva as contingências (Baron & Galizio, 1983). Sendo assim, é mais provável que alguém falhe em responder a uma mudança no reforçamento para um comportamento sendo reforçado em esquema intermitente do que em um esquema contínuo, visto que o esquema intermitente pode não permitir ao participante determinar a melhor estratégia de se ganhar os reforçadores disponíveis, em função da baixa freqüência relativa de reforçamento. De acordo com Newman e cols. (1995), DeGrandpre e Buskist (1991) falharam ao negligenciar em seu experimento os efeitos dos esquemas de reforçamento. Esses autores propõem, então, uma tentativa de se seguir os métodos 28 descritos por DeGrandpre e Buskist (1991), mas com um foco de análise diferenciado. Para tanto, desenvolveram um estudo que examinou o seguir instruções, com a acurácia dessas instruções variando através das fases para cada um dos dezoito participantes e os esquemas de reforçamento variando através dos seis grupos formados. Através das fases, a acurácia das instruções foi de 0-50-100-50-0% ou de 100-50-0-50-100%. Na fase de 100% de precisão, os participantes só ganhavam pontos quando seguiam as instruções em todas as ocasiões em que eram apresentadas. Na condição 50%, os participantes ganhavam pontos se seguissem as instruções somente metade das vezes em que eram apresentadas. Na condição 0%, os participantes só ganhavam pontos se fizessem o oposto do que a instrução especificava. Os participantes foram distribuídos em seis grupos de acordo com as duas ordens de apresentação das instruções e com os esquemas de reforçamento contínuo, FR 2 ou FR 3. Os resultados demonstraram que os participantes que foram submetidos ao esquema contínuo de reforçamento, independente da ordem de apresentação da acurácia das instruções, tiveram seus desempenhos controlados pelas conseqüências colaterais, isto é, demonstraram padrões de comportamento sensíveis à maximização na obtenção de reforçadores em todas as fases. Já em relação aos participantes submetidos aos esquemas intermitentes (FR 2 e FR 3) um padrão generalizado de insensibilidade foi observado, através de uma perda do controle pelas conseqüências colaterais e do seguimento indiscriminado de instruções precisas e imprecisas. Esses achados sugerem que o comportamento de participantes, em experimentos onde as instruções são contrastadas com os esquemas utilizados, é uma função não somente da instrução, mas também do tipo de esquema de reforçamento utilizado. Os autores concluem afirmando que o fenômeno da insensibilidade pode 29 ser considerado como o resultado de falhas nos esquemas intermitentes tradicionalmente utilizados nos estudos sobre o controle do comportamento por regras, e não o resultado de quaisquer propriedades inerentes das instruções (Ver também Newman e cols., 1994, para uma análise da interação entre tipos de esquemas de reforçamento – contínuo e intermitente – e tipos de estímulos discriminativos – verbais e não verbais – sob o responder humano). Na mesma linha de investigação, Cerutti (1991) procurou verificar a concordância com instruções em esquemas independentes da resposta, a fim de analisar se a insensibilidade ao esquema seria determinada por reforçamento do responder inapropriado ou por características discriminativas dos esquemas. Para tanto, o autor hipotetizou que esquemas mistos ocasionariam maior insensibilidade no responder que esquemas simples, em virtude da dificuldade de discriminação das contingências envolvida nos primeiros em comparação aos últimos. Estudantes universitários foram instruídos a pressionar duas chaves para evitar a ocorrência de tons que, no entanto, eram inevitáveis, isto é, independentes dos desempenhos dos participantes. Os estudantes foram distribuídos em três grupos de acordo com o esquema que vigorava para apresentação dos tons. Para o primeiro grupo, os tons foram apresentados de acordo com um esquema misto tempo randômico – tempo randômico (MIX RT RT). Para o segundo grupo, os tons foram programados de acordo com um esquema misto tempo fixo – tempo fixo (MIX FT FT). O último grupo foi submetido à apresentação de tons de acordo com um esquema simples de tempo fixo (FT). Após um ciclo completo de reforçamento, os participantes deveriam responder à questão “A melhor forma de se pressionar a chave da esquerda/direita é...” escolhendo uma dentre as seis seguintes opções apresentadas: “lentamente”, “muito lentamente”, “moderadamente lentamente”, 30 “rapidamente”, “muito rapidamente” e “moderadamente rapidamente”. Tais relatos eram modelados, podendo produzir pontos que variavam de 0 a 3. Para uma chave, o relato “lentamente” foi selecionado e para a outra, o relato “rapidamente” foi escolhido como o correto. Após a sessão, os participantes completavam um questionário de múltipla-escolha com três opções de respostas (“nunca”, “às vezes”, “sempre”) para questões que verificavam se o pressionar prevenia os tons e se as respostas sob a forma de pressionar influenciavam o comportamento não verbal de pressão. Os resultados mostraram que os participantes dos grupos de esquemas mistos (MIX RT RT e MIX FT FT) apresentaram taxas de respostas mais elevadas que os participantes do grupo FT, demonstrando assim maior concordância com a instrução de esquiva fornecida e agindo como se houvesse uma relação de contingência entre as taxas de respostas e a freqüência de apresentação dos tons. Estes participantes também demonstraram significativa correlação entre suas respostas verbais (relatos modelados) e não verbais (pressões às chaves). Quanto às respostas aos questionários, os participantes dos grupos mistos relataram com maior freqüência que os participantes do grupo FT que os tons poderiam ser prevenidos por suas respostas. De acordo com Cerutti (1991), o esquema FT foi o único a permitir que a relação de independência entre as respostas de pressionar as chaves e a eliminação dos tons exercesse controle discriminativo. Dessa forma o autor afirma que o controle exercido por contingências verbais só é possível quando as contingências programadas para o comportamento não verbal não exercem controle discriminativo adequado, concordando assim com Torgrud e Holborn (1990) (Ver também Cerutti, 1989, para uma análise da proposta de que o seguimento de regras discrepantes de 31 contingências é mais provável de ocorrer quando as contingências são “fracas”, isto é, quando há falta de controle pelas conseqüências colaterais do comportamento). 1.9. Auto-regras As pessoas também podem formular e seguir suas próprias regras. Assim, auto-regras podem ser vistas como estímulos especificadores de contingências produzidos pelo comportamento verbal da própria pessoa (Zettle, 1990). Rosenfarb e cols. (1992) procuraram identificar os efeitos de auto-regras sobre o comportamento não verbal através da comparação entre desempenhos autoinstruídos, desempenhos instruídos externamente e desempenhos não instruídos. No estudo desenvolvido por esses autores, vinte e nove estudantes universitários foram distribuídos em três grupos. Os participantes do Grupo 1 foram solicitados a gerarem auto-regras e foram acoplados aos participantes do Grupo 2 que recebiam tais auto-regras como instruções externas. Os participantes do Grupo 3 não foram solicitados a gerarem regras, nem receberam qualquer instrução externa. Durante a Fase de Aquisição os participantes foram submetidos a um esquema múltiplo DRL 5 seg RF 8, com os componentes se alternado a cada dois minutos. A tarefa dos participantes consistia em mover um círculo que aparecia no canto superior esquerdo de uma matriz 5x5 projetada na tela de um computador para o canto inferior direito (similar ao procedimento de Hayes e cols., 1986b). Nessa fase os participantes foram solicitados, a cada intervalo de dois minutos, a completar a afirmação “A melhor forma de mover o círculo quando a luz da direita/esquerda está acesa é...”. Nenhuma conseqüência diferencial foi programada para esses relatos. À cada participante do Grupo 2 foi fornecida a auto-regra formulada por um participante correspondente do Grupo 1, independente da acurácia desta. Aos 32 participantes do Grupo 3 foram fornecidas apenas instruções mínimas. Posteriormente à Fase de Aquisição, todos os participantes foram submetidos a uma Fase de Extinção. Os dados obtidos sugerirem que solicitar pessoas a desenvolverem regras pode facilitar o controle das contingências de reforçamento sobre o comportamento não verbal. Isso porque durante a Fase de Aquisição, o comportamento dos participantes solicitados a formularem regras apresentou-se sob controle das contingências mais rapidamente do que daqueles não solicitados a formularem regras. Já em relação à Fase de Extinção, no entanto, o comportamento daqueles solicitados a formularem regras apresentou-se mais variável e em taxas mais altas em relação aos participantes que não formularam regras. Em outras palavras, os dados com auto-regras replicam resultados obtidos com regras externas. Um resultado adicional e interessante obtido por esses autores foi o de que, dentre os participantes que formularam auto-regras precisas, alguns as formularam antes de ganhar pontos, enquanto outros primeiro ganharam pontos, e somente posteriormente relataram auto-regras precisas. Esses dados sugerem que não é necessário um desenvolvimento prévio de regras acuradas para que o comportamento possa manter-se sob controle das contingências em vigor (Ver os dados de Simonassi, Fróes & Sanabio, 1995; Simonassi, Oliveira & Gosch, 1997; e Simonassi, Oliveira & Sanabio, 1994, que também sugerem que a elaboração de auto-regras não se constitui como condição necessária para que as contingências possam exercer controle). Procurando também analisar os efeitos de regras e auto-regras a partir de uma análise do comportamento supersticioso, Ono (1994) distribuiu trezes estudantes universitários em dois grupos: Grupo Experimental e Grupo Controle. Todos os 33 participantes foram submetidos a uma tarefa na qual deveriam puxar uma alavanca de acordo com um esquema de reforçamento diferencial de altas taxas (DRH), que requeria pelo menos cinco respostas por intervalo de 15 seg. A cada participante do Grupo Experimental foi dito que formaria par com um outro participante – que na verdade era o próprio experimentador – e que no início de cada fase – que durava três minutos – ele receberia informações (“regras sociais”) desse outro participante sobre como se comportar da forma mais adequada para ganhar pontos. Foi informado também ao participante real que ele deveria, ao final de cada fase, relatar ao outro participante a forma adequada de se comportar (“autoregras”). As “regras sociais” fornecidas pelo experimentador, e que não descreviam acuradamente a contingência em vigor, foram: “Puxe mais que 20 vezes” (Fase 1); “Puxe 10 vezes após 7 segundos” (Fase 2); “Puxe 1 vez após 15 segundos” (Fase 3); e “Puxe mais que 20 vezes” (Fase 4, semelhante à Fase 1). Os participantes do Grupo Controle não recebiam “regras sociais”, mas foram solicitados a relatarem suas auto-regras. Em termos de resultados obtidos, os participantes do Grupo Controle demonstraram taxas de respostas sensíveis ao esquema em vigor com desempenhos apropriados rapidamente estabilizados e com relatos de auto-regras precisos. Em relação aos participantes do Grupo Experimental, os desempenhos variaram amplamente demonstrando influência das “regras sociais”. O autor conclui afirmando que, ao contrário do proposto por Rosenfarb e cols. (1992), regras e autoregras não têm efeitos similares sobre o comportamento não verbal. Uma explicação plausível para tal constatação seria, segundo o autor, a diferença quanto à origem, ou seja, regras são o resultado do comportamento verbal de outra pessoa, enquanto autoregras são fruto do comportamento verbal do próprio indivíduo. 34 Objetivos Diante do exposto fica claro o quanto a área de estudos acerca das variáveis envolvidas na sensibilidade do comportamento humano às contingências é vasta e controversa e o quanto a caracterização dessas variáveis é importante para a análise do comportamento humano. Portanto, torna-se evidente a importância de pesquisas atuais desenvolvidas para explorarem os aspectos que afetam a sensibilidade do desempenho humano sob contingências de reforçamento. Seguindo essa linha de raciocínio, o presente estudo propõe contribuir para tal investigação através da realização de dois experimentos. O Experimento 1 foi realizado com os seguintes objetivos: • Considerando a situação em que o participante tem seu desempenho estabelecido sob controle de um determinado esquema, verificar o que ocorre em termos comportamentais, quando são feitas alterações no tipo de esquema utilizado, interpretando os desempenhos que se seguem às mudanças em termos de padrões de comportamento sensível ou insensível às contingências. • Verificar se ao arranjar conseqüências aversivas (perda de pontos) para o comportamento consistente com esquemas anteriores, torna-se possível estabelecer contato com esquemas atuais e assim reduzir a intensidade e a persistência da insensibilidade do desempenho. • Verificar possíveis condições experimentais que estariam relacionadas à sensibilidade e insensibilidade programados. O Experimento 2 foi realizado com o seguinte objetivo: aos esquemas 35 • Verificar se a exposição prévia a uma condição que favoreça o contato com o esquema em vigor, via punição de respostas inadequadas que levariam a perda de pontos, seria suficiente para estabelecer responder adequado em uma fase posterior, com sinais claros de discriminação do esquema em vigor. 36 Método Experimento 1 Participantes Seis alunas do primeiro período do curso de graduação em Psicologia da Universidade Católica de Goiás (UCG), com idades variando entre 17 e 21 anos, participaram do experimento. As participantes foram recrutadas por meio de uma lista de voluntários passada em sala de aula e não tinham nenhuma experiência prévia com procedimentos experimentais dessa natureza. Todas as participantes, antes de serem submetidas ao experimento, assinaram um Termo de Consentimento Livre e Esclarecido (em acordo às normas da resolução 196/96 do Conselho Nacional de Saúde – MS) reafirmando sua concordância em participar do experimento, a partir de um entendimento claro e preciso acerca da realização deste (Anexo 1). Equipamentos O experimento foi conduzido no Laboratório de Análise Experimental do Comportamento (LAEC), da Universidade Católica de Goiás (UCG). A sala de coleta de dados tinha dimensões aproximadas de 2 x 3m, era dotada de boa ventilação e iluminação, bem como de isolamento acústico adequado. O equipamento utilizado consistiu em um microcomputador modelo IBM PC, com configuração básica de Pentium III 800MHz e 128 Mbytes de memória RAM, vídeo colorido, tela sensível ao toque e mouse de dois botões; além de uma mesa de suporte para o computador e uma cadeira. O controle das contingências experimentais e o registro dos dados foram realizados por um programa 37 computacional especialmente desenvolvido em ambiente Windows (Microsoft) para o presente experimento – chamado Insensitivity 1 – em linguagem de programação VisualBasic e com uso de sub-rotinas em Assembler, a fim de garantir um desempenho satisfatório. Procedimentos O delineamento experimental utilizado com os participantes submetidos ao Experimento 1 teve cada sujeito como seu próprio controle. Dessa forma, cada participante foi submetido seqüencialmente a 4 Fases experimentais (A, B, C e D), que compunham o programa Insensitivity 1. Para cada uma dessas fases, o programa permitia selecionar o esquema de reforçamento (Catania, 1999) desejado a que o participante seria submetido, dentre as seguintes opções: RF (razão fixa), RV (razão variável), IF (intervalo fixo), IV (intervalo variável), TF (tempo fixo), TV (tempo variável), DRL (reforçamento diferencial de baixas taxas), DRH (reforçamento diferencial de altas taxas). Também era possível programar para qualquer uma das fases a condição de EXT (extinção). Tendo em vista que um procedimento muito usado para se avaliar a sensibilidade às contingências programadas tem sido desenvolver um responder em estado estável sob um esquema, e então mudar o esquema ou os parâmetros deste (Hayes e cols., 1986a), as Fases experimentais do Experimento 1 foram dispostas de tal forma que o esquema de reforçamento que vigorava em cada uma das Fases implicava em um padrão comportamental nitidamente distinto em relação àquele que vigorava no esquema da Fase seguinte. Dessa forma, quanto mais distintos fossem os padrões de resposta típicos dos esquemas apresentados em seqüência, maiores as possibilidades de se realizar análises acerca de questões sobre 38 sensibilidade/insensibilidade. Após a realização de alguns testes em estudo piloto, foi escolhida a seguinte combinação inicial, apresentada na seqüência em que os participantes foram submetidos: Fase A: RF 18 (razão fixa). Nesta fase o participante foi submetido a seis sessões de razão fixa 18, o que significava que somente a última resposta de uma série de 18 era reforçada. Em tal esquema de reforçamento, o responder ocorre, tipicamente, em um taxa alta e sem interrupção, até que o reforçador seja apresentado (Catania, 1999). Cada sessão tinha duração de 3 minutos. Fase B: DRL 6 seg (reforçamento diferencial de baixas taxas). O participante foi submetido a 6 sessões de reforçamento diferencial de baixas taxas (DRL) 6 seg. Neste caso, cada resposta era reforçada somente quando era precedida por um tempo mínimo de 6 segundos sem nenhuma resposta. Quando respostas ocorriam no meio do intervalo de 6 segundos, recomeçava nova contagem do tempo. O responder, portanto, era baseado no espaçamento temporal de respostas individuais, e não na taxa de respostas geradas ao longo de um período de tempo. Em geral, quanto mais longo o tempo entre as respostas requerido para o reforço, mais baixa a taxa do responder (Catania, 1999). Cada sessão tinha duração de 3 minutos. Fase C: RF 18 (razão fixa). Nesta fase o participante foi novamente submetido a seis sessões de razão fixa 18, como na Fase A. Cada sessão também tinha duração de 3 minutos. Fase D: DRL 6 seg (reforçamento diferencial de baixas taxas) + punição. O participante foi submetido a 6 sessões de reforçamento diferencial de baixas taxas 6 seg. Cada sessão tinha duração de 3 minutos. A única diferença em relação à Fase B foi o acréscimo, em todas as sessões dessa fase, da operação de punição para àquelas respostas que não estavam de acordo com o esquema em vigor, isto é, para respostas 39 que ocorriam no meio do intervalo de 6 seg e que o reprogramavam. Enquanto operação, a punição consiste em programar, para o responder, uma conseqüência que o torna menos provável (Catania, 1999). Na presente fase, a punição foi efetivada via retirada de um ponto ganho para cada resposta inadequada (punição negativa), com a finalidade de diminuir a freqüência de tais respostas e aumentar o contato com o esquema que estava vigorando. Dessa forma, a perda de pontos deveria funcionar como estímulo punitivo. A Tabela 1 resume o procedimento do Experimento 1. Tabela 1. Fases experimentais, esquema de reforçamento, consequenciação de respostas e número de sessões aos quais cada participante foi submetido durante o Experimento 1. Fase Esquema Consequenciação de respostas A RF 18 B DRL 6 seg C RF 18 D DRL 6 seg + punição Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: um ponto perdido Número de sessões 6 6 6 6 Deve-se notar, conforme já apontado, que os esquemas RF (razão fixa) – onde a propriedade sobre a qual a contingência opera é a relação entre repostas e reforçadores – e DRL (reforçamento diferencial de baixas taxas) – onde a principal propriedade contingenciada é a relação temporal entre as respostas – foram escolhidos propositalmente por implicarem padrões de resposta bem distintos (Catania, 1999). A inserção da punição na Fase D teve como objetivo possibilitar análises acerca da possibilidade de tal operação contribuir para um maior contato com as contingências em vigor. Assim, é a comparação dos desempenhos do participante nas Fases B (DRL sem punição) e D (DRL com punição) que dirá até que ponto tal manipulação foi eficaz no sentido de levá-lo a contactar com o esquema em vigor 40 (DRL 6 seg), caso tal contato ainda não tivesse sido estabelecido na Fase B. Dessa forma, comparações entre essas duas fases revelariam ou não a necessidade de se forçar o contato do participante com as discrepâncias entre seu desempenho e o esquema que realmente estava vigorando, a fim de que tal participante se desempenhasse de forma sensível em relação aos arranjos experimentais programados (Galizio, 1979). A tarefa do sujeito em todas as fases era tocar, de acordo com o esquema em vigor, um círculo central de cor amarela que aparecia no centro da tela do computador. Cada toque era computado como uma resposta. Toques fora do círculo central não eram registrados, pois não produziam quaisquer conseqüências no equipamento utilizado. Um contador aparecia no canto superior direito da tela do computador e permitia o registro dos pontos ganhos, dos pontos perdidos e do saldo total do participante. Cada ponto ganho era acompanhado da apresentação de um som característico de pontos ganhos e cada ponto perdido era acompanhado de um som característico de perda de pontos. O saldo total de pontos era registrado pela experimentadora no final de cada sessão e o contador era zerado no início de cada nova sessão (Ver Figura 1). Figura 1. Tela apresentada ao participante para respostas 41 Nas Fases A e C, após cada seqüência de 18 respostas (toques no círculo central), um ponto era acrescido ao contador. O tempo entre cada resposta era variável, dependendo do ritmo de toques de cada participante, sendo que o programa permitia registros de até oito toques por segundo. Já nas Fases B e D, uma resposta só era reforçada após transcorrido um tempo mínimo de 6 seg. em relação à última resposta. Houve perda de pontos programada somente na Fase D, através da inserção da punição para aquelas respostas que não estavam de acordo com o esquema em vigor (DRL 6 seg), isto é, respostas que ocorriam no meio do intervalo de 6 segundos e que o reprogramavam. Dessa forma, nas Fases A, B, C e D sempre que era emitida uma resposta correta, de acordo com os parâmetros do esquema, um ponto ganho era acrescido ao contador acompanhado de um som característico de ganho de pontos e da alteração do saldo total. Nas Fases A, B e C, todas as respostas incorretas não tinham conseqüências programadas. Especificamente na Fase D, quando o participante emitia uma resposta incorreta, fora dos padrões do esquema, ocorria perda de um ponto no contador acompanhado de som característico de perda de pontos e de alteração no seu saldo total. O participante era instruído, logo no início das sessões, de que poderia trocar seu saldo final de pontos por dinheiro ao final destas. Cada ponto correspondia a R$ 0,05 (cinco centavos). Os parâmetros de número de resposta (18) no esquema de RF e tempo (6 segundos) no esquema de DRL foram baseados em Hayes e cols. (1986b). A definição de tais parâmetros foi uma tentativa de equilibrar o número de reforçadores obtidos em cada sessão realizada com os diferentes esquemas de reforçamento. Assim, esperava-se que em uma sessão de 3 minutos de RF 18 a quantidade de reforçadores obtida fosse equivalente à quantidade obtida em uma sessão de 3 42 minutos de DRL 6 seg, considerando desempenhos sensíveis aos esquemas. Também se esperava que com a realização de 6 sessões em cada fase fosse possível atingir um padrão estável de respostas para, na seqüência, submeter o participante à fase seguinte. O critério para o encerramento de cada fase experimental e conseqüente transição para a fase seguinte era a realização de seis sessões, com três minutos de duração cada. As mudanças de fase não eram sinalizadas e nem instruídas. Dessa forma, cada participante foi submetido a um total de 24 sessões, sendo que três sessões eram realizadas pela manhã e três à tarde, totalizando 6 sessões diárias e quatro dias de coleta com cada participante. Entre as três sessões realizadas em um mesmo período eram feitos intervalos de 5 minutos. Cada participante foi submetido somente às seguintes instruções gerais apresentadas na tela do computador no início de cada período (manhã e tarde) de coleta de dados: “Este é um estudo sobre aprendizagem. Você será exposto a tarefas nas quais poderá ganhar ou perder pontos que serão acumulados de forma visível no canto superior direito da tela do computador. Cada ponto ganho ou perdido vale R$ 0,05 (cinco centavos). Seu saldo final será trocado por dinheiro ao término da sessão. Em hipótese alguma você sairá devendo. Tente ganhar o máximo possível de pontos. Você poderá fazer isso tocando o círculo amarelo que aparecerá no centro da tela do computador. Observação: Você poderá abandonar o estudo a qualquer momento em que desejar. Caso você tenha compreendido essas instruções, toque na tela para iniciar o estudo, caso contrário, leia novamente as instruções. Toque na tela para aparecer o círculo amarelo”. 43 Resultados Os resultados foram baseados em uma análise dos desempenhos dos participantes em cada fase experimental específica, bem como, em comparações entre fases. Dessa forma, para cada participante, todas as análises foram realizadas com o objetivo de se verificar até que ponto o sujeito se comportou de acordo com as contingências em vigor para cada fase, possibilitando discussões acerca de sensibilidade/insensibilidade aos esquemas. Os parâmetros selecionados para subsidiar a análise foram o número de respostas em cada sessão, onde foram computadas todas as respostas – reforçadas, não reforçadas ou punidas – do participante ao longo da sessão experimental; a média aritmética simples de respostas a cada três sessões, referente ao somatório de todas as respostas ao longo de um conjunto de três sessões consecutivas dividido por três; a quantidade de reforçadores obtidos em cada sessão, que diz respeito, nas três primeiras Fases experimentais (A, B e C), ao número de pontos ganhos para cada resposta reforçada, e na quarta Fase (D), diz respeito ao total de pontos ganhos, isto é, ao número de respostas reforçadas com ganho de pontos menos o número de respostas punidas com perda de pontos; a taxa de respostas, que se refere à razão entre o total de respostas em uma sessão e a duração da mesma (180 segundos) e, finalmente, a quantidade de respostas por reforçador, que diz respeito à razão entre a quantidade de respostas em cada sessão e a quantidade total de reforçadores obtidos naquela sessão específica. A Tabela 2 mostra os dados do Participante 1 (P1). 44 Tabela 2. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P1 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 547 30 3,0 18,2 760,7 2ª 840 46 4,7 18,3 (σ = 187,1) RF 18 A 3ª 895 49 5,0 18,3 4ª 863 47 4,8 18,4 881,3 5ª 871 48 4,8 18,1 (σ = 25,1) 6ª 910 50 5,1 18,2 1ª 676 0 3,8 -736,3 2ª 730 0 4,1 -(σ = 63,7) B DRL 6 1 4,5 803 3ª 803 seg 4ª 825 0 4,6 -740,3 5ª 715 0 4,0 -(σ = 75,3) 6ª 681 0 3,8 -1ª 864 48 4,8 18,0 876,7 2ª 906 50 5,0 18,1 (σ = 25,5) RF 18 C 47 4,8 18,3 3ª 860 4ª 863 47 4,8 18,4 1020,3 5ª 1114 61 6,2 18,3 (σ = 137,1) 6ª 1084 60 6,0 18,1 1ª 44 (9-35)-26* 0,2 -31,0 2ª 28 (24-4) 20* 0,2 1,4 (σ = 9,6) D DRL 6 (21-0) 21* 0,1 1,0 3ª 21 seg + 4ª 25 (22-3) 19* 0,1 1,3 punição 25,0 5ª 26 (26-0) 26* 0,1 1,0 (σ = 1,0) 6ª 24 (24-0) 24* 0,1 1,0 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. Em relação à Fase A (RF 18) observa-se uma tendência crescente no número de respostas apresentado em cada sessão, com o mínimo de 547 e máximo de 910 respostas na primeira e sexta sessões, respectivamente. Conseqüentemente, a quantidade de reforçadores obtida e a taxa de respostas para cada sessão também apresentaram tendência crescente. A quantidade de respostas por reforçador apresentou tendência estável em todas as sessões – 18 respostas para cada reforçador ganho – como não poderia ser diferente em um esquema de RF 18. Esse mesmo padrão de desempenho foi observado na Fase C (RF 18), com pequenas variações 45 geradas pelo maior número de respostas emitidas por sessão, com mínimo de 860 e máximo de 1114 respostas, na terceira e quinta sessões, respectivamente. Como se trata de um esquema de razão, onde o responder ocorre normalmente em taxas altas a fim de maximizar o ganho de reforçadores, observa-se que P1 desempenhou-se de forma adequada em relação ao esperado para ambas as Fases (A e C). Verifica-se em relação à Fase B (DRL 6 seg.) que o número de respostas por sessão e a taxa de respostas continuaram altos, mesmo com a mudança do esquema. O número total de reforçadores ganho em todas as seis sessões dessa Fase foi de somente 1, o que demonstra uma clara falta de ajustamento do desempenho de P1 ao esquema em vigor. A análise dos dados da Fase D (DRL + punição) permite constatar clara diminuição na emissão do número de respostas e, conseqüentemente, na taxa de respostas em todas as sessões dessa fase com um máximo de 44 e mínimo de 21 respostas, na primeira e terceira sessões, respectivamente. A adaptação do desempenho de P1 ao esquema em vigor foi rápida, visto que já na segunda sessão a quantidade de reforçadores obtida foi de 20, apresentando pouca oscilação desse número em relação às sessões subseqüentes. A partir da segunda sessão, P1 demonstra um desempenho próximo ao ideal para o esquema proposto emitindo cerca de uma resposta para cada reforçador ganho. Isso pode ser observado na coluna QRR da Tabela 2, nas cinco últimas sessões. A Tabela 3 mostra os dados do Participante 2 (P2). 46 Tabela 3. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P2 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 329 18 1,8 18,3 403,7 2ª 288 16 1,6 18,0 (σ = 166,1) RF 18 A 33 3,3 18,0 3ª 594 4ª 1008 56 5,6 18,0 1007,7 5ª 990 55 5,5 18,0 (σ = 17,5) 6ª 1025 56 5,7 18,3 1ª 515 0 2,9 -492,7 2ª 491 0 2,7 -(σ = 21,5) B DRL 6 1 2,6 472 3ª 472 seg 4ª 406 1 2,3 406 490,7 5ª 604 0 3,4 -(σ = 102,1) 6ª 462 0 2,6 -1ª 934 51 5,2 18,3 1029,7 2ª 1097 60 6,1 18,3 (σ = 85,1) RF 18 C 58 5,9 18,2 3ª 1058 4ª 1043 57 5,8 18,3 1028,7 5ª 987 54 5,5 18,3 (σ = 36,7) 6ª 1056 58 5,9 18,2 1ª 78 (5-73)-68* 0,4 -41,7 2ª 26 (21-5) 16* 0,1 1,7 (σ = 31,6) D DRL 6 3ª 21 (19-2) 17* 0,1 1,2 seg + 4ª 25 (21-4) 17* 0,1 1,5 punição 24,3 5ª 24 (20-4) 16* 0,1 1,5 (σ = 0,6) 6ª 24 (20-4) 16* 0,1 1,5 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. A observação dos dados da Fase A (RF 18) revela que P2 apresentou um padrão crescente no número de respostas emitidas, na quantidade de reforçadores obtidos e na taxa de respostas ao longo das seis sessões realizadas. Esse mesmo padrão foi observado para a Fase C (RF 18), com o diferencial de que para essa Fase a variação apresentada no número de respostas por sessão (mínimo de 934 e máximo de 1097) foi menor que aquela apresentada na Fase A (mínimo de 329 e máximo de 1025) e o número total de reforçadores obtidos foi maior do que na Fase A. Uma 47 análise geral dos dados da Fase C permite constatar clara regularidade no desempenho de P2 ao longo das seis sessões dessa Fase, com altas taxas de respostas acompanhadas por um número elevado de reforçadores obtidos. Quanto à Fase B (DRL 6 seg), P2 apresentou diminuição no número de respostas emitidas em relação às últimas sessões da Fase A. No entanto, tal diminuição não representou uma adaptação adequada ao esquema em vigor, visto que a quantidade de reforçadores obtida ao longo das seis sessões foi de somente 2. O que se observa para essa Fase é um padrão de pouca variação no número de respostas emitidas em cada sessão, sendo que os valores apresentados – com média de 492,7 e 490,7 respostas – não foram adequados para permitir ganho de reforçadores. Já em relação à Fase D (DRL + punição), P2 apresentou um desempenho adequado ao esquema a partir da segunda sessão, mantendo, a partir de então, um padrão estável de baixas taxas de respostas e de ganho regular de reforçadores por sessão. Em uma análise geral dos dados apresentados pode-se afirmar que P2 demonstrou desempenhos adequados aos esquemas em vigor nas Fases A, C e D. A Tabela 4 mostra os dados do Participante 3 (P3). De acordo com os dados de P3 observa-se certa semelhança nos padrões de desempenho apresentados nas Fases A (RF 18) e C (RF 18), isto é, números variáveis de respostas, mas em geral altos, acompanhados por uma quantidade também alta de reforçadores, dados esses indicativos de boa adaptação ao esquema em vigor. Um dado diferencial de P3 em relação aos outros participantes é a apresentação de uma taxa média de respostas nas três últimas sessões do esquema RF 18, nas Fases A e C, inferior às três primeiras sessões, o que significa a emissão 48 de um número maior de respostas nas sessões iniciais dessas Fases em relação às sessões finais. Tabela 4. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P3 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 466 25 2,6 18,6 728,7 2ª 740 41 4,1 18,0 (σ = 257,2) RF 18 A 3ª 980 50 5,0 18,2 4ª 677 37 3,8 18,3 698,7 5ª 715 39 4,0 18,3 (σ = 19,6) 6ª 704 39 3,9 18,1 1ª 444 1 2,5 444 366,3 2ª 409 1 2,3 409 (σ = 105,7) B DRL 6 3ª 246 4 1,4 61,5 seg 4ª 225 8 1,2 28,1 117,0 5ª 96 14 0,5 6,9 (σ = 99,2) 6ª 30 11 0,2 2,7 1ª 845 46 5,0 18,4 751,7 2ª 709 39 4,0 18,2 (σ = 80,9) RF 18 C 38 4,0 18,4 3ª 701 4ª 737 40 4,1 18,4 677,7 5ª 439 24 2,4 18,3 (σ = 215,2) 6ª 857 47 4,8 18,2 1ª 31 (18-13) 5* 0,2 6,2 23,0 2ª 18 (16-2) 14* 0,1 1,3 (σ = 7,0) D DRL 6 3ª 20 (19-1) 18* 0,1 1,1 seg + 4ª 18 (17-1) 16* 0,1 1,1 punição 18,3 5ª 19 (17-2) 15* 0,1 1,3 (σ = 0,6) 6ª 18 (17-1) 16* 0,1 1,1 *A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. O desempenho de P3 durante a Fase B (DRL 6 seg.) foi caracterizado por certa irregularidade. Nas sessões iniciais dessa Fase, P3 demonstrou um padrão de não adaptação ao esquema vigente, apresentando altas taxas de respostas e baixa quantidade de obtenção de reforçadores. Já nas duas últimas sessões dessa Fase, P3 começa a apresentar padrões mais sensíveis de desempenho, expressos através da diminuição no número de respostas e do aumento de reforçadores. Considerando a 49 tendência apresentada pelo participante, torna-se possível cogitar a possibilidade de que se as sessões prosseguissem dentro desse mesmo esquema, seria possível que P3 apresentasse desempenhos sensíveis na Fase B como àqueles demonstrados na Fase D (DRL + punição) através da emissão de taxas baixas de respostas e do aumento no número de reforçadores obtidos. A variabilidade nas variáveis analisadas constatada em relação às Fases anteriores não se manteve durante a Fase D. Observa-se, a partir da segunda sessão dessa Fase, que o participante apresentou um desempenho altamente estável quanto ao número de respostas emitidas (com variação mínima de 18 e máxima de 20 respostas), quanto à quantidade de reforçadores obtidos (mínimo de 14 e máximo de 18 reforçadores), quanto à taxa de respostas (0,1) e quanto à quantidade de respostas por reforçador (mínima de 1,1 e máxima de 1,3). A Tabela 5 ilustra os dados do Participante 4 (P4). P4 apresentou durante a Fase A (RF 18) um desempenho típico do esquema em vigor, isto é, taxas altas de respostas conseqüentemente acompanhadas pela obtenção de altos valores de reforçadores, visto que se trata de um esquema de razão. Em relação à Fase B (DRL 6 seg.), P4 diminuiu o número de respostas emitidas em cada sessão em relação à Fase anterior, porém tal mudança em seu desempenho não foi suficiente para gerar um padrão de desempenho adequado durante essa Fase, visto que, a quantidade de reforçadores obtida foi insuficiente em todas as sessões para caracterizar um desempenho sensível. Somente na sexta sessão dessa Fase, o participante reduziu o número de respostas de tal forma a garantir um ganho maior de reforçadores (12) em relação às sessões anteriores (onde a variação foi de 1 a 4 reforçadores obtidos por sessão). Esse dado, porém, é insuficiente para se 50 cogitar uma tendência à sensibilidade com uma possível continuidade das sessões dentro dessa mesma Fase. Tabela 5. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P4 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 409 22 2,3 18,6 825,3 2ª 1047 58 5,8 18,1 (σ = 360,8) A RF 18 3ª 1020 56 5,7 18,2 4ª 923 51 5,1 18,1 881,7 5ª 898 49 5,0 18,3 (σ = 51,5) 6ª 824 45 4,6 18,3 1ª 216 2 1,2 108,0 192,3 2ª 185 2 1,0 92,5 (σ = 21,0) B DRL 6 3ª 176 1 1,0 176,0 seg 4ª 184 1 1,0 184,0 106,3 5ª 107 4 0,6 26,8 (σ = 78,0) 6ª 28 12 0,2 2,3 1ª 133 7 0,7 19,0 170,7 2ª 166 9 0,9 18,4 (σ = 40,2) C RF 18 11 1,2 19,4 3ª 213 4ª 234 13 1,3 18,0 271,3 5ª 256 14 1,4 18,3 (σ = 46,9) 6ª 324 18 1,8 18,0 1ª 44 (9-35)-26* 0,2 -32,3 2ª 26 (24-2) 22* 0,1 1,2 (σ = 10,1) D DRL 6 3ª 27 (26-1) 25* 0,2 1,1 seg + 4ª 28 (28-0) 28* 0,2 1,0 punição 28,0 5ª 28 (26-2) 24* 0,2 1,2 (σ = 0,0) 6ª 28 (28-0) 28* 0,2 1,0 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. Na Fase C (RF 18) observa-se um uma tendência crescente no número de respostas emitidas a medida em que as sessões se sucedem, com um número mínimo de 133 e máximo de 324 respostas, na primeira e sexta sessões, respectivamente. O mesmo ocorre em relação à quantidade de reforçadores (mínima de 7 e máxima de 18). No entanto, o desempenho de P4 nessa Fase difere daquele apresentado na Fase A, a despeito da semelhança no esquema utilizado em ambas as Fases. Em termos de 51 número de respostas e quantidade de reforçadores obtidos na Fase C, pode-se considerar que P4 apresentou um desempenho intermediário entre aqueles apresentados nas Fases A e B. Como o número de respostas aumentou com o avanço das sessões, é possível cogitar que o participante demonstraria padrões mais adequados ao esquema dessa Fase caso o número de sessões fosse maior. Tendo em vista os dados da Fase D (DRL + punição), o desempenho de P4 não difere daqueles apresentados pelos outros participantes, isto é, um padrão adequado e estável de desempenho a partir da segunda sessão dessa Fase, caracterizado por taxas baixas no responder, pouca variabilidade no número de respostas (mínimo de 26 e máximo de 28 respostas) e obtenção dos reforçadores programados. Os dados do Participante 5 (P5) são expostos na Tabela 6. O desempenho de P5 na Fase A (RF 18) foi caracterizado, de forma geral, por taxas altas de respostas e obtenção de um número também alto de reforçadores em cada sessão dessa Fase, dados esses indicativos de um desempenho adequado ao esquema proposto. Nas Fases B (DRL 6 seg) e C (RF 18), no entanto, o padrão de respostas apresentado pelo participante não foi congruente com os esquemas programados. A Fase B foi caracterizada pela manutenção de um número relativamente alto de respostas, o que, por sua vez, gerou baixa quantidade de reforçadores ganhos. Na Fase C ocorreu o inverso, isto é, taxas baixas de respostas e de reforçadores obtidos, onde taxas elevadas é que conduziriam a uma quantidade satisfatória de reforçadores. 52 Tabela 6. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P5 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 319 17 1,8 18,8 475,7 2ª 604 33 3,4 18,3 (σ = 144,6) A RF 18 3ª 504 28 2,8 18,0 4ª 450 25 2,5 18,0 463,7 5ª 464 25 2,6 18,6 (σ = 13,5) 6ª 477 26 2,6 18,3 1ª 264 6 1,5 44,0 240,7 2ª 225 6 1,2 37,5 (σ = 20,6) B DRL 6 2 1,3 116,5 3ª 233 seg 4ª 91 6 0,5 15,2 134,3 5ª 143 6 0,8 23,8 (σ = 39,7) 6ª 169 9 0,9 18,8 1ª 56 3 0,3 18,7 49,7 2ª 44 2 0,2 22,0 (σ = 6,0) C RF 18 2 0,3 24,5 3ª 49 4ª 39 2 0,2 19,5 46,0 5ª 39 2 0,2 19,5 (σ = 12,1) 6ª 60 3 0,3 20,0 1ª 36 (19-17) 2* 0,2 18,0 28,0 2ª 24 (23-1) 22* 0,1 1,1 (σ = 6,9) D DRL 6 (23-1) 22* 0,1 1,1 3ª 24 seg + 4ª 23 (22-1) 21* 0,1 1,1 punição 21,7 5ª 20 (19-1) 18* 0,1 1,1 (σ = 1,5) 6ª 22 (21-1) 20* 0,1 1,1 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. Sem se diferenciar dos outros participantes, a partir da segunda sessão da Fase D (DRL 6 seg. + punição), P5 passa a apresentar um desempenho em acordo com as contingências programadas: número baixo e estável de respostas (variando de 20 a 24 respostas) com a conseqüente obtenção de uma grande quantidade de reforçadores. O padrão regular de desempenho nessa Fase, a partir da segunda sessão, fica claro ao se analisar os valores estáveis de taxa de respostas (0,1) e quantidade de respostas por reforçador (1,1). 53 De uma forma geral, pode-se dizer que P5 apresentou desempenho em acordo com o esquema vigente nas Fases A e D e desempenho inadequado nas Fases B e C. O Participante 6 (P6) tem seus dados apresentados na Tabela 7. Em uma análise geral, pode-se considerar que P6 apresentou um desempenho congruente com os parâmetros dos esquemas programados em todas as quatro Fases experimentais. Tabela 7. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P6 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 0 0 --366,7 2ª 472 26 2,6 18,2 (σ = 327,0) A RF 18 34 3,5 18,5 3ª 628 4ª 526 29 2,9 18,1 562,0 5ª 597 33 3,3 18,1 (σ = 35,5) 6ª 563 31 3,1 18,2 1ª 456 0 2,5 -180,7 2ª 63 10 0,4 6,3 (σ = 239,3) B DRL 6 18 0,1 1,3 3ª 23 seg 4ª 23 23 0,1 1,0 24,3 5ª 24 24 0,1 1,0 (σ = 1,5) 6ª 26 25 0,1 1,0 1ª 117 6 0,6 19,5 473,7 2ª 354 19 2,0 18,6 (σ = 429,2) C RF 18 3ª 950 52 5,3 18,3 4ª 981 54 5,4 18,2 951,3 5ª 936 52 5,2 18,0 (σ = 25,7) 6ª 937 52 5,2 18,0 1ª 25 (17-8) 9* 0,1 2,8 25,3 2ª 26 (24-2) 22* 0,1 1,2 (σ = 0,6) D DRL 6 3ª 25 (25-0) 25* 0,1 1,0 seg + 4ª 27 (26-1) 25* 0,2 1,1 punição 26,3 5ª 25 (25-0) 25* 0,1 1,0 (σ = 1,2) 6ª 27 (25-2) 23* 0,2 1,2 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. 54 No que diz respeito às Fases A (RF 18) e C (RF 18), pode-se notar que, a partir da segunda sessão de ambas as fases, P6 passa a demonstrar alto número de respostas acompanhado por quantidades elevadas de obtenção de reforçadores. Tais dados são indicativos de um desempenho adequado ao esquema estabelecido. Especificamente a partir da terceira sessão da Fase C, o participante apresenta emissões de número de respostas altamente regulares ao longo das sessões (variando de um mínimo de 936 a um máximo de 981 repostas) com a obtenção de uma quantidade de reforçadores também regular (mínimo de 52 e máximo de 54 reforçadores). Diferentemente dos outros participantes, a partir da terceira sessão da Fase B (DRL 6 seg.), P6 demonstra adequação aos parâmetros do esquema programado através da emissão de um baixo número de respostas por sessão a qual, por sua vez, foi acompanhada por quantidades elevadas de obtenção de reforçadores. Um padrão estável de respostas (com variação de 23 a 26 respostas) é estabelecido ao longo das quatro sessões finais dessa Fase. Ao longo de todas as sessões da Fase D (DRL 6 seg. + punição) o participante demonstrou um padrão baixo e regular no número de respostas apresentadas (mínimo de 25 e máximo de 27 respostas), o que levou à obtenção de uma alta quantidade de reforçadores por sessão, a partir da segunda sessão. Considerando o desempenho de P6 a partir da segunda sessão de cada uma das Fases propostas, pode-se constatar a emissão de padrões de respostas – e a conseqüente obtenção de reforçadores – indicativos de uma atuação adequada às contingências vigentes. A Figura 2 apresenta as médias de respostas (MR) das três últimas sessões de cada Fase experimental (A, B, C e D) para os participantes P1, P2, P3, P4, P5 e P6. 55 De acordo com os dados apresentados na Figura 2 pode-se notar que nas comparações entre as Fases AB e CD houve tendência à diminuição na quantidade média de respostas apresentadas pelo P1 na segunda Fase em relação à primeira, sendo tal diminuição mais acentuada entre as duas últimas Fases analisadas (CD). Já em relação às Fases BC houve aumento na taxa média de respostas em C em relação à B. Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de respostas apresentadas foram superiores àquelas obtidas nos esquemas de DRL 6 seg (Fases B e D). A comparação entre as Fases BD permite análises adicionais quanto à questão da sensibilidade/insensibilidade comportamental, visto que a única diferença entre tais Fases consistiu na inserção da punição na Fase D como uma manipulação experimental que deveria viabilizar o processo de sensibilização comportamental ao esquema (DRL 6 seg). A análise dos dados deixa claro o efeito da inserção da punição como elemento facilitador da adaptação comportamental de P1 ao esquema programado, visto que a diferença entre as médias de respostas nas Fases BD foi consideravelmente grande – a média de respostas em B é cerca de 30 vezes maior do que em D – para que se possa afirmar que a punição obrigou P1 a estabelecer um contato mais preciso com o esquema em vigor que àquele estabelecido na Fase B. Deve-se notar que P1 emitiu taxa média de 25,0 respostas nas três últimas sessões da Fase D, próximo ao desempenho ideal para tal Fase que seria de 30 respostas. 56 P1 P2 1200 1000 1200 1020,3 881,3 740,3 800 MÉDIAS DO NÚMERO DE RESPOSTAS 1000 1028,7 1007,7 800 600 600 400 400 200 490,7 200 25 24,3 0 0 A B C A D P3 P4 800 1000 700 698,7 900 677,7 C D 881,7 800 600 700 500 600 400 500 300 400 271,3 300 200 200 117 100 18,3 0 106,3 100 28 0 A B C D A B C D P6 P5 500 B 1000 463,7 450 900 400 800 350 700 300 600 250 500 951,3 562 400 200 134,3 150 300 200 100 46 50 21,7 0 100 24,3 26,3 0 A B C D A B C D FASES EXPERIMENTAIS Figura 2. Médias do número de respostas das três últimas sessões das Fases experimentais A (RF 18), B (DRL 6 seg.), C (RF 18) e D (DRL 6 seg. + punição) para os participantes P1, P2, P3, P4, P5 e P6. 57 Comparações entre as Fases AB (onde a taxa média de respostas diminui de 881,3 para 740,3) e CD (onde a taxa média de respostas diminui de 1020,3 para 25,0) também deixam claro o efeito da punição em levar P1 a um desempenho mais adequado de acordo com o esquema em vigor na Fase D. Assim, pode-se afirmar que houve controle relativamente fraco do esquema DRL 6 seg sem o estabelecimento da punição (Fase B) e taxas mais apropriadamente diferenciadas quando a punição foi adicionada (Fase D), com a conseqüente apresentação de um desempenho claramente controlado pelo esquema programado. Em termos de média de respostas, o padrão geral de desempenho de P2 foi semelhante àquele de P1. De acordo com os dados apresentados na Figura 2 pode-se notar nas comparações realizadas entre as Fases AB e CD tendência à diminuição na quantidade média de respostas apresentadas por P2 na segunda Fase em relação à primeira, sendo tal diminuição mais acentuada entre as Fases CD. Já em relação às Fases BC houve aumento na taxa média de respostas em C em relação a B. Os dados demonstram que nas Fases de RF 18 (A e C) as médias de respostas apresentadas foram superiores àquelas obtidas nos esquemas de DRL 6 seg (fases B e D), indicando assim que o participante demonstrou considerável adaptação de seu padrão de respostas aos esquemas apresentados. Na comparação entre as Fases BD, os dados deixam claro o efeito da inserção da punição como elemento facilitador da adaptação comportamental de P2 ao esquema programado, visto que a diferença entre as médias de respostas nas Fases BD foi consideravelmente grande – a média de respostas em B é cerca de 20 vezes maior do que em D – para que se possa afirmar que a punição levou P2 a estabelecer um contato mais eficiente com o esquema em vigor que àquele estabelecido na Fase B. Deve-se notar que P2 emitiu taxa média de 24,3 respostas nas três últimas sessões 58 da Fase D, próxima ao desempenho ideal para tal Fase que seria de 30 respostas. Comparações entre as Fases AB (onde a taxa média de respostas diminui de 1007,7 para 490,7) e CD (onde a taxa média de respostas diminui de 1028,7 para 24,3) também deixam claro o efeito da punição em levar P2 a um desempenho mais adequado de acordo com o esquema em vigor na Fase D. Assim, pode-se afirmar que o controle exercido pelo esquema DRL 6 seg. foi eficientemente estabelecido através da inserção da punição na Fase final do experimento, levando assim P2 a estabelecer um contato mais preciso com o esquema em vigor. O padrão geral de desempenho de P3 foi semelhante ao de P1 e P2. De acordo com os dados apresentados na Figura 2 pode-se notar que nas comparações realizadas entre as Fases AB e CD houve tendência à diminuição na quantidade média de respostas apresentadas por P3 na segunda Fase em relação à primeira, sendo tal diminuição mais significativa entre as duas últimas Fases analisadas (CD). Já em relação às Fases BC houve aumento na taxa média de respostas em C em relação à B. Os dados demonstram que P3 também apresentou taxas médias de respostas no esquema de razão (Fases A e C) superiores àquelas apresentadas no esquema de DRL (Fases B e D), dado esse indicativo de sensibilidade aos esquemas programados. A comparação das médias das Fases BD permite apontar a inserção da punição como provável variável responsável pela maior adequação comportamental de P3 na Fase D em relação à Fase B, visto que a diferença entre as médias de respostas nas duas Fases foi relativamente grande – a média de respostas em B é cerca de 6 vezes maior do que em D – para que se possa afirmar que a punição levou P3 a estabelecer um contato mais efetivo com o esquema em vigor que aquele estabelecido na Fase B. P3 emitiu taxa média de 18,3 respostas nas três últimas 59 sessões da Fase D, taxa essa muito mais próxima do desempenho ideal para tal Fase, que seria de 30 respostas, do que a taxa emitida na Fase B (117,0). Comparações entre as Fases AB (onde a taxa média de respostas diminui de 698,7 para 117,0 respostas) e CD (onde a taxa média de respostas diminui de 677,7 para 18,3) também deixam claro o efeito da punição em levar P3 a um desempenho mais adequado de acordo com o esquema em vigor na Fase D. De acordo com a Figura 2, P4 teve um padrão de desempenho semelhante aos participantes anteriores, com pequenas diferenças apontadas na seqüência. Pode-se notar que nas comparações realizadas entre as Fases AB e CD houve tendência à diminuição na quantidade média de respostas apresentadas pelo P4 na segunda Fase em relação à primeira, sendo tal diminuição significativa tanto entre as Fases AB (com diminuição nas taxas médias de respostas de 881,7 para 106,3) quanto entre as Fases CD (com diminuição nas taxas médias de respostas de 271,3 para 28,0). Já em relação às Fases BC houve aumento na taxa média de respostas em C em relação à B. Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de respostas apresentadas foram superiores àquelas obtidas nos esquemas de DRL 6 seg (Fases B e D). No entanto, torna-se necessário destacar para P4 uma diminuição acentuada na taxa média de respostas apresentada durante a segunda exposição ao esquema de RF 18 na Fase C (271,3 respostas) em relação à taxa média apresenta na primeira exposição a esse esquema durante a Fase A (881,7 respostas), padrão esse não constatado em relação aos outros participantes já citados. A análise dos valores médios apresentados em cada uma das supracitadas Fases leva à possibilidade de que durante a Fase C o participante tenha apresentado certa insensibilidade comportamental, através da demonstração de taxas baixas de respostas em 60 circunstâncias nas quais taxas altas é que estariam positivamente correlacionadas com o ganho de pontos, em função da exposição anterior ao esquema de reforçamento de DRL (Fase B), o qual reforçava padrões baixos de taxas de respostas. Dessa forma, cogita-se a possibilidade de que a exposição prévia a tal Fase possa ter gerado os aspectos de insensibilidade observados na Fase subseqüente. A análise da comparação entre as fases BD permite verificar o efeito da inserção da punição como provável elemento facilitador da adaptação comportamental de P4 ao esquema apresentado na Fase D, visto que a diferença entre as médias de respostas nas Fases BD foi relativamente significativa – a média de respostas em B é cerca de 4 vezes maior do que em D – para que se possa afirmar que a punição levou P4 a estabelecer um contato mais preciso com o esquema em vigor que àquele estabelecido na Fase B. Comparações entre as Fases AB (onde a taxa média de respostas diminui de 881,7 para 106,3) e CD (onde a taxa média de respostas diminui de 271,3 para 28,0) deixam claro que P4 já havia demonstrado sinais de sensibilidade comportamental já na primeira Fase de DRL (fase B), em virtude da acentuada diminuição de respostas apresentada em relação à Fase anterior (A) e que o efeito da punição consistiu apenas em intensificar tais sinais na Fase D, induzindo assim o participante a um desempenho ainda mais adequado de acordo com o esquema em vigor. Para tanto, deve-se notar que P4 emitiu taxa média de 28,0 respostas nas três últimas sessões da Fase D, próximo ao desempenho ideal para tal Fase (30 respostas). De acordo com os dados apresentados na Figura 2 pode-se notar que nas comparações realizadas entre as Fases AB e CD houve tendência à diminuição na quantidade média de respostas apresentadas pelo P5 na segunda Fase em relação à 61 primeira, sendo tal diminuição mais significativa entre as duas primeiras Fases analisadas (AB). Em relação às Fases BC também foi constatada diminuição da média de respostas da segunda Fase em relação à primeira, dado esse indicador de insensibilidade comportamental, pois P5 apresentou padrões contrários àqueles esperados para os esquemas em vigor (taxa de respostas mais alta no esquema de DRL do que no esquema de razão). Tal dado conduz à constatação de uma diferença significativa entre as médias de respostas apresentadas nas duas Fases de RF 18, Fase A (com média de 463,7 respostas) e Fase C (com média de 46,0 respostas). Dessa forma, constata-se que houve, nesta última Fase, redução na sensibilidade às contingências através da demonstração de taxas baixas de respostas em circunstâncias nas quais taxas altas é que estariam relacionadas com o ganho de reforçadores. É possível levantar a possibilidade de que a baixa taxa média de respostas apresentada durante a Fase C, a qual caracteriza um padrão de insensibilidade comportamental, deveu-se à exposição anterior ao esquema de DRL na Fase B; isto é, o padrão comportamental de baixas taxas desenvolvido ao longo da exposição desse esquema teria influenciado no padrão apresentado na Fase subseqüente. A comparação entre as Fases BD permite análises adicionais quanto à questão da sensibilidade/insensibilidade comportamental. A diferença entre as médias de respostas nas Fases BD foi relativamente grande – a média de respostas em B é cerca de 6 vezes maior do que em D – para que se possa cogitar que a punição levou P5 a estabelecer um contato mais preciso com o esquema em vigor que àquele estabelecido na Fase B. Deve-se notar que P5 emitiu taxa média de 21,7 respostas nas três últimas sessões da Fase D, próximo ao desempenho ideal (30 62 respostas) para tal Fase. Assim, houve controle relativamente fraco do esquema DRL 6 seg. sem o estabelecimento da punição (Fase B) e taxas mais apropriadamente diferenciadas quando a punição foi adicionada (Fase D), com a conseqüente apresentação de um desempenho claramente controlado pelo esquema programado. Portanto, mesmo sendo constatada certa insensibilidade no padrão de respostas apresentado por P5 em relação ao esquema de razão, fica evidente o efeito do fortalecimento do esquema em vigor, via acréscimo da punição, como um recurso facilitador da instalação da sensibilidade comportamental, conforme demonstra comparação entre as Fases BD. De acordo com os dados apresentados na Figura 2 pode-se notar que nas comparações realizadas entre as Fases AB e CD houve clara tendência à diminuição na quantidade média de respostas apresentadas pelo P6 na segunda Fase em relação à primeira, sendo tal diminuição significativa entre todas as Fases comparadas (tanto entre AB como entre CD). Já em relação às Fases BC houve aumento na taxa média de respostas em C em relação à B. Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de respostas apresentadas foram consideravelmente superiores àquelas obtidas nos esquemas de DRL 6 seg (fases B e D), o que aponta para a constatação de sensibilidade comportamental aos esquemas programados em todas as Fases experimentais, indicando assim que o participante adaptou seu padrão de respostas aos esquemas apresentados. Em relação às Fases BD observa-se que a inserção da punição na Fase D não pode ser vista como uma manipulação experimental responsável por viabilizar o processo de sensibilização comportamental no esquema de DRL, visto que, já na primeira exposição a esse esquema (Fase B) P6 demonstrou um padrão de 63 sensibilidade comportamental, com taxa média de respostas baixa e positivamente correlacionada com o ganho de pontos. Assim, pode-se afirmar que houve efetivo controle do esquema DRL 6 seg. sem o estabelecimento da punição (Fase B) e que taxas apropriadamente diferenciadas se mantiveram quando a punição foi adicionada (Fase D), com a conseqüente apresentação de um desempenho claramente controlado pelo esquema programado em ambas as Fases. No entanto, de acordo com análise dos dados apresentados na Tabela 7, podese notar, através da comparação das Fases B e D, o efeito claro da inserção da punição em facilitar a instalação de um padrão comportamental adequado – correlacionado com maior ganho de pontos – já na primeira sessão da Fase D, padrão este observado somente na terceira sessão da Fase B. Assim, é provável que para P6 em específico, a punição não tenha sido necessária para estabelecer desempenhos sensíveis aos esquemas programados, mas seus efeitos rápidos em instalar repertórios adequados continuam evidentes através da análise dos dados mencionados. 64 Discussão À exceção dos participantes P4 e P5 durante a Fase C, todos os demais apresentaram desempenhos adequados aos esquemas de razão, isto é, altas taxas de respostas positivamente correlacionadas com ganho de pontos. Um dado interessante é que os participantes P1, P2 e P6 demonstraram um desempenho ainda mais adequado a esse esquema durante a Fase C do que na Fase A. Uma possibilidade explicativa para esse dado é a consideração de que a criação de uma história experimental de exposição prévia ao esquema de RF durante Fase A talvez tenha facilitado uma sensibilização ainda maior às condições de tal esquema durante a Fase C. Todos os participantes, a exceção de P5 durante a Fase C, demonstraram médias de respostas mais altas nos esquemas de RF, tanto na Fase A quanto C, do que DRL (Ver Figura 2). No entanto, esse dado não é suficiente para que se possa afirmar que houve padrões generalizados de sensibilidade. P4, por exemplo, apesar de ter mantido suas taxas médias de respostas nos esquemas de RF superiores às taxas dos esquemas DRL teve seu desempenho durante a Fase C caracterizado como insensível ao esquema vigente, já que o número de respostas emitas em cada sessão dessa Fase, bem como a quantidade de reforçadores obtida, foram acentuadamente inferiores aos da Fase A. Efeitos da exposição anterior a uma contingência de DRL (fase B) podem ser sugeridos na explicação das diferenças constatadas na Fase C em relação à Fase A para esse participante. Por outro lado, taxas médias de respostas inferiores nos esquemas de DRL em relação aos esquemas de RF também não garantiram padrões sensíveis nos primeiros. Basta observar que durante a Fase B somente P6 atingiu um número 65 adequado de emissões de respostas, a partir da terceira sessão, para que se pudesse fazer referência a um desempenho sensível. Os outros participantes, apesar de terem diminuído o número de respostas nessa Fase (B) em relação à Fase anterior (A), ainda assim não demonstraram padrões de comportamento em acordo com os parâmetros do esquema, isto é, taxas suficientemente baixas de respostas acompanhadas por alto ganho de reforçadores. Todos, a exceção de P5, apresentaram aumento na taxa média de respostas na Fase C após exposição à Fase B. Se em alguns casos essa taxa foi maior que na Fase A (P1, P2 e P6), em outros foi equivalente (P3) ou inferior (P4). Já na transição da Fase C para D, todos os participantes diminuíram adequadamente suas taxas médias de respostas, garantindo um desempenho sensível em D. Para os participantes P1, P2, P3, P4 e P5 as comparações entre as Fases B e D levaram a constatação de uma significativa diminuição na taxa de respostas em D em relação a B. Como a variável diferencial entre as duas Fases consistiu na inserção da punição na Fase D, pode-se considerar que as diferenças constatadas devam-se a tal variável. Os dados mostram claramente que a punição levou a uma adaptação rápida às condições de esquema presentes na Fase D – visto que todos os participantes apresentaram número adequado de emissão de respostas já a partir da segunda sessão dessa Fase – e a um desempenho altamente regular, caracterizado por estabilidade no número de respostas emitidas e por um ganho considerável dos reforçadores programados. Em outras palavras, houve pobre controle do esquema DRL sem o estabelecimento da punição (Fase B) e taxas mais apropriadamente diferenciadas quando a punição foi adicionada (Fase D). Embora a única variável diferencial entre as Fases B e D se constitua na operação de punição inserida na Fase D, torna-se necessário considerar que a 66 disposição dos esquemas em Fases como ocorreu no presente experimento pode ter facilitado o desenvolvimento de uma história experimental que pode ter exercido influência nos dados obtidos. Assim como a história de exposição anterior à Fase A foi evocada para explicar desempenhos ainda mais adequados ao esquema de RF que surgiram durante a Fase C (P1, P2 e P6), o mesmo dever ocorrer quando se considera os desempenhos avaliados na Fase D. Isto significa dizer que a exposição anterior à Fase B também pode ter gerado efeitos que se estenderam sob o desempenho dos participantes durante a Fase D. Assim, não se pode descartar a possibilidade de que além da punição, a história experimental de exposição prévia a Fase B também possa ter contribuído para desempenhos sensíveis observados durante a Fase D. O objetivo principal do presente Experimento foi verificar se ao arranjar conseqüências aversivas (perda de pontos) para o comportamento consistente com esquemas anteriores – e, portanto, insensível – seria possível estabelecer contato com esquemas atuais e assim reduzir a força e a persistência da insensibilidade do desempenho. Os resultados permitem afirmar que quando condições aversivas são estabilizadas de tal forma que o comportamento insensível conduz à perda de pontos, a insensibilidade comportamental é esperada declinar. Tomados em conjunto, os dados apresentados suportam evidências de que aspectos relacionados a um fortalecimento das contingências em vigor – representado pela inserção da punição na Fase D, no presente experimento – devem ser considerados como relevantes em uma discussão sobre sensibilidade/insensibilidade comportamental. Em outras palavras, os desempenhos sensíveis demonstrados por todos os participantes durante a Fase D demonstram que a insensibilidade às contingências pode ser muito mais uma questão de arranjo experimental do que uma característica inerente ao controle instrucional. 67 Experimento 2 Participantes Os participantes foram quatro alunos do primeiro período do curso de graduação em Psicologia, três do sexo feminino com idades de 18, 20 e 36 anos e um do sexo masculino com idade de 33 anos, da Universidade Católica de Goiás (UCG). Os critérios de seleção dos participantes, bem como, de concordância dos mesmos em participar do experimento foram semelhantes aos utilizados no Experimento 1. Equipamentos O equipamento utilizado foi exatamente o mesmo descrito no Experimento 1. Procedimentos O delineamento experimental utilizado com os participantes submetidos ao Experimento 2 teve cada sujeito como seu próprio controle. Dessa forma, cada participante foi submetido seqüencialmente a 6 Fases experimentais (A, B, C, D, E e F), que constituíram a nova composição do programa em uso. O diferencial em relação ao Experimento 1 consistiu apenas no fato de que após serem submetidos à Fase experimental D (DRL 6 seg + punição) os participantes foram seqüencialmente submetidos às novas Fases E (RF 18), idêntica às Fases A e C, e F (DRL 6 seg), idêntica à Fase B. O objetivo básico, conforme exposto anteriormente, foi verificar se após a exposição à Fase (D), em que um padrão adequado de comportamento sensível ao esquema é atingido via inserção da punição de respostas inadequadas, seria mantido esse mesmo padrão em uma Fase posterior (F) sem necessidade da punição de respostas inadequadas. Comparações 68 entre as Fases B (DRL 6 seg), D (DRL 6 seg + punição) e F (DRL 6 seg) permitirão análises dessa natureza. A composição de cada Fase experimental em termos de sessões realizadas, duração de sessão, tipos de esquemas utilizados, tarefa a ser desenvolvida pelo participante, instrução fornecida, etc. foi semelhante ao Experimento. O único diferencial, portanto, consistiu na inserção das Fases E e F, com características exatamente idênticas às Fases A e B, respectivamente, a fim de possibilitar as análises necessárias. A Tabela 8 resume o procedimento do Experimento 2. Tabela 8. Fases experimentais, esquema de reforçamento, consequenciação de respostas e número de sessões aos quais cada participante foi submetido durante o Experimento 2. Fase Esquema Conseqüenciação de respostas A RF 18 B DRL 6 seg C RF 18 D E DRL 6 seg + punição RF 18 F DRL 6 seg Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: um ponto perdido Correta: um ponto ganho Errada: nenhuma conseqüência Correta: um ponto ganho Errada: nenhuma conseqüência Número de sessões 6 6 6 6 6 6 69 Resultados Os parâmetros utilizados para análise são semelhantes aos descritos no Experimento 1. A Tabela 9 expõe os dados do Participante 7 (P7). De acordo com os dados apresentados pode-se notar que nas Fases A (RF 18), C (RF 18) e E (RF 18) o participante ajustou perfeitamente sua taxa de respostas ao esquema em vigor, isto é, emitiu número alto de respostas acompanhado por uma quantidade também alta de obtenção de reforçadores, visto que se tratava de um esquema de razão. Apesar de ter diminuído o número de respostas emitido em cada sessão durante a Fase B (DRL 6 seg.) em relação às Fases de RF, tal diminuição não foi suficiente para garantir padrões adequados de desempenho nessa Fase, visto que a quantidade de reforçadores obtida (máximo de 7, na terceira e quinta sessões) manteve-se bem abaixo da quantidade total que poderia ter sido alcançada (30 por sessão), caracterizando assim um desempenho não ajustado ao esquema em vigor. Os dados relacionados à quantidade de respostas por reforçador (QRR) também atestam a não adequação do comportamento às contingências estabelecidas, visto que o padrão esperado para um esquema DRL é de uma resposta por reforçador, e P7 emitiu valores bem acima desse (com variação de 10,3 a 474,0 respostas por reforçador). Já a partir da segunda sessão da Fase D (DRL 6 seg. + punição), o que se observa é um padrão de ajustamento ao esquema em vigor, caracterizado pela apresentação de baixo número de respostas (variando de um mínimo de 20, na terceira sessão, a um máximo de 26 respostas, na quinta sessão), baixa taxa de respostas (0,1 respostas por segundo), ganho médio de reforçadores (com variação 70 de 14 a 23) e baixa quantidade de respostas por reforçador (variando de 1,0 a 1,6 resposta por reforçador). Tabela 9. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P7 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 2 0 0,0 --380,0 (σ = 406,5) 2ª 328 18 1,8 18,2 A RF 18 3ª 810 45 4,5 18,0 922,0 4ª 783 43 4,4 18,0 (σ = 120,7) 5ª 983 54 5,5 18,2 6ª 1000 55 5,6 18,2 1ª 474 1 2,6 474,0 229,3 (σ = 212,4) 2ª 122 6 0,7 20,3 B DRL 6 3ª 92 7 0,5 13,1 seg 103,0 4ª 145 4 0,8 36,2 (σ = 37,7) 5ª 72 7 0,4 10,3 6ª 92 2 0,5 46,0 1ª 1006 55 5,6 18,3 1000,3 (σ = 19,1) 2ª 979 54 5,4 18,1 C RF 18 3ª 1016 56 5,6 18,1 901,0 4ª 954 53 5,3 18,0 (σ = 82,4) 5ª 943 52 5,2 18,1 6ª 806 44 4,5 18,3 38,7 1ª 74 (14-60)-46* 0,4 --(σ = 30,6) 2ª 22 (18-4) 14* 0,1 1,6 D DRL 6 3ª 20 (20-0) 20* 0,1 1,0 seg + 24,3 4ª 23 (23-0) 23* 0,1 1,0 (σ = 1,5) punição 5ª 26 (22-4) 18* 0,1 1,4 6ª 24 (20-4) 16* 0,1 1,5 902,3 1ª 721 40 4,0 18,0 (σ = 164,2) 2ª 945 52 5,2 18,2 E RF 18 57 5,8 18,3 3ª 1041 1103,3 4ª 1130 62 6,3 18,2 (σ = 23,6) 5ª 1085 60 6,0 18,1 6ª 1095 60 6,1 18,2 29,3 1ª 37 21 0,2 1,8 (σ = 6,8) 2ª 27 25 0,2 1,1 F DRL 6 3ª 24 20 0,1 1,2 seg 24,7 4ª 27 24 0,1 1,1 (σ = 2,1) 5ª 23 23 0,1 1,0 6ª 24 24 0,1 1,0 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. 71 Durante a Fase F (DRL 6 seg.), onde a contingência de DRL é restabelecida, um padrão ainda mais estável e regular de desempenho é apresentado, visto que, durante todas as sessões dessa Fase fica constatado um responder que ocorre em baixa freqüência (com média de 24,7 respostas nas três últimas sessões) e que tem como conseqüência ganhos elevados de reforçadores (mínimo de 20 e máximo de 25). As respostas inadequadas que ocorriam no meio dos intervalos e que os reprogramavam durante a Fase B, praticamente deixam de existir durante essa Fase; na quinta e sexta sessões, por exemplo, o número de respostas emitido (23 e 24, respectivamente) é exatamente igual à quantidade de reforçadores obtida, indicando a não emissão de respostas incorretas. Em uma análise geral, pode-se dizer que P7 manifestou um desempenho ajustável ao esquema em vigor em todas as Fases experimentais, a exceção da Fase B. A Tabela 10 mostra os dados do Participante 8 (P8). Ao longo de todas as Fases de RF 18 (A, C e E), P8 apresentou uma tendência crescente no número de respostas emitido ao longo das sessões. Ao se considerar as médias de respostas das três últimas sessões de cada uma dessas Fases (756,0; 986,3 e1112,0) constata-se um ajustamento ao esquema em vigor, via emissão de alto número de respostas e ganho considerável de reforçadores. A Fase B (DRL 6 seg.) é caracterizada pela apresentação de um número variável e não adequado de respostas ao esquema em vigor e conseqüente ganho limitado de reforçadores (máximo de 5 na quinta sessão). 72 Tabela 10. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P8 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 125 6 0,7 20,8 159,7 (σ = 30,0) 2ª 177 9 1,0 19,7 RF 18 A 3ª 177 9 1,0 19,7 756,0 4ª 281 15 1,6 18,7 (σ = 421,9) 5ª 900 50 5,0 18,0 6ª 1087 60 6,0 18,1 1ª 664 1 3,7 664,0 655,7 (σ = 130,7) 2ª 782 0 4,3 --B DRL 6 3ª 521 2 2,9 260,5 seg 286,7 4ª 558 0 3,1 --(σ = 240,2) 5ª 101 5 0,6 20,2 6ª 201 4 1,1 50,25 1ª 153 8 0,8 19,1 550,0 (σ = 344,2) 2ª 733 40 4,1 18,3 RF 18 C 3ª 764 42 4,2 18,2 986,3 4ª 1006 55 5,6 18,3 (σ = 25,9) 5ª 996 55 5,5 18,1 6ª 957 53 5,3 18,1 1ª 33 (20-13) 7* 0,2 4,7 27,7 (σ = 5,0) 2ª 27 (20-7) 13* 0,2 2,1 D DRL 6 3ª 23 (20-3) 17* 0,1 1,4 seg + 23,3 4ª 23 (20-3) 17* 0,1 1,4 (σ = 1,5) punição 5ª 25 (18-7) 11* 0,1 2,3 6ª 22 (20-2) 18* 0,1 1,2 821,0 1ª 599 33 3,3 18,2 (σ = 248,9) 2ª 774 43 4,3 18,0 RF 18 E 3ª 1090 60 6,1 18,2 1112,0 4ª 1164 64 6,5 18,2 (σ = 76,6) 5ª 1024 56 5,7 18,3 6ª 1148 63 6,4 18,2 1ª 433 2 2,4 216,5 289,3 (σ = 200,7) 2ª 375 4 2,1 93,8 F DRL 6 3ª 60 15 0,3 4,0 seg 26,7 4ª 25 25 0,1 1,0 (σ = 1,5) 5ª 28 22 0,2 1,3 6ª 27 25 0,2 1,1 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. 73 Durante toda Fase D (DRL 6 seg. + punição) um padrão adaptável ao esquema em vigor é estabelecido, identificado através da apresentação de um baixo número de respostas pelo participante – principalmente a partir da segunda sessão – da obtenção de uma quantidade mediana de reforçadores por sessão e da pouca variação na taxa de respostas (mínimo de 0,1 e máximo de 0,2 respostas por segundo). Ao longo da Fase F (DRL 6 seg.), P8 demonstra tendência decrescente na freqüência de respostas emitida a medida em que as sessões avançam. A média de respostas das três últimas sessões (26,7) bem como a quantidade de reforçadores obtida nessas sessões (mínimo de 22 e máximo de 25) são indicativos de adequação ao esquema em vigor. Os dados do Participante 9 (P9) são expostos na Tabela 11. A análise dos dados das Fases A (FR 18), C (RF 18) e E (RF 18) revela uma tendência de P9 em apresentar freqüências elevadas de respostas, principalmente nas três últimas sessões de cada uma dessas Fases, indicando assim um desempenho bem ajustado ao esquema de RF em vigor. Na Fase A, tal tendência pode ser notada a partir da segunda sessão (581 respostas), na Fase C, a partir da terceira sessão (808 respostas) e na Fase E, a partir da primeira sessão (1251 respostas). A quantidade de reforçadores obtida em cada uma dessas Fases também foi alta, chegando a atingir 80 reforçadores por sessão (Fase C, quarta e sexta sessões). Deve-se notar o desempenho altamente estável atingido por P9 durante a Fase E, onde a variação no número de respostas (mínimo de 1150 e máximo de1297 respostas), na quantidade de reforçadores (mínimo de 63 e máximo de 72) e na taxa de respostas (mínimo de 6,4 e máximo de 7,2 respostas por segundo) foi mínima em relação às outras Fases de RF, caracterizadas por maior variabilidade nesses números. 74 Tabela 11. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P9 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 63 3 0,4 21,0 419,0 (σ = 308,7) 2ª 581 32 3,2 18,2 A RF 18 3ª 613 34 3,4 18,0 835,7 4ª 822 45 4,6 18,3 (σ = 40,3) 5ª 881 48 4,9 18,3 6ª 804 44 4,5 18,3 1ª 693 0 3,8 -692,7 (σ = 33,5) 2ª 659 0 3,7 -B DRL 6 3ª 726 0 4,0 -seg 280,0 4ª 648 0 3,6 -(σ = 323,2) 5ª 150 3 0,8 50,0 6ª 42 7 0,2 6,0 1ª 85 4 0,5 21,2 314,3 (σ = 427,9) 2ª 50 2 0,3 25,0 C RF 18 3ª 808 44 4,5 18,4 1397,7 4ª 1454 80 8,1 18,2 (σ = 91,6) 5ª 1292 71 7,2 18,2 6ª 1447 80 8,0 18,1 1ª 82 (8-74)-66* 0,5 --40,3 (σ = 36,7) 2ª 14 (7-7) 0* 0,1 --D DRL 6 3ª 24 (17-7) 10* 0,1 2,4 seg + 24,7 4ª 26 (18-8) 10* 0,1 2,6 (σ = 2,3) punição 5ª 26 (18-8) 10* 0,1 2,6 6ª 22 (20-2) 18* 0,1 1,2 1224,0 1ª 1251 69 7,0 18,1 (σ = 28,6) 2ª 1194 66 6,6 18,1 E RF 18 3ª 1227 68 6,8 18,0 1227,3 4ª 1297 72 7,2 18,0 (σ = 73,8) 5ª 1235 68 6,9 18,2 6ª 1150 63 6,4 18,3 1ª 289 5 1,6 57,8 112,3 (σ = 153,1) 2ª 29 20 0,2 1,4 F DRL 6 3ª 19 18 0,1 1,1 seg 30,3 4ª 17 17 0,1 1,0 (σ = 11,9) 5ª 40 19 0,2 2,1 6ª 34 26 0,2 1,3 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. 75 Durante a Fase B (DRL 6 seg.) o participante apresenta números de respostas com tendência decrescente no decorrer das sessões. No entanto, a diminuição demonstrada não foi suficiente para assegurar um desempenho sensível ao esquema durante essa Fase, pois as taxas de respostas ainda se apresentaram em níveis altos e o número de reforçadores manteve-se baixo, com a obtenção de apenas 3 e 7 reforçadores na quinta e sexta sessões, respectivamente. Analisando dados das três últimas sessões, é possível cogitar a possibilidade de que se o número de sessões fosse maior, P9 apresentaria desempenhos mais ajustáveis ao esquema. A partir da terceira sessão da Fase D (DRL 6 seg. + punição) pode-se notar um desempenho característico do esquema em vigor, com apresentação de baixos números de respostas por sessão (mínimo de 22 e máximo de 26) e ganho mediano dos reforçadores programados. Nenhum outro participante demorou tanto quanto P9 para obter reforçadores nessa Fase. Em geral, desempenhos mais característicos do esquema surgem na primeira ou segunda sessão; P9, no entanto, só os demonstrou a partir da terceira sessão. A adaptação de P9 ao esquema de DRL ocorreu de forma mais rápida durante a Fase F (DRL 6 seg.), onde, já a partir da segunda sessão, passa a demonstrar número de respostas reduzido e, conseqüentemente, quantidades significativas de reforçadores. Os dados do Participante 10 (P10) são apresentados na Tabela 12. Um desempenho adaptável ao esquema de RF pode ser identificado nas Fases A (RF 18), C (RF 18) e E (RF 18) para P10, pois todas essas Fases foram marcadas pela emissão de um alto número de respostas e elevada quantidade de reforçadores obtida. As Fases C e E, por apresentarem parâmetros com valores mais altos que 76 aqueles observados na Fase A, são ainda mais características de um desempenho adequado. Tabela 12. Número de Respostas (NR), Média de Respostas (MR), Quantidade de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por Reforçador (QRR) apresentados pelo P10 nas Fases Experimentais (FE), Esquemas de Reforçamento (ER) e Sessões a que foi exposto. FE ER Sessão NR MR QR TR QRR 1ª 229 12 1,3 19,1 388,3 (σ = 142,4) 2ª 433 24 2,4 18,0 A RF 18 3ª 503 27 2,8 18,6 536,7 4ª 537 29 3,0 18,5 (σ = 11,5) 5ª 548 30 3,0 18,3 6ª 525 29 2,9 18,1 1ª 778 0 4,3 --324,0 (σ = 393,4) 2ª 83 10 0,5 8,3 B DRL 6 3ª 111 15 0,6 7,4 seg 169,7 4ª 189 4 1,0 47,2 (σ = 21,2) 5ª 173 7 1,0 24,7 6ª 147 5 0,8 29,4 1ª 825 45 4,6 18,3 855,0 (σ = 28,6) 2ª 858 47 4,8 18,2 C RF 18 3ª 882 49 4,9 18,0 913,7 4ª 901 50 5,0 18,0 (σ = 24,6) 5ª 942 51 5,2 18,5 6ª 898 49 5,0 18,3 27,3 1ª 42 (10-32)-22* 0,2 --(σ = 13,1) 2ª 23 (16-7) 9* 0,1 2,6 D DRL 6 3ª 17 (14-3) 11* 0,1 1,5 seg + 20,7 4ª 23 (19-4) 15* 0,1 1,5 (σ = 3,2) punição 5ª 22 (18-4) 14* 0,1 1,6 6ª 17 (16-1) 15* 0,1 1,1 892,3 1ª 796 44 4,4 18,1 (σ = 118,0) 2ª 857 47 4,8 18,2 E RF 18 56 5,7 18,3 3ª 1024 831,7 4ª 899 49 5,0 18,3 (σ = 110,6) 5ª 892 49 5,0 18,2 6ª 704 39 3,9 18,1 113,7 1ª 294 9 1,6 32,7 (σ = 156,2) 2ª 24 18 0,1 1,3 F DRL 6 3ª 23 17 0,1 1,4 seg 25,7 4ª 25 21 0,1 1,2 (σ = 1,2) 5ª 25 22 0,1 1,1 6ª 27 22 0,2 1,2 * A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de reforçadores perdidos. 77 Durante a Fase B (DRL 6 seg.) um padrão de não ajustamento ao esquema pode ser observado, através da identificação de números variáveis, e em geral elevados, de respostas emitidas acompanhados por quantidades restritas de reforçadores. Já a partir da segunda sessão da Fase D (DRL 6 seg. + punição) o número de respostas por sessão é reduzido significativamente em relação às Fases anteriores (mínimo de 17 e máximo de 23 respostas) garantindo ganhos medianos e regulares de reforçadores (mínimo de 9 e máximo de 15 reforçadores). A taxa de respostas também apresenta maior estabilidade (0,1 resposta por segundo). Ao se considerar os dados a partir da segunda sessão da Fase F (DRL 6 seg.), pode-se notar que o número de respostas por sessão (mínimo de 23 e máximo de 27) sofreu um leve aumento em relação à Fase D e a quantidade de reforçadores obtida também foi maior (mínimo de 17 e máximo de 22), indicando que, o responder durante a Fase F foi mais ajustado ao esquema vigente do que aquele registrado durante a Fase D, garantindo assim maior ganho de reforçadores e, evidentemente, um desempenho ainda mais congruente com o esquema vigente. Em uma análise geral, pode-se afirmar que P10 apresentou padrões adaptados às contingências estabelecidas durante todas as Fases experimentais, a exceção da Fase B. A figura 3 mostra as médias dos números de respostas (MR) das três últimas sessões de cada uma das Fases experimentais A (FR 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.) para os participantes P7, P8, P9 e P10. De acordo com os dados de P7 pode-se verificar que em todas as Fases onde prevaleceu o esquema de RF 18 (A, C e E) a média de respostas foi maior do que nas Fases onde o esquema DRL esteve em vigor (B, D e F). Assim, analisando a 78 transição entre as Fases AB, CD e EF, observa-se que houve uma diminuição no número de respostas emitido na segunda Fase em relação à primeira, sendo tal diminuição mais significativa entre as Fases CD e EF. P7 1500 1000 922 1103,3 901 500 103 0 A B 24,3 C D 24,7 E F MÉDIAS DO NÚMERO DE RESPOSTAS P8 1500 1000 1112 986,3 756 500 286,7 23,3 0 A B C D 26,7 E F P9 1500 1000 1397,7 1227,3 835,7 500 280 24,7 0 A B C D 30,3 E F P10 1000 800 600 400 200 0 913,7 831,7 536,7 169,7 A B 20,7 C D 25,7 E F FASES EXPERIMENTAIS Figura 3. Médias do número de respostas das três últimas sessões das Fases experimentais A (RF 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.) para os participantes P7, P8, P9 e P10. 79 Comparações entre as Fases B (DRL 6 seg.), D (DRL 6 seg. + punição) e F (DRL 6 seg.) permitem análises adicionais quanto aos efeitos imediatos e posteriores da inserção da punição enquanto variável que deveria viabilizar ou intensificar desempenhos sensíveis ao esquema. Comparando as médias apresentadas entre as Fases BD constata-se que a freqüência de respostas emitida durante a Fase D foi significativamente menor que aquela apresentada durante a Fase B, o que reporta para os efeitos de fortalecimento da contingência em vigor exercidos pela operação de punição. Em outras palavras, a inserção da punição durante a Fase D fez com que o participante estabelecesse um contato mais preciso com os parâmetros do esquema em vigor, isto é, diminuísse adequadamente o número de respostas emitido por sessão a fim de obter os reforçadores disponíveis, desempenho este não observado durante a Fase B. Já a comparação entre as Fases DF permite a identificação de valores médios muito próximos para ambas às Fases (24,3 para Fase D e 24,7 para a Fase F), dado esse indicativo de que a inserção da punição durante a Fase D gerou efeitos também durante a Fase F. Em função das semelhanças entre os valores médios apresentados nas Fases D e F, é possível identificar entre as Fases BF diferenças idênticas àquelas constatadas entre as Fases BD. Analisando os dados de P8 verifica-se que ao longo das Fases de RF 18 (A, C e E), o participante demonstrou altas médias de respostas – o que caracteriza um padrão geral de sensibilidade ao esquema – bem como uma tendência de aumento em tais médias com o decorrer das Fases, sendo a média em A de 756, em C de 986,3 e em E de 1112 respostas. Em todas essas Fases de RF, P8 apresentou médias superiores às apresentadas nas Fases de DRL (B, D e F). A comparação entre as Fases BD evidencia o efeito da punição em estabelecer um desempenho perfeitamente ajustado ao esquema programado, já que 80 a média de respostas em B é cerca de 12 vezes maior que em D. Isso significa que mesmo manifestando uma clara diminuição no número de respostas emitido durante a Fase B em relação às Fases de RF, ainda assim tal diminuição não foi suficiente para garantir um padrão sensível de desempenho, padrão esse só alcançado na Fase D via inserção da punição. Apesar de não existir diferença quanto ao esquema programado entre as Fases B (DRL 6 seg.) e F (DRL 6 seg.), o que se pode constatar é uma sensível diminuição na taxa média de respostas apresentada em F (26,7) em relação a B (286,7). A explicação para tal diferença encontra-se na comparação entre as Fases DF e na conseqüente constatação de taxas médias de respostas muito próximas, indicando que o efeito de sensibilização exercido pela punição durante a Fase D (média de 23,3 respostas) estendeu-se para a Fase F. De acordo ainda com a Figura 3, pode-se observar que para P9 a comparação entre as Fases AB, CD e EF é também marcada por uma acentuada diminuição na média de respostas na segunda Fase em relação à primeira, sendo tal diminuição mais significativa entre as Fases CD e EF. Dessa forma, em todas as Fases onde o esquema de RF 18 vigorou (A, C e E) a média de respostas foi superior em relação às Fases onde o esquema de DRL foi programado (B, D e F), indicando assim um padrão de sensibilidade quanto ao primeiro esquema. As diferenças entre as médias de respostas entre B (DRL 6 seg.) e D (DRL 6 seg. + punição) permite novamente apontar para a inserção da punição como um elemento de fortalecimento do esquema em vigor, visto que na Fase D a média de respostas (24,7) foi cerca de 11 vezes menor que em B (280) e muito mais próxima do valor ideal para o esquema (30 respostas). 81 A comparação entre as Fases DF permite constatar que uma taxa média muito próxima àquela estabelecida na Fase D manteve-se durante a Fase F (30,3), indicando a manutenção de um desempenho sensível durante a última Fase, mesmo na ausência de elementos fortalecedores do esquema em vigor. Em função da semelhança no número médio de respostas entre as Fases DF, as diferenças identificadas entre as Fases BF são semelhantes àquelas já apontadas entre BD. O padrão geral de desempenho de P10 não diferiu dos outros participantes. Em todas as Fases de FR 18 (A, C e E) sua taxa média de respostas foi superior em relação às Fases dos esquemas de DRL. Portanto, nas comparações entre as Fases AB, CD e EF constata-se diminuição na taxa média de respostas na segunda Fase em relação à primeira, sendo tal diminuição mais significativa entre as Fases CD e EF. Em uma comparação entre as Fases BD novamente se constata uma diminuição acentuada na taxa média de D (20,7) em relação à B (169,7), sugerindo a eficácia da punição em gerar padrões mais ajustáveis ao esquema estabelecido. Também para P10 a comparação entre as Fases DF permite a identificação de médias de respostas muito semelhantes e próximas ao valor ideal (30 respostas), sendo que um desempenho perfeitamente adequado ao esquema pode ser observado durante a Fase F (com média de 25,7 respostas). Embora nenhuma diferença tenha sido programada entre o esquema estabelecido (DRL 6 seg.) nas Fases B e F, pode ser constatada diferença significativa entre os valores médios apresentados em ambas as Fases (a média em B foi de 169,7 e em F de 25,7), dado esse que evidencia a possibilidade de que a inserção da punição durante a Fase D tenha gerado conseqüências que se mantiveram durante a Fase posterior F. 82 Discussão De acordo com os resultados apresentados é possível afirmar que para todos os participantes, as médias de respostas nas Fases do esquema de RF 18 (Fases A, C e E), foram superiores àquelas apresentadas nas Fases do esquema DRL 6 seg. (B, D e F). Dessa forma, pode-se dizer que os participantes desempenharam-se adequadamente durante a exposição ao primeiro esquema, isto é, demonstraram padrões caracterizados por altas taxas de respostas positivamente correlacionadas com ganhos elevados de pontos. Tal fato é indicativo de desempenhos sensíveis, ou seja, claramente controlados pelo esquema programado. Torna-se necessário destacar que todos os participantes – menos P7 na comparação entre as Fases AC – aumentaram suas taxas de respostas nas Fases C e E em relação à Fase A. Soma-se a isso o fato de que todos atingiram desempenhos ainda mais estáveis e em acordo com o esquema de RF 18 durante a última Fase de exposição ao mesmo (Fase E). Já que não foram inseridas variáveis diferenciais entre essas Fases, tal resultado aponta para a possibilidade de que a exposição continuada ao esquema se constitua como uma variável que favoreça desempenhos cada vez mais ajustados, isto é, as próprias condições experimentais podem ter propiciado o desenvolvimento de uma história de exposição ao esquema que tenha, à medida que as Fases se sucediam, facilitado uma adequação comportamental em relação a este. Já em relação ao esquema de DRL 6 seg., apesar de terem diminuído o número de respostas emitido durante a primeira exposição a esse esquema (Fase B) em relação ao esquema de razão que vigorou previamente (Fase A), tal diminuição não foi significativa a ponto de gerar desempenhos suficientemente ajustáveis que pudessem ser classificados como padrões sensíveis. Os participantes P7, P8 e P10 83 tiveram seus desempenhos caracterizados por alta variabilidade e baixa obtenção de reforçadores, isto é, demonstraram uma lacuna de ajustamento entre o responder apresentado e aquele que estaria correlacionado com a obtenção dos reforçadores programados, enquanto os dados de P9 sinalizam a possibilidade de que um desempenho mais sensível poderia ser atingido, caso o número de sessões fosse estendido. Quando a punição é incluída durante a Fase D, no entanto, todos os participantes passam a apresentar desempenhos perfeitamente ajustados ao esquema em vigor (DRL 6 seg. + punição), caracterizados pela apresentação de baixo número de respostas acompanhado por ganhos regulares ou altos de pontos. Como no Experimento 1, fica novamente evidenciado os efeitos de certas manipulações experimentais – no caso do presente estudo, a inclusão da punição – em gerar padrões de desempenho sensíveis às contingências estabelecidas. Os resultados obtidos quanto à exposição à Fase F (DRL 6 seg.), no entanto, constituem-se nos dados mais importantes para o objetivo do Experimento 2, que foi verificar se a exposição prévia a uma condição que favorecesse o contato com o esquema em vigor, via punição de respostas inadequadas que levariam a perda de pontos, seria eficiente para estabelecer responder adequado em uma Fase posterior, com sinais claros de discriminação do esquema em vigor. A questão chave, portanto, foi a de verificar se a sensibilidade comportamental persistiria após a retirada da punição. Durante a Fase F, um padrão estável de desempenho é demonstrado por parte de todos os participantes a partir da primeira (P7), da segunda (P9 e P10) ou da terceira sessão (P8). Uma vez estabelecido esse desempenho adequado ao esquema, caracterizado pela emissão de taxas baixas de respostas perfeitamente correlacionadas com ganho de pontos, este se manteve de forma regular, com 84 variabilidade mínima entre os parâmetros analisados. Deve ser destacado que alguns participantes (P7, P9 e P10) apresentaram durante essa Fase um padrão geral de respostas ainda mais adequado – isto é, relacionado com maior obtenção dos reforçadores programados – que aquele apresentado durante a Fase D, quando a operação de punição foi inserida. Pode-se concluir, portanto, que os desempenhos sensíveis da Fase D não se mantiveram sob controle exclusivo da perda de pontos programada, de tal forma que quando esta foi retirada na Fase F, o esquema de DRL exerceu controle efetivo sobre o desempenho. É como se a punição tivesse informado os participantes quanto às condições características do esquema em vigor e quanto à discrepância de seus desempenhos em relação a tais condições, possibilitando aos mesmos, a partir de então, desempenharem-se adequadamente em situações semelhantes. Dessa forma, ficam evidenciados os efeitos da operação de punição não só em gerar ou intensificar padrões sensíveis de desempenho aos esquemas programados, como também, em manter tais padrões em situações posteriores e similares. 85 Discussão Geral Vários foram os aspectos levantados na parte introdutória deste trabalho como estando possivelmente relacionados a uma discussão sobre sensibilidade de desempenhos humanos a esquemas de reforçamento. Assim, foi apontado que alguns autores consideram as instruções como variáveis críticas no controle da sensibilidade às contingências do esquema (Harzem e cols., 1978) e que a insensibilidade seria uma característica definidora das instruções (Matthews e cols., 1977; Shimoff e cols., 1981). Já outros autores sugerem que o controle instrucional seria uma função de sua correlação com as contingências de reforçamento (Ayllon & Azrin, 1964; Buskist & Miller, 1986; Galizio, 1979), com contingências fracas (Cerutti, 1989), ou com falta de controle pelas contingências (Torgrud & Holborn, 1990) e, ainda, que as instruções seriam seguidas a menos que o responder do sujeito contactasse com contingências incongruentes (Albuquerque e cols., 2004; Baron & Galizio, 1983; Buskist & Miller, 1986; Galizio, 1979; Paracampo e cols., 1993; Weiner, 1970). Outros autores se dedicaram à investigação dos efeitos de auto-regras sobre a sensibilidade do responder humano (Catania e cols., 1989; Perone, 1988; Pouthas e cols., 1990; Rosenfarb e cols., 1992; Shimoff, 1986) e aspectos diferentes dos citados ainda foram explorados por outros pesquisadores (Buskist e cols., 1981; Joyce & Chase, 1990; DeGrandpre & Buskist, 1991; Newman e cols., 1994). Os resultados do presente estudo (Experimento 1) demonstraram o papel do contato com a discrepância entre o desempenho mantido e o desempenho realmente exigido pelo esquema em enfraquecer padrões insensíveis. 86 A eliminação da insensibilidade comportamental ocorreu somente quando o comportamento insensível levou os participantes a entrarem em contato com uma contingência de perda de pontos, sendo tal contato suficiente para gerar a discriminação de características relevantes do esquema em vigor e, conseqüentemente, um responder mais sensível. Tais resultados estão de acordo com as colocações de Baron & Galizio, 1983; Buskist e Miller (1986), DeGrandpre e Buskist (1991), Galizio (1979), Otto, Torgrud, & Holborn, 1999, Torgrud & Holborn (1990) segundo as quais a insensibilidade comportamental seria um resultado de falhas em contactar com alguns aspectos das contingências, cujo controle seria deficitário, e que seria mais provável tal insensibilidade ser mantida quando as conseqüências colaterais do responder fossem fracas (Cerutti, 1989). Quando a punição foi inserida e desempenhos inadequados passaram a ser punidos com perda de pontos – fortalecendo assim a contingência em vigor e forçando o contato do responder do participante com tal contingência – tais desempenhos foram rapidamente eliminados. A eliminação desses desempenhos permaneceu durante nova exposição ao esquema quando a punição não mais estava presente (Experimento 2). Esse achado é particularmente importante à medida que mostra que padrões de insensibilidade podem ser alterados, talvez até irreversivelmente, após exposição a uma condição que estabeleça sensibilidade, isto é, controle do comportamento pelo esquema (Galizio, 1979). Assim, ao contrário do que defende alguns autores (e.g., Matthews e cols., 1977; Shimoff e cols., 1981), a insensibilidade não pode ser considerada somente uma propriedade inerente a respostas instruídas, mas sim, um resultado de 87 contingências fracamente estabelecidas. Dessa forma, talvez o foco de análise tenha que ser dirigido para o fato de que a partir do momento em que o desempenho passa a estabelecer contato efetivo com os parâmetros do esquema programado, a insensibilidade tende a desaparecer (Galizio, 1979). Esse fato destaca o papel das características dos esquemas vigentes em uma discussão sobre sensibilidade/insensibilidade comportamental (Torgrud & Holborn, 1990). Apesar de não ter sido diretamente manipulada, a história de reforçamento (DeGrandpre & Buskist, 1991) também foi uma variável de destaque no presente experimento. Os dados permitiram constatar que a forma como as Fases experimentais foram organizadas permitiu aos participantes o desenvolvimento de uma história experimental que facilitou a adaptação do desempenho às contingências que vigoravam nas últimas Fases. Provavelmente a exposição alternada aos esquemas também tenha contribuído para a discriminação de características relevantes dos mesmos. Algumas considerações sobre o procedimento utilizado no presente estudo merecem destaque. Foi dito que a definição dos parâmetros de número de resposta (18) no esquema de RF e tempo (6 segundos) no esquema de DRL foi baseada em Hayes e cols. (1986b) e que a especificação de tais parâmetros foi uma tentativa de equilibrar o número de reforçadores obtidos em cada sessão realizada com os diferentes esquemas de reforçamento. Assim, esperava-se que em uma sessão de 3 minutos de RF 18 a quantidade de reforçadores obtida fosse equivalente à quantidade obtida em uma sessão de 3 minutos de DRL 6 seg, considerando desempenhos sensíveis aos esquemas. No entanto, foi constatado que a definição de tais parâmetros foi falha, visto que, todos 88 os participantes podiam atingir quantidades muito maiores de pontos durante o esquema de RF 18 do que durante o esquema de DRL 6 seg. Tal fato ocorreu em função de ser o número de reforçadores obtidos durante o primeiro esquema dependente do ritmo de respostas do participante, permitindo assim grandes variações nos valores obtidos (P9, por exemplo, chegou a ganhar 80 pontos em única sessão). O mesmo não ocorreu em relação ao segundo esquema, já que a liberação de reforçadores era controlada pela passagem do tempo, sendo 30 o máximo possível de pontos passíveis de serem conquistados em uma única sessão. A fim de nivelar a quantidade de reforçadores liberados em ambos os esquemas o ideal seria que o esquema de RF tivesse seu valor aumentado. Também se esperava que com a realização de 6 sessões em cada fase fosse possível atingir um padrão estável de respostas para, na seqüência, submeter o participante à fase seguinte. Muitos participantes, no entanto, não demonstraram um padrão regular de respostas no momento em que foram realizadas transições de fase, demonstrando certa instabilidade nos últimos valores de número de respostas apresentados no final de cada fase. A adoção de critérios para se definir um estado estável de desempenho, diferentemente do critério adotado baseado no número de sessões, deveria ter sido definida para o presente estudo. Um exemplo seria considerar que mudanças de fases seriam realizadas somente quanto o participante apresentasse uma variabilidade inferior a 10% entre os números de respostas apresentados nas três últimas sessões realizadas. Infelizmente, questões baseadas no tempo e na necessidade de manter o participante até o final do experimento não possibilitaram que critérios dessa natureza, que sem dúvida poderiam estender demasiadamente o número de sessões realizadas, fossem aplicados no presente estudo. 89 Finalmente, considerando que exista uma correlação entre desempenhos em situações de laboratório e padrões comportamentais que ocorram em situações naturais, o presente trabalho procurou, via realização de pesquisa básica, contribuir para a identificação de variáveis controladoras da sensibilidade comportamental a esquemas de reforçamento, representando assim mais um passo significativo no acúmulo do conhecimento necessário para se propor estratégias de modificação do comportamento e intervenções no ambiente clínico. 90 Referências Bibliográficas Abreu-Rodrigues, J., & Sanabio, E. T. (no prelo). Instruções e auto-instruções: Contribuições da pesquisa básica. Em C. N. de Abreu & H. J. Ghilhardi (Orgs.), Manual prático de técnicas em psicoterapia comportamental, cognitiva e construtivista. São Paulo: Editora Roca. Albuquerque (2001). Definições de regras. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, & M. C. Scoz (Orgs.), Sobre Comportamento e Cognição – Expondo a variabilidade (pp. 132-140). Santo André: ESETec. Albuquerque (1998). Efeitos de histórias experimentais sobre o seguimento subseqüente de regras. Tese de doutorado, Instituto de Psicologia, Universidade de São Paulo. Albuquerque, L. C. de, de Souza, D. G., Matos, M. A., & Paracampo, C. C. P. (2003). Análise dos efeitos de histórias experimentais sobre o seguimento subseqüente de regras. Acta Comportamentalia, 11 (1), 87-126. Albuquerque, L. C. de, & Ferreira, K. V. D. (2001). Efeitos de regras com diferentes extensões sobre o comportamento humano. Psicologia: Reflexão e Crítica, 14 (1), 143-155. Albuquerque, L. C. de, Matos, M. A., de Souza, D. G., & Paracampo, C. C. P. (2004). Investigação do controle por regras e do controle por histórias de reforço sobre o comportamento humano. Psicologia: Reflexão e Crítica, 17 (3), 395-412. Albuquerque, L. C. de, Santos, A. C. S., Silva, F. M., Mendonça, P. S. M., Queiroz, T. M. M., & Silva, W. C. M. P. (1993). Análise do papel das conseqüências 91 programadas no seguimento de regras. Anais da 45ª Reunião Anual da Sociedade Brasileira para o Progresso da Ciência, p. 903. Albuquerque, N. M. A. de, Paracampo, C. C. P., & Albuquerque, L. C. de (2004). Análise do papel de variáveis sociais e de conseqüências programadas no seguimento de instruções. Psicologia: Reflexão e Crítica,17 (1), 31-42. Ayllon, T., & Azrin, N. H. (1964). Reinforcement and instructions with mental patients. Journal of the Experimental Analysis of Behavior, 7 (4), 327-331. Baron, A., & Galizio, M. (1983). Instructional control of human operante behavior. The Psychological Record, 33, 495-520. Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura. Porto Alegre: ARTMED. Bentall, R. P., Lowe, C. F., & Beasty, A. (1985). The role of verbal behavior in human learning: II. Developmental differences. Journal of the Experimental Analysis of Behavior,43 (2), 165-181. Braam, C., & Malott, R. W. (1990). “I'll do it when the snow melts”: The effects of deadlines and delayed outcomes on rule-governed behavior in preschool children. The Analysis of Verbal Behavior, 8, 67-76. Buskist, W. F., Bennett, R. H., & Miller Jr., H. L. (1981). Effects of instructional constraints on human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 35 (2), 217-225. 92 Buskist, W. F., & Miller Jr., H. L. (1986). Interaction between rules and contingencies in the control of human fixed-interval performance. The Psychological Record, 36, 109-116. Castanheira, S. dos S. (2001). Regras e aprendizagem por contingência: Sempre e em todo lugar. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, & M. C. Scoz (Orgs.), Sobre comportamento e cognição – Expondo a variabilidade (pp. 36-46). Santo André: ESETec. Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto Alegre: ARTMED. Catania, A. C. (1989). Rules as classes of verbal behavior: A reply to Glenn. The Analysis of Verbal Behavior, 7, 49-50. Catania, A. C., Matthews, B. A., & Shimoff, E. (1982). Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior, 38 (3), 233-248. Catania, A. C., Matthews, B. A., & Shimoff, E. (1990). Properties of rule-governed behavior and their implications. In D. E. Blackman & H. Lejeune (Orgs.), Behaviour analysis in theory and practice: Contribuitions and controversies (pp. 215-230). Erlbaum: Hilsdale. Catania, A. C., Shimoff, E., & Matthews, B. A. (1989). An experimental analysis of rule-governed behavior. In S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies, and instructional control (pp. 119-150). New York: Plenum Press. 93 Cerutti, D. T. (1994). Compliance with instructions: Effects of randomness in scheduling and monitoring. The Psychological Record, 44, 259-269. Cerutti, D. T. (1989). Discrimination theory of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 51 (2), 259-276. Cerutti, D. T. (1991). Discriminative versus reinforcing properties of schedules as determinants of schedule insensitivity in humans. The Psychological Record, 41, 5167. Danforth, J. S., Chase, P. N., Dolan, M., & Joyce, J. H. (1990). The establishment of stimulus control by instructions and by differential reinforcement. Journal of the Experimental Analysis of Behavior, 54 (2), 97-112. DeGrandpre, R. J., & Buskist, W. F. (1991). Effects of accuracy of instructions on human behavior: correspondence with reinforcement contingencies matters. The Psychological Record, 41, 371-384. Dermer, M. L., & Rodgers, J. G. (1997). Schedule control over following instructions comprised of novel combinations of verbal stimuli. The Psychological Record, 47, 243-260. Dixon, M. R. (2000). Manipulating the illusion of control: Variations in gambling as a function of perceived control over change outcomes. The Psychological Record,50, 705-719. Dixon, M. R., Hayes, L. J., & Aban, I. B. (2000). Examining the roles of rulefollowing, reinforcement, and preexperimental histories on risk-taking behavior. The Psychological Record,49, 687-705. 94 Dixon, M. R., & Hayes, L. J. (1998). Effects of differing instructional histories on the resurgence of rule-following. The Psychological Record,48, 275-292. Galizio, M. (1979). Contingency-shaped and rule-governed behavior: Instructional control of human loss avoidance. Journal of the Experimental Analysis of Behavior, 31(1), 53-70. Glenn, S. G. (1987). Rules as environmental events. The Analysis of Verbal Behavior,5, 29-32. Hackenberg, T. D., & Joker, V. R. (1994). Instructional versus schedule control of humans’ choices in situations of diminishing returns. Journal of the Experimental Analysis of Behavior,62 (3), 367-383. Harzem, P., Lowe, C. F., & Bagshaw, M. (1978). Verbal control in human operant behavior. The Psychological Record, 28, 405-423. Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986a). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46 (2), 137-147. Hayes, S. C., Brownstein, A. J., Zettle, R. D., Rosenfarb, I., & Korn, Z. (1986b). Rule-governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45 (3), 237-256. Hojo, R. (2002). Effects of instructional accuracy on a conditional discrimination task. The Psychological Record, 52, 493-506. 95 Joyce, J. H., & Chase, P. N. (1990). Effects of response variability on the sensitivity of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 54 (3), 251-262. Kaufman, A., Baron, A., & Kopp, R. E. (1966). Some effects of instructions on human operant behavior. Psychonomic Monograph Supplements, 1, 243-250. Kerr, K. P. F., & Keenan, M. (1997). Rules and rule-governance: New directions in the theoretical and experimental analysis of human behaviour. In K. Dillenburger, M. F. O’Reilly, & M. Keenan (Eds.), Advances in behaviour analysis (pp. 205-226). Dublin: University College Dublin Press. LeFrancois, J. R., Chase, P. N., & Joyce, J. H. (1988). The effects of a variety of instructions on human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 49, 383-393. Madden, G. J., Chase, P. N., & Joyce, J. H. (1998). Making sense of sensitivity in the human operant literature. The Behavior Analyst,21 (1), 1-12. Martinez, H., & Ribes, E. (1996). Interactions of contingencies and instructional history on conditional discrimination. The Psychological Record, 46, 301-318. Matos, M. A. (2001). Comportamento governado por regras. Revista Brasileira de Terapia Comportamental e Cognitiva, III, 51-66. Matthews, B. A., Catania, A. C., & Shimoff, E. (1985). Effects of uninstructed verbal behavior on nonverbal responding: Contingency descriptions versus performance descriptions. Journal of the Experimental Analysis of Behavior,43 (2), 155-164. 96 Matthews, B. A., Shimoff, E., Catania, A. C., & Sagvolden, T. (1977). Uninstructed human responding: Sensitivity to ratio and interval contingencies. Journal of the Experimental Analysis of Behavior, 27(3), 453-467. Meyer, S. B. (2005). Regras e auto-regras no laboratório e na clínica. Em J. AbreuRodrigues & M. R. Ribeiro (Orgs.), Análise do Comportamento – Pesquisa, Teoria e Aplicação (pp. 211-. Porto Alegre: ARTMED. Newman, B., Buffington, D. M., & Hemmes, N. S. (1995). The effects of schedules of reinforcement on instruction following. The Psychological Record, 45, 463-476. Newman, B., Hemmes, N. S., Buffington, D. M., & Andreopoulos, S. (1994). The effects of schedules of reinforcement on instruction-following in human subjects with verbal and nonverbal stimuli. The Analysis of Verbal Behavior, 12, 31-41. Nico, Y. (1999). Regras e insensibilidade: conceitos básicos, algumas considerações teóricas e empíricas. Em R. R. Kerbauy, & R. C. Wielenska (Orgs.), Sobre comportamento e cognição – Psicologia comportamental e cognitiva – Da reflexão teórica à diversidade na aplicação (pp. 31-39). Santo André: ARBytes. Ono, K. (1994). Verbal control of superstitious behavior: Superstitious as false rules. In S. C. Hayes, L. J. Hayes, M. Sato and K. Ono (Eds.), Behavior Analysis of Language and Cognition (pp. 181-196). Reno (NV): Context Press. Otto, T. L., Torgrud, L. J., & Holborn, S. W. (1999). An operant blocking interpretation of instructed insensitivity Psychological Record,49, 663-684. to schedule contingencies. The 97 Paracampo, C. C. P. (1991). Alguns efeitos de estímulos antecedentes verbais e reforço programado no seguimento de regras. Psicologia: Teoria e Pesquisa, 7 (2), 149-161. Paracampo, C. C. P., Albuquerque, L. C. de, & Fontes, J. C. S. (1993). Análise de algumas das variáveis responsáveis pela manutenção do seguimento de regras. Anais da 45ª Reunião anual da Sociedade Brasileira para o Progresso da ciência, Vol. 3, p. 984. Paracampo, C. C. P., de Souza, D. G., Matos, M. A., & Albuquerque, L. C. de (2001). Efeitos de mudança em contingências de reforço sobre o comportamento verbal e não verbal. Acta Comportamentalia, 9 (1), 31-55. Perone, M. (1988). Laboratory lore and research practices in the experimental analysis of human behavior: Use and abuse of subject’s verbal reports. The Behavior Analyst, 11, 71-75. Pouthas, V., Droit, S., Jacquet, A. Y., & Wearden, J. H. (1990). Temporal differentiation of response duration in children of different ages: developmental changes in relations between verbal and nonverbal behavior. Journal of the Experimental Analysis of Behavior, 53 (1), 21-31. Raia, C. P., Shillingford, S. W., Miller Jr., H. L. , & Baier, P. S. (2000). Interaction of procedural factors in human performance on yoked schedules. Journal of the Experimental Analysis of Behavior, 74 (3), 265-281. 98 Reese, H. W. (1989). Rules and rule-governance: Cognitive and behavioristic views. In S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies and instructional control (pp. 3-84). New York: Plenun Press. Ribes, E., & Rodriguez, M. E. (2001). Correspondence between instructions, performance, and self-descriptions in a conditional discrimination task: The effects of feedback and type of matching response. The Psychological Record, 51, 309-333. Rosenfarb, I. S., Newland, M. C., Brannon, S. E., & Howey, D. S. (1992). Effects of self-generated rules on the development of schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 58 (1), 107-121. Santos, J. G. W., Paracampo, C. C. P., & Albuquerque, L. C. de (2004). Análise dos efeitos de histórias de variação comportamental sobre o seguimento de regras. Psicologia, Reflexão e Crítica, 17 (3), 413-425. Schlinger, H. D. Jr., & Blakely, E. (1987). Function-altering effects of contingencyspecifying stimuli. The Behavior Analyst,10, 41-45. Schmitt, D. R. (1998). Effects of consequences of advice on patterns of rule control and rule choice. Journal of the Experimental Analysis of Behavior, 70 (1), 1-21. Shimoff, E. (1986). Post-session verbal reports and the experimental analysis of behavior. The Analysis of Verbal Behavior, 4, 19-22. Shimoff, E., Catania, A. C., & Matthews, B. A. (1981). Uninstructed human responding: Sensitivity of low-rate performance to schedule contingencies. Journal of the Experimental Analysis of Behavior, 36 (2), 207-220. 99 Shimoff, E., Matthews, B. A., & Catania, A. C. (1986). Human operant performance: sensitivity and pseudosensitivity to contingencies. Journal of the Experimental Analysis of Behavior, 46 (2), 149-157. Simonassi, L. E., Fróes, A. C., Sanabio, E. T. (1995). Contingências e regras: Considerações sobre comportamentos conscientes. Estudos (Goiânia), 22, 71-82. Simonassi. L. E., Oliveira, C. I., & Gosch, C. S. (1997). Exposição a contingências, conteúdo de instrução e formulação de regras. Psicologia: Teoria e Pesquisa, 13 (2), 189-195. Simonassi, L. E., Oliveira, C. I., Sanabio, E. T. (1994). Descrição sobre possíveis relações entre contingências programadas e formulação de regras. Estudos (Goiânia), 21 (3/4), 97-112. Skinner, B. F. (1974). About behaviorism. New York: Alfred A. Knopf. Skinner, B. F. (1966). An operant analysis of problem solving. In B. Kleinmuntz (Ed.), Problem solving: Research, method, teaching (pp. 225-257). New York: Wiley. Skinner, B. F. (1969). Contingencies of Reinforcement: A theoretical analysis. New York: Appleton-Century-Crofts. Torgrud, L. J., & Holborn, S. W. (1990). The effects of verbal performance descriptions on nonverbal operant responding. Journal of the Experimental Analysis of Behavior,54 (3), 273-291. 100 Vaughan, M. E. (1985). Repeated acquisition in the analysis of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 44 (2), 175-184. Weiner, H. (1970). Instructional control of human operant responding during extinction following fixed-ratio conditioning. Journal of the Experimental Analysis of Behavior, 13 (3), 391-395. Wulfert, E., Greenway, D. E., Farkas, P., Hayes, S. C., & Dougher, M. J. (1994). Correlation between self-reported rigidity and rule-governed insensitivity to operant contingencies. Journal of Applied Behavior Analysis,27, 659-671. Zettle, R. D. (1990). Rule-governed behavior: A radical behavioral answer to the cognitive challenge. The Psychological Record,40, 41-49. 101 ANEXO 1 Termo de Consentimento Livre e Esclarecido 102 Universidade Católica de Goiás Vice-Reitoria de Pós-Graduação e Pesquisa Departamento de Psicologia Mestrado em Psicologia Laboratório de Análise Experimental do Comportamento (LAEC) Termo de Consentimento Livre e Esclarecido (Em acordo às Normas da resolução 196/96 do Conselho Nacional de Saúde – MS) Prezado Participante, Estamos realizando uma pesquisa científica com o objetivo de investigar variáveis que afetam processos comportamentais. Esta pesquisa envolve a aplicação de um procedimento desenvolvido em computador. A sua tarefa consiste em tocar o círculo central que aparecerá na tela do computador; não necessitando utilizar mouse ou teclado. Em alguns momentos você ganhará pontos e em outros perderá. Sua participação na pesquisa terá duração máxima de 4 (quatro) horas, distribuídas em 8 (oito) encontros. Este experimento estará sendo realizado a partir do primeiro semestre de 2005, em período acordado com você. Essa pesquisa será realizada e coordenada pela aluna de mestrado da UCG Sandra de Araújo Álvares, juntamente com o professor Dr. Lorismário E. Simonassi. Você poderá recusar-se a participar da pesquisa ou dela afastar-se em qualquer momento, sem que este fato venha lhe causar qualquer constrangimento ou penalidade por parte da instituição. Sua participação também poderá ser interrompida a qualquer tempo, por razões técnicas, quando, então, lhe serão fornecidas todas as explicações necessárias. Os investigadores se obrigam a não revelar a sua identidade em qualquer publicação resultante deste estudo. É extremamente importante que você mantenha sigilo sobre o procedimento experimental, até que o projeto seja finalizado. A duração prevista para o desenvolvimento de todo o projeto é de, aproximadamente, 6 meses. Ao final do experimento será realizada uma reunião com a participação voluntária de todos os participantes com o objetivo de prestar informações a respeito dos resultados obtidos e, também, responder às questões levantadas pelos mesmos. Antes de assinar este termo, você deverá informar-se plenamente sobre o mesmo, não hesitando em formular perguntas sobre qualquer aspecto que julgar conveniente esclarecer. É importante estar ciente das seguintes informações: 1-Os resultados deste estudo poderão nos ajudar a conhecer melhor os efeitos de certas variáveis sobre o comportamento humano; 2-Você poderá ganhar pontos podendo assim trocá-los por dinheiro; 3-Não existirão quaisquer ônus em relação à sua participação e nenhum risco à sua integridade física e psicológica. 4-Caso necessário você poderá se comunicar com a pesquisadora Sandra de Araújo Álvares, pelo telefone (62) 261-8932 ou (62) 9924-7372. 103 Agradecemos antecipadamente sua colaboração. ______________________________________ Sandra de Araújo Álvares Mestranda em Psicologia _____________________________________ Lorismário E. Simonassi Profº. Dr. da Universidade Católica de Goiás Concordo em participar do projeto de pesquisa explicitado acima. Nome do voluntário:_____________________________________________ (LETRA DE FORMA) CPF:_________________________________ RG:__________________________________ Assinatura do voluntário:__________________________ OBSERVAÇÃO: Este Termo de Consentimento Livre e Esclarecido está apresentado em duas cópias, das quais uma ficará com o voluntário da pesquisa. Goiânia, ______de__________________ de 2005.