Sandra de Araujo Alvares

Universidade Católica de Goiás
Pró-Reitoria de Pós-Graduação e Pesquisa
Mestrado em Psicologia
Efeitos de Arranjos Experimentais sobre a
Sensibilidade/Insensibilidade a Esquemas de
Reforçamento
Sandra de Araújo Álvares
Goiânia
Março de 2006
ii
Universidade Católica de Goiás
Pró-Reitoria de Pós-Graduação e Pesquisa
Mestrado em Psicologia
Efeitos de Arranjos Experimentais sobre a
Sensibilidade/Insensibilidade a Esquemas de
Reforçamento
Sandra de Araújo Álvares
Dissertação apresentada ao Curso de
Mestrado em Psicologia da Universidade
Católica de Goiás como requisito parcial
à obtenção do grau de Mestre em
Psicologia.
Orientador: Prof. Dr. Lorismário Ernesto
Simonassi
Goiânia
Março de 2006
iii
Agradecimentos
Ao professor Lorismário, por ter-me aceito como orientanda e pelas
prestimosas contribuições a esse trabalho.
Aos professores Sônia Mello e Dwain Santee pelas contribuições apontadas
durante o momento de qualificação.
Aos professores Carla Paracampo, Sônia Mello e Lauro Lalini por terem
aceito participar da Banca de Defesa.
Ao professor Márcio Barreto, por quem terei eterna gratidão pela confiança
em mim depositada e pelo importante apoio para o início da minha carreira em
docência.
Ao professor Luc Vandenbergh, por quem tenho o mais profundo respeito e
admiração. Agradeço-lhe pela compreensão quanto às mudanças de decisão que
tomei ao longo do curso de mestrado.
A todos os professores do curso de graduação em Psicologia e do Mestrado
em Psicologia da UCG que contribuíram para meu crescimento profissional e
pessoal.
Aos participantes do presente trabalho.
À amiga e companheira Michele, a quem agradeço pelos momentos de
desabafo e descontração.
Ao meu amado sobrinho Gustavo, sempre fonte de esperança e alegria.
Ao meu amor, José Ramos, pelo apoio, paciência e carinho nos momentos
difíceis.
Especialmente a meus pais, sem os quais a realização desse grande sonho não
seria possível. Devo a eles toda minha formação!
iv
Resumo
Vários são os aspectos apontados como passíveis de influenciarem a sensibilidade de
desempenhos humanos a esquemas de reforçamento. A fim de avaliar alguns desses
aspectos, o presente estudo submeteu participantes à tarefa de tocar um círculo
central que aparecia na tela do computador de acordo com um esquema de RF
(Razão Fixa) ou DRL (Reforçamento Diferencial de Baixas Taxas). Cada esquema
vigorava por três minutos; a troca entre eles não era sinalizada e nem instruída.
Respostas corretas produziam pontos trocáveis por dinheiro. O Experimento 1 teve
por objetivo verificar se o arranjo de conseqüências aversivas (perda de pontos) para
comportamentos inconsistentes com o esquema em vigor resultaria em aumento da
sensibilidade comportamental a tal esquema. Para tanto, seis participantes foram
submetidos a quatro fases experimentais: A (RF 18), B (DRL 6 seg.), C (RF 18) e D
(DRL 6 seg. + punição). Os resultados sugeriram que aspectos relacionados a um
fortalecimento das contingências em vigor – representado no presente experimento
pela inserção da punição na fase D – devem ser considerados como relevantes em
uma discussão sobre sensibilidade/insensibilidade comportamental. O Experimento 2
objetivou verificar se a exposição prévia a uma condição que favorecesse o contato
com o esquema em vigor seria suficiente para estabelecer responder adequado em
uma fase posterior, com sinais claros de discriminação do esquema em vigor. Quatro
participantes foram submetidos às seguintes fases experimentais: A (RF 18), B (DRL
6 seg.), C (RF 18), D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.). Os
resultados evidenciaram que os desempenhos sensíveis atingidos durante a fase D,
mantiveram-se durante a fase F, demonstrando os efeitos da punição não só em gerar
ou intensificar padrões sensíveis de desempenho aos esquemas programados, como
também, em manter tais padrões em situações posteriores e similares.
Palavras-chave: controle instrucional, desempenho, esquemas de reforçamento,
insensibilidade, sensibilidade, punição.
v
Abstract
Various aspects are pointed out as possible influences on human sensibility to
performance on reinforcement schedules. This study evaluates some of these aspects
by submitting participants to a the task of touching a circle that appeared on a
computed screen, according to a Fixed Ratio (FR) or a Low-rate Differential
Reinforcement (LDR) reinforcement schedule. Each schedule was effective for three
minutes and the change between them was neither signaled nor instructed. Correct
responses produced points that could be exchanged for money. Experiment 1 verified
if the arrangement of aversive consequences (loss of points) to behaviors
inconsistent with the schedule would result in an increase in behavioral sensibility to
this schedule. Six subjects were submitted to four experimental phases: A (FR 18), B
(LDR 6 sec.), C (FR 18) and D (LDR 6 sec. + punishment). The results suggest that
aspects pertaining to the strengthening of ongoing contingencies – here represented
by the insertion of punishment in phase D – should be considered relevant in the
discussion about behavioral sensibility/insensibility. Experiment 2 verified if the
previous exposure to one condition that favors the contact with the ongoing schedule
would be sufficient to establish adequate responding in a latter phase with clear signs
of discrimination of the ongoing phase. Four participants ere submitted to the
following phases: A (RF 18), B (LDR 6 sec.), C (FR 18), D (LDR 6 sec +
punishment), E (FR 18) and F (LDR 6 sec.). Results show that the sensitive
performances affected during phase D were sustained during phase F, showing that
punishment not only generated sensitive performance patterns in relation to the
programmed schedules, but also in maintaining such patterns in latter similar
situations.
Keywords: instructional control, performance, reinforcement schedules, insensitivity,
sensitivity, punishment.
vi
Lista de Figuras
Figura 1 – Tela apresentada ao participante para respostas............................................ 40
Figura 2 – Médias do número de respostas das três últimas sessões das fases
experimentais A (RF 18), B (DRL 6 seg.), C (RF 18) e D (DRL 6 seg. + punição)
para os participantes P1, P2, P3, P4, P5 e P6 ................................................................ 56
Figura 3 – Médias do número de respostas das três últimas sessões das fases
experimentais A (RF 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição), E
(RF 18) e F (DRL 6 seg.) para os participantes P7, P8, P9 e P10 ................................. 78
vii
Lista de Tabelas
Tabela 1 – Fases experimentais, esquema de reforçamento, conseqüenciação de
respostas e número de sessões aos quais cada participante foi submetido durante o
Experimento 1 ................................................................................................................ 39
Tabela 2 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P1 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 44
Tabela 3 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P2 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 46
Tabela 4 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P3 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 48
Tabela 5 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P4 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 50
Tabela 6 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P5 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 52
Tabela 7 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P6 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 53
viii
Tabela 8 – Fases experimentais, esquema de reforçamento, conseqüenciação de
respostas e número de sessões aos quais cada participante foi submetido durante o
Experimento 2 ................................................................................................................ 69
Tabela 9 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P7 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 70
Tabela 10 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P8 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 72
Tabela 11 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P9 nas Fases Experimentais (FE), Esquemas de
Reforçamento (ER) e Sessões a que foi exposto............................................................ 74
Tabela 12 – Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P10 nas Fases Experimentais (FE), Esquemas
de Reforçamento (ER) e Sessões a que foi exposto....................................................... 76
ix
Sumário
Resumo .......................................................................................................................... iv
Abstract......................................................................................................................... v
Lista de Figuras ............................................................................................................ vi
Lista de Tabelas............................................................................................................ vii
Introdução..................................................................................................................... 01
1.1. Grau de contato com a contingência em vigor............................................... 04
1.2. Persistência do controle instrucional mesmo diante do contato com
discrepância entre instruções e o desempenho............................................... 08
1.3. Conteúdo das instruções................................................................................ 14
1.4. Variabilidade comportamental ...................................................................... 16
1.5. História de reforçamento............................................................................... 19
1.6. Efeitos de relatos verbais modelados ou instruídos sobre o responder não
verbal.............................................................................................................. 21
1.7. Aumento do controle discriminativo das contingências programadas.......... 23
1.8. Grau de discriminabilidade dos esquemas em vigor..................................... 27
1.9. Auto-regras.................................................................................................... 31
Objetivos ....................................................................................................................... 34
Método........................................................................................................................... 36
Experimento I........................................................................................................ 36
Participantes ................................................................................................. 36
Equipamentos............................................................................................... 36
Procedimentos .............................................................................................. 37
Resultados .................................................................................................... 43
Discussão ..................................................................................................... 64
Experimento II ...................................................................................................... 67
Participantes ................................................................................................. 67
Equipamentos............................................................................................... 67
Procedimentos .............................................................................................. 67
Resultados .................................................................................................... 69
Discussão ..................................................................................................... 82
Discussão Geral ............................................................................................................ 85
Referências Bibliográficas ........................................................................................... 90
Anexo 1 – Termo de Consentimento Livre e Esclarecido......................................... 101
1
Introdução
Regras foram definidas por Skinner (1966, 1969) como estímulos
discriminativos especificadores de contingências, isto é, estímulos que podem
especificar o comportamento a ser emitido, as condições sob as quais deve ocorrer e
suas prováveis conseqüências (Ver também as posições de Albuquerque, 2001;
Catania, 1989; Glenn, 1987; Kerr & Keenan, 1997; Schlinger & Blakely, 1987). O
comportamento controlado por esse tipo de descrição é conhecido como
comportamento governado por regras. Já o comportamento estabelecido e mantido
pelas conseqüências naturais do ambiente é definido como comportamento modelado
por contingências. Dessa forma, tanto regras quanto contingências podem ser
eficazes em estabelecer novos padrões comportamentais, a despeito de representarem
variáveis controladoras distintas.
Tem sido confirmado por diversos estudos de pesquisa básica que as regras
podem facilitar a aquisição de novos comportamentos, principalmente quando as
contingências são fracas, complexas, ambíguas ou imprecisas (Baum, 1999;
Castanheira, 2001; Catania, Shimoff & Matthews, 1989; Matos, 2001; Nico, 1999;
Paracampo, 1991), antes mesmo que tais comportamentos mantenham contato com
suas conseqüências imediatas (Albuquerque, de Souza, Matos & Paracampo, 2003).
No entanto, um dos resultados mais proeminentes e polêmicos de tais pesquisas tem
sido a constatação de que as regras podem levar a uma rejeição das contingências
programadas, isto é, levar a uma redução na sensibilidade comportamental às
contingências (Kaufman, Baron & Kopp, 1966; Madden, Chase & Joyce, 1998;
Meyer, 2005; Skinner, 1969). Este último resultado é interpretado por alguns autores
como uma limitação do controle por reforçamento em humanos.
2
O comportamento sensível seria aquele que muda sistematicamente
acompanhando mudanças nas contingências de reforço, isto é, se o comportamento
muda sempre que a contingência muda, então o comportamento é considerado como
sensível às suas conseqüências. Por outro lado, se o comportamento persiste a
despeito de mudanças nas contingências, então o comportamento é considerado
insensível às suas conseqüências (Catania, Matthews & Shimoff, 1982; Dermer &
Rodgers, 1997; Galizio, 1979; Hackenberg & Joker, 1994; Hayes, Brownstein, Haas
& Greenway, 1986a; Hayes, Brownstein, Zettle, Rosenfarb & Korn, 1986b;
Kaufman, Baron & Kopp, 1966; Madden, Chase & Joyce, 1998; Matthews, Catania
& Shimoff, 1985; Matthews, Shimoff, Catania & Sagvolden, 1977; Shimoff, Catania
& Matthews, 1981; Shimoff, Matthews & Catania, 1986; Torgrud & Holborn, 1990).
Tal definição de sensibilidade é, portanto, baseada em uma comparação intra-sujeito
(Madden, Chase & Joyce, 1998).
Considerando que só se pode ter certeza de que o comportamento é
controlado por regras ou contingências quando essas variáveis são contrastadas
(Catania, Matthews & Shimoff, 1990), um procedimento muito utilizado para avaliar
o controle exercido por regras sobre o comportamento humano consiste, em geral,
em apresentar ao participante uma instrução que descreve o desempenho apropriado
a um determinado esquema de reforçamento e, em seguida, expor o participante ao
esquema descrito na instrução. Passado um certo tempo realizando a tarefa (como,
por exemplo, pressionar uma chave e obter pontos trocáveis por dinheiro), o
esquema é alterado sem que nenhuma informação adicional seja fornecida ao
participante. Observa-se, então, se após a mudança do esquema, o participante muda
seu padrão de respostas acompanhando as mudanças nas contingências programadas,
ou se mantém o padrão anteriormente estabelecido via instrução. No primeiro caso,
3
diz-se que o comportamento é controlado pelas contingências, e no segundo, que é
controlado por regras (Albuquerque, 1998; Baron & Galizio, 1983).
Enquanto alguns pesquisadores argumentam que as instruções tornam o
responder do sujeito insensível às contingências do esquema (Harzem, Lowe, &
Bagshaw, 1978) e que a insensibilidade seria uma característica definidora das
instruções (Matthews e cols., 1977; Shimoff e cols., 1981), outros estudos sugerem
que o controle instrucional é uma função de sua correlação com as contingências de
reforçamento (Ayllon & Azrin, 1964; Buskist & Miller, 1986; Danforth, Chase,
Dolan & Joyce, 1990; Galizio, 1979), com contingências fracas (Cerutti, 1989), ou
com falta de controle pelas contingências (Torgrud & Holborn, 1990) e, ainda, que
as instruções seriam seguidas a menos que o responder do sujeito contactasse com
contingências incongruentes (Albuquerque, Paracampo & Albuquerque, 2004; Baron
& Galizio, 1983; Buskist & Miller, 1986; Galizio, 1979; Paracampo, Albuquerque &
Fontes, 1993; Weiner, 1970). Esses estudos, em conjunto com aqueles que têm
investigado os efeitos de auto-regras (Catania e cols., 1989; Perone, 1988; Pouthas,
Droit, Jacquet & Wearden, 1990; Rosenfarb, Newland, Brannon & Howey, 1992;
Shimoff, 1986) têm contribuído para identificar algumas das variáveis envolvidas na
sensibilidade do comportamento não verbal humano às contingências de
reforçamento.
O que se observa recentemente é que vários estudos vêm apontando para o
fato de que a redução na sensibilidade comportamental às contingências em vigor
não pode e nem deve ser considerada uma característica inerente do controle
instrucional, visto que tal redução pode ser ocasionada por uma série de aspectos
variados.
4
Serão apresentados na seqüência, alguns estudos que apontam variáveis
outras, além do controle instrucional, que devem ser consideradas numa discussão
mais precisa sobre sensibilidade/insensibilidade comportamental. As variáveis
destacadas são parcialmente baseadas na descrição feita por Abreu-Rodrigues e
Sanabio (no prelo) e consistem numa discussão sobre 1) grau de contato com a
contingência em vigor; 2) persistência do controle instrucional mesmo diante do
contato com a discrepância entre instruções e desempenhos; 3) conteúdos das
instruções; 4) variabilidade comportamental; 5) história de reforçamento; 6) efeitos
de relatos verbais modelados ou instruídos sobre o responder não verbal; 7) aumento
do
controle
discriminativo
das
contingências
programadas;
8)
grau
de
discriminabilidade dos esquemas em vigor e 9) auto-regras.
1.1. Grau de contato com a contingência em vigor
Galizio (1979) defendia a idéia de que se instruções fossem apresentadas em
um ambiente experimental onde levassem a perda de reforçamento, então uma
eliminação do seguir instruções deveria ocorrer. A pesquisa desenvolvida por esse
autor consistiu em uma tentativa de examinar essa predição usando uma linha-debase de esquiva com perda de dinheiro como evento aversivo.
No Experimento 1 o papel de instruções acuradas foi avaliado. Para tanto,
desempenhos gerados por um esquema múltiplo simples foram comparados com
desempenhos quando instruções acuradas foram acrescentadas.
Seis estudantes universitários participaram. O aparato experimental consistiu
em uma mesa contendo um painel vertical com uma alavanca manipulável e um
arranjo de seis luzes coloridas. A luz verde da esquerda indicava quando uma sessão
estava em progresso e a luz vermelha da direita servia como um sinal de perda de
5
dinheiro. As outras quatro luzes eram âmbar e serviam como estímulos
discriminativo e instrucional para os componentes do esquema múltiplo. Havia a
possibilidade de se colocar um rótulo com instrução (“10 seg”, “30 seg”, “60 seg” ou
“SEM PERDA”) acima de cada uma dessas quatro luzes. A resposta de esquiva
consistia em girar a alavanca 45º para a direita a fim de adiar a apresentação da luz
vermelha.
O esquema completo era composto de três esquemas de esquiva de 12,5
minutos, cada um com um intervalo de perda de resposta diferente (10, 30 ou 60
segundos), e um quarto componente de 12,5 minutos no qual nenhuma perda foi
programada.
Quatro dos seis sujeitos foram inicialmente expostos aos esquemas sem
nenhuma instrução. Na fase seguinte do experimento, rótulos com instruções foram
adicionados aos esquemas múltiplos. Na última fase, as luzes e os componentes
foram misturados e os rótulos com instruções retirados. O procedimento para os dois
sujeitos restantes foi o mesmo, exceto que foram inicialmente expostos a uma
condição com instruções adicionadas aos esquemas múltiplos. Posteriormente, os
estímulos foram misturados e as instruções retiradas.
Os resultados da primeira fase envolvendo os quatro sujeitos mostraram que,
sem instruções, somente um sujeito foi capaz de discriminar dentre os quatro
componentes do esquema múltiplo. Quando os rótulos com instruções foram
adicionados, os três sujeitos que não haviam previamente demonstrado controle
discriminativo completo passaram a discriminar dentre os componentes do esquema
total. Para dois dos três sujeitos que foram submetidos à última fase, pôde-se
verificar que suas taxas de respostas permaneceram praticamente idênticas em
relação à fase anterior. No entanto, um dos sujeitos pareceu inalterado pela
6
exposição prévia às instruções, pois, após estas terem sido retiradas, suas taxas
retornaram àquelas observadas na exposição inicial.
Os outros dois sujeitos que foram primeiramente treinados com instruções e
só posteriormente foram submetidos à condição de nenhuma instrução permitiram
uma análise adicional dos efeitos destas. Já na fase com instruções a aquisição da
resposta de esquiva foi rápida e o controle instrucional desenvolveu-se para os dois
sujeitos. Quando na fase posterior os esquemas tiveram suas posições trocadas e as
instruções foram retiradas, somente um dos sujeitos adquiriu rapidamente as novas
discriminações, enquanto o outro sujeito demonstrou estar sob controle exclusivo de
instruções.
De uma forma geral, pode-se afirmar que as instruções que especificavam
qual responder afetava a liberação de perdas foram suficientes para induzir esquiva
regular quase que imediatamente para todos os sujeitos. Esses resultados mostram
pobre controle de esquemas sem instruções e taxas mais diferenciadas quando as
mesmas são adicionadas, ilustrando, dessa forma, o controle que as instruções podem
exercer sob o comportamento operante humano (ver também Ayllon & Azrin, 1964;
Danforth, Chase, Dolan & Joyce, 1990; Vaughan, 1985, Experimento I, para uma
análise dos efeitos facilitadores das instruções no processo de aquisição de novos
repertórios).
O Experimento 2 avaliou os efeitos de instruções imprecisas. Os sujeitos
foram estudados sob condições onde o comportamento evocado por instruções
imprecisas levava a uma perda programada (condição contato) ou a nenhuma
conseqüência aversiva (condição sem contato).
Na condição sem contato, o esquema completo do Experimento 1 foi
transformado em um esquema sem perdas em todos os quatro componentes, embora
7
os estímulos discriminativos (luzes) e instrucionais (rótulos) tenham permanecido os
mesmos. As instruções eram inacuradas sob essas condições, mas os sujeitos que
continuaram a segui-las não entraram em contato com a discrepância. Já na condição
contato, um esquema de esquiva com um intervalo de perda de resposta de 10
segundos foi programado para todos os quatro componentes. Neste caso, o seguir
instruções levava a perdas.
Participaram quatro sujeitos que já haviam participado do Experimento 1. O
procedimento foi iniciado com a última condição do Experimento 1, mantendo a
contingência de esquiva com os quatro componentes de 10, 30, 60 segundos e sem
perda com suas respectivas instruções acuradas. Após essa fase seguiu-se a condição
sem contato onde a programação de perdas foi retirada, mas as luzes e os rótulos
permaneceram como na fase anterior. Posteriormente, a condição contato foi
introduzida envolvendo a mesma seqüência de luzes e rótulos que a condição sem
contato, mas cada um dos quatro componentes estava em um esquema de esquiva
com um intervalo de perda de resposta de 10 segundos. Finalmente, os sujeitos
foram retornados à condição sem contato, onde todos os componentes não levavam a
perdas.
Os resultados mostraram que na primeira condição onde as instruções eram
precisas (última condição do Experimento 1), o controle instrucional foi rapidamente
restabelecido. Na condição posterior (sem contato) onde nenhuma perda foi
programada, os sujeitos permaneceram sob o controle instrucional da fase anterior.
No entanto, na condição contato, onde um intervalo de perda de 10 segundos estava
em vigor para os quatro componentes, houve uma imediata quebra do controle
instrucional para todos os sujeitos, demonstrando que o responder passou a ficar sob
controle do esquema de esquiva programado e não das instruções. Durante a segunda
8
exposição à condição sem contato, o seguir instruções não reapareceu em qualquer
sujeito. Nessa fase, os dados de três dos quatro sujeitos declinaram apropriadamente
para o esquema sem perda, enquanto que um dos sujeitos manteve seu desempenho
em taxas altas e indiferenciadas como na condição precedente (contato),
demonstrando um não ajustamento ao esquema sem perda.
Esses resultados, tomados em conjunto, mostram o papel do contato com a
discrepância instrução-esquema em enfraquecer o controle instrucional. Galizio
(1979) reafirma que o contato com a discrepância é necessário para a eliminação do
seguir instruções, não simplesmente a existência de tal discrepância. O seguir
instruções seria, dessa forma, controlado por suas conseqüências.
Buskist e Miller (1986) e DeGrandpre e Buskist (1991) concordam com
Galizio (1979) ao afirmarem que, ao contrário do que propõem alguns estudos, são
as contingências que podem ofuscar as instruções se estas últimas contradizem as
primeiras. Formas puras de controle instrucional seriam um resultado de instruções
imprecisas junto com falhas em contactar com alguns aspectos das contingências,
isto é, o estímulo instrucional pode minimizar os efeitos das contingências quando as
instruções são imprecisas e o comportamento dos sujeitos não estabelece contato
com as contingências em vigor.
1.2. Persistência do controle instrucional mesmo diante do contato com
discrepância entre instruções e o desempenho
Alguns autores apontam para o fato de que o seguir instruções pode ocorrer
mesmo naquelas situações em que ocorre contato com a discrepância entre a
instrução e o desempenho.
9
Shimoff e cols. (1981) afirmam que os desempenhos instruídos insensíveis
são normalmente caracterizados por taxas altas e constantes de responder. Diante
desses achados, os autores questionam se taxas baixas também não poderiam estar
relacionadas à insensibilidade a contingências. Avaliar tal possibilidade seria
importante na visão desses autores, visto que, constatada sua validade, os efeitos de
instruções deveriam ser avaliados também com desempenhos de baixas taxas.
Dessa forma, os dois experimentos realizados por Shimoff e cols. (1981)
examinaram a sensibilidade do responder de baixas taxas, as quais foram mantidas
por esquemas de intervalo variável (VI) ou razão variável (VR) com a superposição
de uma contingência de reforçamento diferencial de baixas taxas (DRL). Somente
respostas que terminassem com intervalos entre respostas mais longos do que
aqueles especificados pela contingência de DRL foram válidas para produzir pontos
que valiam dinheiro. A sensibilidade foi testada pelo relaxamento da contingência de
DRL, visto que, após tal manipulação experimental, esperava-se que o responder
aumentasse, demonstrando assim, sensibilidade às contingências.
Estudantes universitários pressionavam uma chave de telégrafo que, de
acordo com o esquema em vigor, acendia uma luz na presença da qual a pressão de
um botão produzia pontos posteriormente trocáveis por dinheiro. Pressionar a chave
em taxas baixas foi uma resposta estabilizada para alguns estudantes através de
modelagem e para outros por demonstração associada a instruções escritas
(Matthews e cols., 1977).
No experimento 1, taxas baixas foram estabilizadas pela combinação de uma
contingência de DRL 3s com um esquema de VI, e a sensibilidade foi avaliada pelo
término da contingência de DRL. Com esta mudança, no entanto, taxas de respostas
aumentadas não aumentariam correspondentemente o ganho de pontos.
10
De acordo com a análise dos resultados obtidos, quando o responder foi
estabilizado por modelagem, a remoção da contingência de DRL aumentou as taxas
de respostas para seis dos sete sujeitos com taxas altas o suficiente para contactar
com as contingências. Já quando o responder foi mantido por instruções, somente
quatro de dez sujeitos demonstraram aumento nas taxas.
No Experimento 2 o responder foi mantido por um esquema de VR com uma
contingência de DRL 4s subseqüentemente reduzida para DRL 1s. Esse experimento
enfocou a questão de se taxas de responder instruído permaneceriam baixas ainda
quando taxas altas aumentariam o ganho de pontos. A insensibilidade seria
demonstrada, portanto, quando baixas taxas fossem mantidas sob condições nas
quais taxas altas aumentariam o ganho de pontos.
O material e o procedimento utilizados foram semelhantes àqueles descritos
no Experimento 1.
Os resultados permitiram constatar que as taxas de resposta para quatro dos
seis sujeitos com respostas modeladas aumentaram após a redução da contingência
de DRL, mas quando as respostas foram instruídas, as taxas não aumentaram (cinco
casos) ou tiveram uma pequena redução (três casos).
Ambos os experimentos mostraram que respostas de baixas taxas
estabilizadas por modelagem são geralmente sensíveis a alterações nas
contingências, ao passo que as instruções podem produzir um responder de baixas
taxas insensível às mesmas contingências até quando o aumento nas
taxas de
respostas – e o conseqüente contato com às contingências – é positivamente
correlacionado com ganho de pontos (Ver também Dixon, 2000; Dixon, Hayes &
Aban, 2000; Mattews e cols., 1977; Raia, Shillingford, Miller, Baier, 2000,
Experimento 1).
11
O enfoque dado por Galizio (1979) à questão da insensibilidade implica que
o responder em altas taxas gerado por instruções freqüentemente exclui contato com
as contingências. Uma visão alternativa proposta por Shimoff e cols. (1981) na
discussão dos experimentos descritos é a de que o responder insensível pode assim
permanecer a despeito do contato com as contingências, visto que, os sujeitos
continuaram a se comportar de acordo com as instruções recebidas ainda que tal
responder implicasse numa diminuição do ganho de pontos. Ao contrário do que
propõe Galizio (1979), afirmam que a insensibilidade induzida por instruções não
seria limitada a desempenhos que excluem contato com as contingências, pois
mesmo quando tal contato existe, a insensibilidade pode se manter, conforme
demonstrado no Experimento 2.
Hayes e cols. (1986b) preocuparam-se com a questão de que é possível que
um comportamento aparentemente sensível a um esquema, se estabilizado por uma
regra, possa ser uma instância de seguimento da regra, não um desempenho
controlado pelo esquema.
Um procedimento muito utilizado para avaliar a sensibilidade a contingências
programadas tem sido desenvolver um responder em estado estável em um dado
esquema e então, alterar o esquema ou os parâmetros deste. Uma segunda alternativa
envolve o uso de esquemas múltiplos. Hayes e cols. (1986b) realizaram um estudo
para examinar o grau de conformidade entre esses dois tipos de avaliação de
sensibilidade a esquemas, nas situações em que as instruções dadas estavam ou não
de acordo com o esquema de reforçamento prevalente.
Participaram 55 estudantes universitários cuja tarefa consistia em mover um
sinal positivo (+) que aparecia no canto superior esquerdo de uma matriz 5x5
projetada na tela de um computador para o canto inferior direito através da
12
manipulação de dois botões que eram sinalizados pelas luzes amarela e azul. Os
sujeitos foram divididos randomicamente em 4 grupos: “Instrução mínima”,
“Instrução responda lentamente”, “Instrução responda rapidamente” ou “Instrução
precisa”. No grupo de “Instrução mínima”, nenhuma instrução adicional foi
fornecida; no grupo “Instrução responda lentamente”, os participantes recebiam a
instrução adicional de que a melhor forma de pressionar os botões era lentamente; no
grupo “Instrução responda rapidamente”, a instrução adicional indicava aos
participantes que deveriam pressionar rapidamente e no grupo “Instrução precisa” as
relações entre os estímulos sinalizadores e a velocidade de pressão aos botões foram
precisamente expressas.
Na fase de treino (sessões 1 e 2), a mudança do sinal positivo estava sob
controle do esquema MULT DRL 6s FR 18. Os esquemas se alternavam a cada 2
minutos. Na fase de extinção (sessão 3) o sinal não se movia, independente dos
padrões de resposta e nenhum ponto era ganho. Cada sessão durou 32 minutos.
Os resultados sugeriram uma relação entre sensibilidade ao esquema múltiplo
e sensibilidade à extinção, mas tal relação manteve-se somente quando o responder
diferencial no esquema múltiplo não ocorreu diretamente devido a uma regra
fornecida pelo experimentador. Os dados sugeriram ainda que a confiança em formas
de padrões de respostas, mais do que em suas variáveis de controle, pode levar a uma
categorização incorreta do tipo de responder.
Os autores concluem que o mero responder diferencial que se apresenta
dentro dos padrões de um determinado esquema não é suficiente para definir o
comportamento como sensível ao esquema. Isto porque, somente aquele
comportamento que se mostra realmente sensível às mudanças nas contingências
poderia ser considerado como verdadeiramente sensível às contingências. Dessa
13
forma, a interpretação de qualquer medida de sensibilidade em humanos deveria ser
baseada na possibilidade de fontes verbais estarem controlando o comportamento em
questão. Daí a proposta de uso do termo criado por Hayes e cols. (1986b),
“sensibilidade aparente ao esquema”, como aplicável àquelas situações onde os
humanos apresentam padrões comportamentais que somente parecem sensíveis ao
esquema em vigor, mas que na verdade não o são (Ver também Shimoff e cols.,
1986, para uma explicação sobre “pseudosensibilidade”).
Com base nos resultados desse experimento, Hayes e cols. (1986b), assim
como Shimoff e cols. (1981) (Ver também Albuquerque e cols., 2003, Experimento
1; Kaufman e cols., 1966), questionaram dados experimentais segundo os quais
regras produzem insensibilidade a esquemas programados de reforçamento porque
elas excluem contato efetivo com esses esquemas (Galizio, 1979), visto que, se tal
informação estivesse correta, teria que ser explicado porque o contato com a
extinção em um componente do esquema múltiplo ou na fase de extinção deste
experimento não constituiu contato efetivo com os esquemas. Hayes e cols. (1986b)
questionaram ainda dados segundo os quais a insensibilidade seria vista como uma
propriedade definidora do controle instrucional (Shimoff e cols., 1981), pois, se
assim o fosse, teria que ser explicado porque alguns sujeitos na condição de
“Instrução precisa” mostraram efeitos de extinção a despeito da exposição a um
suposto controle pela regra.
Segundo Hayes e cols. (1986b) os dados parecem melhor interpretados em
termos de uma interação entre dois tipos distintos de responder: comportamento
modelado por contingência e comportamento governado por regra (Ver Otto,
Torgrud & Holborn, 1999, para uma análise diferenciada de tais dados baseada na
“teoria do bloqueio operante”, p. 665). O comportamento sensível a uma regra pode
14
ocorrer de forma idêntica àquele sensível ao esquema e, ainda assim, ser uma
instância de seguimento de regra não controlada por conseqüências programadas.
Portanto, o problema é o definir as bases funcionais para o comportamento em
análise.
Em relação aos estudos abordados, torna-se necessário destacar diferenças
nos tipos de conseqüências programadas para seguir regras. No estudo de Galizio
(1979), seguir regras discrepantes dos esquemas produzia perda de pontos trocáveis
por dinheiro. Já nos estudos de Hayes e cols. (1986b) e Shimoff e cols. (1981), o
seguimento de regras apenas não produzia tantos pontos quanto poderia produzir,
caso mudasse acompanhando as mudanças nas contingências programadas. Tal
constatação sugere que a manutenção ou não do seguimento de regras depende, em
parte, dos tipos de conseqüências produzidas pelo comportamento de seguir regras
(Albuquerque, 1998).
1.3. Conteúdo das instruções
Outra variável apontada como passível de influenciar o grau de contato com
as contingências em vigor é o conteúdo das instruções fornecidas. Tal questão vem
sendo enfocada por vários autores (Braam & Malott, 1990; Buskist, Bennett &
Miller, 1981; DeGrandpre & Buskist, 1991; Dixon & Hayes, 1998; Hojo, 2002;
Newman, Buffington & Hemmes, 1995; Raia e cols., 2000; Schmitt, 1998).
Ao discutirem as diferenças entre desempenhos humanos e infrahumanos em
esquemas de FI, Buskist e cols. (1981) propõem um método alternativo para se
produzir padrões típicos de FI em humanos. Dentro dessa perspectiva, o experimento
por eles realizado foi delineado para testar se o emprego de restrições, tanto de
15
tempo quanto de taxa de respostas, nas instruções fornecidas aos participantes
poderia induzir à sensibilidade em relação às contingências experimentais.
O procedimento implicou, dentre outras resoluções, na formação de sete
grupos que se diferenciavam pelo tipo de instrução recebida. Um grupo não recebeu
nenhuma instrução adicional, dois grupos receberam instruções diferenciadas
baseadas apenas nas taxas de respostas, dois grupos foram providos de instruções
diferenciadas baseadas tanto no tempo quanto nas taxas de respostas, um grupo
recebeu instruções baseadas apenas no tempo e um grupo recebeu instruções com
referência ao tempo e a taxa de resposta, além de ter sido submetido a uma variação
no esquema utilizado. Todos os sujeitos foram expostos a um esquema de FI 27s.
Os resultados mostraram que quando o desempenho humano em FI foi
modificado por instruções que envolviam restrições de tempo, de taxa de resposta ou
ambas, emergiu uma variedade de padrões de respostas. Dentre os padrões
detectados foi possível constatar que, a partir de instruções que comportem restrições
de tempo e/ou comportamento, a sensibilidade humana a esquemas de FI pode ser
atingida (Ver também Bentall, Lowe & Beasty, 1985; Harzem e cols., 1978, para
uma discussão sobre variáveis envolvidas na sensibilidade humana a esquemas de
FI).
Preocupados com aspectos formais das regras que poderiam interferir no
seguimento destas, Albuquerque e Ferreira (2001) investigaram se a extensão de uma
regra, medida pelo número de diferentes respostas descritas, poderia interferir em
seu seguimento.
Os dados obtidos por esses autores sugerem que a extensão de uma regra
pode interferir na probabilidade de que ela venha a ser seguida, no sentido de que,
quanto maior a extensão de uma regra (isto é, quanto maior o número de diferentes
16
respostas descritas na regra) menor a probabilidade de que venha a ser seguida e,
inversamente, quanto menor a extensão de uma regra, maior a possibilidade de que
venha a ser seguida. Assim, concluem os autores, quando humanos são confrontados
pela primeira vez com uma regra, eles podem ou não emitir o comportamento
especificado, dependendo em parte do número de respostas especificado na regra, ou
seja, da extensão desta.
1.4. Variabilidade comportamental
Uma explicação para a freqüente insensibilidade do comportamento às
contingências estabelecidas em situações experimentais pode estar na maneira como
regras e contingências restringem a variabilidade do comportamento. Tal questão foi
abordada por Joyce e Chase (1990).
Em seus estudos esses autores destacam que uma das características mais
marcantes do comportamento governado por regras é sua não alteração diante de
mudanças nas contingências ambientais (Galizio, 1979; Matthews e cols., 1977;
Shimoff e cols., 1981). Muitas pesquisas têm se concentrado justamente em
identificar as variáveis responsáveis por tal insensibilidade às contingências (Galizio,
1979; Hayes e cols., 1986b; LeFrancois, Chase, & Joyce, 1988; Shimoff e cols.,
1981; Shimoff e cols., 1986).
Contudo, nenhum desses estudos, de acordo com Joyce e Chase (1990), tem
avaliado a possibilidade de que a insensibilidade comportamental possa estar
relacionada a uma falta de variabilidade produzida pelas regras manipuladas. Assim,
os dois experimentos desenvolvidos por esses autores examinaram a relação entre
variabilidade de resposta e sensibilidade às mudanças nas contingências de reforço.
17
No
Experimento
1,
dezenove
participantes
foram
randomicamente
distribuídos em 4 grupos: 1) Grupo Instrução Completa com Desempenho Estável;
2) Grupo Instrução Completa sem Desempenho Estável; 3) Grupo Instrução
Incompleta com Desempenho Estável e 4) Grupo Instrução Incompleta sem
Desempenho Estável. A diferença entre os grupos de Instrução Completa e
Incompleta é que somente ao primeiro foi fornecida a informação adicional
“Pressione o botão 40 vezes para cada ponto”. Nos grupos que exigiam desempenho
estável os participantes foram submetidos a uma condição inicial de treino na qual o
responder foi estabilizado sob um esquema de FR 40 e, posteriormente a essa fase,
todos os grupos foram submetidos a sessões de teste onde um esquema de FR 40 era
seguido por um esquema de FI 10s.
Os resultados mostraram que para os grupos cujo responder foi
completamente instruído e para o grupo de instrução incompleta que exigiu
desempenhos estáveis, houve pouca variabilidade no momento da mudança dos
esquemas e o responder dos participantes demonstrou-se insensível a tal mudança. Já
para o grupo de instrução incompleta sem desempenho estável foi detectada maior
variabilidade no momento da troca de esquemas, bem como, sensibilidade à nova
contingência.
Esse experimento sugere uma relação entre variabilidade do responder e
sensibilidade do comportamento a mudanças nas contingências, visto que, uma vez
que se tenha atingido um responder estável, seja por intermédio de exposição
prolongada às contingências ou por instrução, este se torna insensível às alterações
nos esquemas.
No Experimento 2, seis sujeitos foram divididos em dois grupos: 1) Grupo
Instrução Completa e 2) Grupo Instrução Incompleta, cujo diferencial consistiu no
18
fato de que o primeiro grupo recebeu instrução explícita para responder sob o
esquema de RF 40 usado no Experimento 1.
Após ambos os grupos terem atingido o critério de estabilidade para o
esquema de FR 40, foi realizado um teste que não identificou sensibilidade às
mudanças nas contingências. Foi então inserida uma instrução que especificava que
um responder variável (ora baseado na quantidade de respostas, ora baseado na
passagem do tempo) permitiria maior ganho de pontos com menos esforço.
Os resultados indicaram que 5 dos 6 sujeitos mostraram aumento da
variabilidade do responder após a introdução dessa instrução e todos os 6
participantes demonstraram sensibilidade à mudança na contingência.
Os autores concluem afirmando que muitas variáveis são apontadas como
responsáveis pela insensibilidade comportamental. Eles acreditam que para produzir
comportamentos sensíveis às variações nas contingências, deve ocorrer uma variação
tal que produza respostas alternativas que façam contato com as contingências,
possibilitando assim o estabelecimento de um responder sensível.
Esse estudo sugere que, além das variáveis inerentes aos procedimentos
adotados para estabelecer comportamentos não verbais (como instrução e reforço
diferencial), existem outras variáveis que podem afetar a sensibilidade de tais
comportamentos, como, por exemplo, a variação comportamental gerada e
estabelecida antes das mudanças nas contingências de reforço (Ver também a
sugestão de Santos, Paracampo & Albuquerque, 2004, sobre como uma história de
variação comportamental, gerada pela apresentação de diferentes instruções, pode
interferir na sensibilidade do comportamento de seguir regras às mudanças nas
contingências de reforço).
19
1.5. História de reforçamento
Outra variável apontada como influente na questão da sensibilidade a
contingências tem sido a história de reforçamento. Tal proposta é consistente com a
colocação de Skinner (1974) de que regras são seguidas porque o comportamento de
seguir regras foi reforçado no passado.
Com o objetivo de determinar a relação entre a precisão de instruções e o
grau de seguimento destas, bem como avaliar os efeitos da história de reforçamento
sob o seguimento de instruções, DeGrandpre e Buskist (1991) elaboraram um
experimento onde a variável independente consistiu na percentagem de instruções
precisas fornecidas aos participantes. Estes foram submetidos a uma de quatro
seqüências de condições, dependendo do grupo ao qual foram randomicamente
distribuídos. Cada seqüência variou de acordo com o nível de precisão das
instruções: 1) 100–50–0%, 2) 0–50– 100%, 3) 40–50–60%, 4) 60–50–40%.
Os resultados indicaram que o seguimento de instruções esteve altamente
correlacionado com o grau de precisão de cada condição (ver também Hayes e cols.,
1986a, para uma análise de como a precisão das instruções pode afetar a natureza do
contato feito com as contingências programadas). Indicaram ainda que os
participantes apresentavam maior probabilidade de seguir instruções imprecisas
quando já haviam sido submetidos a uma condição experimental anterior de
seguimento de instruções precisas – o que indica que o controle instrucional foi
determinado pela história de reforçamento dos sujeitos (Ver também o estudo de
Albuquerque, Santos, Silva, Mendonça, Queiroz & Silva, 1993, sobre como o
controle por uma história de reforço para o seguimento de uma regra correspondente
com a contingência em vigor pode contribuir para manter o seguimento subseqüente
de uma regra discrepante).
20
Abordando o mesmo tópico em questão, Wulfert, Greenway, Farkas, Hayes e
Dougher (1994) chamam atenção para o fato de que diferenças individuais, que
resultam de diferenças na história de condicionamento, poderiam influenciar na
sensibilidade comportamental. Consideram que pessoas com uma longa história de
seguir instruções podem aderir mais facilmente a regras, tanto em situações
experimentais quanto em situações naturais, sendo, portanto, caracterizadas como
indivíduos rígidos.
No estudo realizado por esses autores fica evidenciada uma correlação entre
alta rigidez comportamental – identificada a partir da utilização de um teste de
rigidez – e insensibilidade aos esquemas programados: indivíduos com altos escores
nos testes de rigidez demonstraram uma maior persistência de padrões
comportamentais em uma situação de extinção.
A principal contribuição desse estudo consistiu em demonstrar que diferenças
individuais podem ser consideradas uma variável que afeta a sensibilidade do
comportamento às contingências. Possivelmente, pessoas consideradas rígidas
possuem uma longa história de punição contingente ao não seguimento de regras,
demonstrando assim, forte tendência a seguir instruções.
Segundo Hayes e cols. (1986b), é possível que as instruções continuem a
afetar o responder por causa de uma longa história de conseqüências programadas
para responder como especificado. Tal história poderia ser pouco afetada pelas
conseqüências programadas dentro de um experimento breve (Ver também as
exposições de Albuquerque, Matos, Souza & Paracampo, 2004; Dixon & Hayes,
1998; Harzem e cols., 1978; Martinez & Ribes, 1996; Reese, 1989; Vaughan, 1985,
sobre como a experiência passada de um indivíduo pode afetar seu modo de agir em
uma dada situação). De acordo com esta visão, o comportamento de seguir regras
21
estaria sob controle de duas fontes de variáveis distintas. Na primeira, uma regra é
seguida devido a uma história passada de correspondência entre a regra e as
contingências naturais. Na segunda, a regra é seguida por causa de uma história
passada de reforçamento mediado socialmente para a correspondência entre a regra e
o comportamento por ela especificado.
1.6. Efeitos de relatos verbais modelados ou instruídos sobre o responder não
verbal
O estudo desenvolvido por Catania e cols. (1982) objetivou verificar os
efeitos de relatos verbais modelados ou instruídos sobre o responder não verbal.
Dessa forma, os autores acreditavam que estariam estendendo a distinção entre
comportamento governado por regras e comportamento governado por contingências
do comportamento não verbal para o comportamento verbal.
Trinta e seis estudantes universitários tinham como tarefa pressionar botões
que ocasionalmente tornavam disponíveis pontos trocáveis por dinheiro. Luzes azuis
acima dos botões estavam correlacionadas com um esquema MULT RR 20 RI 10s.
Após a ocorrência dos dois componentes, o que caracterizava um ciclo completo de
esquema de 3 minutos, os estudantes completavam sentenças como “A melhor forma
de ganhar pontos com o botão da esquerda (direita) é...”.
Em alguns casos, o ganho de pontos para os relatos verbais dependia do
conteúdo da sentença. Dessa forma, modelagem e instrução foram utilizadas para
estabilizar tal conteúdo. Em outros casos, o conteúdo das sentenças não tinha
conseqüências diferenciais, isto é, pontos foram dados independentemente do
conteúdo. Para o Grupo Modelagem os relatos verbais foram modelados, isto é,
reforçados diferencialmente com pontos que poderiam variar de 0 a 3. Já o Grupo
22
Instrução recebeu instruções precisas sobre como as sentenças deveriam ser
completadas: “Para ganhar o máximo de pontos nas sentenças, escreva ‘Pressione
rápido’ (ou ‘devagar’) para o botão da esquerda e escreva ‘Pressione devagar’ (ou
‘rápido’) para o botão da direita”.
Em geral, quando os relatos foram modelados, foi observada correspondência
entre tais relatos e o comportamento não verbal de pressionar o botão, mesmo
quando havia discrepância entre os relatos e as contingências que estavam vigorando
e conseqüente diminuição no ganho de pontos. Já quando os relatos foram instruídos,
geralmente eles corresponderam às instruções fornecidas, mas os efeitos sobre o
pressionar foram variados: os relatos às vezes influenciaram, às vezes foram
influenciados e outras vezes eram independentes do comportamento não verbal (ver
também Matthews e cols., 1985; Pouthas e cols., 1990, para uma análise dos efeitos
de descrições de desempenhos sob o responder não verbal).
Segundo Catania e cols. (1982), tais achados sugerem que é mais provável
que o comportamento verbal determine comportamentos não verbais subseqüentes
quando o primeiro é modelado, do que quando é instruído. Afirmam ainda que é
mais difícil estabilizar comportamento verbal modelado, mas uma vez estabilizado,
seu controle será muito mais efetivo sob o comportamento não verbal do que o
controle exercido pelo comportamento verbal instruído (Ver Cerutti, 1994, para um
exame de como a concordância do comportamento não verbal com o verbal pode ser
afetada por variáveis como a observação do desempenho do participante e a
variabilidade na distribuição das conseqüências em um esquema).
23
1.7. Aumento do controle discriminativo das contingências programadas
Os dados do estudo anterior de Catania e cols. (1982) não foram confirmados
por Torgrud e Holborn (1990). Segundo esses autores, várias investigações (e.g.,
Catania e cols., 1982; Hayes e cols., 1986b; Matthews e cols., 1985) têm tentado
criar uma interação oposta entre um esquema de reforçamento para uma resposta
motora e um estímulo verbal especificador de taxas de respostas. Tipicamente, as
taxas de respostas têm se conformado às descrições verbais instruídas ou modeladas
e não aos esquemas utilizados, o que sugere que tais descrições poderiam exercer
controle mais forte sobre uma resposta motora do que as contingências de
reforçamento programadas para tal resposta.
Torgrud e Holborn (1990) questionaram os resultados dessas pesquisas ao
afirmarem que embora esses estudos prévios demonstrem controle verbal de taxas de
respostas, eles o fazem sob condições específicas onde os esquemas utilizados são
caracterizados por pobre controle discriminativo.
Esses autores desenvolveram então um estudo numa tentativa de estender a
literatura sobre as interações entre comportamento verbal e não verbal através da
utilização de descrições verbais de taxas de respostas opostas a esquemas com
controle discriminativo bem demonstrado. O maior diferencial em termos de
procedimento adotado por esses autores foi, portanto, o aumento do controle
discriminativo dos esquemas utilizados e a clara demonstração desse controle antes
da introdução dos estímulos verbais (Ver também a discussão promovida por Otto e
cols., 1999, a qual fornece suporte para uma apreciação do controle instrucional em
termos de falhas em discriminar características relevantes dos esquemas).
Foram utilizados esquemas de reforçamento (DRL e DRH) que permitiam
que quantidades específicas de pontos fossem obtidas dependendo das taxas de
24
respostas emitidas em duas chaves. Taxas de respostas pré-determinadas pelos
experimentadores produziam uma quantidade máxima de pontos em cada chave e, à
medida que as taxas se distanciavam do valor crítico, a quantidade de pontos
diminuía progressivamente. As taxas de respostas foram identificadas a partir de
cinco categorias: muito devagar (1 a 5 respostas por intervalo de 5,5 segundos),
devagar (6 a 10 respostas), média (11 a 15 respostas), rápida (16 a 20 respostas) e
muito rápida (mais de 20 respostas). Após a apresentação de cada chave, os
participantes deveriam preencher a sentença “A melhor forma de obter pontos na
chave X é...”. Para tanto, cinco possíveis relatos eram disponibilizados para escolha:
“pressionar muito devagar”, “pressionar devagar”, “pressionar em taxa média”,
“pressionar rápido” ou “pressionar muito rápido”. Assim como ocorria com as taxas
de respostas, a cada relato também eram atribuídos pontos que variavam dentro de
uma escala de acordo com a precisão destes.
Com base nesse delineamento, o Experimento 1 foi desenvolvido com quatro
participantes e teve como objetivo verificar se o aumento do controle discriminativo
dos esquemas utilizados resultaria em menor controle verbal das taxas de respostas.
Os participantes foram modelados a apresentarem uma taxa média de
respostas. Somente depois que os esquemas adquiriram controle sobre o desempenho
dos participantes, os relatos foram solicitados. Na primeira fase do experimento, as
contingências verbais permaneceram inalteradas: para a chave A, descrições de
“pressione muito devagar”, e para a chave K, descrições de “pressione muito rápido”
receberam o máximo de pontos. Já as contingências não verbais foram gradualmente
modificadas até atingirem a condição de pressões muito rápidas para a chave A e
pressões muito lentas para a chave K. Na segunda fase, as contingências não verbais
permaneceram constantes, ao passo que as contingências verbais foram
25
gradualmente modificadas: para a chave que exigia taxa muito devagar, os relatos
eram alterados até que “pressionar muito rápido” produzisse o máximo de pontos;
para a chave que exigia taxa muito rápida, os relatos eram modificados até que o
máximo de pontos fosse contingente a “pressionar muito devagar”.
Os resultados mostraram que a escolha das descrições verbais não teve efeito
sobre as taxas de pressão à chave, isto é, as contingências relacionadas às descrições
verbais e aquelas relacionadas às pressões nas chaves controlaram suas respectivas
classes de comportamentos sem interferência mútua. A partir desses resultados, ficou
evidenciado, segundo os autores, as condições nas quais descrições verbais de taxas
de respostas não controlam o responder não verbal na presença de esquemas opostos.
A relação entre o desempenho não verbal e relatos verbais também foi
investigada por Paracampo, Souza, Matos e Albuquerque (2001). Para tanto,
expuseram vinte crianças, entre sete e oito anos de idade, a um procedimento de
controle contextual de escolha segundo o modelo. As crianças foram distribuídas em
três condições, sendo cada condição composta por três fases. Na Condição Reforço
Diferencial (RD), os participantes foram expostos a instruções mínimas sobre como
se comportar; na Condição Instrução (I) os participantes foram expostos a instruções
precisas correspondentes às contingências em vigor na Fase 1, e na Condição
Múltiplas Instruções (MI) foram expostos a três conjuntos de instruções diferentes
(Passos 1, 2 e 3), de acordo com as contingências em vigor na Fase 1. Durante a Fase
1, os participantes deveriam escolher o estímulo comparação idêntico ao estímulo
modelo na presença de uma luz verde e o estímulo de comparação oposto caso a luz
vermelha estivesse acesa, nas Condições RD e CI. Essas contingências em vigor
durante a Fase 1 eram revertidas na Fase 2 e restabelecidas na Fase 3. Na Fase 1 da
Condição MI eram reforçadas as respostas de escolher o estímulo de comparação
26
igual ao modelo na presença da luz verde e o diferente na presença da luz amarela
(Passo 1), escolher o igual na presença da luz amarela e o diferente na presença da
luz vermelha (Passo 2), e escolher o igual na presença da luz verde e o diferente na
presença da luz vermelha (Passo 3). Os Passos 1 e 2 foram compostos por uma única
fase cada (Fase 1). As contingências em vigor no Passo 3 eram revertidas na Fase 2 e
restabelecidas na Fase 3. As transições de fases não eram instruídas e nem
sinalizadas. Perguntas a respeito do que os participantes deveriam fazer para ganhar
pontos foram feitas ao longo de todas as fases.
Os dados mostraram que os participantes da Condição RD conseguiram
contactar a inversão das relações entre cores e o tipo de escolha, isto é demonstraram
sensibilidade às mudanças nas contingências, mais eficientemente que os
participantes das Condições I e MI, os quais continuaram seguindo a instrução
apresentada na fase anterior, a despeito da discrepância entre instrução e
contingência. Para os participantes das três condições foi constatada correspondência
entre as respostas de escolha e os relatos. No entanto, para os participantes da
Condição RD, tal correspondência indica que não somente as respostas de escolha,
mas também os relatos estavam sob controle da contingência não verbal. Já para os
participantes das Condições I e MI, a correspondência verbal – não verbal indica que
os relatos, assim como as respostas de escolha, estavam sob controle das instruções.
Os resultados também demonstraram que os participantes da Condição RD
emitiram respostas de escolha precisas antes que relatos verbais corretos fossem
observados, sugerindo dessa forma que, na ausência de conseqüenciação para o
comportamento verbal, a contingência não verbal pode exercer funções
controladoras sobre este comportamento. Esses resultados indicam que a
correspondência entre os comportamentos não verbal e verbal pode ser controlada
27
por diferentes variáveis (Ver também Ribes & Rodrigues, 2001, para uma análise das
possíveis relações entre instruções, relatos e desempenhos não verbais).
1.8. Grau de discriminabilidade dos esquemas em vigor
Outro conjunto de variáveis importantes na investigação da sensibilidade às
mudanças de contingências envolve os esquemas de reforçamento. Nessa linha de
raciocínio, Newman, Hemmes, Buffington & Andreopoulos (1994) chamam atenção
para o fato de que boa parte dos estudos empíricos sobre insensibilidade geralmente
fazem uso de esquemas de reforçamento intermitentes (e. g., Matthews e cols., 1985;
Shimoff e cols., 1981; Shimoff e cols., 1986; Hayes e cols., 1986a; Hayes e cols.,
1986b).
Fazendo uma análise crítica do experimento anteriormente citado de
DeGrandpre e Buskist (1991), Newman e cols. (1995) hipotetizam que a variável
crítica que possibilitou os resultados obtidos nesse experimento foi a natureza
contínua do esquema de reforçamento utilizado e não a precisão ou imprecisão das
instruções fornecidas. Essa hipótese é baseada na concepção de que a insensibilidade
pode ser causada por uma falha em contactar de forma efetiva as contingências
(Baron & Galizio, 1983). Sendo assim, é mais provável que alguém falhe em
responder a uma mudança no reforçamento para um comportamento sendo reforçado
em esquema intermitente do que em um esquema contínuo, visto que o esquema
intermitente pode não permitir ao participante determinar a melhor estratégia de se
ganhar os reforçadores disponíveis, em função da baixa freqüência relativa de
reforçamento. De acordo com Newman e cols. (1995), DeGrandpre e Buskist (1991)
falharam ao negligenciar em seu experimento os efeitos dos esquemas de
reforçamento. Esses autores propõem, então, uma tentativa de se seguir os métodos
28
descritos por DeGrandpre e Buskist (1991), mas com um foco de análise
diferenciado. Para tanto, desenvolveram um estudo que examinou o seguir
instruções, com a acurácia dessas instruções variando através das fases para cada um
dos dezoito participantes e os esquemas de reforçamento variando através dos seis
grupos formados. Através das fases, a acurácia das instruções foi de 0-50-100-50-0%
ou de 100-50-0-50-100%. Na fase de 100% de precisão, os participantes só
ganhavam pontos quando seguiam as instruções em todas as ocasiões em que eram
apresentadas. Na condição 50%, os participantes ganhavam pontos se seguissem as
instruções somente metade das vezes em que eram apresentadas. Na condição 0%, os
participantes só ganhavam pontos se fizessem o oposto do que a instrução
especificava. Os participantes foram distribuídos em seis grupos de acordo com as
duas ordens de apresentação das instruções e com os esquemas de reforçamento
contínuo, FR 2 ou FR 3.
Os resultados demonstraram que os participantes que foram submetidos ao
esquema contínuo de reforçamento, independente da ordem de apresentação da
acurácia das instruções, tiveram seus desempenhos controlados pelas conseqüências
colaterais, isto é, demonstraram padrões de comportamento sensíveis à maximização
na obtenção de reforçadores em todas as fases. Já em relação aos participantes
submetidos aos esquemas intermitentes (FR 2 e FR 3) um padrão generalizado de
insensibilidade foi observado, através de uma perda do controle pelas conseqüências
colaterais e do seguimento indiscriminado de instruções precisas e imprecisas.
Esses achados sugerem que o comportamento de participantes, em
experimentos onde as instruções são contrastadas com os esquemas utilizados, é uma
função não somente da instrução, mas também do tipo de esquema de reforçamento
utilizado. Os autores concluem afirmando que o fenômeno da insensibilidade pode
29
ser considerado como o resultado de falhas nos esquemas intermitentes
tradicionalmente utilizados nos estudos sobre o controle do comportamento por
regras, e não o resultado de quaisquer propriedades inerentes das instruções (Ver
também Newman e cols., 1994, para uma análise da interação entre tipos de
esquemas de reforçamento – contínuo e intermitente – e tipos de estímulos
discriminativos – verbais e não verbais – sob o responder humano).
Na mesma linha de investigação, Cerutti (1991) procurou verificar a
concordância com instruções em esquemas independentes da resposta, a fim de
analisar se a insensibilidade ao esquema seria determinada por reforçamento do
responder inapropriado ou por características discriminativas dos esquemas. Para
tanto, o autor hipotetizou que esquemas mistos ocasionariam maior insensibilidade
no responder que esquemas simples, em virtude da dificuldade de discriminação das
contingências envolvida nos primeiros em comparação aos últimos.
Estudantes universitários foram instruídos a pressionar duas chaves para
evitar a ocorrência de tons que, no entanto, eram inevitáveis, isto é, independentes
dos desempenhos dos participantes. Os estudantes foram distribuídos em três grupos
de acordo com o esquema que vigorava para apresentação dos tons. Para o primeiro
grupo, os tons foram apresentados de acordo com um esquema misto tempo
randômico – tempo randômico (MIX RT RT). Para o segundo grupo, os tons foram
programados de acordo com um esquema misto tempo fixo – tempo fixo (MIX FT
FT). O último grupo foi submetido à apresentação de tons de acordo com um
esquema simples de tempo fixo (FT). Após um ciclo completo de reforçamento, os
participantes deveriam responder à questão “A melhor forma de se pressionar a
chave da esquerda/direita é...” escolhendo uma dentre as seis seguintes opções
apresentadas: “lentamente”, “muito lentamente”, “moderadamente lentamente”,
30
“rapidamente”, “muito rapidamente” e “moderadamente rapidamente”. Tais relatos
eram modelados, podendo produzir pontos que variavam de 0 a 3. Para uma chave, o
relato “lentamente” foi selecionado e para a outra, o relato “rapidamente” foi
escolhido como o correto. Após a sessão, os participantes completavam um
questionário de múltipla-escolha com três opções de respostas (“nunca”, “às vezes”,
“sempre”) para questões que verificavam se o pressionar prevenia os tons e se as
respostas sob a forma de pressionar influenciavam o comportamento não verbal de
pressão.
Os resultados mostraram que os participantes dos grupos de esquemas mistos
(MIX RT RT e MIX FT FT) apresentaram taxas de respostas mais elevadas que os
participantes do grupo FT, demonstrando assim maior concordância com a instrução
de esquiva fornecida e agindo como se houvesse uma relação de contingência entre
as taxas de respostas e a freqüência de apresentação dos tons. Estes participantes
também demonstraram significativa correlação entre suas respostas verbais (relatos
modelados) e não verbais (pressões às chaves). Quanto às respostas aos
questionários, os participantes dos grupos mistos relataram com maior freqüência
que os participantes do grupo FT que os tons poderiam ser prevenidos por suas
respostas.
De acordo com Cerutti (1991), o esquema FT foi o único a permitir que a
relação de independência entre as respostas de pressionar as chaves e a eliminação
dos tons exercesse controle discriminativo. Dessa forma o autor afirma que o
controle exercido por contingências verbais só é possível quando as contingências
programadas para o comportamento não verbal não exercem controle discriminativo
adequado, concordando assim com Torgrud e Holborn (1990) (Ver também Cerutti,
1989, para uma análise da proposta de que o seguimento de regras discrepantes de
31
contingências é mais provável de ocorrer quando as contingências são “fracas”, isto
é, quando há falta de controle pelas conseqüências colaterais do comportamento).
1.9. Auto-regras
As pessoas também podem formular e seguir suas próprias regras. Assim,
auto-regras podem ser vistas como estímulos especificadores de contingências
produzidos pelo comportamento verbal da própria pessoa (Zettle, 1990).
Rosenfarb e cols. (1992) procuraram identificar os efeitos de auto-regras
sobre o comportamento não verbal através da comparação entre desempenhos autoinstruídos, desempenhos instruídos externamente e desempenhos não instruídos.
No estudo desenvolvido por esses autores, vinte e nove estudantes
universitários foram distribuídos em três grupos. Os participantes do Grupo 1 foram
solicitados a gerarem auto-regras e foram acoplados aos participantes do Grupo 2
que recebiam tais auto-regras como instruções externas. Os participantes do Grupo 3
não foram solicitados a gerarem regras, nem receberam qualquer instrução externa.
Durante a Fase de Aquisição os participantes foram submetidos a um
esquema múltiplo DRL 5 seg RF 8, com os componentes se alternado a cada dois
minutos. A tarefa dos participantes consistia em mover um círculo que aparecia no
canto superior esquerdo de uma matriz 5x5 projetada na tela de um computador para
o canto inferior direito (similar ao procedimento de Hayes e cols., 1986b). Nessa fase
os participantes foram solicitados, a cada intervalo de dois minutos, a completar a
afirmação “A melhor forma de mover o círculo quando a luz da direita/esquerda está
acesa é...”. Nenhuma conseqüência diferencial foi programada para esses relatos. À
cada participante do Grupo 2 foi fornecida a auto-regra formulada por um
participante correspondente do Grupo 1, independente da acurácia desta. Aos
32
participantes do Grupo 3 foram fornecidas apenas instruções mínimas.
Posteriormente à Fase de Aquisição, todos os participantes foram submetidos a uma
Fase de Extinção.
Os dados obtidos sugerirem que solicitar pessoas a desenvolverem regras
pode facilitar o controle das contingências de reforçamento sobre o comportamento
não verbal. Isso porque durante a Fase de Aquisição, o comportamento dos
participantes solicitados a formularem regras apresentou-se sob controle das
contingências mais rapidamente do que daqueles não solicitados a formularem
regras. Já em relação à Fase de Extinção, no entanto, o comportamento daqueles
solicitados a formularem regras apresentou-se mais variável e em taxas mais altas em
relação aos participantes que não formularam regras. Em outras palavras, os dados
com auto-regras replicam resultados obtidos com regras externas.
Um resultado adicional e interessante obtido por esses autores foi o de que,
dentre os participantes que formularam auto-regras precisas, alguns as formularam
antes de ganhar pontos, enquanto outros primeiro ganharam pontos, e somente
posteriormente relataram auto-regras precisas. Esses dados sugerem que não é
necessário um desenvolvimento prévio de regras acuradas para que o comportamento
possa manter-se sob controle das contingências em vigor (Ver os dados de
Simonassi, Fróes & Sanabio, 1995; Simonassi, Oliveira & Gosch, 1997; e
Simonassi, Oliveira & Sanabio, 1994, que também sugerem que a elaboração de
auto-regras não se constitui como condição necessária para que as contingências
possam exercer controle).
Procurando também analisar os efeitos de regras e auto-regras a partir de uma
análise do comportamento supersticioso, Ono (1994) distribuiu trezes estudantes
universitários em dois grupos: Grupo Experimental e Grupo Controle. Todos os
33
participantes foram submetidos a uma tarefa na qual deveriam puxar uma alavanca
de acordo com um esquema de reforçamento diferencial de altas taxas (DRH), que
requeria pelo menos cinco respostas por intervalo de 15 seg.
A cada participante do Grupo Experimental foi dito que formaria par com um
outro participante – que na verdade era o próprio experimentador – e que no início
de cada fase – que durava três minutos – ele receberia informações (“regras sociais”)
desse outro participante sobre como se comportar da forma mais adequada para
ganhar pontos. Foi informado também ao participante real que ele deveria, ao final
de cada fase, relatar ao outro participante a forma adequada de se comportar (“autoregras”). As “regras sociais” fornecidas pelo experimentador, e que não descreviam
acuradamente a contingência em vigor, foram: “Puxe mais que 20 vezes” (Fase 1);
“Puxe 10 vezes após 7 segundos” (Fase 2); “Puxe 1 vez após 15 segundos” (Fase 3);
e “Puxe mais que 20 vezes” (Fase 4, semelhante à Fase 1). Os participantes do
Grupo Controle não recebiam “regras sociais”, mas foram solicitados a relatarem
suas auto-regras.
Em termos de resultados obtidos, os participantes do Grupo Controle
demonstraram taxas de respostas sensíveis ao esquema em vigor com desempenhos
apropriados rapidamente estabilizados e com relatos de auto-regras precisos. Em
relação aos participantes do Grupo Experimental, os desempenhos variaram
amplamente demonstrando influência das “regras sociais”. O autor conclui
afirmando que, ao contrário do proposto por Rosenfarb e cols. (1992), regras e autoregras não têm efeitos similares sobre o comportamento não verbal. Uma explicação
plausível para tal constatação seria, segundo o autor, a diferença quanto à origem, ou
seja, regras são o resultado do comportamento verbal de outra pessoa, enquanto autoregras são fruto do comportamento verbal do próprio indivíduo.
34
Objetivos
Diante do exposto fica claro o quanto a área de estudos acerca das variáveis
envolvidas na sensibilidade do comportamento humano às contingências é vasta e
controversa e o quanto a caracterização dessas variáveis é importante para a análise
do comportamento humano. Portanto, torna-se evidente a importância de pesquisas
atuais desenvolvidas para explorarem os aspectos que afetam a sensibilidade do
desempenho humano sob contingências de reforçamento. Seguindo essa linha de
raciocínio, o presente estudo propõe contribuir para tal investigação através da
realização de dois experimentos.
O Experimento 1 foi realizado com os seguintes objetivos:
•
Considerando a situação em que o participante tem seu
desempenho estabelecido sob controle de um determinado esquema,
verificar o que ocorre em termos comportamentais, quando são feitas
alterações no tipo de esquema utilizado, interpretando os desempenhos
que se seguem às mudanças em termos de padrões de comportamento
sensível ou insensível às contingências.
•
Verificar se ao arranjar conseqüências aversivas (perda de
pontos) para o comportamento consistente com esquemas anteriores,
torna-se possível estabelecer contato com esquemas atuais e assim
reduzir a intensidade e a persistência da insensibilidade do desempenho.
•
Verificar possíveis condições experimentais que estariam
relacionadas
à
sensibilidade
e
insensibilidade
programados.
O Experimento 2 foi realizado com o seguinte objetivo:
aos
esquemas
35
•
Verificar se a exposição prévia a uma condição que favoreça o
contato com o esquema em vigor, via punição de respostas inadequadas
que levariam a perda de pontos, seria suficiente para estabelecer
responder adequado em uma fase posterior, com sinais claros de
discriminação do esquema em vigor.
36
Método
Experimento 1
Participantes
Seis alunas do primeiro período do curso de graduação em Psicologia da
Universidade Católica de Goiás (UCG), com idades variando entre 17 e 21 anos,
participaram do experimento. As participantes foram recrutadas por meio de uma
lista de voluntários passada em sala de aula e não tinham nenhuma experiência
prévia com procedimentos experimentais dessa natureza. Todas as participantes,
antes de serem submetidas ao experimento, assinaram um Termo de Consentimento
Livre e Esclarecido (em acordo às normas da resolução 196/96 do Conselho
Nacional de Saúde – MS) reafirmando sua concordância em participar do
experimento, a partir de um entendimento claro e preciso acerca da realização deste
(Anexo 1).
Equipamentos
O experimento foi conduzido no Laboratório de Análise Experimental do
Comportamento (LAEC), da Universidade Católica de Goiás (UCG). A sala de
coleta de dados tinha dimensões aproximadas de 2 x 3m, era dotada de boa
ventilação e iluminação, bem como de isolamento acústico adequado.
O equipamento utilizado consistiu em um microcomputador modelo IBM PC,
com configuração básica de Pentium III 800MHz e 128 Mbytes de memória RAM,
vídeo colorido, tela sensível ao toque e mouse de dois botões; além de uma mesa de
suporte para o computador e uma cadeira. O controle das contingências
experimentais e o registro dos dados foram realizados por um programa
37
computacional especialmente desenvolvido em ambiente Windows (Microsoft) para
o presente experimento – chamado Insensitivity 1 – em linguagem de programação
VisualBasic e com uso de sub-rotinas em Assembler, a fim de garantir um
desempenho satisfatório.
Procedimentos
O delineamento experimental utilizado com os participantes submetidos ao
Experimento 1 teve cada sujeito como seu próprio controle. Dessa forma, cada
participante foi submetido seqüencialmente a 4 Fases experimentais (A, B, C e D),
que compunham o programa Insensitivity 1.
Para cada uma dessas fases, o programa permitia selecionar o esquema de
reforçamento (Catania, 1999) desejado a que o participante seria submetido, dentre
as seguintes opções: RF (razão fixa), RV (razão variável), IF (intervalo fixo), IV
(intervalo variável), TF (tempo fixo), TV (tempo variável), DRL (reforçamento
diferencial de baixas taxas), DRH (reforçamento diferencial de altas taxas). Também
era possível programar para qualquer uma das fases a condição de EXT (extinção).
Tendo em vista que um procedimento muito usado para se avaliar a
sensibilidade às contingências programadas tem sido desenvolver um responder em
estado estável sob um esquema, e então mudar o esquema ou os parâmetros deste
(Hayes e cols., 1986a), as Fases experimentais do Experimento 1 foram dispostas de
tal forma que o esquema de reforçamento que vigorava em cada uma das Fases
implicava em um padrão comportamental nitidamente distinto em relação àquele que
vigorava no esquema da Fase seguinte. Dessa forma, quanto mais distintos fossem os
padrões de resposta típicos dos esquemas apresentados em seqüência, maiores as
possibilidades
de
se
realizar
análises
acerca
de
questões
sobre
38
sensibilidade/insensibilidade. Após a realização de alguns testes em estudo piloto, foi
escolhida a seguinte combinação inicial, apresentada na seqüência em que os
participantes foram submetidos:
Fase A: RF 18 (razão fixa). Nesta fase o participante foi submetido a seis sessões de
razão fixa 18, o que significava que somente a última resposta de uma série de 18 era
reforçada. Em tal esquema de reforçamento, o responder ocorre, tipicamente, em um
taxa alta e sem interrupção, até que o reforçador seja apresentado (Catania, 1999).
Cada sessão tinha duração de 3 minutos.
Fase B: DRL 6 seg (reforçamento diferencial de baixas taxas). O participante foi
submetido a 6 sessões de reforçamento diferencial de baixas taxas (DRL) 6 seg.
Neste caso, cada resposta era reforçada somente quando era precedida por um tempo
mínimo de 6 segundos sem nenhuma resposta. Quando respostas ocorriam no meio
do intervalo de 6 segundos, recomeçava nova contagem do tempo. O responder,
portanto, era baseado no espaçamento temporal de respostas individuais, e não na
taxa de respostas geradas ao longo de um período de tempo. Em geral, quanto mais
longo o tempo entre as respostas requerido para o reforço, mais baixa a taxa do
responder (Catania, 1999). Cada sessão tinha duração de 3 minutos.
Fase C: RF 18 (razão fixa). Nesta fase o participante foi novamente submetido a seis
sessões de razão fixa 18, como na Fase A. Cada sessão também tinha duração de 3
minutos.
Fase D: DRL 6 seg (reforçamento diferencial de baixas taxas) + punição. O
participante foi submetido a 6 sessões de reforçamento diferencial de baixas taxas 6
seg. Cada sessão tinha duração de 3 minutos. A única diferença em relação à Fase B
foi o acréscimo, em todas as sessões dessa fase, da operação de punição para àquelas
respostas que não estavam de acordo com o esquema em vigor, isto é, para respostas
39
que ocorriam no meio do intervalo de 6 seg e que o reprogramavam. Enquanto
operação, a punição consiste em programar, para o responder, uma conseqüência que
o torna menos provável (Catania, 1999). Na presente fase, a punição foi efetivada via
retirada de um ponto ganho para cada resposta inadequada (punição negativa), com a
finalidade de diminuir a freqüência de tais respostas e aumentar o contato com o
esquema que estava vigorando. Dessa forma, a perda de pontos deveria funcionar
como estímulo punitivo. A Tabela 1 resume o procedimento do Experimento 1.
Tabela 1. Fases experimentais, esquema de reforçamento, consequenciação de
respostas e número de sessões aos quais cada participante foi submetido
durante o Experimento 1.
Fase
Esquema
Consequenciação de respostas
A
RF 18
B
DRL 6 seg
C
RF 18
D
DRL 6 seg +
punição
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: um ponto perdido
Número de
sessões
6
6
6
6
Deve-se notar, conforme já apontado, que os esquemas RF (razão fixa) –
onde a propriedade sobre a qual a contingência opera é a relação entre repostas e
reforçadores – e DRL (reforçamento diferencial de baixas taxas) – onde a principal
propriedade contingenciada é a relação temporal entre as respostas – foram
escolhidos propositalmente por implicarem padrões de resposta bem distintos
(Catania, 1999).
A inserção da punição na Fase D teve como objetivo possibilitar análises
acerca da possibilidade de tal operação contribuir para um maior contato com as
contingências em vigor. Assim, é a comparação dos desempenhos do participante
nas Fases B (DRL sem punição) e D (DRL com punição) que dirá até que ponto tal
manipulação foi eficaz no sentido de levá-lo a contactar com o esquema em vigor
40
(DRL 6 seg), caso tal contato ainda não tivesse sido estabelecido na Fase B. Dessa
forma, comparações entre essas duas fases revelariam ou não a necessidade de se
forçar o contato do participante com as discrepâncias entre seu desempenho e o
esquema que realmente estava vigorando, a fim de que tal participante se
desempenhasse de forma sensível em relação aos arranjos experimentais
programados (Galizio, 1979).
A tarefa do sujeito em todas as fases era tocar, de acordo com o esquema em
vigor, um círculo central de cor amarela que aparecia no centro da tela do
computador. Cada toque era computado como uma resposta. Toques fora do círculo
central não eram registrados, pois não produziam quaisquer conseqüências no
equipamento utilizado. Um contador aparecia no canto superior direito da tela do
computador e permitia o registro dos pontos ganhos, dos pontos perdidos e do saldo
total do participante. Cada ponto ganho era acompanhado da apresentação de um
som característico de pontos ganhos e cada ponto perdido era acompanhado de um
som característico de perda de pontos. O saldo total de pontos era registrado pela
experimentadora no final de cada sessão e o contador era zerado no início de cada
nova sessão (Ver Figura 1).
Figura 1. Tela apresentada ao participante para respostas
41
Nas Fases A e C, após cada seqüência de 18 respostas (toques no círculo
central), um ponto era acrescido ao contador. O tempo entre cada resposta era
variável, dependendo do ritmo de toques de cada participante, sendo que o programa
permitia registros de até oito toques por segundo. Já nas Fases B e D, uma resposta
só era reforçada após transcorrido um tempo mínimo de 6 seg. em relação à última
resposta. Houve perda de pontos programada somente na Fase D, através da inserção
da punição para aquelas respostas que não estavam de acordo com o esquema em
vigor (DRL 6 seg), isto é, respostas que ocorriam no meio do intervalo de 6
segundos e que o reprogramavam. Dessa forma, nas Fases A, B, C e D sempre que
era emitida uma resposta correta, de acordo com os parâmetros do esquema, um
ponto ganho era acrescido ao contador acompanhado de um som característico de
ganho de pontos e da alteração do saldo total. Nas Fases A, B e C, todas as respostas
incorretas não tinham conseqüências programadas. Especificamente na Fase D,
quando o participante emitia uma resposta incorreta, fora dos padrões do esquema,
ocorria perda de um ponto no contador acompanhado de som característico de perda
de pontos e de alteração no seu saldo total.
O participante era instruído, logo no início das sessões, de que poderia trocar
seu saldo final de pontos por dinheiro ao final destas. Cada ponto correspondia a R$
0,05 (cinco centavos).
Os parâmetros de número de resposta (18) no esquema de RF e tempo (6
segundos) no esquema de DRL foram baseados em Hayes e cols. (1986b). A
definição de tais parâmetros foi uma tentativa de equilibrar o número de reforçadores
obtidos em cada sessão realizada com os diferentes esquemas de reforçamento.
Assim, esperava-se que em uma sessão de 3 minutos de RF 18 a quantidade de
reforçadores obtida fosse equivalente à quantidade obtida em uma sessão de 3
42
minutos de DRL 6 seg, considerando desempenhos sensíveis aos esquemas. Também
se esperava que com a realização de 6 sessões em cada fase fosse possível atingir um
padrão estável de respostas para, na seqüência, submeter o participante à fase
seguinte.
O critério para o encerramento de cada fase experimental e conseqüente
transição para a fase seguinte era a realização de seis sessões, com três minutos de
duração cada. As mudanças de fase não eram sinalizadas e nem instruídas. Dessa
forma, cada participante foi submetido a um total de 24 sessões, sendo que três
sessões eram realizadas pela manhã e três à tarde, totalizando 6 sessões diárias e
quatro dias de coleta com cada participante. Entre as três sessões realizadas em um
mesmo período eram feitos intervalos de 5 minutos. Cada participante foi submetido
somente às seguintes instruções gerais apresentadas na tela do computador no início
de cada período (manhã e tarde) de coleta de dados:
“Este é um estudo sobre aprendizagem. Você será exposto a tarefas nas
quais poderá ganhar ou perder pontos que serão acumulados de forma visível no
canto superior direito da tela do computador. Cada ponto ganho ou perdido vale R$
0,05 (cinco centavos). Seu saldo final será trocado por dinheiro ao término da
sessão. Em hipótese alguma você sairá devendo. Tente ganhar o máximo possível de
pontos. Você poderá fazer isso tocando o círculo amarelo que aparecerá no centro
da tela do computador.
Observação: Você poderá abandonar o estudo a qualquer momento em que desejar.
Caso você tenha compreendido essas instruções, toque na tela para iniciar o estudo,
caso contrário, leia novamente as instruções.
Toque na tela para aparecer o círculo amarelo”.
43
Resultados
Os resultados foram baseados em uma análise dos desempenhos dos
participantes em cada fase experimental específica, bem como, em comparações
entre fases. Dessa forma, para cada participante, todas as análises foram realizadas
com o objetivo de se verificar até que ponto o sujeito se comportou de acordo com as
contingências em vigor para cada fase, possibilitando discussões acerca de
sensibilidade/insensibilidade aos esquemas.
Os parâmetros selecionados para subsidiar a análise foram o número de
respostas em cada sessão, onde foram computadas todas as respostas – reforçadas,
não reforçadas ou punidas – do participante ao longo da sessão experimental; a
média aritmética simples de respostas a cada três sessões, referente ao somatório de
todas as respostas ao longo de um conjunto de três sessões consecutivas dividido por
três; a quantidade de reforçadores obtidos em cada sessão, que diz respeito, nas três
primeiras Fases experimentais (A, B e C), ao número de pontos ganhos para cada
resposta reforçada, e na quarta Fase (D), diz respeito ao total de pontos ganhos, isto
é, ao número de respostas reforçadas com ganho de pontos menos o número de
respostas punidas com perda de pontos; a taxa de respostas, que se refere à razão
entre o total de respostas em uma sessão e a duração da mesma (180 segundos) e,
finalmente, a quantidade de respostas por reforçador, que diz respeito à razão entre a
quantidade de respostas em cada sessão e a quantidade total de reforçadores obtidos
naquela sessão específica.
A Tabela 2 mostra os dados do Participante 1 (P1).
44
Tabela 2. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P1 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
547
30
3,0
18,2
760,7
2ª
840
46
4,7
18,3
(σ
=
187,1)
RF 18
A
3ª
895
49
5,0
18,3
4ª
863
47
4,8
18,4
881,3
5ª
871
48
4,8
18,1
(σ
=
25,1)
6ª
910
50
5,1
18,2
1ª
676
0
3,8
-736,3
2ª
730
0
4,1
-(σ = 63,7)
B DRL 6
1
4,5
803
3ª
803
seg
4ª
825
0
4,6
-740,3
5ª
715
0
4,0
-(σ
=
75,3)
6ª
681
0
3,8
-1ª
864
48
4,8
18,0
876,7
2ª
906
50
5,0
18,1
(σ
=
25,5)
RF 18
C
47
4,8
18,3
3ª
860
4ª
863
47
4,8
18,4
1020,3
5ª
1114
61
6,2
18,3
(σ
=
137,1)
6ª
1084
60
6,0
18,1
1ª
44
(9-35)-26*
0,2
-31,0
2ª
28
(24-4) 20*
0,2
1,4
(σ = 9,6)
D DRL 6
(21-0) 21*
0,1
1,0
3ª
21
seg +
4ª
25
(22-3) 19*
0,1
1,3
punição
25,0
5ª
26
(26-0) 26*
0,1
1,0
(σ
=
1,0)
6ª
24
(24-0) 24*
0,1
1,0
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
Em relação à Fase A (RF 18) observa-se uma tendência crescente no número
de respostas apresentado em cada sessão, com o mínimo de 547 e máximo de 910
respostas na primeira e sexta sessões, respectivamente. Conseqüentemente, a
quantidade de reforçadores obtida e a taxa de respostas para cada sessão também
apresentaram tendência crescente. A quantidade de respostas por reforçador
apresentou tendência estável em todas as sessões – 18 respostas para cada reforçador
ganho – como não poderia ser diferente em um esquema de RF 18. Esse mesmo
padrão de desempenho foi observado na Fase C (RF 18), com pequenas variações
45
geradas pelo maior número de respostas emitidas por sessão, com mínimo de 860 e
máximo de 1114 respostas, na terceira e quinta sessões, respectivamente.
Como se trata de um esquema de razão, onde o responder ocorre
normalmente em taxas altas a fim de maximizar o ganho de reforçadores, observa-se
que P1 desempenhou-se de forma adequada em relação ao esperado para ambas as
Fases (A e C).
Verifica-se em relação à Fase B (DRL 6 seg.) que o número de respostas por
sessão e a taxa de respostas continuaram altos, mesmo com a mudança do esquema.
O número total de reforçadores ganho em todas as seis sessões dessa Fase foi de
somente 1, o que demonstra uma clara falta de ajustamento do desempenho de P1 ao
esquema em vigor.
A análise dos dados da Fase D (DRL + punição) permite constatar clara
diminuição na emissão do número de respostas e, conseqüentemente, na taxa de
respostas em todas as sessões dessa fase com um máximo de 44 e mínimo de 21
respostas, na primeira e terceira sessões, respectivamente. A adaptação do
desempenho de P1 ao esquema em vigor foi rápida, visto que já na segunda sessão a
quantidade de reforçadores obtida foi de 20, apresentando pouca oscilação desse
número em relação às sessões subseqüentes. A partir da segunda sessão, P1
demonstra um desempenho próximo ao ideal para o esquema proposto emitindo
cerca de uma resposta para cada reforçador ganho. Isso pode ser observado na coluna
QRR da Tabela 2, nas cinco últimas sessões.
A Tabela 3 mostra os dados do Participante 2 (P2).
46
Tabela 3. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P2 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
329
18
1,8
18,3
403,7
2ª
288
16
1,6
18,0
(σ = 166,1)
RF 18
A
33
3,3
18,0
3ª
594
4ª
1008
56
5,6
18,0
1007,7
5ª
990
55
5,5
18,0
(σ
=
17,5)
6ª
1025
56
5,7
18,3
1ª
515
0
2,9
-492,7
2ª
491
0
2,7
-(σ
=
21,5)
B DRL 6
1
2,6
472
3ª
472
seg
4ª
406
1
2,3
406
490,7
5ª
604
0
3,4
-(σ
=
102,1)
6ª
462
0
2,6
-1ª
934
51
5,2
18,3
1029,7
2ª
1097
60
6,1
18,3
(σ = 85,1)
RF 18
C
58
5,9
18,2
3ª
1058
4ª
1043
57
5,8
18,3
1028,7
5ª
987
54
5,5
18,3
(σ
=
36,7)
6ª
1056
58
5,9
18,2
1ª
78
(5-73)-68*
0,4
-41,7
2ª
26
(21-5) 16*
0,1
1,7
(σ = 31,6)
D DRL 6
3ª
21
(19-2) 17*
0,1
1,2
seg +
4ª
25
(21-4) 17*
0,1
1,5
punição
24,3
5ª
24
(20-4) 16*
0,1
1,5
(σ = 0,6)
6ª
24
(20-4) 16*
0,1
1,5
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
A observação dos dados da Fase A (RF 18) revela que P2 apresentou um
padrão crescente no número de respostas emitidas, na quantidade de reforçadores
obtidos e na taxa de respostas ao longo das seis sessões realizadas. Esse mesmo
padrão foi observado para a Fase C (RF 18), com o diferencial de que para essa Fase
a variação apresentada no número de respostas por sessão (mínimo de 934 e máximo
de 1097) foi menor que aquela apresentada na Fase A (mínimo de 329 e máximo de
1025) e o número total de reforçadores obtidos foi maior do que na Fase A. Uma
47
análise geral dos dados da Fase C permite constatar clara regularidade no
desempenho de P2 ao longo das seis sessões dessa Fase, com altas taxas de respostas
acompanhadas por um número elevado de reforçadores obtidos.
Quanto à Fase B (DRL 6 seg), P2 apresentou diminuição no número de
respostas emitidas em relação às últimas sessões da Fase A. No entanto, tal
diminuição não representou uma adaptação adequada ao esquema em vigor, visto
que a quantidade de reforçadores obtida ao longo das seis sessões foi de somente 2.
O que se observa para essa Fase é um padrão de pouca variação no número de
respostas emitidas em cada sessão, sendo que os valores apresentados – com média
de 492,7 e 490,7 respostas – não foram adequados para permitir ganho de
reforçadores.
Já em relação à Fase D (DRL + punição), P2 apresentou um desempenho
adequado ao esquema a partir da segunda sessão, mantendo, a partir de então, um
padrão estável de baixas taxas de respostas e de ganho regular de reforçadores por
sessão.
Em uma análise geral dos dados apresentados pode-se afirmar que P2
demonstrou desempenhos adequados aos esquemas em vigor nas Fases A, C e D.
A Tabela 4 mostra os dados do Participante 3 (P3).
De acordo com os dados de P3 observa-se certa semelhança nos padrões de
desempenho apresentados nas Fases A (RF 18) e C (RF 18), isto é, números
variáveis de respostas, mas em geral altos, acompanhados por uma quantidade
também alta de reforçadores, dados esses indicativos de boa adaptação ao esquema
em vigor. Um dado diferencial de P3 em relação aos outros participantes é a
apresentação de uma taxa média de respostas nas três últimas sessões do esquema
RF 18, nas Fases A e C, inferior às três primeiras sessões, o que significa a emissão
48
de um número maior de respostas nas sessões iniciais dessas Fases em relação às
sessões finais.
Tabela 4. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P3 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
466
25
2,6
18,6
728,7
2ª
740
41
4,1
18,0
(σ
=
257,2)
RF 18
A
3ª
980
50
5,0
18,2
4ª
677
37
3,8
18,3
698,7
5ª
715
39
4,0
18,3
(σ = 19,6)
6ª
704
39
3,9
18,1
1ª
444
1
2,5
444
366,3
2ª
409
1
2,3
409
(σ = 105,7)
B DRL 6
3ª
246
4
1,4
61,5
seg
4ª
225
8
1,2
28,1
117,0
5ª
96
14
0,5
6,9
(σ
=
99,2)
6ª
30
11
0,2
2,7
1ª
845
46
5,0
18,4
751,7
2ª
709
39
4,0
18,2
(σ
=
80,9)
RF 18
C
38
4,0
18,4
3ª
701
4ª
737
40
4,1
18,4
677,7
5ª
439
24
2,4
18,3
(σ = 215,2)
6ª
857
47
4,8
18,2
1ª
31
(18-13) 5*
0,2
6,2
23,0
2ª
18
(16-2) 14*
0,1
1,3
(σ
=
7,0)
D DRL 6
3ª
20
(19-1) 18*
0,1
1,1
seg +
4ª
18
(17-1) 16*
0,1
1,1
punição
18,3
5ª
19
(17-2) 15*
0,1
1,3
(σ
=
0,6)
6ª
18
(17-1) 16*
0,1
1,1
*A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
O desempenho de P3 durante a Fase B (DRL 6 seg.) foi caracterizado por
certa irregularidade. Nas sessões iniciais dessa Fase, P3 demonstrou um padrão de
não adaptação ao esquema vigente, apresentando altas taxas de respostas e baixa
quantidade de obtenção de reforçadores. Já nas duas últimas sessões dessa Fase, P3
começa a apresentar padrões mais sensíveis de desempenho, expressos através da
diminuição no número de respostas e do aumento de reforçadores. Considerando a
49
tendência apresentada pelo participante, torna-se possível cogitar a possibilidade de
que se as sessões prosseguissem dentro desse mesmo esquema, seria possível que P3
apresentasse desempenhos sensíveis na Fase B como àqueles demonstrados na Fase
D (DRL + punição) através da emissão de taxas baixas de respostas e do aumento no
número de reforçadores obtidos.
A variabilidade nas variáveis analisadas constatada em relação às Fases
anteriores não se manteve durante a Fase D. Observa-se, a partir da segunda sessão
dessa Fase, que o participante apresentou um desempenho altamente estável quanto
ao número de respostas emitidas (com variação mínima de 18 e máxima de 20
respostas), quanto à quantidade de reforçadores obtidos (mínimo de 14 e máximo de
18 reforçadores), quanto à taxa de respostas (0,1) e quanto à quantidade de respostas
por reforçador (mínima de 1,1 e máxima de 1,3).
A Tabela 5 ilustra os dados do Participante 4 (P4).
P4 apresentou durante a Fase A (RF 18) um desempenho típico do esquema
em vigor, isto é, taxas altas de respostas conseqüentemente acompanhadas pela
obtenção de altos valores de reforçadores, visto que se trata de um esquema de razão.
Em relação à Fase B (DRL 6 seg.), P4 diminuiu o número de respostas
emitidas em cada sessão em relação à Fase anterior, porém tal mudança em seu
desempenho não foi suficiente para gerar um padrão de desempenho adequado
durante essa Fase, visto que, a quantidade de reforçadores obtida foi insuficiente em
todas as sessões para caracterizar um desempenho sensível. Somente na sexta sessão
dessa Fase, o participante reduziu o número de respostas de tal forma a garantir um
ganho maior de reforçadores (12) em relação às sessões anteriores (onde a variação
foi de 1 a 4 reforçadores obtidos por sessão). Esse dado, porém, é insuficiente para se
50
cogitar uma tendência à sensibilidade com uma possível continuidade das sessões
dentro dessa mesma Fase.
Tabela 5. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P4 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
409
22
2,3
18,6
825,3
2ª
1047
58
5,8
18,1
(σ = 360,8)
A RF 18
3ª
1020
56
5,7
18,2
4ª
923
51
5,1
18,1
881,7
5ª
898
49
5,0
18,3
(σ = 51,5)
6ª
824
45
4,6
18,3
1ª
216
2
1,2
108,0
192,3
2ª
185
2
1,0
92,5
(σ = 21,0)
B DRL 6
3ª
176
1
1,0
176,0
seg
4ª
184
1
1,0
184,0
106,3
5ª
107
4
0,6
26,8
(σ
=
78,0)
6ª
28
12
0,2
2,3
1ª
133
7
0,7
19,0
170,7
2ª
166
9
0,9
18,4
(σ
=
40,2)
C RF 18
11
1,2
19,4
3ª
213
4ª
234
13
1,3
18,0
271,3
5ª
256
14
1,4
18,3
(σ = 46,9)
6ª
324
18
1,8
18,0
1ª
44
(9-35)-26*
0,2
-32,3
2ª
26
(24-2) 22*
0,1
1,2
(σ = 10,1)
D DRL 6
3ª
27
(26-1) 25*
0,2
1,1
seg +
4ª
28
(28-0) 28*
0,2
1,0
punição
28,0
5ª
28
(26-2) 24*
0,2
1,2
(σ
=
0,0)
6ª
28
(28-0) 28*
0,2
1,0
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
Na Fase C (RF 18) observa-se um uma tendência crescente no número de
respostas emitidas a medida em que as sessões se sucedem, com um número mínimo
de 133 e máximo de 324 respostas, na primeira e sexta sessões, respectivamente. O
mesmo ocorre em relação à quantidade de reforçadores (mínima de 7 e máxima de
18). No entanto, o desempenho de P4 nessa Fase difere daquele apresentado na Fase
A, a despeito da semelhança no esquema utilizado em ambas as Fases. Em termos de
51
número de respostas e quantidade de reforçadores obtidos na Fase C, pode-se
considerar que P4 apresentou um desempenho intermediário entre aqueles
apresentados nas Fases A e B. Como o número de respostas aumentou com o avanço
das sessões, é possível cogitar que o participante demonstraria padrões mais
adequados ao esquema dessa Fase caso o número de sessões fosse maior.
Tendo em vista os dados da Fase D (DRL + punição), o desempenho de P4
não difere daqueles apresentados pelos outros participantes, isto é, um padrão
adequado e estável de desempenho a partir da segunda sessão dessa Fase,
caracterizado por taxas baixas no responder, pouca variabilidade no número de
respostas (mínimo de 26 e máximo de 28 respostas) e obtenção dos reforçadores
programados.
Os dados do Participante 5 (P5) são expostos na Tabela 6.
O desempenho de P5 na Fase A (RF 18) foi caracterizado, de forma geral, por
taxas altas de respostas e obtenção de um número também alto de reforçadores em
cada sessão dessa Fase, dados esses indicativos de um desempenho adequado ao
esquema proposto.
Nas Fases B (DRL 6 seg) e C (RF 18), no entanto, o padrão de respostas
apresentado pelo participante não foi congruente com os esquemas programados. A
Fase B foi caracterizada pela manutenção de um número relativamente alto de
respostas, o que, por sua vez, gerou baixa quantidade de reforçadores ganhos. Na
Fase C ocorreu o inverso, isto é, taxas baixas de respostas e de reforçadores obtidos,
onde taxas elevadas é que conduziriam a uma quantidade satisfatória de
reforçadores.
52
Tabela 6. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P5 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
319
17
1,8
18,8
475,7
2ª
604
33
3,4
18,3
(σ
=
144,6)
A RF 18
3ª
504
28
2,8
18,0
4ª
450
25
2,5
18,0
463,7
5ª
464
25
2,6
18,6
(σ
=
13,5)
6ª
477
26
2,6
18,3
1ª
264
6
1,5
44,0
240,7
2ª
225
6
1,2
37,5
(σ = 20,6)
B DRL 6
2
1,3
116,5
3ª
233
seg
4ª
91
6
0,5
15,2
134,3
5ª
143
6
0,8
23,8
(σ = 39,7)
6ª
169
9
0,9
18,8
1ª
56
3
0,3
18,7
49,7
2ª
44
2
0,2
22,0
(σ
=
6,0)
C RF 18
2
0,3
24,5
3ª
49
4ª
39
2
0,2
19,5
46,0
5ª
39
2
0,2
19,5
(σ
=
12,1)
6ª
60
3
0,3
20,0
1ª
36
(19-17) 2*
0,2
18,0
28,0
2ª
24
(23-1) 22*
0,1
1,1
(σ = 6,9)
D DRL 6
(23-1) 22*
0,1
1,1
3ª
24
seg +
4ª
23
(22-1) 21*
0,1
1,1
punição
21,7
5ª
20
(19-1) 18*
0,1
1,1
(σ
=
1,5)
6ª
22
(21-1) 20*
0,1
1,1
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
Sem se diferenciar dos outros participantes, a partir da segunda sessão da
Fase D (DRL 6 seg. + punição), P5 passa a apresentar um desempenho em acordo
com as contingências programadas: número baixo e estável de respostas (variando de
20 a 24 respostas) com a conseqüente obtenção de uma grande quantidade de
reforçadores. O padrão regular de desempenho nessa Fase, a partir da segunda
sessão, fica claro ao se analisar os valores estáveis de taxa de respostas (0,1) e
quantidade de respostas por reforçador (1,1).
53
De uma forma geral, pode-se dizer que P5 apresentou desempenho em acordo
com o esquema vigente nas Fases A e D e desempenho inadequado nas Fases B e C.
O Participante 6 (P6) tem seus dados apresentados na Tabela 7. Em uma análise
geral, pode-se considerar que P6 apresentou um desempenho congruente com os
parâmetros dos esquemas programados em todas as quatro Fases experimentais.
Tabela 7. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P6 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
0
0
--366,7
2ª
472
26
2,6
18,2
(σ
=
327,0)
A RF 18
34
3,5
18,5
3ª
628
4ª
526
29
2,9
18,1
562,0
5ª
597
33
3,3
18,1
(σ = 35,5)
6ª
563
31
3,1
18,2
1ª
456
0
2,5
-180,7
2ª
63
10
0,4
6,3
(σ = 239,3)
B DRL 6
18
0,1
1,3
3ª
23
seg
4ª
23
23
0,1
1,0
24,3
5ª
24
24
0,1
1,0
(σ
=
1,5)
6ª
26
25
0,1
1,0
1ª
117
6
0,6
19,5
473,7
2ª
354
19
2,0
18,6
(σ = 429,2)
C RF 18
3ª
950
52
5,3
18,3
4ª
981
54
5,4
18,2
951,3
5ª
936
52
5,2
18,0
(σ = 25,7)
6ª
937
52
5,2
18,0
1ª
25
(17-8) 9*
0,1
2,8
25,3
2ª
26
(24-2) 22*
0,1
1,2
(σ
=
0,6)
D DRL 6
3ª
25
(25-0) 25*
0,1
1,0
seg +
4ª
27
(26-1) 25*
0,2
1,1
punição
26,3
5ª
25
(25-0) 25*
0,1
1,0
(σ
=
1,2)
6ª
27
(25-2) 23*
0,2
1,2
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
54
No que diz respeito às Fases A (RF 18) e C (RF 18), pode-se notar que, a
partir da segunda sessão de ambas as fases, P6 passa a demonstrar alto número de
respostas acompanhado por quantidades elevadas de obtenção de reforçadores. Tais
dados são indicativos de um desempenho adequado ao esquema estabelecido.
Especificamente a partir da terceira sessão da Fase C, o participante apresenta
emissões de número de respostas altamente regulares ao longo das sessões (variando
de um mínimo de 936 a um máximo de 981 repostas) com a obtenção de uma
quantidade de reforçadores também regular (mínimo de 52 e máximo de 54
reforçadores).
Diferentemente dos outros participantes, a partir da terceira sessão da Fase B
(DRL 6 seg.), P6 demonstra adequação aos parâmetros do esquema programado
através da emissão de um baixo número de respostas por sessão a qual, por sua vez,
foi acompanhada por quantidades elevadas de obtenção de reforçadores.
Um padrão estável de respostas (com variação de 23 a 26 respostas) é
estabelecido ao longo das quatro sessões finais dessa Fase.
Ao longo de todas as sessões da Fase D (DRL 6 seg. + punição) o
participante demonstrou um padrão baixo e regular no número de respostas
apresentadas (mínimo de 25 e máximo de 27 respostas), o que levou à obtenção de
uma alta quantidade de reforçadores por sessão, a partir da segunda sessão.
Considerando o desempenho de P6 a partir da segunda sessão de cada uma
das Fases propostas, pode-se constatar a emissão de padrões de respostas – e a
conseqüente obtenção de reforçadores – indicativos de uma atuação adequada às
contingências vigentes.
A Figura 2 apresenta as médias de respostas (MR) das três últimas sessões de
cada Fase experimental (A, B, C e D) para os participantes P1, P2, P3, P4, P5 e P6.
55
De acordo com os dados apresentados na Figura 2 pode-se notar que nas
comparações entre as Fases AB e CD houve tendência à diminuição na quantidade
média de respostas apresentadas pelo P1 na segunda Fase em relação à primeira,
sendo tal diminuição mais acentuada entre as duas últimas Fases analisadas (CD). Já
em relação às Fases BC houve aumento na taxa média de respostas em C em relação
à B.
Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de
respostas apresentadas foram superiores àquelas obtidas nos esquemas de DRL 6 seg
(Fases B e D).
A comparação entre as Fases BD permite análises adicionais quanto à
questão da sensibilidade/insensibilidade comportamental, visto que a única diferença
entre tais Fases consistiu na inserção da punição na Fase D como uma manipulação
experimental que deveria viabilizar o processo de sensibilização comportamental ao
esquema (DRL 6 seg).
A análise dos dados deixa claro o efeito da inserção da punição como
elemento facilitador da adaptação comportamental de P1 ao esquema programado,
visto que a diferença entre as médias de respostas nas Fases BD foi
consideravelmente grande – a média de respostas em B é cerca de 30 vezes maior do
que em D – para que se possa afirmar que a punição obrigou P1 a estabelecer um
contato mais preciso com o esquema em vigor que àquele estabelecido na Fase B.
Deve-se notar que P1 emitiu taxa média de 25,0 respostas nas três últimas
sessões da Fase D, próximo ao desempenho ideal para tal Fase que seria de 30
respostas.
56
P1
P2
1200
1000
1200
1020,3
881,3
740,3
800
MÉDIAS DO NÚMERO DE RESPOSTAS
1000
1028,7
1007,7
800
600
600
400
400
200
490,7
200
25
24,3
0
0
A
B
C
A
D
P3
P4
800
1000
700
698,7
900
677,7
C
D
881,7
800
600
700
500
600
400
500
300
400
271,3
300
200
200
117
100
18,3
0
106,3
100
28
0
A
B
C
D
A
B
C
D
P6
P5
500
B
1000
463,7
450
900
400
800
350
700
300
600
250
500
951,3
562
400
200
134,3
150
300
200
100
46
50
21,7
0
100
24,3
26,3
0
A
B
C
D
A
B
C
D
FASES EXPERIMENTAIS
Figura 2. Médias do número de respostas das três últimas sessões das Fases
experimentais A (RF 18), B (DRL 6 seg.), C (RF 18) e D (DRL 6 seg. + punição)
para os participantes P1, P2, P3, P4, P5 e P6.
57
Comparações entre as Fases AB (onde a taxa média de respostas diminui de
881,3 para 740,3) e CD (onde a taxa média de respostas diminui de 1020,3 para
25,0) também deixam claro o efeito da punição em levar P1 a um desempenho mais
adequado de acordo com o esquema em vigor na Fase D. Assim, pode-se afirmar que
houve controle relativamente fraco do esquema DRL 6 seg sem o estabelecimento da
punição (Fase B) e taxas mais apropriadamente diferenciadas quando a punição foi
adicionada (Fase D), com a conseqüente apresentação de um desempenho
claramente controlado pelo esquema programado.
Em termos de média de respostas, o padrão geral de desempenho de P2 foi
semelhante àquele de P1. De acordo com os dados apresentados na Figura 2 pode-se
notar nas comparações realizadas entre as Fases AB e CD tendência à diminuição na
quantidade média de respostas apresentadas por P2 na segunda Fase em relação à
primeira, sendo tal diminuição mais acentuada entre as Fases CD. Já em relação às
Fases BC houve aumento na taxa média de respostas em C em relação a B. Os dados
demonstram que nas Fases de RF 18 (A e C) as médias de respostas apresentadas
foram superiores àquelas obtidas nos esquemas de DRL 6 seg (fases B e D),
indicando assim que o participante demonstrou considerável adaptação de seu padrão
de respostas aos esquemas apresentados.
Na comparação entre as Fases BD, os dados deixam claro o efeito da inserção
da punição como elemento facilitador da adaptação comportamental de P2 ao
esquema programado, visto que a diferença entre as médias de respostas nas Fases
BD foi consideravelmente grande – a média de respostas em B é cerca de 20 vezes
maior do que em D – para que se possa afirmar que a punição levou P2 a estabelecer
um contato mais eficiente com o esquema em vigor que àquele estabelecido na Fase
B. Deve-se notar que P2 emitiu taxa média de 24,3 respostas nas três últimas sessões
58
da Fase D, próxima ao desempenho ideal para tal Fase que seria de 30 respostas.
Comparações entre as Fases AB (onde a taxa média de respostas diminui de 1007,7
para 490,7) e CD (onde a taxa média de respostas diminui de 1028,7 para 24,3)
também deixam claro o efeito da punição em levar P2 a um desempenho mais
adequado de acordo com o esquema em vigor na Fase D. Assim, pode-se afirmar que
o controle exercido pelo esquema DRL 6 seg. foi eficientemente estabelecido através
da inserção da punição na Fase final do experimento, levando assim P2 a estabelecer
um contato mais preciso com o esquema em vigor.
O padrão geral de desempenho de P3 foi semelhante ao de P1 e P2. De
acordo com os dados apresentados na Figura 2 pode-se notar que nas comparações
realizadas entre as Fases AB e CD houve tendência à diminuição na quantidade
média de respostas apresentadas por P3 na segunda Fase em relação à primeira,
sendo tal diminuição mais significativa entre as duas últimas Fases analisadas (CD).
Já em relação às Fases BC houve aumento na taxa média de respostas em C em
relação à B. Os dados demonstram que P3 também apresentou taxas médias de
respostas no esquema de razão (Fases A e C) superiores àquelas apresentadas no
esquema de DRL (Fases B e D), dado esse indicativo de sensibilidade aos esquemas
programados.
A comparação das médias das Fases BD permite apontar a inserção da
punição como provável variável responsável pela maior adequação comportamental
de P3 na Fase D em relação à Fase B, visto que a diferença entre as médias de
respostas nas duas Fases foi relativamente grande – a média de respostas em B é
cerca de 6 vezes maior do que em D – para que se possa afirmar que a punição levou
P3 a estabelecer um contato mais efetivo com o esquema em vigor que aquele
estabelecido na Fase B. P3 emitiu taxa média de 18,3 respostas nas três últimas
59
sessões da Fase D, taxa essa muito mais próxima do desempenho ideal para tal Fase,
que seria de 30 respostas, do que a taxa emitida na Fase B (117,0). Comparações
entre as Fases AB (onde a taxa média de respostas diminui de 698,7 para 117,0
respostas) e CD (onde a taxa média de respostas diminui de 677,7 para 18,3) também
deixam claro o efeito da punição em levar P3 a um desempenho mais adequado de
acordo com o esquema em vigor na Fase D.
De acordo com a Figura 2, P4 teve um padrão de desempenho semelhante aos
participantes anteriores, com pequenas diferenças apontadas na seqüência. Pode-se
notar que nas comparações realizadas entre as Fases AB e CD houve tendência à
diminuição na quantidade média de respostas apresentadas pelo P4 na segunda Fase
em relação à primeira, sendo tal diminuição significativa tanto entre as Fases AB
(com diminuição nas taxas médias de respostas de 881,7 para 106,3) quanto entre as
Fases CD (com diminuição nas taxas médias de respostas de 271,3 para 28,0). Já em
relação às Fases BC houve aumento na taxa média de respostas em C em relação à
B. Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de
respostas apresentadas foram superiores àquelas obtidas nos esquemas de DRL 6 seg
(Fases B e D).
No entanto, torna-se necessário destacar para P4 uma diminuição acentuada
na taxa média de respostas apresentada durante a segunda exposição ao esquema de
RF 18 na Fase C (271,3 respostas) em relação à taxa média apresenta na primeira
exposição a esse esquema durante a Fase A (881,7 respostas), padrão esse não
constatado em relação aos outros participantes já citados. A análise dos valores
médios apresentados em cada uma das supracitadas Fases leva à possibilidade de que
durante a Fase C o participante tenha apresentado certa insensibilidade
comportamental, através da demonstração de taxas baixas de respostas em
60
circunstâncias nas quais taxas altas é que estariam positivamente correlacionadas
com o ganho de pontos, em função da exposição anterior ao esquema de
reforçamento de DRL (Fase B), o qual reforçava padrões baixos de taxas de
respostas. Dessa forma, cogita-se a possibilidade de que a exposição prévia a tal Fase
possa ter gerado os aspectos de insensibilidade observados na Fase subseqüente.
A análise da comparação entre as fases BD permite verificar o efeito da
inserção
da
punição
como
provável
elemento
facilitador
da
adaptação
comportamental de P4 ao esquema apresentado na Fase D, visto que a diferença
entre as médias de respostas nas Fases BD foi relativamente significativa – a média
de respostas em B é cerca de 4 vezes maior do que em D – para que se possa afirmar
que a punição levou P4 a estabelecer um contato mais preciso com o esquema em
vigor que àquele estabelecido na Fase B. Comparações entre as Fases AB (onde a
taxa média de respostas diminui de 881,7 para 106,3) e CD (onde a taxa média de
respostas diminui de 271,3 para 28,0) deixam claro que P4 já havia demonstrado
sinais de sensibilidade comportamental já na primeira Fase de DRL (fase B), em
virtude da acentuada diminuição de respostas apresentada em relação à Fase anterior
(A) e que o efeito da punição consistiu apenas em intensificar tais sinais na Fase D,
induzindo assim o participante a um desempenho ainda mais adequado de acordo
com o esquema em vigor. Para tanto, deve-se notar que P4 emitiu taxa média de 28,0
respostas nas três últimas sessões da Fase D, próximo ao desempenho ideal para tal
Fase (30 respostas).
De acordo com os dados apresentados na Figura 2 pode-se notar que nas
comparações realizadas entre as Fases AB e CD houve tendência à diminuição na
quantidade média de respostas apresentadas pelo P5 na segunda Fase em relação à
61
primeira, sendo tal diminuição mais significativa entre as duas primeiras Fases
analisadas (AB).
Em relação às Fases BC também foi constatada diminuição da média de
respostas da segunda Fase em relação à primeira, dado esse indicador de
insensibilidade comportamental, pois P5 apresentou padrões contrários àqueles
esperados para os esquemas em vigor (taxa de respostas mais alta no esquema de
DRL do que no esquema de razão). Tal dado conduz à constatação de uma diferença
significativa entre as médias de respostas apresentadas nas duas Fases de RF 18,
Fase A (com média de 463,7 respostas) e Fase C (com média de 46,0 respostas).
Dessa forma, constata-se que houve, nesta última Fase, redução na sensibilidade às
contingências através da demonstração de taxas baixas de respostas em
circunstâncias nas quais taxas altas é que estariam relacionadas com o ganho de
reforçadores. É possível levantar a possibilidade de que a baixa taxa média de
respostas apresentada durante a Fase C, a qual caracteriza um padrão de
insensibilidade comportamental, deveu-se à exposição anterior ao esquema de DRL
na Fase B; isto é, o padrão comportamental de baixas taxas desenvolvido ao longo da
exposição desse esquema teria influenciado no padrão apresentado na Fase
subseqüente.
A comparação entre as Fases BD permite análises adicionais quanto à
questão da sensibilidade/insensibilidade comportamental. A diferença entre as
médias de respostas nas Fases BD foi relativamente grande – a média de respostas
em B é cerca de 6 vezes maior do que em D – para que se possa cogitar que a
punição levou P5 a estabelecer um contato mais preciso com o esquema em vigor
que àquele estabelecido na Fase B. Deve-se notar que P5 emitiu taxa média de 21,7
respostas nas três últimas sessões da Fase D, próximo ao desempenho ideal (30
62
respostas) para tal Fase. Assim, houve controle relativamente fraco do esquema DRL
6 seg. sem o estabelecimento da punição (Fase B) e taxas mais apropriadamente
diferenciadas quando a punição foi adicionada (Fase D), com a conseqüente
apresentação de um desempenho claramente controlado pelo esquema programado.
Portanto, mesmo sendo constatada certa insensibilidade no padrão de
respostas apresentado por P5 em relação ao esquema de razão, fica evidente o efeito
do fortalecimento do esquema em vigor, via acréscimo da punição, como um recurso
facilitador da instalação da sensibilidade comportamental, conforme demonstra
comparação entre as Fases BD.
De acordo com os dados apresentados na Figura 2 pode-se notar que nas
comparações realizadas entre as Fases AB e CD houve clara tendência à diminuição
na quantidade média de respostas apresentadas pelo P6 na segunda Fase em relação à
primeira, sendo tal diminuição significativa entre todas as Fases comparadas (tanto
entre AB como entre CD). Já em relação às Fases BC houve aumento na taxa média
de respostas em C em relação à B.
Os dados demonstram que em todas as Fases de RF 18 (A e C) as médias de
respostas apresentadas foram consideravelmente superiores àquelas obtidas nos
esquemas de DRL 6 seg (fases B e D), o que aponta para a constatação de
sensibilidade comportamental aos esquemas programados em todas as Fases
experimentais, indicando assim que o participante adaptou seu padrão de respostas
aos esquemas apresentados.
Em relação às Fases BD observa-se que a inserção da punição na Fase D não
pode ser vista como uma manipulação experimental responsável por viabilizar o
processo de sensibilização comportamental no esquema de DRL, visto que, já na
primeira exposição a esse esquema (Fase B) P6 demonstrou um padrão de
63
sensibilidade comportamental, com taxa média de respostas baixa e positivamente
correlacionada com o ganho de pontos. Assim, pode-se afirmar que houve efetivo
controle do esquema DRL 6 seg. sem o estabelecimento da punição (Fase B) e que
taxas apropriadamente diferenciadas se mantiveram quando a punição foi adicionada
(Fase D), com a conseqüente apresentação de um desempenho claramente controlado
pelo esquema programado em ambas as Fases.
No entanto, de acordo com análise dos dados apresentados na Tabela 7, podese notar, através da comparação das Fases B e D, o efeito claro da inserção da
punição em facilitar a instalação de um padrão comportamental adequado –
correlacionado com maior ganho de pontos – já na primeira sessão da Fase D, padrão
este observado somente na terceira sessão da Fase B. Assim, é provável que para P6
em específico, a punição não tenha sido necessária para estabelecer desempenhos
sensíveis aos esquemas programados, mas seus efeitos rápidos em instalar
repertórios adequados continuam evidentes através da análise dos dados
mencionados.
64
Discussão
À exceção dos participantes P4 e P5 durante a Fase C, todos os demais
apresentaram desempenhos adequados aos esquemas de razão, isto é, altas taxas de
respostas positivamente correlacionadas com ganho de pontos. Um dado interessante
é que os participantes P1, P2 e P6 demonstraram um desempenho ainda mais
adequado a esse esquema durante a Fase C do que na Fase A. Uma possibilidade
explicativa para esse dado é a consideração de que a criação de uma história
experimental de exposição prévia ao esquema de RF durante Fase A talvez tenha
facilitado uma sensibilização ainda maior às condições de tal esquema durante a Fase
C.
Todos os participantes, a exceção de P5 durante a Fase C, demonstraram
médias de respostas mais altas nos esquemas de RF, tanto na Fase A quanto C, do
que DRL (Ver Figura 2). No entanto, esse dado não é suficiente para que se possa
afirmar que houve padrões generalizados de sensibilidade. P4, por exemplo, apesar
de ter mantido suas taxas médias de respostas nos esquemas de RF superiores às
taxas dos esquemas DRL teve seu desempenho durante a Fase C caracterizado como
insensível ao esquema vigente, já que o número de respostas emitas em cada sessão
dessa Fase, bem como a quantidade de reforçadores obtida, foram acentuadamente
inferiores aos da Fase A. Efeitos da exposição anterior a uma contingência de DRL
(fase B) podem ser sugeridos na explicação das diferenças constatadas na Fase C em
relação à Fase A para esse participante.
Por outro lado, taxas médias de respostas inferiores nos esquemas de DRL
em relação aos esquemas de RF também não garantiram padrões sensíveis nos
primeiros. Basta observar que durante a Fase B somente P6 atingiu um número
65
adequado de emissões de respostas, a partir da terceira sessão, para que se pudesse
fazer referência a um desempenho sensível. Os outros participantes, apesar de terem
diminuído o número de respostas nessa Fase (B) em relação à Fase anterior (A),
ainda assim não demonstraram padrões de comportamento em acordo com os
parâmetros do esquema, isto é, taxas suficientemente baixas de respostas
acompanhadas por alto ganho de reforçadores.
Todos, a exceção de P5, apresentaram aumento na taxa média de respostas na
Fase C após exposição à Fase B. Se em alguns casos essa taxa foi maior que na Fase
A (P1, P2 e P6), em outros foi equivalente (P3) ou inferior (P4). Já na transição da
Fase C para D, todos os participantes diminuíram adequadamente suas taxas médias
de respostas, garantindo um desempenho sensível em D.
Para os participantes P1, P2, P3, P4 e P5 as comparações entre as Fases B e D
levaram a constatação de uma significativa diminuição na taxa de respostas em D em
relação a B. Como a variável diferencial entre as duas Fases consistiu na inserção da
punição na Fase D, pode-se considerar que as diferenças constatadas devam-se a tal
variável. Os dados mostram claramente que a punição levou a uma adaptação rápida
às condições de esquema presentes na Fase D – visto que todos os participantes
apresentaram número adequado de emissão de respostas já a partir da segunda sessão
dessa Fase – e a um desempenho altamente regular, caracterizado por estabilidade no
número de respostas emitidas e por um ganho considerável dos reforçadores
programados. Em outras palavras, houve pobre controle do esquema DRL sem o
estabelecimento da punição (Fase B) e taxas mais apropriadamente diferenciadas
quando a punição foi adicionada (Fase D).
Embora a única variável diferencial entre as Fases B e D se constitua na
operação de punição inserida na Fase D, torna-se necessário considerar que a
66
disposição dos esquemas em Fases como ocorreu no presente experimento pode ter
facilitado o desenvolvimento de uma história experimental que pode ter exercido
influência nos dados obtidos. Assim como a história de exposição anterior à Fase A
foi evocada para explicar desempenhos ainda mais adequados ao esquema de RF que
surgiram durante a Fase C (P1, P2 e P6), o mesmo dever ocorrer quando se considera
os desempenhos avaliados na Fase D. Isto significa dizer que a exposição anterior à
Fase B também pode ter gerado efeitos que se estenderam sob o desempenho dos
participantes durante a Fase D. Assim, não se pode descartar a possibilidade de que
além da punição, a história experimental de exposição prévia a Fase B também possa
ter contribuído para desempenhos sensíveis observados durante a Fase D.
O objetivo principal do presente Experimento foi verificar se ao arranjar
conseqüências aversivas (perda de pontos) para o comportamento consistente com
esquemas anteriores – e, portanto, insensível – seria possível estabelecer contato com
esquemas atuais e assim reduzir a força e a persistência da insensibilidade do
desempenho. Os resultados permitem afirmar que quando condições aversivas são
estabilizadas de tal forma que o comportamento insensível conduz à perda de pontos,
a insensibilidade comportamental é esperada declinar.
Tomados em conjunto, os dados apresentados suportam evidências de que
aspectos relacionados a um fortalecimento das contingências em vigor –
representado pela inserção da punição na Fase D, no presente experimento – devem
ser
considerados
como
relevantes
em
uma
discussão
sobre
sensibilidade/insensibilidade comportamental. Em outras palavras, os desempenhos
sensíveis demonstrados por todos os participantes durante a Fase D demonstram que
a insensibilidade às contingências pode ser muito mais uma questão de arranjo
experimental do que uma característica inerente ao controle instrucional.
67
Experimento 2
Participantes
Os participantes foram quatro alunos do primeiro período do curso de
graduação em Psicologia, três do sexo feminino com idades de 18, 20 e 36 anos e um
do sexo masculino com idade de 33 anos, da Universidade Católica de Goiás (UCG).
Os critérios de seleção dos participantes, bem como, de concordância dos mesmos
em participar do experimento foram semelhantes aos utilizados no Experimento 1.
Equipamentos
O equipamento utilizado foi exatamente o mesmo descrito no Experimento 1.
Procedimentos
O delineamento experimental utilizado com os participantes submetidos ao
Experimento 2 teve cada sujeito como seu próprio controle. Dessa forma, cada
participante foi submetido seqüencialmente a 6 Fases experimentais (A, B, C, D, E e
F), que constituíram a nova composição do programa em uso.
O diferencial em relação ao Experimento 1 consistiu apenas no fato de que
após serem submetidos à Fase experimental D (DRL 6 seg + punição) os
participantes foram seqüencialmente submetidos às novas Fases E (RF 18), idêntica
às Fases A e C, e F (DRL 6 seg), idêntica à Fase B. O objetivo básico, conforme
exposto anteriormente, foi verificar se após a exposição à Fase (D), em que um
padrão adequado de comportamento sensível ao esquema é atingido via inserção da
punição de respostas inadequadas, seria mantido esse mesmo padrão em uma Fase
posterior (F) sem necessidade da punição de respostas inadequadas. Comparações
68
entre as Fases B (DRL 6 seg), D (DRL 6 seg + punição) e F (DRL 6 seg) permitirão
análises dessa natureza.
A composição de cada Fase experimental em termos de sessões realizadas,
duração de sessão, tipos de esquemas utilizados, tarefa a ser desenvolvida pelo
participante, instrução fornecida, etc. foi semelhante ao Experimento. O único
diferencial, portanto, consistiu na inserção das Fases E e F, com características
exatamente idênticas às Fases A e B, respectivamente, a fim de possibilitar as
análises necessárias. A Tabela 8 resume o procedimento do Experimento 2.
Tabela 8. Fases experimentais, esquema de reforçamento, consequenciação de
respostas e número de sessões aos quais cada participante foi submetido
durante o Experimento 2.
Fase
Esquema
Conseqüenciação de respostas
A
RF 18
B
DRL 6 seg
C
RF 18
D
E
DRL 6 seg +
punição
RF 18
F
DRL 6 seg
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: um ponto perdido
Correta: um ponto ganho
Errada: nenhuma conseqüência
Correta: um ponto ganho
Errada: nenhuma conseqüência
Número de
sessões
6
6
6
6
6
6
69
Resultados
Os parâmetros utilizados para análise são semelhantes aos descritos no
Experimento 1. A Tabela 9 expõe os dados do Participante 7 (P7).
De acordo com os dados apresentados pode-se notar que nas Fases A (RF
18), C (RF 18) e E (RF 18) o participante ajustou perfeitamente sua taxa de respostas
ao esquema em vigor, isto é, emitiu número alto de respostas acompanhado por uma
quantidade também alta de obtenção de reforçadores, visto que se tratava de um
esquema de razão.
Apesar de ter diminuído o número de respostas emitido em cada sessão
durante a Fase B (DRL 6 seg.) em relação às Fases de RF, tal diminuição não foi
suficiente para garantir padrões adequados de desempenho nessa Fase, visto que a
quantidade de reforçadores obtida (máximo de 7, na terceira e quinta sessões)
manteve-se bem abaixo da quantidade total que poderia ter sido alcançada (30 por
sessão), caracterizando assim um desempenho não ajustado ao esquema em vigor.
Os dados relacionados à quantidade de respostas por reforçador (QRR) também
atestam a não adequação do comportamento às contingências estabelecidas, visto
que o padrão esperado para um esquema DRL é de uma resposta por reforçador, e P7
emitiu valores bem acima desse (com variação de 10,3 a 474,0 respostas por
reforçador).
Já a partir da segunda sessão da Fase D (DRL 6 seg. + punição), o que se
observa é um padrão de ajustamento ao esquema em vigor, caracterizado pela
apresentação de baixo número de respostas (variando de um mínimo de 20, na
terceira sessão, a um máximo de 26 respostas, na quinta sessão), baixa taxa de
respostas (0,1 respostas por segundo), ganho médio de reforçadores (com variação
70
de 14 a 23) e baixa quantidade de respostas por reforçador (variando de 1,0 a 1,6
resposta por reforçador).
Tabela 9. Número de Respostas (NR), Média de Respostas (MR), Quantidade de
Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P7 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
2
0
0,0
--380,0
(σ = 406,5)
2ª
328
18
1,8
18,2
A RF 18
3ª
810
45
4,5
18,0
922,0
4ª
783
43
4,4
18,0
(σ
=
120,7)
5ª
983
54
5,5
18,2
6ª
1000
55
5,6
18,2
1ª
474
1
2,6
474,0
229,3
(σ
=
212,4)
2ª
122
6
0,7
20,3
B DRL 6
3ª
92
7
0,5
13,1
seg
103,0
4ª
145
4
0,8
36,2
(σ = 37,7)
5ª
72
7
0,4
10,3
6ª
92
2
0,5
46,0
1ª
1006
55
5,6
18,3
1000,3
(σ
=
19,1)
2ª
979
54
5,4
18,1
C RF 18
3ª
1016
56
5,6
18,1
901,0
4ª
954
53
5,3
18,0
(σ
=
82,4)
5ª
943
52
5,2
18,1
6ª
806
44
4,5
18,3
38,7
1ª
74
(14-60)-46*
0,4
--(σ = 30,6)
2ª
22
(18-4) 14*
0,1
1,6
D DRL 6
3ª
20
(20-0) 20*
0,1
1,0
seg +
24,3
4ª
23
(23-0) 23*
0,1
1,0
(σ = 1,5)
punição
5ª
26
(22-4) 18*
0,1
1,4
6ª
24
(20-4) 16*
0,1
1,5
902,3
1ª
721
40
4,0
18,0
(σ = 164,2)
2ª
945
52
5,2
18,2
E RF 18
57
5,8
18,3
3ª
1041
1103,3
4ª
1130
62
6,3
18,2
(σ
=
23,6)
5ª
1085
60
6,0
18,1
6ª
1095
60
6,1
18,2
29,3
1ª
37
21
0,2
1,8
(σ = 6,8)
2ª
27
25
0,2
1,1
F DRL 6
3ª
24
20
0,1
1,2
seg
24,7
4ª
27
24
0,1
1,1
(σ = 2,1)
5ª
23
23
0,1
1,0
6ª
24
24
0,1
1,0
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
71
Durante a Fase F (DRL 6 seg.), onde a contingência de DRL é restabelecida,
um padrão ainda mais estável e regular de desempenho é apresentado, visto que,
durante todas as sessões dessa Fase fica constatado um responder que ocorre em
baixa freqüência (com média de 24,7 respostas nas três últimas sessões) e que tem
como conseqüência ganhos elevados de reforçadores (mínimo de 20 e máximo de
25). As respostas inadequadas que ocorriam no meio dos intervalos e que os
reprogramavam durante a Fase B, praticamente deixam de existir durante essa Fase;
na quinta e sexta sessões, por exemplo, o número de respostas emitido (23 e 24,
respectivamente) é exatamente igual à quantidade de reforçadores obtida, indicando
a não emissão de respostas incorretas.
Em uma análise geral, pode-se dizer que P7 manifestou um desempenho
ajustável ao esquema em vigor em todas as Fases experimentais, a exceção da Fase
B.
A Tabela 10 mostra os dados do Participante 8 (P8).
Ao longo de todas as Fases de RF 18 (A, C e E), P8 apresentou uma
tendência crescente no número de respostas emitido ao longo das sessões. Ao se
considerar as médias de respostas das três últimas sessões de cada uma dessas Fases
(756,0; 986,3 e1112,0) constata-se um ajustamento ao esquema em vigor, via
emissão de alto número de respostas e ganho considerável de reforçadores.
A Fase B (DRL 6 seg.) é caracterizada pela apresentação de um número
variável e não adequado de respostas ao esquema em vigor e conseqüente ganho
limitado de reforçadores (máximo de 5 na quinta sessão).
72
Tabela 10. Número de Respostas (NR), Média de Respostas (MR), Quantidade
de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P8 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
125
6
0,7
20,8
159,7
(σ = 30,0)
2ª
177
9
1,0
19,7
RF 18
A
3ª
177
9
1,0
19,7
756,0
4ª
281
15
1,6
18,7
(σ
=
421,9)
5ª
900
50
5,0
18,0
6ª
1087
60
6,0
18,1
1ª
664
1
3,7
664,0
655,7
(σ = 130,7)
2ª
782
0
4,3
--B DRL 6
3ª
521
2
2,9
260,5
seg
286,7
4ª
558
0
3,1
--(σ = 240,2)
5ª
101
5
0,6
20,2
6ª
201
4
1,1
50,25
1ª
153
8
0,8
19,1
550,0
(σ = 344,2)
2ª
733
40
4,1
18,3
RF 18
C
3ª
764
42
4,2
18,2
986,3
4ª
1006
55
5,6
18,3
(σ
=
25,9)
5ª
996
55
5,5
18,1
6ª
957
53
5,3
18,1
1ª
33
(20-13) 7*
0,2
4,7
27,7
(σ
=
5,0)
2ª
27
(20-7) 13*
0,2
2,1
D DRL 6
3ª
23
(20-3) 17*
0,1
1,4
seg +
23,3
4ª
23
(20-3) 17*
0,1
1,4
(σ = 1,5)
punição
5ª
25
(18-7) 11*
0,1
2,3
6ª
22
(20-2) 18*
0,1
1,2
821,0
1ª
599
33
3,3
18,2
(σ = 248,9)
2ª
774
43
4,3
18,0
RF 18
E
3ª
1090
60
6,1
18,2
1112,0
4ª
1164
64
6,5
18,2
(σ
=
76,6)
5ª
1024
56
5,7
18,3
6ª
1148
63
6,4
18,2
1ª
433
2
2,4
216,5
289,3
(σ
=
200,7)
2ª
375
4
2,1
93,8
F DRL 6
3ª
60
15
0,3
4,0
seg
26,7
4ª
25
25
0,1
1,0
(σ = 1,5)
5ª
28
22
0,2
1,3
6ª
27
25
0,2
1,1
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
73
Durante toda Fase D (DRL 6 seg. + punição) um padrão adaptável ao
esquema em vigor é estabelecido, identificado através da apresentação de um baixo
número de respostas pelo participante – principalmente a partir da segunda sessão –
da obtenção de uma quantidade mediana de reforçadores por sessão e da pouca
variação na taxa de respostas (mínimo de 0,1 e máximo de 0,2 respostas por
segundo).
Ao longo da Fase F (DRL 6 seg.), P8 demonstra tendência decrescente na
freqüência de respostas emitida a medida em que as sessões avançam. A média de
respostas das três últimas sessões (26,7) bem como a quantidade de reforçadores
obtida nessas sessões (mínimo de 22 e máximo de 25) são indicativos de adequação
ao esquema em vigor.
Os dados do Participante 9 (P9) são expostos na Tabela 11.
A análise dos dados das Fases A (FR 18), C (RF 18) e E (RF 18) revela uma
tendência de P9 em apresentar freqüências elevadas de respostas, principalmente nas
três últimas sessões de cada uma dessas Fases, indicando assim um desempenho bem
ajustado ao esquema de RF em vigor. Na Fase A, tal tendência pode ser notada a
partir da segunda sessão (581 respostas), na Fase C, a partir da terceira sessão (808
respostas) e na Fase E, a partir da primeira sessão (1251 respostas). A quantidade de
reforçadores obtida em cada uma dessas Fases também foi alta, chegando a atingir
80 reforçadores por sessão (Fase C, quarta e sexta sessões). Deve-se notar o
desempenho altamente estável atingido por P9 durante a Fase E, onde a variação no
número de respostas (mínimo de 1150 e máximo de1297 respostas), na quantidade
de reforçadores (mínimo de 63 e máximo de 72) e na taxa de respostas (mínimo de
6,4 e máximo de 7,2 respostas por segundo) foi mínima em relação às outras Fases
de RF, caracterizadas por maior variabilidade nesses números.
74
Tabela 11. Número de Respostas (NR), Média de Respostas (MR), Quantidade
de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P9 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
63
3
0,4
21,0
419,0
(σ = 308,7)
2ª
581
32
3,2
18,2
A RF 18
3ª
613
34
3,4
18,0
835,7
4ª
822
45
4,6
18,3
(σ
=
40,3)
5ª
881
48
4,9
18,3
6ª
804
44
4,5
18,3
1ª
693
0
3,8
-692,7
(σ
=
33,5)
2ª
659
0
3,7
-B DRL 6
3ª
726
0
4,0
-seg
280,0
4ª
648
0
3,6
-(σ = 323,2)
5ª
150
3
0,8
50,0
6ª
42
7
0,2
6,0
1ª
85
4
0,5
21,2
314,3
(σ = 427,9)
2ª
50
2
0,3
25,0
C RF 18
3ª
808
44
4,5
18,4
1397,7
4ª
1454
80
8,1
18,2
(σ
=
91,6)
5ª
1292
71
7,2
18,2
6ª
1447
80
8,0
18,1
1ª
82
(8-74)-66*
0,5
--40,3
(σ
=
36,7)
2ª
14
(7-7) 0*
0,1
--D DRL 6
3ª
24
(17-7) 10*
0,1
2,4
seg +
24,7
4ª
26
(18-8) 10*
0,1
2,6
(σ = 2,3)
punição
5ª
26
(18-8) 10*
0,1
2,6
6ª
22
(20-2) 18*
0,1
1,2
1224,0
1ª
1251
69
7,0
18,1
(σ = 28,6)
2ª
1194
66
6,6
18,1
E RF 18
3ª
1227
68
6,8
18,0
1227,3
4ª
1297
72
7,2
18,0
(σ
=
73,8)
5ª
1235
68
6,9
18,2
6ª
1150
63
6,4
18,3
1ª
289
5
1,6
57,8
112,3
(σ
=
153,1)
2ª
29
20
0,2
1,4
F DRL 6
3ª
19
18
0,1
1,1
seg
30,3
4ª
17
17
0,1
1,0
(σ = 11,9)
5ª
40
19
0,2
2,1
6ª
34
26
0,2
1,3
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
75
Durante a Fase B (DRL 6 seg.) o participante apresenta números de respostas
com tendência decrescente no decorrer das sessões. No entanto, a diminuição
demonstrada não foi suficiente para assegurar um desempenho sensível ao esquema
durante essa Fase, pois as taxas de respostas ainda se apresentaram em níveis altos e
o número de reforçadores manteve-se baixo, com a obtenção de apenas 3 e 7
reforçadores na quinta e sexta sessões, respectivamente. Analisando dados das três
últimas sessões, é possível cogitar a possibilidade de que se o número de sessões
fosse maior, P9 apresentaria desempenhos mais ajustáveis ao esquema.
A partir da terceira sessão da Fase D (DRL 6 seg. + punição) pode-se notar
um desempenho característico do esquema em vigor, com apresentação de baixos
números de respostas por sessão (mínimo de 22 e máximo de 26) e ganho mediano
dos reforçadores programados. Nenhum outro participante demorou tanto quanto P9
para obter reforçadores nessa Fase. Em geral, desempenhos mais característicos do
esquema surgem na primeira ou segunda sessão; P9, no entanto, só os demonstrou a
partir da terceira sessão.
A adaptação de P9 ao esquema de DRL ocorreu de forma mais rápida durante
a Fase F (DRL 6 seg.), onde, já a partir da segunda sessão, passa a demonstrar
número de respostas reduzido e, conseqüentemente, quantidades significativas de
reforçadores.
Os dados do Participante 10 (P10) são apresentados na Tabela 12.
Um desempenho adaptável ao esquema de RF pode ser identificado nas Fases
A (RF 18), C (RF 18) e E (RF 18) para P10, pois todas essas Fases foram marcadas
pela emissão de um alto número de respostas e elevada quantidade de reforçadores
obtida. As Fases C e E, por apresentarem parâmetros com valores mais altos que
76
aqueles observados na Fase A, são ainda mais características de um desempenho
adequado.
Tabela 12. Número de Respostas (NR), Média de Respostas (MR), Quantidade
de Reforçadores (QR), Taxa de Respostas (TR) e Quantidade de Respostas por
Reforçador (QRR) apresentados pelo P10 nas Fases Experimentais (FE),
Esquemas de Reforçamento (ER) e Sessões a que foi exposto.
FE
ER
Sessão
NR
MR
QR
TR
QRR
1ª
229
12
1,3
19,1
388,3
(σ = 142,4)
2ª
433
24
2,4
18,0
A RF 18
3ª
503
27
2,8
18,6
536,7
4ª
537
29
3,0
18,5
(σ
=
11,5)
5ª
548
30
3,0
18,3
6ª
525
29
2,9
18,1
1ª
778
0
4,3
--324,0
(σ
=
393,4)
2ª
83
10
0,5
8,3
B DRL 6
3ª
111
15
0,6
7,4
seg
169,7
4ª
189
4
1,0
47,2
(σ = 21,2)
5ª
173
7
1,0
24,7
6ª
147
5
0,8
29,4
1ª
825
45
4,6
18,3
855,0
(σ
=
28,6)
2ª
858
47
4,8
18,2
C RF 18
3ª
882
49
4,9
18,0
913,7
4ª
901
50
5,0
18,0
(σ
=
24,6)
5ª
942
51
5,2
18,5
6ª
898
49
5,0
18,3
27,3
1ª
42
(10-32)-22*
0,2
--(σ = 13,1)
2ª
23
(16-7) 9*
0,1
2,6
D DRL 6
3ª
17
(14-3) 11*
0,1
1,5
seg +
20,7
4ª
23
(19-4) 15*
0,1
1,5
(σ = 3,2)
punição
5ª
22
(18-4) 14*
0,1
1,6
6ª
17
(16-1) 15*
0,1
1,1
892,3
1ª
796
44
4,4
18,1
(σ = 118,0)
2ª
857
47
4,8
18,2
E RF 18
56
5,7
18,3
3ª
1024
831,7
4ª
899
49
5,0
18,3
(σ
=
110,6)
5ª
892
49
5,0
18,2
6ª
704
39
3,9
18,1
113,7
1ª
294
9
1,6
32,7
(σ = 156,2)
2ª
24
18
0,1
1,3
F DRL 6
3ª
23
17
0,1
1,4
seg
25,7
4ª
25
21
0,1
1,2
(σ = 1,2)
5ª
25
22
0,1
1,1
6ª
27
22
0,2
1,2
* A quantidade de reforçadores nesta fase diz respeito ao saldo final do participante
em cada sessão, isto é, quantidade de reforçadores obtidos menos quantidade de
reforçadores perdidos.
77
Durante a Fase B (DRL 6 seg.) um padrão de não ajustamento ao esquema
pode ser observado, através da identificação de números variáveis, e em geral
elevados, de respostas emitidas acompanhados por quantidades restritas de
reforçadores. Já a partir da segunda sessão da Fase D (DRL 6 seg. + punição) o
número de respostas por sessão é reduzido significativamente em relação às Fases
anteriores (mínimo de 17 e máximo de 23 respostas) garantindo ganhos medianos e
regulares de reforçadores (mínimo de 9 e máximo de 15 reforçadores). A taxa de
respostas também apresenta maior estabilidade (0,1 resposta por segundo).
Ao se considerar os dados a partir da segunda sessão da Fase F (DRL 6 seg.),
pode-se notar que o número de respostas por sessão (mínimo de 23 e máximo de 27)
sofreu um leve aumento em relação à Fase D e a quantidade de reforçadores obtida
também foi maior (mínimo de 17 e máximo de 22), indicando que, o responder
durante a Fase F foi mais ajustado ao esquema vigente do que aquele registrado
durante a Fase D, garantindo assim maior ganho de reforçadores e, evidentemente,
um desempenho ainda mais congruente com o esquema vigente.
Em uma análise geral, pode-se afirmar que P10 apresentou padrões adaptados
às contingências estabelecidas durante todas as Fases experimentais, a exceção da
Fase B.
A figura 3 mostra as médias dos números de respostas (MR) das três últimas
sessões de cada uma das Fases experimentais A (FR 18), B (DRL 6 seg.), C (RF 18),
D (DRL 6 seg. + punição), E (RF 18) e F (DRL 6 seg.) para os participantes P7, P8,
P9 e P10.
De acordo com os dados de P7 pode-se verificar que em todas as Fases onde
prevaleceu o esquema de RF 18 (A, C e E) a média de respostas foi maior do que nas
Fases onde o esquema DRL esteve em vigor (B, D e F). Assim, analisando a
78
transição entre as Fases AB, CD e EF, observa-se que houve uma diminuição no
número de respostas emitido na segunda Fase em relação à primeira, sendo tal
diminuição mais significativa entre as Fases CD e EF.
P7
1500
1000
922
1103,3
901
500
103
0
A
B
24,3
C
D
24,7
E
F
MÉDIAS DO NÚMERO DE RESPOSTAS
P8
1500
1000
1112
986,3
756
500
286,7
23,3
0
A
B
C
D
26,7
E
F
P9
1500
1000
1397,7
1227,3
835,7
500
280
24,7
0
A
B
C
D
30,3
E
F
P10
1000
800
600
400
200
0
913,7
831,7
536,7
169,7
A
B
20,7
C
D
25,7
E
F
FASES EXPERIMENTAIS
Figura 3. Médias do número de respostas das três últimas sessões das Fases
experimentais A (RF 18), B (DRL 6 seg.), C (RF 18), D (DRL 6 seg. + punição),
E (RF 18) e F (DRL 6 seg.) para os participantes P7, P8, P9 e P10.
79
Comparações entre as Fases B (DRL 6 seg.), D (DRL 6 seg. + punição) e F
(DRL 6 seg.) permitem análises adicionais quanto aos efeitos imediatos e posteriores
da inserção da punição enquanto variável que deveria viabilizar ou intensificar
desempenhos sensíveis ao esquema. Comparando as médias apresentadas entre as
Fases BD constata-se que a freqüência de respostas emitida durante a Fase D foi
significativamente menor que aquela apresentada durante a Fase B, o que reporta
para os efeitos de fortalecimento da contingência em vigor exercidos pela operação
de punição. Em outras palavras, a inserção da punição durante a Fase D fez com que
o participante estabelecesse um contato mais preciso com os parâmetros do esquema
em vigor, isto é, diminuísse adequadamente o número de respostas emitido por
sessão a fim de obter os reforçadores disponíveis, desempenho este não observado
durante a Fase B. Já a comparação entre as Fases DF permite a identificação de
valores médios muito próximos para ambas às Fases (24,3 para Fase D e 24,7 para a
Fase F), dado esse indicativo de que a inserção da punição durante a Fase D gerou
efeitos também durante a Fase F. Em função das semelhanças entre os valores
médios apresentados nas Fases D e F, é possível identificar entre as Fases BF
diferenças idênticas àquelas constatadas entre as Fases BD.
Analisando os dados de P8 verifica-se que ao longo das Fases de RF 18 (A, C
e E), o participante demonstrou altas médias de respostas – o que caracteriza um
padrão geral de sensibilidade ao esquema – bem como uma tendência de aumento
em tais médias com o decorrer das Fases, sendo a média em A de 756, em C de
986,3 e em E de 1112 respostas. Em todas essas Fases de RF, P8 apresentou médias
superiores às apresentadas nas Fases de DRL (B, D e F).
A comparação entre as Fases BD evidencia o efeito da punição em
estabelecer um desempenho perfeitamente ajustado ao esquema programado, já que
80
a média de respostas em B é cerca de 12 vezes maior que em D. Isso significa que
mesmo manifestando uma clara diminuição no número de respostas emitido durante
a Fase B em relação às Fases de RF, ainda assim tal diminuição não foi suficiente
para garantir um padrão sensível de desempenho, padrão esse só alcançado na Fase
D via inserção da punição.
Apesar de não existir diferença quanto ao esquema programado entre as
Fases B (DRL 6 seg.) e F (DRL 6 seg.), o que se pode constatar é uma sensível
diminuição na taxa média de respostas apresentada em F (26,7) em relação a B
(286,7). A explicação para tal diferença encontra-se na comparação entre as Fases
DF e na conseqüente constatação de taxas médias de respostas muito próximas,
indicando que o efeito de sensibilização exercido pela punição durante a Fase D
(média de 23,3 respostas) estendeu-se para a Fase F.
De acordo ainda com a Figura 3, pode-se observar que para P9 a comparação
entre as Fases AB, CD e EF é também marcada por uma acentuada diminuição na
média de respostas na segunda Fase em relação à primeira, sendo tal diminuição
mais significativa entre as Fases CD e EF. Dessa forma, em todas as Fases onde o
esquema de RF 18 vigorou (A, C e E) a média de respostas foi superior em relação
às Fases onde o esquema de DRL foi programado (B, D e F), indicando assim um
padrão de sensibilidade quanto ao primeiro esquema.
As diferenças entre as médias de respostas entre B (DRL 6 seg.) e D (DRL 6
seg. + punição) permite novamente apontar para a inserção da punição como um
elemento de fortalecimento do esquema em vigor, visto que na Fase D a média de
respostas (24,7) foi cerca de 11 vezes menor que em B (280) e muito mais próxima
do valor ideal para o esquema (30 respostas).
81
A comparação entre as Fases DF permite constatar que uma taxa média muito
próxima àquela estabelecida na Fase D manteve-se durante a Fase F (30,3),
indicando a manutenção de um desempenho sensível durante a última Fase, mesmo
na ausência de elementos fortalecedores do esquema em vigor. Em função da
semelhança no número médio de respostas entre as Fases DF, as diferenças
identificadas entre as Fases BF são semelhantes àquelas já apontadas entre BD.
O padrão geral de desempenho de P10 não diferiu dos outros participantes.
Em todas as Fases de FR 18 (A, C e E) sua taxa média de respostas foi superior em
relação às Fases dos esquemas de DRL. Portanto, nas comparações entre as Fases
AB, CD e EF constata-se diminuição na taxa média de respostas na segunda Fase em
relação à primeira, sendo tal diminuição mais significativa entre as Fases CD e EF.
Em uma comparação entre as Fases BD novamente se constata uma
diminuição acentuada na taxa média de D (20,7) em relação à B (169,7), sugerindo a
eficácia da punição em gerar padrões mais ajustáveis ao esquema estabelecido.
Também para P10 a comparação entre as Fases DF permite a identificação de médias
de respostas muito semelhantes e próximas ao valor ideal (30 respostas), sendo que
um desempenho perfeitamente adequado ao esquema pode ser observado durante a
Fase F (com média de 25,7 respostas). Embora nenhuma diferença tenha sido
programada entre o esquema estabelecido (DRL 6 seg.) nas Fases B e F, pode ser
constatada diferença significativa entre os valores médios apresentados em ambas as
Fases (a média em B foi de 169,7 e em F de 25,7), dado esse que evidencia a
possibilidade de que a inserção da punição durante a Fase D tenha gerado
conseqüências que se mantiveram durante a Fase posterior F.
82
Discussão
De acordo com os resultados apresentados é possível afirmar que para todos
os participantes, as médias de respostas nas Fases do esquema de RF 18 (Fases A, C
e E), foram superiores àquelas apresentadas nas Fases do esquema DRL 6 seg. (B, D
e F). Dessa forma, pode-se dizer que os participantes desempenharam-se
adequadamente durante a exposição ao primeiro esquema, isto é, demonstraram
padrões caracterizados por altas taxas de respostas positivamente correlacionadas
com ganhos elevados de pontos. Tal fato é indicativo de desempenhos sensíveis, ou
seja, claramente controlados pelo esquema programado.
Torna-se necessário destacar que todos os participantes – menos P7 na
comparação entre as Fases AC – aumentaram suas taxas de respostas nas Fases C e E
em relação à Fase A. Soma-se a isso o fato de que todos atingiram desempenhos
ainda mais estáveis e em acordo com o esquema de RF 18 durante a última Fase de
exposição ao mesmo (Fase E). Já que não foram inseridas variáveis diferenciais entre
essas Fases, tal resultado aponta para a possibilidade de que a exposição continuada
ao esquema se constitua como uma variável que favoreça desempenhos cada vez
mais ajustados, isto é, as próprias condições experimentais podem ter propiciado o
desenvolvimento de uma história de exposição ao esquema que tenha, à medida que
as Fases se sucediam, facilitado uma adequação comportamental em relação a este.
Já em relação ao esquema de DRL 6 seg., apesar de terem diminuído o
número de respostas emitido durante a primeira exposição a esse esquema (Fase B)
em relação ao esquema de razão que vigorou previamente (Fase A), tal diminuição
não foi significativa a ponto de gerar desempenhos suficientemente ajustáveis que
pudessem ser classificados como padrões sensíveis. Os participantes P7, P8 e P10
83
tiveram seus desempenhos caracterizados por alta variabilidade e baixa obtenção de
reforçadores, isto é, demonstraram uma lacuna de ajustamento entre o responder
apresentado e aquele que estaria correlacionado com a obtenção dos reforçadores
programados, enquanto os dados de P9 sinalizam a possibilidade de que um
desempenho mais sensível poderia ser atingido, caso o número de sessões fosse
estendido.
Quando a punição é incluída durante a Fase D, no entanto, todos os
participantes passam a apresentar desempenhos perfeitamente ajustados ao esquema
em vigor (DRL 6 seg. + punição), caracterizados pela apresentação de baixo número
de respostas acompanhado por ganhos regulares ou altos de pontos. Como no
Experimento 1, fica novamente evidenciado os efeitos de certas manipulações
experimentais – no caso do presente estudo, a inclusão da punição – em gerar
padrões de desempenho sensíveis às contingências estabelecidas.
Os resultados obtidos quanto à exposição à Fase F (DRL 6 seg.), no entanto,
constituem-se nos dados mais importantes para o objetivo do Experimento 2, que foi
verificar se a exposição prévia a uma condição que favorecesse o contato com o
esquema em vigor, via punição de respostas inadequadas que levariam a perda de
pontos, seria eficiente para estabelecer responder adequado em uma Fase posterior,
com sinais claros de discriminação do esquema em vigor. A questão chave, portanto,
foi a de verificar se a sensibilidade comportamental persistiria após a retirada da
punição. Durante a Fase F, um padrão estável de desempenho é demonstrado por
parte de todos os participantes a partir da primeira (P7), da segunda (P9 e P10) ou da
terceira sessão (P8). Uma vez estabelecido esse desempenho adequado ao esquema,
caracterizado
pela
emissão
de
taxas
baixas
de
respostas
perfeitamente
correlacionadas com ganho de pontos, este se manteve de forma regular, com
84
variabilidade mínima entre os parâmetros analisados. Deve ser destacado que alguns
participantes (P7, P9 e P10) apresentaram durante essa Fase um padrão geral de
respostas ainda mais adequado – isto é, relacionado com maior obtenção dos
reforçadores programados – que aquele apresentado durante a Fase D, quando a
operação de punição foi inserida.
Pode-se concluir, portanto, que os desempenhos sensíveis da Fase D não se
mantiveram sob controle exclusivo da perda de pontos programada, de tal forma que
quando esta foi retirada na Fase F, o esquema de DRL exerceu controle efetivo sobre
o desempenho. É como se a punição tivesse informado os participantes quanto às
condições características do esquema em vigor e quanto à discrepância de seus
desempenhos em relação a tais condições, possibilitando aos mesmos, a partir de
então, desempenharem-se adequadamente em situações semelhantes. Dessa forma,
ficam evidenciados os efeitos da operação de punição não só em gerar ou intensificar
padrões sensíveis de desempenho aos esquemas programados, como também, em
manter tais padrões em situações posteriores e similares.
85
Discussão Geral
Vários foram os aspectos levantados na parte introdutória deste trabalho
como estando possivelmente relacionados a uma discussão sobre sensibilidade de
desempenhos humanos a esquemas de reforçamento. Assim, foi apontado que alguns
autores consideram as instruções como variáveis críticas no controle da sensibilidade
às contingências do esquema (Harzem e cols., 1978) e que a insensibilidade seria
uma característica definidora das instruções (Matthews e cols., 1977; Shimoff e
cols., 1981).
Já outros autores sugerem que o controle instrucional seria uma função de sua
correlação com as contingências de reforçamento (Ayllon & Azrin, 1964; Buskist &
Miller, 1986; Galizio, 1979), com contingências fracas (Cerutti, 1989), ou com falta
de controle pelas contingências (Torgrud & Holborn, 1990) e, ainda, que as
instruções seriam seguidas a menos que o responder do sujeito contactasse com
contingências incongruentes (Albuquerque e cols., 2004; Baron & Galizio, 1983;
Buskist & Miller, 1986; Galizio, 1979; Paracampo e cols., 1993; Weiner, 1970).
Outros autores se dedicaram à investigação dos efeitos de auto-regras sobre a
sensibilidade do responder humano (Catania e cols., 1989; Perone, 1988; Pouthas e
cols., 1990; Rosenfarb e cols., 1992; Shimoff, 1986) e aspectos diferentes dos
citados ainda foram explorados por outros pesquisadores (Buskist e cols., 1981;
Joyce & Chase, 1990; DeGrandpre & Buskist, 1991; Newman e cols., 1994).
Os resultados do presente estudo (Experimento 1) demonstraram o papel do
contato com a discrepância entre o desempenho mantido e o desempenho realmente
exigido pelo esquema em enfraquecer padrões insensíveis.
86
A eliminação da insensibilidade comportamental ocorreu somente quando o
comportamento insensível levou os participantes a entrarem em contato com uma
contingência de perda de pontos, sendo tal contato suficiente para gerar a
discriminação
de
características
relevantes
do
esquema
em
vigor
e,
conseqüentemente, um responder mais sensível.
Tais resultados estão de acordo com as colocações de Baron & Galizio, 1983;
Buskist e Miller (1986), DeGrandpre e Buskist (1991), Galizio (1979), Otto,
Torgrud, & Holborn, 1999, Torgrud & Holborn (1990) segundo as quais a
insensibilidade comportamental seria um resultado de falhas em contactar com
alguns aspectos das contingências, cujo controle seria deficitário, e que seria mais
provável tal insensibilidade ser mantida quando as conseqüências colaterais do
responder fossem fracas (Cerutti, 1989).
Quando a punição foi inserida e desempenhos inadequados passaram a ser
punidos com perda de pontos – fortalecendo assim a contingência em vigor e
forçando o contato do responder do participante com tal contingência – tais
desempenhos foram rapidamente eliminados.
A eliminação desses desempenhos permaneceu durante nova exposição ao
esquema quando a punição não mais estava presente (Experimento 2). Esse achado é
particularmente importante à medida que mostra que padrões de insensibilidade
podem ser alterados, talvez até irreversivelmente, após exposição a uma condição
que estabeleça sensibilidade, isto é, controle do comportamento pelo esquema
(Galizio, 1979).
Assim, ao contrário do que defende alguns autores (e.g., Matthews e cols.,
1977; Shimoff e cols., 1981), a insensibilidade não pode ser considerada somente
uma propriedade inerente a respostas instruídas, mas sim, um resultado de
87
contingências fracamente estabelecidas. Dessa forma, talvez o foco de análise tenha
que ser dirigido para o fato de que a partir do momento em que o desempenho passa
a estabelecer contato efetivo com os parâmetros do esquema programado, a
insensibilidade tende a desaparecer (Galizio, 1979). Esse fato destaca o papel das
características
dos
esquemas
vigentes
em
uma
discussão
sobre
sensibilidade/insensibilidade comportamental (Torgrud & Holborn, 1990).
Apesar de não ter sido diretamente manipulada, a história de reforçamento
(DeGrandpre & Buskist, 1991) também foi uma variável de destaque no presente
experimento.
Os dados permitiram constatar que a forma como as Fases experimentais
foram organizadas permitiu aos participantes o desenvolvimento de uma história
experimental que facilitou a adaptação do desempenho às contingências que
vigoravam nas últimas Fases. Provavelmente a exposição alternada aos esquemas
também tenha contribuído para a discriminação de características relevantes dos
mesmos.
Algumas considerações sobre o procedimento utilizado no presente estudo
merecem destaque. Foi dito que a definição dos parâmetros de número de resposta
(18) no esquema de RF e tempo (6 segundos) no esquema de DRL foi baseada em
Hayes e cols. (1986b) e que a especificação de tais parâmetros foi uma tentativa de
equilibrar o número de reforçadores obtidos em cada sessão realizada com os
diferentes esquemas de reforçamento.
Assim, esperava-se que em uma sessão de 3 minutos de RF 18 a quantidade
de reforçadores obtida fosse equivalente à quantidade obtida em uma sessão de 3
minutos de DRL 6 seg, considerando desempenhos sensíveis aos esquemas. No
entanto, foi constatado que a definição de tais parâmetros foi falha, visto que, todos
88
os participantes podiam atingir quantidades muito maiores de pontos durante o
esquema de RF 18 do que durante o esquema de DRL 6 seg. Tal fato ocorreu em
função de ser o número de reforçadores obtidos durante o primeiro esquema
dependente do ritmo de respostas do participante, permitindo assim grandes
variações nos valores obtidos (P9, por exemplo, chegou a ganhar 80 pontos em única
sessão). O mesmo não ocorreu em relação ao segundo esquema, já que a liberação de
reforçadores era controlada pela passagem do tempo, sendo 30 o máximo possível de
pontos passíveis de serem conquistados em uma única sessão. A fim de nivelar a
quantidade de reforçadores liberados em ambos os esquemas o ideal seria que o
esquema de RF tivesse seu valor aumentado.
Também se esperava que com a realização de 6 sessões em cada fase fosse
possível atingir um padrão estável de respostas para, na seqüência, submeter o
participante à fase seguinte. Muitos participantes, no entanto, não demonstraram um
padrão regular de respostas no momento em que foram realizadas transições de fase,
demonstrando certa instabilidade nos últimos valores de número de respostas
apresentados no final de cada fase.
A adoção de critérios para se definir um estado estável de desempenho,
diferentemente do critério adotado baseado no número de sessões, deveria ter sido
definida para o presente estudo. Um exemplo seria considerar que mudanças de fases
seriam realizadas somente quanto o participante apresentasse uma variabilidade
inferior a 10% entre os números de respostas apresentados nas três últimas sessões
realizadas. Infelizmente, questões baseadas no tempo e na necessidade de manter o
participante até o final do experimento não possibilitaram que critérios dessa
natureza, que sem dúvida poderiam estender demasiadamente o número de sessões
realizadas, fossem aplicados no presente estudo.
89
Finalmente, considerando que exista uma correlação entre desempenhos em
situações de laboratório e padrões comportamentais que ocorram em situações
naturais, o presente trabalho procurou, via realização de pesquisa básica, contribuir
para a identificação de variáveis controladoras da sensibilidade comportamental a
esquemas de reforçamento, representando assim mais um passo significativo no
acúmulo do conhecimento necessário para se propor estratégias de modificação do
comportamento e intervenções no ambiente clínico.
90
Referências Bibliográficas
Abreu-Rodrigues, J., & Sanabio, E. T. (no prelo). Instruções e auto-instruções:
Contribuições da pesquisa básica. Em C. N. de Abreu & H. J. Ghilhardi (Orgs.),
Manual prático de técnicas em psicoterapia comportamental, cognitiva e
construtivista. São Paulo: Editora Roca.
Albuquerque (2001). Definições de regras. Em H. J. Guilhardi, M. B. B. P. Madi, P.
P. Queiroz, & M. C. Scoz (Orgs.), Sobre Comportamento e Cognição – Expondo a
variabilidade (pp. 132-140). Santo André: ESETec.
Albuquerque (1998). Efeitos de histórias experimentais sobre o seguimento
subseqüente de regras. Tese de doutorado, Instituto de Psicologia, Universidade de
São Paulo.
Albuquerque, L. C. de, de Souza, D. G., Matos, M. A., & Paracampo, C. C. P.
(2003). Análise dos efeitos de histórias experimentais sobre o seguimento
subseqüente de regras. Acta Comportamentalia, 11 (1), 87-126.
Albuquerque, L. C. de, & Ferreira, K. V. D. (2001). Efeitos de regras com diferentes
extensões sobre o comportamento humano. Psicologia: Reflexão e Crítica, 14 (1),
143-155.
Albuquerque, L. C. de, Matos, M. A., de Souza, D. G., & Paracampo, C. C. P.
(2004). Investigação do controle por regras e do controle por histórias de reforço
sobre o comportamento humano. Psicologia: Reflexão e Crítica, 17 (3), 395-412.
Albuquerque, L. C. de, Santos, A. C. S., Silva, F. M., Mendonça, P. S. M., Queiroz,
T. M. M., & Silva, W. C. M. P. (1993). Análise do papel das conseqüências
91
programadas no seguimento de regras. Anais da 45ª Reunião Anual da Sociedade
Brasileira para o Progresso da Ciência, p. 903.
Albuquerque, N. M. A. de, Paracampo, C. C. P., & Albuquerque, L. C. de (2004).
Análise do papel de variáveis sociais e de conseqüências programadas no
seguimento de instruções. Psicologia: Reflexão e Crítica,17 (1), 31-42.
Ayllon, T., & Azrin, N. H. (1964). Reinforcement and instructions with mental
patients. Journal of the Experimental Analysis of Behavior, 7 (4), 327-331.
Baron, A., & Galizio, M. (1983). Instructional control of human operante behavior.
The Psychological Record, 33, 495-520.
Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e
cultura. Porto Alegre: ARTMED.
Bentall, R. P., Lowe, C. F., & Beasty, A. (1985). The role of verbal behavior in
human learning: II. Developmental differences. Journal of the Experimental Analysis
of Behavior,43 (2), 165-181.
Braam, C., & Malott, R. W. (1990). “I'll do it when the snow melts”: The effects of
deadlines and delayed outcomes on rule-governed behavior in preschool children.
The Analysis of Verbal Behavior, 8, 67-76.
Buskist, W. F., Bennett, R. H., & Miller Jr., H. L. (1981). Effects of instructional
constraints on human fixed-interval performance. Journal of the Experimental
Analysis of Behavior, 35 (2), 217-225.
92
Buskist, W. F., & Miller Jr., H. L. (1986). Interaction between rules and
contingencies in the control of human fixed-interval performance. The Psychological
Record, 36, 109-116.
Castanheira, S. dos S. (2001). Regras e aprendizagem por contingência: Sempre e em
todo lugar. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, & M. C. Scoz
(Orgs.), Sobre comportamento e cognição – Expondo a variabilidade (pp. 36-46).
Santo André: ESETec.
Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. Porto
Alegre: ARTMED.
Catania, A. C. (1989). Rules as classes of verbal behavior: A reply to Glenn. The
Analysis of Verbal Behavior, 7, 49-50.
Catania, A. C., Matthews, B. A., & Shimoff, E. (1982). Instructed versus shaped
human verbal behavior: Interactions with nonverbal responding. Journal of the
Experimental Analysis of Behavior, 38 (3), 233-248.
Catania, A. C., Matthews, B. A., & Shimoff, E. (1990). Properties of rule-governed
behavior and their implications. In D. E. Blackman & H. Lejeune (Orgs.), Behaviour
analysis in theory and practice: Contribuitions and controversies (pp. 215-230).
Erlbaum: Hilsdale.
Catania, A. C., Shimoff, E., & Matthews, B. A. (1989). An experimental analysis of
rule-governed behavior. In S. C. Hayes (Ed.), Rule-governed behavior: Cognition,
contingencies, and instructional control (pp. 119-150). New York: Plenum Press.
93
Cerutti, D. T. (1994). Compliance with instructions: Effects of randomness in
scheduling and monitoring. The Psychological Record, 44, 259-269.
Cerutti, D. T. (1989). Discrimination theory of rule-governed behavior. Journal of
the Experimental Analysis of Behavior, 51 (2), 259-276.
Cerutti, D. T. (1991). Discriminative versus reinforcing properties of schedules as
determinants of schedule insensitivity in humans. The Psychological Record, 41, 5167.
Danforth, J. S., Chase, P. N., Dolan, M., & Joyce, J. H. (1990). The establishment of
stimulus control by instructions and by differential reinforcement. Journal of the
Experimental Analysis of Behavior, 54 (2), 97-112.
DeGrandpre, R. J., & Buskist, W. F. (1991). Effects of accuracy of instructions on
human behavior: correspondence with reinforcement contingencies matters. The
Psychological Record, 41, 371-384.
Dermer, M. L., & Rodgers, J. G. (1997). Schedule control over following
instructions comprised of novel combinations of verbal stimuli. The Psychological
Record, 47, 243-260.
Dixon, M. R. (2000). Manipulating the illusion of control: Variations in gambling as
a function of perceived control over change outcomes. The Psychological Record,50,
705-719.
Dixon, M. R., Hayes, L. J., & Aban, I. B. (2000). Examining the roles of rulefollowing, reinforcement, and preexperimental histories on risk-taking behavior. The
Psychological Record,49, 687-705.
94
Dixon, M. R., & Hayes, L. J. (1998). Effects of differing instructional histories on
the resurgence of rule-following. The Psychological Record,48, 275-292.
Galizio, M. (1979). Contingency-shaped and rule-governed behavior: Instructional
control of human loss avoidance. Journal of the Experimental Analysis of Behavior,
31(1), 53-70.
Glenn, S. G. (1987). Rules as environmental events. The Analysis of Verbal
Behavior,5, 29-32.
Hackenberg, T. D., & Joker, V. R. (1994). Instructional versus schedule control of
humans’ choices in situations of diminishing returns. Journal of the Experimental
Analysis of Behavior,62 (3), 367-383.
Harzem, P., Lowe, C. F., & Bagshaw, M. (1978). Verbal control in human operant
behavior. The Psychological Record, 28, 405-423.
Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986a).
Instructions, multiple schedules, and extinction: Distinguishing rule-governed from
schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46
(2), 137-147.
Hayes, S. C., Brownstein, A. J., Zettle, R. D., Rosenfarb, I., & Korn, Z. (1986b).
Rule-governed behavior and sensitivity to changing consequences of responding.
Journal of the Experimental Analysis of Behavior, 45 (3), 237-256.
Hojo, R. (2002). Effects of instructional accuracy on a conditional discrimination
task. The Psychological Record, 52, 493-506.
95
Joyce, J. H., & Chase, P. N. (1990). Effects of response variability on the sensitivity
of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 54 (3),
251-262.
Kaufman, A., Baron, A., & Kopp, R. E. (1966). Some effects of instructions on
human operant behavior. Psychonomic Monograph Supplements, 1, 243-250.
Kerr, K. P. F., & Keenan, M. (1997). Rules and rule-governance: New directions in
the theoretical and experimental analysis of human behaviour. In K. Dillenburger,
M. F. O’Reilly, & M. Keenan (Eds.), Advances in behaviour analysis (pp. 205-226).
Dublin: University College Dublin Press.
LeFrancois, J. R., Chase, P. N., & Joyce, J. H. (1988). The effects of a variety of
instructions on human fixed-interval performance. Journal of the Experimental
Analysis of Behavior, 49, 383-393.
Madden, G. J., Chase, P. N., & Joyce, J. H. (1998). Making sense of sensitivity in
the human operant literature. The Behavior Analyst,21 (1), 1-12.
Martinez, H., & Ribes, E. (1996). Interactions of contingencies and instructional
history on conditional discrimination. The Psychological Record, 46, 301-318.
Matos, M. A. (2001). Comportamento governado por regras. Revista Brasileira de
Terapia Comportamental e Cognitiva, III, 51-66.
Matthews, B. A., Catania, A. C., & Shimoff, E. (1985). Effects of uninstructed
verbal behavior on nonverbal responding: Contingency descriptions versus
performance descriptions. Journal of the Experimental Analysis of Behavior,43 (2),
155-164.
96
Matthews, B. A., Shimoff, E., Catania, A. C., & Sagvolden, T. (1977). Uninstructed
human responding: Sensitivity to ratio and interval contingencies. Journal of the
Experimental Analysis of Behavior, 27(3), 453-467.
Meyer, S. B. (2005). Regras e auto-regras no laboratório e na clínica. Em J. AbreuRodrigues & M. R. Ribeiro (Orgs.), Análise do Comportamento – Pesquisa, Teoria e
Aplicação (pp. 211-. Porto Alegre: ARTMED.
Newman, B., Buffington, D. M., & Hemmes, N. S. (1995). The effects of schedules
of reinforcement on instruction following. The Psychological Record, 45, 463-476.
Newman, B., Hemmes, N. S., Buffington, D. M., & Andreopoulos, S. (1994). The
effects of schedules of reinforcement on instruction-following in human subjects
with verbal and nonverbal stimuli. The Analysis of Verbal Behavior, 12, 31-41.
Nico, Y. (1999). Regras e insensibilidade: conceitos básicos, algumas considerações
teóricas e empíricas. Em R. R. Kerbauy, & R. C. Wielenska (Orgs.), Sobre
comportamento e cognição – Psicologia comportamental e cognitiva – Da reflexão
teórica à diversidade na aplicação (pp. 31-39). Santo André: ARBytes.
Ono, K. (1994). Verbal control of superstitious behavior: Superstitious as false rules.
In S. C. Hayes, L. J. Hayes, M. Sato and K. Ono (Eds.), Behavior Analysis of
Language and Cognition (pp. 181-196). Reno (NV): Context Press.
Otto, T. L., Torgrud, L. J., & Holborn, S. W. (1999). An operant blocking
interpretation
of
instructed
insensitivity
Psychological Record,49, 663-684.
to
schedule
contingencies.
The
97
Paracampo, C. C. P. (1991). Alguns efeitos de estímulos antecedentes verbais e
reforço programado no seguimento de regras. Psicologia: Teoria e Pesquisa, 7 (2),
149-161.
Paracampo, C. C. P., Albuquerque, L. C. de, & Fontes, J. C. S. (1993). Análise de
algumas das variáveis responsáveis pela manutenção do seguimento de regras. Anais
da 45ª Reunião anual da Sociedade Brasileira para o Progresso da ciência, Vol. 3,
p. 984.
Paracampo, C. C. P., de Souza, D. G., Matos, M. A., & Albuquerque, L. C. de
(2001). Efeitos de mudança em contingências de reforço sobre o comportamento
verbal e não verbal. Acta Comportamentalia, 9 (1), 31-55.
Perone, M. (1988). Laboratory lore and research practices in the experimental
analysis of human behavior: Use and abuse of subject’s verbal reports. The Behavior
Analyst, 11, 71-75.
Pouthas, V., Droit, S., Jacquet, A. Y., & Wearden, J. H. (1990). Temporal
differentiation of response duration in children of different ages: developmental
changes in relations between verbal and nonverbal behavior. Journal of the
Experimental Analysis of Behavior, 53 (1), 21-31.
Raia, C. P., Shillingford, S. W., Miller Jr., H. L. , & Baier, P. S. (2000). Interaction
of procedural factors in human performance on yoked schedules. Journal of the
Experimental Analysis of Behavior, 74 (3), 265-281.
98
Reese, H. W. (1989). Rules and rule-governance: Cognitive and behavioristic views.
In S. C. Hayes (Ed.), Rule-governed behavior: Cognition, contingencies and
instructional control (pp. 3-84). New York: Plenun Press.
Ribes, E., & Rodriguez, M. E. (2001). Correspondence between instructions,
performance, and self-descriptions in a conditional discrimination task: The effects
of feedback and type of matching response. The Psychological Record, 51, 309-333.
Rosenfarb, I. S., Newland, M. C., Brannon, S. E., & Howey, D. S. (1992). Effects of
self-generated rules on the development of schedule-controlled behavior. Journal of
the Experimental Analysis of Behavior, 58 (1), 107-121.
Santos, J. G. W., Paracampo, C. C. P., & Albuquerque, L. C. de (2004). Análise dos
efeitos de histórias de variação comportamental sobre o seguimento de regras.
Psicologia, Reflexão e Crítica, 17 (3), 413-425.
Schlinger, H. D. Jr., & Blakely, E. (1987). Function-altering effects of contingencyspecifying stimuli. The Behavior Analyst,10, 41-45.
Schmitt, D. R. (1998). Effects of consequences of advice on patterns of rule control
and rule choice. Journal of the Experimental Analysis of Behavior, 70 (1), 1-21.
Shimoff, E. (1986). Post-session verbal reports and the experimental analysis of
behavior. The Analysis of Verbal Behavior, 4, 19-22.
Shimoff, E., Catania, A. C., & Matthews, B. A. (1981). Uninstructed human
responding: Sensitivity of low-rate performance to schedule contingencies. Journal
of the Experimental Analysis of Behavior, 36 (2), 207-220.
99
Shimoff, E., Matthews, B. A., & Catania, A. C. (1986). Human operant performance:
sensitivity and pseudosensitivity to contingencies. Journal of the Experimental
Analysis of Behavior, 46 (2), 149-157.
Simonassi, L. E., Fróes, A. C., Sanabio, E. T. (1995). Contingências e regras:
Considerações sobre comportamentos conscientes. Estudos (Goiânia), 22, 71-82.
Simonassi. L. E., Oliveira, C. I., & Gosch, C. S. (1997). Exposição a contingências,
conteúdo de instrução e formulação de regras. Psicologia: Teoria e Pesquisa, 13 (2),
189-195.
Simonassi, L. E., Oliveira, C. I., Sanabio, E. T. (1994). Descrição sobre possíveis
relações entre contingências programadas e formulação de regras. Estudos
(Goiânia), 21 (3/4), 97-112.
Skinner, B. F. (1974). About behaviorism. New York: Alfred A. Knopf.
Skinner, B. F. (1966). An operant analysis of problem solving. In B. Kleinmuntz
(Ed.), Problem solving: Research, method, teaching (pp. 225-257). New York:
Wiley.
Skinner, B. F. (1969). Contingencies of Reinforcement: A theoretical analysis. New
York: Appleton-Century-Crofts.
Torgrud, L. J., & Holborn, S. W. (1990). The effects of verbal performance
descriptions on nonverbal operant responding. Journal of the Experimental Analysis
of Behavior,54 (3), 273-291.
100
Vaughan, M. E. (1985). Repeated acquisition in the analysis of rule-governed
behavior. Journal of the Experimental Analysis of Behavior, 44 (2), 175-184.
Weiner, H. (1970). Instructional control of human operant responding during
extinction following fixed-ratio conditioning. Journal of the Experimental Analysis
of Behavior, 13 (3), 391-395.
Wulfert, E., Greenway, D. E., Farkas, P., Hayes, S. C., & Dougher, M. J. (1994).
Correlation between self-reported rigidity and rule-governed insensitivity to operant
contingencies. Journal of Applied Behavior Analysis,27, 659-671.
Zettle, R. D. (1990). Rule-governed behavior: A radical behavioral answer to the
cognitive challenge. The Psychological Record,40, 41-49.
101
ANEXO 1
Termo de Consentimento Livre e Esclarecido
102
Universidade Católica de Goiás
Vice-Reitoria de Pós-Graduação e Pesquisa
Departamento de Psicologia
Mestrado em Psicologia
Laboratório de Análise Experimental do Comportamento (LAEC)
Termo de Consentimento Livre e Esclarecido
(Em acordo às Normas da resolução 196/96 do Conselho Nacional de Saúde – MS)
Prezado Participante,
Estamos realizando uma pesquisa científica com o objetivo de investigar
variáveis que afetam processos comportamentais. Esta pesquisa envolve a aplicação
de um procedimento desenvolvido em computador. A sua tarefa consiste em tocar o
círculo central que aparecerá na tela do computador; não necessitando utilizar mouse
ou teclado. Em alguns momentos você ganhará pontos e em outros perderá. Sua
participação na pesquisa terá duração máxima de 4 (quatro) horas, distribuídas em 8
(oito) encontros.
Este experimento estará sendo realizado a partir do primeiro semestre de
2005, em período acordado com você. Essa pesquisa será realizada e coordenada
pela aluna de mestrado da UCG Sandra de Araújo Álvares, juntamente com o
professor Dr. Lorismário E. Simonassi.
Você poderá recusar-se a participar da pesquisa ou dela afastar-se em
qualquer momento, sem que este fato venha lhe causar qualquer constrangimento ou
penalidade por parte da instituição. Sua participação também poderá ser
interrompida a qualquer tempo, por razões técnicas, quando, então, lhe serão
fornecidas todas as explicações necessárias.
Os investigadores se obrigam a não revelar a sua identidade em qualquer
publicação resultante deste estudo. É extremamente importante que você mantenha
sigilo sobre o procedimento experimental, até que o projeto seja finalizado. A
duração prevista para o desenvolvimento de todo o projeto é de, aproximadamente, 6
meses. Ao final do experimento será realizada uma reunião com a participação
voluntária de todos os participantes com o objetivo de prestar informações a respeito
dos resultados obtidos e, também, responder às questões levantadas pelos mesmos.
Antes de assinar este termo, você deverá informar-se plenamente sobre o
mesmo, não hesitando em formular perguntas sobre qualquer aspecto que julgar
conveniente esclarecer. É importante estar ciente das seguintes informações:
1-Os resultados deste estudo poderão nos ajudar a conhecer melhor os efeitos
de certas variáveis sobre o comportamento humano;
2-Você poderá ganhar pontos podendo assim trocá-los por dinheiro;
3-Não existirão quaisquer ônus em relação à sua participação e nenhum risco
à sua integridade física e psicológica.
4-Caso necessário você poderá se comunicar com a pesquisadora Sandra de
Araújo Álvares, pelo telefone (62) 261-8932 ou (62) 9924-7372.
103
Agradecemos antecipadamente sua colaboração.
______________________________________
Sandra de Araújo Álvares
Mestranda em Psicologia
_____________________________________
Lorismário E. Simonassi
Profº. Dr. da Universidade Católica de Goiás
Concordo em participar do projeto de pesquisa explicitado acima.
Nome do voluntário:_____________________________________________
(LETRA DE FORMA)
CPF:_________________________________
RG:__________________________________
Assinatura do voluntário:__________________________
OBSERVAÇÃO: Este Termo de Consentimento Livre e Esclarecido está
apresentado em duas cópias, das quais uma ficará com o voluntário da
pesquisa.
Goiânia, ______de__________________ de 2005.