Reforço

Propaganda
2. Condicionamento operante ou
instrumental:
Os comportamentos são mantidos pelas
suas consequências.
E.g. Thorndike (experiências com gatos) e Skinner (experiências com
ratos e pombos).
1
PUZZLE-BOX (THORNDIKE)
2
CAIXA DE SKINNER
3
CONCEITOS IMPORTANTES
• Reforço: aumenta a probabilidade de ocorrência de
certos acontecimentos:
– No condicionamento operante o reforço acompanha o acto.
– Comportamento é reforçado pelas consequências que se lhe seguem.
O que serve de reforço varia de indivíduo para
indivíduo e no mesmo indivíduo varia com o
momento.
4
REFORÇO POSITIVO
•
Sempre que está presente a consequência do
comportamento.
• Positivo não significa, necessariamente, “agradável”
mas apenas que a consequência está presente.
• A consequência pode ser desagradável mas reforçar o
comportamento.
5
REFORÇO NEGATIVO
• Sempre que a supressão da consequência aumenta a
probabilidade de ocorrência do comportamento, ou seja,
é reforçado o comportamento que evita consequências
desagradáveis.
•
Tipos de reforço negativo:
– Condicionamento de fuga
– Condicionamento de evitação
6
O Reforço pode ainda ser:
Intrínseco - comportamento reforça-se por si mesmo
Extrínseco - recompensas não fazem parte do comportamento
- Primário – comportamento espontâneos
- Secundário ou Social – comportamentos aprendidos
Permanente – reforço acompanha todas as respostas correctas
Intermitente ou Parcial – reforço acompanha apenas algumas respostas
correctas
7
Num mesmo comportamento podem combinar-se diferentes
reforçadores.
→ Os estudos mostram que quando se pretende ensinar um
comportamento novo, o uso do reforço permanente é mais eficaz.
→ Em comportamentos habituais que se pretendem manter é mais
eficaz o reforço intermitente ou parcial.
Assim é desejável para o ensino do comportamento operante a
combinação:
Reforço Contínuo
Reforço Intermitente
8
Dentro do Condicionamento Operante existem 4 programas parciais
básicos:
I. PROGRAMAS DE RAZÃO
Programa de razão fixa
O reforço ocorre após um nº definido e invariável de respostas correctas.
Programa de razão variável
O reforço ocorre após um nº variável de respostas correctas.
9
II. PROGRAMAS DE INTERVALO
O aparecimento do reforço depende da passagem do tempo.
Programa de intervalo fixo
O período de tempo entre os reforços é constante.
Programa de intervalo variável
O período de tempo entre os diferentes reforços varia aleatoriamente
em redor de um valor médio.
10
Conclusão:
i) Os programas de razão tendem a produzir uma
percentagem global de respostas ligeiramente
mais elevada que os de intervalo;
ii) Os programas variáveis produzem poucas pausas
enquanto que os programas fixos produzem
pausas mais longas, mas previsíveis (após o
reforço).
iii) Assim, normalmente estes programas combinamse entre si
11
CONCEITOS IMPORTANTES
• PUNIÇÃO:
ocorre quando um comportamento específico é acompanhado por
uma consequência que reduz a sua frequência em situações
semelhantes.
TIPOS DE PUNIDORES:
– Positivos ou Negativos – consoante se apresente o
acontecimento consequente ou se suprima o adie o reforço que
acompanha o comportamento;
– Físicos ou Psicológicos
– Punidores Potenciais – a consequência
procedimento aversivo não é bem conhecido
ou
efeitos
do
– Intrínsecos ou Extrínsecos
12
PUNIÇÃO = REFORÇO
→ Elimina o comportamento;
Mantêm o comportamento;
→ Enfraquece a probabilidade
de manter uma resposta.
Aumenta a probabilidade de
manter uma resposta.
• Aquilo que funciona como punidor varia de indivíduo para
indivíduo.
• O que para um indivíduo é punidor para outro pode ser
um reforço.
•Por vezes as punições passam a reforços.
13
OUTROS CONCEITOS
1. Aquisição
2. Modelagem
3. Extinção
4. Recuperação espontânea
5. Generalização
6. Discriminação
14
CONDICIONAMENTO
CLÁSSICO
CONDICIONAMENTO
OPERANTE
PROCESSO DE
APRENDIZAGEM
-Os actos são desencadeados por
acontecimentos imediatamente
antecedentes.
- Os comportamentos são mantidos pelas
suas consequências.
REFORÇO
- Precede o acto.
- Acompanha ou segue-se ao acto.
MÉTODO
- O acto é reforçado combinando-se
inicialmente estímulos neutros e
incondicionados.
- O acto é reforçado pelas consequências
que se lhe seguem.
AQUISIÇÃO
- Aparecimento da resposta condicionada
por combinações do estímulo
incondicionado com o estímulo
condicionado.
- Aparecimento do comportamento devido
ao reforço representado pelas
consequências do comportamento.
EXTINÇÃO
- O comportamento decresce ou desaparece
por deixar de se relacionar o estímulo
incondicionado com o estímulo
condicionado.
- O comportamento decresce ou
desaparece por ser retirada a
consequência que se lhe seguia.
GENERALIZAÇÃO
- Produção da resposta condicionada em
situações semelhantes à do estímulo
condicionado.
- Produção do comportamento em
situações semelhantes àquela em que se
deu o condicionamento operante.
DISCRIMINAÇÃO
- Distinção entre estímulos (mesmo que
semelhantes) reagindo apenas aos
estímulos presentes durante o
condicionamento.
- Distinção entre situações em que os
comportamentos são reforçados e
situações em que o não são.
15
Download