Aprendizagem e Recompensa

Propaganda
Aprendizagem e
Recompensa
Prof. Dr. Ana Raquel Karkow
 Aprendizagem é uma mudança relativamente
duradoura resultante da experiência.
 Adapta comportamentos ao ambiente
 Behaviorismo: foco no comportamento observável
 Aprendizagem
 Cognitivismo: consideram os processos mentais
 Retenção e recuperação do conhecimento (memória)
 Aprendizagem ≠ memória = separação arbitrária
Estudo comportamental da
aprendizagem
 Insatisfação com a metodologia de
relatos verbais para estudar estados
mentais
 John B. Watson: o comportamento
manifesto como único indicador
válido da atividade psicológica
 John Locke: animais e humanos
nascem como uma tábula rasa
 Watson, 1924, pg. 82
 "Dê-me uma dúzia de bebês sadios, bem-formados e
meu próprio mundo especificado para criá-los, e eu
garanto que poderei tomar qualquer um deles,
aleatoriamente, e treiná-los para se tornar um
especialista em algo que eu escolher – médico,
advogado, artista, comerciante, e sim, inclusive, um
mendigo pedinte ou ladrão, independente de seus
talentos, inclinações, tendências, capacidades, vocação
e raça de seus ancestrais."
As respostas
comportamentais são
condicionadas
 Cães salivavam ao
apenas ver os tratadores
Aparato: instrumento utilizado para medição
Condicionamento clássico ou pavloviano
 Condicionamento clássico
 Quando um objeto neutro passa a eliciar uma resposta
reflexa incondicionada (RI) a um estímulo incondicionado
(EI), por associação
 Estímulo incondicionado (EI)
 Estímulo que elicia uma resposta não aprendida
 Resposta incondicionada (RI)
 Resposta não aprendida (reflexo)
 Estímulo condicionado
(EC)
 Estímulo que elicia uma
resposta após
aprendizagem
 Resposta condicionada
(RC)
 Resposta aprendida
 Aquisição
 Formação gradual da associação entre EI – EC
 Contiguidade, e mais eficiente se EI antes do EC
 Consolidação
 Extinção
 Enfraquecimento da RC devido à exposição do EC sem o EI
 É um novo aprendizado, não esquecimento
 Recuperação espontânea
 Recuperação da resposta extinta após apresentação do EC
 Generalização do estímulo
 Estímulos semelhantes (mas não idênticos) ao EC produzem
RC
 Discriminação de estímulo
 Diferenciação dois estímulos semelhantes, sendo um
associado a um EI e outro não.
 Condicionamento de segunda ordem
 Associação de um EC a outro EC
 Ex.: medo do dentista
Fobias e adicções têm componentes aprendidos
 Fobias
 Respostas emocionais de medo condicionadas
 Tratamento: dessensibilização sistemática
 Adicção ou adição a drogas
 Contingências ambientais
 Soldados de guerra do Vietnã
 Overdose de drogas em lugares não associados ao uso
 O condicionamento clássico envolve mais do que
contiguidade
 Prontidão biológica
 Programação biológica para temer objetos específicos
 Olfato em roedores
 Visão em aves
 Fobia a aranhas, mas não a sapatos, por exemplo
Condicionamento operante
 Condicionamento clássico
 Passivo
 Condicionamento instrumental ou operante
 Instrumenta o organismo a atuar no ambiente
 Processo de aprendizagem no qual as consequências da
ação determinam a probabilidade dela ser realizada no
futuro
 William James
 Edward Thornidike
 Teoria geral da
aprendizagem
 Lei do efeito
 Qualquer comportamento
que leve a um estado
satisfatório tem maior
probabilidade de ocorrer
novamente
 Os que levam a um
estado insatisfatório tem
menos probabilidade
Reforço aumenta o
comportamento
 Burrhus Frederic Skinner
(1904 – 1990)
Reforço aumenta o comportamento
 Burrhus Frederic Skinner (1904 – 1990)
 Modelagem
 Processo de condicionamento operante que envolve reforçar o
comportamento (cada vez mais próximo do) desejado
 Exemplo: adestramento
 Reforços primários
 Satisfazem necessidades biológicas
 Evolutivamente importantes
 Reforços secundários
 Estabelecidos pelo condicionamento clássico
 Dinheiro – comida  EC – EI
 Punição
 Estímulo que se segue a uma resposta e diminui a
probabilidade da resposta ser aprendida
 Reforço
 Aumenta a probabilidade do comportamento ocorrer
 Positivo: administração de estímulo agradável
 Comer algo gostoso
 Orgasmo depois do sexo
 Negativo: remoção do estímulo aversivo
 Tirar uma pedra do sapato
 Pressionar uma alavanca pra cessar um choque
 Mudar o canal de TV com programa chato
 Punição
 Diminui a probabilidade de um comportamento ocorrer
 Positivo: administrar algo ruim
 Levar choque ao descer de uma plataforma isolante
 Bater na bunda de uma criança por mau comportamento
 Cobrar multa por uma infração no trânsito
 Negativo: tirar algo bom
 Apreender a carteira de motorista por dirigir embriagado
 Esquiva passiva
Reforço: "vai pro melhor"
Punição: "vai pro pior"
Positivo
Acrescenta algo bom
Positiva
Acrescenta algo ruim
Negativo
Retira algo ruim
Negativa
Retira algo bom
Esquemas de reforço
 Reforço
 Contínuo
 A cada ocorrência do comportamento desejado
 Parcial
 Ocorre intermitentemente
 Persistência
comportamental
 Efeito de extinção do
reforço parcial
 Máquinas caça-níqueis
 Jogos eletrônicos
Biologia e cognição influenciam o comportamento
operante
 Limitações biológicas
 A aprendizagem está relacionada a resolução de
problemas adaptativos
 Guaxinim
 Formiga
Diferenças entre condicionamento clássico e operante
 Clássico
 Associação aprendida entre estímulos neutros e reflexivos
 Operante
 Estímulos que se seguem a comportamentos determinam a
probabilidade de sua repetição
 Reforço
 Punição
Observar os outros afeta a
aprendizagem
Aprendizagem por
observação
 O comportamento é
adquirido ou modificado
após a observação de
outros.
 Estudos de Bandura
 Exposição à violência na
mídia aumenta a
probabilidade de
comportamentos
agressivos pelas
crianças?
 Jogos eletrônicos
 Filmes
 Aprendizagem observacional do medo
 Macacos
 Selvagens
 De laboratório
 Com medo de cobra
 Sem medo de cobra
Animais e seres humanos imitam os outros
 Pombos, macacos, humanos
 Modelação
 Imitação do comportamento por aprendizagem observacional
 Aprendizagem vicária
 Ocorre quando se aprende as consequências de uma ação
vendo outros serem recompensados ou punidos
 Experimento com crianças e bobo
 Neurônios espelhos
 Neurônios do córtex prémotor ativados quando
se observa outro
executar uma ação
 Descarga ≠
comportamento imitativo
Download