Aprendizagem - Prof. Saulo Almeida

Propaganda
Aprendizagem
Perspectivas Diferentes
• Os psicólogos comportamentais focalizam a aprendizagem
de associações por meio do condicionamento clássico e do
condicionamento operante
• Os psicólogos cognitivos que estudam a aprendizagem
estão interessados no tipo de aprendizagem mais complexo
que envolve a memória humana
Aprendizagem pelo
Condicionamento Clássico
Os Elementos e Procedimentos do Condicionamento Clássico
Processos Gerais de Aprendizagem no Condicionamento Clássico
Condicionamento Clássico
• O processo de aprendizagem em que um estímulo sinaliza a
chegada de outro estímulo
• Às vezes chamado de condicionamento “pavloviano”, porque
Ivan Pavlov foi o primeiro pesquisador a estudar
sistematicamente este tipo de aprendizagem
Pavlov
• Um fisiologista russo que estudou os processos digestivos em cães
• Os cães ficavam presos a um equipamento e tinham tubos
inseridos nas bochechas
para medir a quantidade de
salivação, a etapa inicial do
processo digestivo
• Com o tempo, ele notou que
os cães começavam a salivar
antes que o pó de carne fosse
colocado em suas bocas, e quis
saber por que isso acontecia
Os Elementos e Procedimentos
do Condicionamento Clássico
Estímulo
Incondicionado
(EI)
Associada
Estímulo
Condicionado
(EC)
Resposta
Incondicionada
(RI)
Similar
Resposta
Condicionada
(RC)
EI e RI
• Os cães salivam quando o pó de carne é colocado em suas
bocas – isto é um reflexo, uma resposta que ocorre
automaticamente na presença de um determinado estímulo
(i.e., o pó de carne)
• Um estímulo incondicionado (EI)
é um estímulo que elicia a resposta reflexa (aqui, o EI é o pó
de carne)
• Uma resposta incondicionada (RI)
é uma resposta eliciada automaticamente pelo EI (aqui, a RI é
salivar em resposta ao pó de carne)
EC e RC
•
Um estímulo neutro é um estímulo que não elicia, naturalmente, a resposta a ser
condicionada (p. ex., tons auditivos)
•
Para se obter condicionamento, o estímulo neutro (uma campainha) é apresentado logo antes
(idealmente, de meio segundo a um segundo antes) do EI (pó de carne) por várias tentativas
•
Depois de ocorrer o condicionamento (isto é, o cão
começa a salivar ao som da campainha antes de
o alimento ser colocado em sua boca), o
estímulo neutro é chamado de estímulo
condicionado (EC)
•
A resposta aprendida ao estímulo condicionado
se chama resposta condicionada (RC)
Condicionamento Retardado
e de Traço
•
No condicionamento retardado, o EC é mantido até depois de
ser apresentado o EI para que os dois estímulos ocorram ao
mesmo tempo
• A campainha seria ligada e continuaria a soar até o pó de carne ser colocado
na boca do cão
•
No condicionamento de traço, existe um período de tempo entre
o desligamento do EC e o início do EI em que nenhum dos estímulos
está presente
• É chamado de condicionamento “de traço” porque precisa haver um traço de
memória do EC para que seja aprendida a associação entre os estímulos
•
O condicionamento retardado é o procedimento de condicionamento
clássico mais eficiente; o condicionamento de traço pode ser eficiente
se o intervalo entre os estímulos for muito breve
Um Resumo do
Condicionamento Clássico
O Estudo do “Pequeno Albert”
• John Watson e Rosalie Rayner realizaram um estudo com um bebê
de 11 meses chamado Albert
• Enquanto Albert estava olhando para um ratinho branco, Watson se
esgueirou silenciosamente por trás dele com uma barra de ferro e
um martelo e bateu um no outro
• A resposta reflexa de Albert, a RI, foi uma resposta de medoevitação (p. ex., chorar e tentar engatinhar para longe) ao ruído
alto, que era o EI
• Depois de emparelhar o rato branco com o ruído alto e inesperado
apenas 7 vezes, o ratinho branco se tornou um EC
Outras Comprovações
• Elise Bregman não conseguiu condicionar bebês a sentir
medo de objetos inanimados como blocos de madeira e
cortinas de tecido, o que sugere possíveis predisposições
biológicas a aprender certos medos mais facilmente do que
outros
• O condicionamento clássico pode ser usado para condicionar
reações positivas, como é feito na propaganda para
condicionar atitudes e sentimentos positivos em relação a
determinados produtos (p. ex., uma celebridade serve como
um EI e o produto como o EC)
Processos Gerais de Aprendizagem no
Condicionamento Clássico
• Aquisição é o processo de adquirir uma nova resposta, isto
é, uma RC a um EC
• A força da RC aumenta durante a aquisição
• Outros processos:
Generalização
do Estímulo
Extinção
Recuperação
Espontânea
Discriminação
do Estímulo
Extinção
• Um EC deve sinalizar, confiavelmente, que o EI está
chegando
• Extinção é o desaparecimento da RC quando o EI deixa de
se seguir ao EC
• A força da RC diminui durante a extinção
Recuperação Espontânea
• Durante o processo de extinção, todavia, a força da RC
misteriosamente aumenta um pouco após um intervalo de
descanso
• Isto se chama recuperação espontânea
• Conforme a extinção continua, a recuperação observada depois de
intervalos de descanso segue diminuindo até ser minimizada
Aquisição, Extinção e Recuperação
Espontânea
Generalização do Estímulo
• Generalização do estímulo é dar a RC a um estímulo semelhante
ao EC
• Quanto mais semelhante for o estímulo ao EC, mais
forte será a resposta
• Por exemplo, se um cão aprende a latir ao som da
campainha da porta, ele também pode latir ao som do
telefone se for para uma nova casa, porque ambos os
estímulos são sons de campainha
• Este é um processo adaptativo, porque o
condicionamento clássico não seria muito útil se só
nos permitisse aprender relações entre estímulos
específicos
Discriminação do Estímulo
• No entanto, supergeneralizar uma resposta pode não ser
adaptativo; assim, nós precisamos aprender a discriminar os
estímulos
• Discriminação do Estímulo é aprender a dar a RC somente
ao EC ou somente a um pequeno conjunto de estímulos muito
semelhantes incluindo o EC
• Por exemplo, depois de estar morando na
nova casa já há algum tempo, o cão
aprenderá a diferenciar/discriminar
os sons da campainha da porta e
do telefone
Treinamento da Discriminação
• Durante o treinamento da discriminação, apresentamos
muitos estímulos diferentes numerosas vezes, mas o EI só vai
se seguir a um EC
• Este procedimento extinguirá as respostas aos outros estímulos
Generalização e Discriminação
do Estímulo
Aprendizagem por Condicionamento
Operante
Aprendizagem por Reforço e Punição
Processos Gerais de Aprendizagem no
Condicionamento Operante
Esquemas de Reforço Parcial no
Condicionamento Operante
Motivação, Comportamento e Reforço
Condicionamento Operante
Aprender a associar comportamentos às
suas consequências
• Comportamentos que são reforçados (levam a consequências
satisfatórias) serão fortalecidos, e comportamentos que são
punidos (levam a consequências insatisfatórias) serão
enfraquecidos
• Chama-se condicionamento “operante” porque o organismo
precisa “operar” sobre o ambiente para produzir as
consequências com as quais aprenderá
A Lei do Efeito
• A Lei do Efeito de Thorndike afirma que qualquer
comportamento que resulte em consequências satisfatórias
tende a ser repetido, e qualquer comportamento que resulte
em consequências insatisfatórias tende a não ser repetido
Aprendizagem por Reforço e Punição
• Um reforçador é um estímulo que aumenta a probabilidade de
uma resposta anterior
• Reforço é o processo pelo qual a probabilidade de uma resposta é
aumentada pela apresentação de um reforçador após a resposta
• Por exemplo, se você condicionar
operantemente o seu cão a latir
dando-lhe comida cada vez que
ele “falar,” o alimento seria um
reforçador, e o processo de
aumentar o comportamento de
latir usando esse reforçador
seria chamado de reforço
Aprendizagem por Reforço e Punição
• Um punitivo é um estímulo que diminui a
probabilidade de uma resposta anterior
• Punição é o processo pelo qual a
probabilidade de uma resposta é diminuída
pela apresentação de um punitivo após a
resposta
• Por exemplo, se você condicionou o seu cão a
parar de subir no sofá molhando-o com um spray
de água cada vez que ele subia no sofá, o spray
de água seria o punitivo, e o processo de
diminuir o comportamento de subir no sofá seria
chamado de punição
Positivo e Negativo
• Positivo significa que um estímulo é apresentado
• Tanto no reforço positivo quanto na punição positiva é apresentado
um estímulo
• Negativo significa que um estímulo é removido
• Tanto no reforço negativo quanto na punição negativa é removido
um estímulo
Apetitivo e Aversivo
• Um estímulo apetitivo é um estímulo que o organismo
considera agradável (p. ex., comida, dinheiro)
• Um estímulo aversivo é um estímulo que o organismo
considera desagradável (p. ex., doença, isolamento social)
Apetitivo e Aversivo
• Consequentemente...
• No reforço positivo é apresentado um estímulo apetitivo (p. ex., um
elogio pelo trabalho bem feito)
• Na punição positiva é apresentado um estímulo aversivo (p. ex.,
uma repreensão por um trabalho malfeito)
• No reforço negativo é removido um estímulo aversivo (p. ex., usar
uma bolsa quente para uma dor nas costas)
• Na punição negativa é removido um estímulo apetitivo (p. ex., os
pais tiram a sobremesa de uma criança)
Reforço e Punição Positivos
e Negativos
Positivo
Negativo
Reforço
É apresentado
um estímulo
apetitivo
É removido
um estímulo
aversivo
Punição
É apresentado
um estímulo
aversivo
É removido
um estímulo
apetitivo
Como Saber?
• Em qualquer exemplo de reforço ou punição, positivos ou
negativos, é essencial perceber que nós só saberemos que
um estímulo serviu como reforçador ou punitivo e levou ao
reforço ou à punição se o comportamento acontecer
novamente ou parar de acontecer
Reforçadores Primários e
Secundários
• Um reforçador primário é inatamente reforçador desde o
nascimento (p. ex., comida, contato social)
• Um reforçador secundário não é inatamente reforçador, mas
adquire propriedades reforçadoras por meio da aprendizagem
(p. ex., dinheiro, boas notas)
Processos Gerais de Aprendizagem no
Condicionamento Operante
•
A modelagem ocorre quando um animal é treinado para dar uma
determinada resposta reforçando-se aproximações sucessivamente mais
próximas da resposta desejada
• Com os seres humanos, isso significaria reforçar uma criança conforme ela se aproxima
cada vez mais do comportamento de arrumar a sua cama corretamente pela manhã
•
As respostas, em um experimento de condicionamento
operante, são apresentadas em um
registro cumulativo – um registro do
número total de respostas ao longo
do tempo
• É uma descrição visual do índice de respostas
• Conforme a inclinação da linha do registro aumenta,
o ritmo de resposta fica mais rápido
Como Compreender um
Registro Cumulativo
Aquisição, Extinção e
Recuperação Espontânea
• Aquisição refere-se ao fortalecimento da resposta operante
reforçada
• Extinção é o desaparecimento da resposta operante quando
ela deixa de ser reforçada
• A inclinação decrescente do registro indica que a resposta está
sendo extinta (i.e., há cada vez menos respostas no decorrer do
tempo)
• Recuperação espontânea é a recuperação temporária da
resposta operante após um intervalo durante o treinamento de
extinção
Aquisição, Extinção e Recuperação
Espontânea
Máquinas Automáticas de Venda
•
Nós aprendemos que, colocando dinheiro em uma máquina
automática de venda, obtemos alguma coisa da qual gostamos muito.
Nós adquirimos a resposta de inserir dinheiro nessa máquina
específica.
•
Mas, um dia, colocamos o dinheiro e não sai o alimento ou a bebida
que esperamos. Isso segue acontecendo. Nós logo paramos de pôr
dinheiro na máquina. A nossa resposta está sendo extinta.
•
Entretanto, depois de um período de tempo, nós voltamos e tentamos
novamente (recuperação espontânea). Se a máquina tiver sido
consertada, conseguiremos a nossa bebida ou alimento e o nosso
índice de resposta retornará ao seu nível anterior. Se não, nós
seguiremos pelo caminho da extinção.
Discriminação e Generalização
• Um estímulo discriminativo é um estímulo que precisa estar
presente para que a resposta operante seja reforçada
• Ele “cria a oportunidade” para que a resposta seja reforçada
• Por exemplo, um rato aprende que pressionar uma alavanca resultará em
comida só quando uma luz estiver acesa, não quando ela estiver apagada
• Generalização do estímulo é dar a resposta operante na
presença de estímulos semelhantes ao estímulo discriminativo
• Por exemplo, o rato aprende a pressionar a alavanca
por comida somente quando a luz tiver um
determinado tom de vermelho. A apresentação de
luzes com cores diferentes depois da aquisição
constitui um teste para a generalização.
Esquemas de Reforço Parcial no
Condicionamento Operante
• Reforçar todas as respostas é um esquema de reforço
contínuo
• Os esquemas de reforço parcial reforçam o comportamento
apenas parte do tempo
• O efeito de reforço parcial afirma que as respostas que são
reforçadas segundo um esquema parcial em vez de um esquema
contínuo são mais resistentes à extinção
Esquemas de Reforço Parcial
• Um esquema de razão baseia-se no número de respostas
dadas
• Um esquema de intervalo baseia-se no período de tempo
decorrido
• Em um esquema fixo, o número de respostas requerido para
um esquema de razão ou o período de tempo necessário para
um esquema de intervalo são fixos
• Em um esquema variável, o número de respostas requerido
para um esquema de razão e o período de tempo necessário
para um esquema de intervalo variam em cada tentativa
Esquemas de Razão
• Em um esquema de razão fixa, um reforçador é entregue
depois que um número fixo de respostas foi dado (p. ex., um
rato tem de pressionar uma alavanca 10 vezes antes de
receber o reforçador de alimento)
• Em um esquema de razão variável, o número de respostas
necessário para se obter um reforçador varia em cada
tentativa, mas atinge uma média numérica entre as repetições
(p. ex., os prêmios nas máquinas de jogo)
Esquemas de Reforço Parcial
de Razão Fixa e Razão Variável
Esquemas de Intervalo
• Em um esquema de intervalo fixo, um reforçador é entregue
depois que a primeira resposta é dada e é decorrido um
intervalo de tempo determinado (p. ex., exames periódicos em
uma turma, com os alunos se comportando melhor e
estudando mais logo antes do exame/reforçador)
• Em um esquema de intervalo variável, um reforçador é
entregue depois de um intervalo de tempo diferente em cada
repetição, mas os intervalos de tempo atingem uma média
determinada ao longo das repetições (p. ex., provas-surpresa)
Esquemas de Reforço Parcial de Intervalo Fixo
e Intervalo Variável
Qual é Melhor?
• Os esquemas de razão levam a índices mais altos de
resposta do que os esquemas de intervalo (inclinações mais
íngremes no registro cumulativo)
• Os esquemas variáveis levam a menos pausas (quando não
ocorre nenhuma resposta) após o reforço do que os esquemas
fixos
• Com respeito à extinção, é necessário mais tempo para
extinguir uma resposta com um esquema de reforço parcial
do que com um esquema de reforço contínuo
Motivação, Comportamento
e Reforço
Motivação é o conjunto de fatores internos e externos que
energizam o nosso comportamento e o dirigem para objetivos
Teorias da Motivação
•
A teoria da redução do impulso propõe que, primeiro, uma
necessidade corporal (tal como a fome) cria um estado de tensão
corporal chamado impulso ou pulsão; então,o comportamento motivado
(buscar alimento) funciona para reduzir esse impulso obtendo
o reforço (alimento), para eliminar essa
necessidade e fazer o corpo retornar a um
estado de equilíbrio interno.
• Em essência, nós somos “empurrados” para a ação
por estados pulsionais desagradáveis
• É eficaz para explicar necessidades biológicas como
a fome e a sede
Teorias da Motivação
• A teoria do incentivo propõe que somos “puxados” para a
ação pelos incentivos, estímulos externos ambientais que não
envolvem a redução do impulso
• Por exemplo, os alunos podem ser motivados
por tirar boas notas, o que os levará a se
esforçar e estudar mais
• O dinheiro é outro exemplo clássico de um
incentivo que nos “puxa” para determinados
comportamentos
Teorias da Motivação
• A teoria da excitação afirma que o nosso comportamento é
motivado para manter um nível ótimo de excitação, o que
varia de pessoa para pessoa
• Quando abaixo do nível ótimo, somos motivados a elevar a nossa
excitação até aquele nível
• Quando superexcitados, somos motivados a reduzir o nosso nível de
excitação até o nosso nível ótimo
• A teoria da excitação argumenta que o nosso nível de excitação
influencia o nosso nível de desempenho, com um certo nível sendo
ótimo
A Lei de Yerkes-Dodson
Uma excitação
aumentada
ajudará o
desempenho até
um certo ponto,
após o qual uma
excitação
adicional
prejudicará o
desempenho
Motivação Extrínseca vs. Intrínseca
• Motivação extrínseca é o desejo de realizar um
comportamento para obter um reforço externo ou para evitar
um estímulo externo aversivo
• Motivação intrínseca é o desejo de realizar um
comportamento de modo eficiente e pelo comportamento em
si
• O reforço é fornecido pela própria atividade
• Por exemplo, por que os alunos estudam para as aulas?
• Um motivador extrínseco seriam as notas
• Um motivador intrínseco seria o prazer de obter informações
O Efeito da Superjustificação
• Em um estudo de Lepper, Greene e Nisbett (1973), algumas
crianças que gostavam de desenhar com canetas hidrocor
(elas faziam isso durante os períodos de brincar livre e,
portanto, estavam no início intrinsecamente motivadas)
receberam prêmios,
um incentivo extrínseco, por
desenhar com as canetas.
Outras crianças não receberam
nenhum prêmio por desenhar
com as canetas.
O Efeito da Superjustificação
• Uma semana depois, quando não foi dado nenhum prêmio
pelos desenhos feitos com as canetas, as crianças que não
tinham recebido
prêmios ainda continuavam
desenhando, mas aquelas que
tinham recebido os prêmios
passaram muito menos tempo
usando as canetas para
desenhar.
O Efeito da Superjustificação
• Ocorre quando há um decréscimo em um comportamento
intrinsecamente motivado depois que o comportamento é
extrinsecamente reforçado e então o reforço é interrompido
• O efeito de superjustificação indica que o processamento
cognitivo da pessoa está influenciando o seu comportamento,
e que esse processamento pode diminuir a eficácia de
reforçadores extrínsecos
• Entretanto, não é provável que o reforço extrínseco influencie
a motivação intrínseca se o reforço extrínseco depende de se
fazer bem alguma coisa versus apenas fazê-la
Aspectos Biológicos e
Cognitivos da Aprendizagem
Prontidão Biológica na Aprendizagem
Aprendizagem Latente e
Aprendizagem Observacional
Prontidão Biológica
na Aprendizagem
A nossa prontidão para aprender a temer objetos ou situações
perigosos para nós (p. ex., alturas) e para evitar alimentos e
bebidas que nos fazem mal tem importância adaptativa
Aversão de Paladar
• Garcia e Koelling (1966) estavam estudando os efeitos da
radiação sobre os ratos
• Depois de vários tratamentos com radiação, os ratos
continuavam entrando nas câmaras experimentais onde
tinham sofrido a radiação, mas não bebiam mais a água que
havia dentro dessas gaiolas
Aversão de Paladar
• Os pesquisadores descobriram que as garrafas de água das
câmaras experimentais eram feitas de uma substância
diferente da das gaiolas – plástico versus vidro
• Assim, a água tinha um gosto diferente em cada local, e os
ratos aprenderam rapidamente uma aversão às garrafas de
água da câmara experimental, mesmo que a náusea viesse
horas depois de terem estado na câmara experimental
Aversão de Paladar
• Assim, a aversão de paladar é um surpreendente
contraexemplo da regra de que o EI (náusea) precisa se
seguir imediatamente ao EC (a água com gosto diferente)
para que a aprendizagem aconteça
• Os ratos aprenderam a
aversão de paladar sem
que houvesse um
emparelhamento de deixa
e consequência…
Aversão de Paladar
•
Os pesquisadores examinaram duas deixas que foram associadas à náusea
provocada pela radiação:
• Água adoçada
• Água de gosto normal acompanhada por estalidos e luzes piscantes quando os ratos
bebiam a água
•
Os ratos que beberam a água adoçada aprenderam facilmente a aversão à
água, mas os ratos que beberam a água de gosto normal acompanhada por
estalidos e luzes piscantes não aprenderam
• Os ratos, simplesmente, não aprenderam a associar essas deixas ambientais auditivas e
visuais, que ocorriam enquanto eles bebiam, com a náusea que sentiam posteriormente;
esta associação não fazia nenhum sentido “biológico” para eles
Tendência Instintiva
• A tendência de um animal de recuar de uma resposta
operante aprendida a um objeto para uma resposta inata,
instintiva
• Portanto, respostas biologicamente instintivas às vezes
limitam ou atrapalham a nossa capacidade de condicionar
outras respostas menos naturais
• Os organismos aprenderão certas associações (aquelas
consistentes com o seu comportamento natural) mais
facilmente do que outras (aquelas menos consistentes com o
seu comportamento natural)
Aprendizagem Latente e Aprendizagem
Observacional
• A aprendizagem latente é a aprendizagem que ocorre, mas
não é demonstrada até haver um incentivo para isso
• Por exemplo, os alunos estudam para as aulas, mas não
demonstram abertamente a aprendizagem até uma prova, para a
qual o incentivo é uma boa nota
• A aprendizagem observacional (modelagem) é aprender
observando os outros e imitando o seu comportamento
Aprendizagem Latente
• Edward Tolman foi um pesquisador pioneiro da
aprendizagem latente
• Ratos privados de comida tinham de encontrar seu caminho
em um labirinto, e o número de voltas erradas/erros era
contado
• Por exemplo, em um experimento com três
grupos, o alimento (reforço) estava sempre
presente na caixa-alvo que havia no final
do labirinto para um grupo, mas nunca
para outro. Para um terceiro grupo,
não havia comida nenhuma até o
décimo primeiro dia do experimento.
Aprendizagem Latente
• Interessantemente, o desempenho do grupo que só começou
a obter o reforço do alimento no décimo
primeiro dia melhorou imediatamente no dia seguinte,
igualando-se ao desempenho do grupo que sempre
encontrara o reforço
• Assim, parece que eles estiveram aprendendo
o labirinto todo o tempo, mas não
demonstraram a sua aprendizagem até o
incentivo ser apresentado
Aprendizagem Latente
Aprendizagem Observacional
A pesquisa pioneira de Albert Bandura sobre a modelagem
• Em um experimento, algumas crianças foram expostas a um adulto que batia,
chutava e gritava com um boneco Bobo
• Depois de observar esse comportamento, cada criança era levada para outra sala cheia de
brinquedos atraentes, mas lhe diziam que os brinquedos eram para outras crianças e que ela
não poderia brincar com eles
• Mais tarde, a criança era levada para uma outra sala com brinquedos com os quais ela poderia
brincar, incluindo um boneco Bobo
• A criança passava a bater no boneco exatamente como o modelo adulto fizera
• No entanto, quando expostas a um modelo gentil, as crianças agiam mais
gentilmente em relação ao boneco do que as crianças expostas ao outro modelo
• Assim, o comportamento das crianças era guiado pelo comportamento do modelo ao
qual tinham sido expostas
Aprendizagem Observacional
• Em outro experimento, um adulto era recompensado pelo
comportamento agressivo, punido pelo comportamento
agressivo, ou não sofria nenhuma consequência pelo seu
comportamento
• As crianças que viam o adulto ser reforçado por seu
comportamento agressivo agiam mais agressivamente em
relação ao boneco Bobo do que aquelas que tinham visto o
modelo agir e não sofrer nenhuma consequência
• Além disso, as crianças que tinham visto o adulto ser punido
foram menos agressivas em relação ao boneco do que aquelas
que não tinham visto o adulto não sofrer nenhuma
consequência por agir agressivamente em relação ao boneco
Download