Aprendizagem Perspectivas Diferentes • Os psicólogos comportamentais focalizam a aprendizagem de associações por meio do condicionamento clássico e do condicionamento operante • Os psicólogos cognitivos que estudam a aprendizagem estão interessados no tipo de aprendizagem mais complexo que envolve a memória humana Aprendizagem pelo Condicionamento Clássico Os Elementos e Procedimentos do Condicionamento Clássico Processos Gerais de Aprendizagem no Condicionamento Clássico Condicionamento Clássico • O processo de aprendizagem em que um estímulo sinaliza a chegada de outro estímulo • Às vezes chamado de condicionamento “pavloviano”, porque Ivan Pavlov foi o primeiro pesquisador a estudar sistematicamente este tipo de aprendizagem Pavlov • Um fisiologista russo que estudou os processos digestivos em cães • Os cães ficavam presos a um equipamento e tinham tubos inseridos nas bochechas para medir a quantidade de salivação, a etapa inicial do processo digestivo • Com o tempo, ele notou que os cães começavam a salivar antes que o pó de carne fosse colocado em suas bocas, e quis saber por que isso acontecia Os Elementos e Procedimentos do Condicionamento Clássico Estímulo Incondicionado (EI) Associada Estímulo Condicionado (EC) Resposta Incondicionada (RI) Similar Resposta Condicionada (RC) EI e RI • Os cães salivam quando o pó de carne é colocado em suas bocas – isto é um reflexo, uma resposta que ocorre automaticamente na presença de um determinado estímulo (i.e., o pó de carne) • Um estímulo incondicionado (EI) é um estímulo que elicia a resposta reflexa (aqui, o EI é o pó de carne) • Uma resposta incondicionada (RI) é uma resposta eliciada automaticamente pelo EI (aqui, a RI é salivar em resposta ao pó de carne) EC e RC • Um estímulo neutro é um estímulo que não elicia, naturalmente, a resposta a ser condicionada (p. ex., tons auditivos) • Para se obter condicionamento, o estímulo neutro (uma campainha) é apresentado logo antes (idealmente, de meio segundo a um segundo antes) do EI (pó de carne) por várias tentativas • Depois de ocorrer o condicionamento (isto é, o cão começa a salivar ao som da campainha antes de o alimento ser colocado em sua boca), o estímulo neutro é chamado de estímulo condicionado (EC) • A resposta aprendida ao estímulo condicionado se chama resposta condicionada (RC) Condicionamento Retardado e de Traço • No condicionamento retardado, o EC é mantido até depois de ser apresentado o EI para que os dois estímulos ocorram ao mesmo tempo • A campainha seria ligada e continuaria a soar até o pó de carne ser colocado na boca do cão • No condicionamento de traço, existe um período de tempo entre o desligamento do EC e o início do EI em que nenhum dos estímulos está presente • É chamado de condicionamento “de traço” porque precisa haver um traço de memória do EC para que seja aprendida a associação entre os estímulos • O condicionamento retardado é o procedimento de condicionamento clássico mais eficiente; o condicionamento de traço pode ser eficiente se o intervalo entre os estímulos for muito breve Um Resumo do Condicionamento Clássico O Estudo do “Pequeno Albert” • John Watson e Rosalie Rayner realizaram um estudo com um bebê de 11 meses chamado Albert • Enquanto Albert estava olhando para um ratinho branco, Watson se esgueirou silenciosamente por trás dele com uma barra de ferro e um martelo e bateu um no outro • A resposta reflexa de Albert, a RI, foi uma resposta de medoevitação (p. ex., chorar e tentar engatinhar para longe) ao ruído alto, que era o EI • Depois de emparelhar o rato branco com o ruído alto e inesperado apenas 7 vezes, o ratinho branco se tornou um EC Outras Comprovações • Elise Bregman não conseguiu condicionar bebês a sentir medo de objetos inanimados como blocos de madeira e cortinas de tecido, o que sugere possíveis predisposições biológicas a aprender certos medos mais facilmente do que outros • O condicionamento clássico pode ser usado para condicionar reações positivas, como é feito na propaganda para condicionar atitudes e sentimentos positivos em relação a determinados produtos (p. ex., uma celebridade serve como um EI e o produto como o EC) Processos Gerais de Aprendizagem no Condicionamento Clássico • Aquisição é o processo de adquirir uma nova resposta, isto é, uma RC a um EC • A força da RC aumenta durante a aquisição • Outros processos: Generalização do Estímulo Extinção Recuperação Espontânea Discriminação do Estímulo Extinção • Um EC deve sinalizar, confiavelmente, que o EI está chegando • Extinção é o desaparecimento da RC quando o EI deixa de se seguir ao EC • A força da RC diminui durante a extinção Recuperação Espontânea • Durante o processo de extinção, todavia, a força da RC misteriosamente aumenta um pouco após um intervalo de descanso • Isto se chama recuperação espontânea • Conforme a extinção continua, a recuperação observada depois de intervalos de descanso segue diminuindo até ser minimizada Aquisição, Extinção e Recuperação Espontânea Generalização do Estímulo • Generalização do estímulo é dar a RC a um estímulo semelhante ao EC • Quanto mais semelhante for o estímulo ao EC, mais forte será a resposta • Por exemplo, se um cão aprende a latir ao som da campainha da porta, ele também pode latir ao som do telefone se for para uma nova casa, porque ambos os estímulos são sons de campainha • Este é um processo adaptativo, porque o condicionamento clássico não seria muito útil se só nos permitisse aprender relações entre estímulos específicos Discriminação do Estímulo • No entanto, supergeneralizar uma resposta pode não ser adaptativo; assim, nós precisamos aprender a discriminar os estímulos • Discriminação do Estímulo é aprender a dar a RC somente ao EC ou somente a um pequeno conjunto de estímulos muito semelhantes incluindo o EC • Por exemplo, depois de estar morando na nova casa já há algum tempo, o cão aprenderá a diferenciar/discriminar os sons da campainha da porta e do telefone Treinamento da Discriminação • Durante o treinamento da discriminação, apresentamos muitos estímulos diferentes numerosas vezes, mas o EI só vai se seguir a um EC • Este procedimento extinguirá as respostas aos outros estímulos Generalização e Discriminação do Estímulo Aprendizagem por Condicionamento Operante Aprendizagem por Reforço e Punição Processos Gerais de Aprendizagem no Condicionamento Operante Esquemas de Reforço Parcial no Condicionamento Operante Motivação, Comportamento e Reforço Condicionamento Operante Aprender a associar comportamentos às suas consequências • Comportamentos que são reforçados (levam a consequências satisfatórias) serão fortalecidos, e comportamentos que são punidos (levam a consequências insatisfatórias) serão enfraquecidos • Chama-se condicionamento “operante” porque o organismo precisa “operar” sobre o ambiente para produzir as consequências com as quais aprenderá A Lei do Efeito • A Lei do Efeito de Thorndike afirma que qualquer comportamento que resulte em consequências satisfatórias tende a ser repetido, e qualquer comportamento que resulte em consequências insatisfatórias tende a não ser repetido Aprendizagem por Reforço e Punição • Um reforçador é um estímulo que aumenta a probabilidade de uma resposta anterior • Reforço é o processo pelo qual a probabilidade de uma resposta é aumentada pela apresentação de um reforçador após a resposta • Por exemplo, se você condicionar operantemente o seu cão a latir dando-lhe comida cada vez que ele “falar,” o alimento seria um reforçador, e o processo de aumentar o comportamento de latir usando esse reforçador seria chamado de reforço Aprendizagem por Reforço e Punição • Um punitivo é um estímulo que diminui a probabilidade de uma resposta anterior • Punição é o processo pelo qual a probabilidade de uma resposta é diminuída pela apresentação de um punitivo após a resposta • Por exemplo, se você condicionou o seu cão a parar de subir no sofá molhando-o com um spray de água cada vez que ele subia no sofá, o spray de água seria o punitivo, e o processo de diminuir o comportamento de subir no sofá seria chamado de punição Positivo e Negativo • Positivo significa que um estímulo é apresentado • Tanto no reforço positivo quanto na punição positiva é apresentado um estímulo • Negativo significa que um estímulo é removido • Tanto no reforço negativo quanto na punição negativa é removido um estímulo Apetitivo e Aversivo • Um estímulo apetitivo é um estímulo que o organismo considera agradável (p. ex., comida, dinheiro) • Um estímulo aversivo é um estímulo que o organismo considera desagradável (p. ex., doença, isolamento social) Apetitivo e Aversivo • Consequentemente... • No reforço positivo é apresentado um estímulo apetitivo (p. ex., um elogio pelo trabalho bem feito) • Na punição positiva é apresentado um estímulo aversivo (p. ex., uma repreensão por um trabalho malfeito) • No reforço negativo é removido um estímulo aversivo (p. ex., usar uma bolsa quente para uma dor nas costas) • Na punição negativa é removido um estímulo apetitivo (p. ex., os pais tiram a sobremesa de uma criança) Reforço e Punição Positivos e Negativos Positivo Negativo Reforço É apresentado um estímulo apetitivo É removido um estímulo aversivo Punição É apresentado um estímulo aversivo É removido um estímulo apetitivo Como Saber? • Em qualquer exemplo de reforço ou punição, positivos ou negativos, é essencial perceber que nós só saberemos que um estímulo serviu como reforçador ou punitivo e levou ao reforço ou à punição se o comportamento acontecer novamente ou parar de acontecer Reforçadores Primários e Secundários • Um reforçador primário é inatamente reforçador desde o nascimento (p. ex., comida, contato social) • Um reforçador secundário não é inatamente reforçador, mas adquire propriedades reforçadoras por meio da aprendizagem (p. ex., dinheiro, boas notas) Processos Gerais de Aprendizagem no Condicionamento Operante • A modelagem ocorre quando um animal é treinado para dar uma determinada resposta reforçando-se aproximações sucessivamente mais próximas da resposta desejada • Com os seres humanos, isso significaria reforçar uma criança conforme ela se aproxima cada vez mais do comportamento de arrumar a sua cama corretamente pela manhã • As respostas, em um experimento de condicionamento operante, são apresentadas em um registro cumulativo – um registro do número total de respostas ao longo do tempo • É uma descrição visual do índice de respostas • Conforme a inclinação da linha do registro aumenta, o ritmo de resposta fica mais rápido Como Compreender um Registro Cumulativo Aquisição, Extinção e Recuperação Espontânea • Aquisição refere-se ao fortalecimento da resposta operante reforçada • Extinção é o desaparecimento da resposta operante quando ela deixa de ser reforçada • A inclinação decrescente do registro indica que a resposta está sendo extinta (i.e., há cada vez menos respostas no decorrer do tempo) • Recuperação espontânea é a recuperação temporária da resposta operante após um intervalo durante o treinamento de extinção Aquisição, Extinção e Recuperação Espontânea Máquinas Automáticas de Venda • Nós aprendemos que, colocando dinheiro em uma máquina automática de venda, obtemos alguma coisa da qual gostamos muito. Nós adquirimos a resposta de inserir dinheiro nessa máquina específica. • Mas, um dia, colocamos o dinheiro e não sai o alimento ou a bebida que esperamos. Isso segue acontecendo. Nós logo paramos de pôr dinheiro na máquina. A nossa resposta está sendo extinta. • Entretanto, depois de um período de tempo, nós voltamos e tentamos novamente (recuperação espontânea). Se a máquina tiver sido consertada, conseguiremos a nossa bebida ou alimento e o nosso índice de resposta retornará ao seu nível anterior. Se não, nós seguiremos pelo caminho da extinção. Discriminação e Generalização • Um estímulo discriminativo é um estímulo que precisa estar presente para que a resposta operante seja reforçada • Ele “cria a oportunidade” para que a resposta seja reforçada • Por exemplo, um rato aprende que pressionar uma alavanca resultará em comida só quando uma luz estiver acesa, não quando ela estiver apagada • Generalização do estímulo é dar a resposta operante na presença de estímulos semelhantes ao estímulo discriminativo • Por exemplo, o rato aprende a pressionar a alavanca por comida somente quando a luz tiver um determinado tom de vermelho. A apresentação de luzes com cores diferentes depois da aquisição constitui um teste para a generalização. Esquemas de Reforço Parcial no Condicionamento Operante • Reforçar todas as respostas é um esquema de reforço contínuo • Os esquemas de reforço parcial reforçam o comportamento apenas parte do tempo • O efeito de reforço parcial afirma que as respostas que são reforçadas segundo um esquema parcial em vez de um esquema contínuo são mais resistentes à extinção Esquemas de Reforço Parcial • Um esquema de razão baseia-se no número de respostas dadas • Um esquema de intervalo baseia-se no período de tempo decorrido • Em um esquema fixo, o número de respostas requerido para um esquema de razão ou o período de tempo necessário para um esquema de intervalo são fixos • Em um esquema variável, o número de respostas requerido para um esquema de razão e o período de tempo necessário para um esquema de intervalo variam em cada tentativa Esquemas de Razão • Em um esquema de razão fixa, um reforçador é entregue depois que um número fixo de respostas foi dado (p. ex., um rato tem de pressionar uma alavanca 10 vezes antes de receber o reforçador de alimento) • Em um esquema de razão variável, o número de respostas necessário para se obter um reforçador varia em cada tentativa, mas atinge uma média numérica entre as repetições (p. ex., os prêmios nas máquinas de jogo) Esquemas de Reforço Parcial de Razão Fixa e Razão Variável Esquemas de Intervalo • Em um esquema de intervalo fixo, um reforçador é entregue depois que a primeira resposta é dada e é decorrido um intervalo de tempo determinado (p. ex., exames periódicos em uma turma, com os alunos se comportando melhor e estudando mais logo antes do exame/reforçador) • Em um esquema de intervalo variável, um reforçador é entregue depois de um intervalo de tempo diferente em cada repetição, mas os intervalos de tempo atingem uma média determinada ao longo das repetições (p. ex., provas-surpresa) Esquemas de Reforço Parcial de Intervalo Fixo e Intervalo Variável Qual é Melhor? • Os esquemas de razão levam a índices mais altos de resposta do que os esquemas de intervalo (inclinações mais íngremes no registro cumulativo) • Os esquemas variáveis levam a menos pausas (quando não ocorre nenhuma resposta) após o reforço do que os esquemas fixos • Com respeito à extinção, é necessário mais tempo para extinguir uma resposta com um esquema de reforço parcial do que com um esquema de reforço contínuo Motivação, Comportamento e Reforço Motivação é o conjunto de fatores internos e externos que energizam o nosso comportamento e o dirigem para objetivos Teorias da Motivação • A teoria da redução do impulso propõe que, primeiro, uma necessidade corporal (tal como a fome) cria um estado de tensão corporal chamado impulso ou pulsão; então,o comportamento motivado (buscar alimento) funciona para reduzir esse impulso obtendo o reforço (alimento), para eliminar essa necessidade e fazer o corpo retornar a um estado de equilíbrio interno. • Em essência, nós somos “empurrados” para a ação por estados pulsionais desagradáveis • É eficaz para explicar necessidades biológicas como a fome e a sede Teorias da Motivação • A teoria do incentivo propõe que somos “puxados” para a ação pelos incentivos, estímulos externos ambientais que não envolvem a redução do impulso • Por exemplo, os alunos podem ser motivados por tirar boas notas, o que os levará a se esforçar e estudar mais • O dinheiro é outro exemplo clássico de um incentivo que nos “puxa” para determinados comportamentos Teorias da Motivação • A teoria da excitação afirma que o nosso comportamento é motivado para manter um nível ótimo de excitação, o que varia de pessoa para pessoa • Quando abaixo do nível ótimo, somos motivados a elevar a nossa excitação até aquele nível • Quando superexcitados, somos motivados a reduzir o nosso nível de excitação até o nosso nível ótimo • A teoria da excitação argumenta que o nosso nível de excitação influencia o nosso nível de desempenho, com um certo nível sendo ótimo A Lei de Yerkes-Dodson Uma excitação aumentada ajudará o desempenho até um certo ponto, após o qual uma excitação adicional prejudicará o desempenho Motivação Extrínseca vs. Intrínseca • Motivação extrínseca é o desejo de realizar um comportamento para obter um reforço externo ou para evitar um estímulo externo aversivo • Motivação intrínseca é o desejo de realizar um comportamento de modo eficiente e pelo comportamento em si • O reforço é fornecido pela própria atividade • Por exemplo, por que os alunos estudam para as aulas? • Um motivador extrínseco seriam as notas • Um motivador intrínseco seria o prazer de obter informações O Efeito da Superjustificação • Em um estudo de Lepper, Greene e Nisbett (1973), algumas crianças que gostavam de desenhar com canetas hidrocor (elas faziam isso durante os períodos de brincar livre e, portanto, estavam no início intrinsecamente motivadas) receberam prêmios, um incentivo extrínseco, por desenhar com as canetas. Outras crianças não receberam nenhum prêmio por desenhar com as canetas. O Efeito da Superjustificação • Uma semana depois, quando não foi dado nenhum prêmio pelos desenhos feitos com as canetas, as crianças que não tinham recebido prêmios ainda continuavam desenhando, mas aquelas que tinham recebido os prêmios passaram muito menos tempo usando as canetas para desenhar. O Efeito da Superjustificação • Ocorre quando há um decréscimo em um comportamento intrinsecamente motivado depois que o comportamento é extrinsecamente reforçado e então o reforço é interrompido • O efeito de superjustificação indica que o processamento cognitivo da pessoa está influenciando o seu comportamento, e que esse processamento pode diminuir a eficácia de reforçadores extrínsecos • Entretanto, não é provável que o reforço extrínseco influencie a motivação intrínseca se o reforço extrínseco depende de se fazer bem alguma coisa versus apenas fazê-la Aspectos Biológicos e Cognitivos da Aprendizagem Prontidão Biológica na Aprendizagem Aprendizagem Latente e Aprendizagem Observacional Prontidão Biológica na Aprendizagem A nossa prontidão para aprender a temer objetos ou situações perigosos para nós (p. ex., alturas) e para evitar alimentos e bebidas que nos fazem mal tem importância adaptativa Aversão de Paladar • Garcia e Koelling (1966) estavam estudando os efeitos da radiação sobre os ratos • Depois de vários tratamentos com radiação, os ratos continuavam entrando nas câmaras experimentais onde tinham sofrido a radiação, mas não bebiam mais a água que havia dentro dessas gaiolas Aversão de Paladar • Os pesquisadores descobriram que as garrafas de água das câmaras experimentais eram feitas de uma substância diferente da das gaiolas – plástico versus vidro • Assim, a água tinha um gosto diferente em cada local, e os ratos aprenderam rapidamente uma aversão às garrafas de água da câmara experimental, mesmo que a náusea viesse horas depois de terem estado na câmara experimental Aversão de Paladar • Assim, a aversão de paladar é um surpreendente contraexemplo da regra de que o EI (náusea) precisa se seguir imediatamente ao EC (a água com gosto diferente) para que a aprendizagem aconteça • Os ratos aprenderam a aversão de paladar sem que houvesse um emparelhamento de deixa e consequência… Aversão de Paladar • Os pesquisadores examinaram duas deixas que foram associadas à náusea provocada pela radiação: • Água adoçada • Água de gosto normal acompanhada por estalidos e luzes piscantes quando os ratos bebiam a água • Os ratos que beberam a água adoçada aprenderam facilmente a aversão à água, mas os ratos que beberam a água de gosto normal acompanhada por estalidos e luzes piscantes não aprenderam • Os ratos, simplesmente, não aprenderam a associar essas deixas ambientais auditivas e visuais, que ocorriam enquanto eles bebiam, com a náusea que sentiam posteriormente; esta associação não fazia nenhum sentido “biológico” para eles Tendência Instintiva • A tendência de um animal de recuar de uma resposta operante aprendida a um objeto para uma resposta inata, instintiva • Portanto, respostas biologicamente instintivas às vezes limitam ou atrapalham a nossa capacidade de condicionar outras respostas menos naturais • Os organismos aprenderão certas associações (aquelas consistentes com o seu comportamento natural) mais facilmente do que outras (aquelas menos consistentes com o seu comportamento natural) Aprendizagem Latente e Aprendizagem Observacional • A aprendizagem latente é a aprendizagem que ocorre, mas não é demonstrada até haver um incentivo para isso • Por exemplo, os alunos estudam para as aulas, mas não demonstram abertamente a aprendizagem até uma prova, para a qual o incentivo é uma boa nota • A aprendizagem observacional (modelagem) é aprender observando os outros e imitando o seu comportamento Aprendizagem Latente • Edward Tolman foi um pesquisador pioneiro da aprendizagem latente • Ratos privados de comida tinham de encontrar seu caminho em um labirinto, e o número de voltas erradas/erros era contado • Por exemplo, em um experimento com três grupos, o alimento (reforço) estava sempre presente na caixa-alvo que havia no final do labirinto para um grupo, mas nunca para outro. Para um terceiro grupo, não havia comida nenhuma até o décimo primeiro dia do experimento. Aprendizagem Latente • Interessantemente, o desempenho do grupo que só começou a obter o reforço do alimento no décimo primeiro dia melhorou imediatamente no dia seguinte, igualando-se ao desempenho do grupo que sempre encontrara o reforço • Assim, parece que eles estiveram aprendendo o labirinto todo o tempo, mas não demonstraram a sua aprendizagem até o incentivo ser apresentado Aprendizagem Latente Aprendizagem Observacional A pesquisa pioneira de Albert Bandura sobre a modelagem • Em um experimento, algumas crianças foram expostas a um adulto que batia, chutava e gritava com um boneco Bobo • Depois de observar esse comportamento, cada criança era levada para outra sala cheia de brinquedos atraentes, mas lhe diziam que os brinquedos eram para outras crianças e que ela não poderia brincar com eles • Mais tarde, a criança era levada para uma outra sala com brinquedos com os quais ela poderia brincar, incluindo um boneco Bobo • A criança passava a bater no boneco exatamente como o modelo adulto fizera • No entanto, quando expostas a um modelo gentil, as crianças agiam mais gentilmente em relação ao boneco do que as crianças expostas ao outro modelo • Assim, o comportamento das crianças era guiado pelo comportamento do modelo ao qual tinham sido expostas Aprendizagem Observacional • Em outro experimento, um adulto era recompensado pelo comportamento agressivo, punido pelo comportamento agressivo, ou não sofria nenhuma consequência pelo seu comportamento • As crianças que viam o adulto ser reforçado por seu comportamento agressivo agiam mais agressivamente em relação ao boneco Bobo do que aquelas que tinham visto o modelo agir e não sofrer nenhuma consequência • Além disso, as crianças que tinham visto o adulto ser punido foram menos agressivas em relação ao boneco do que aquelas que não tinham visto o adulto não sofrer nenhuma consequência por agir agressivamente em relação ao boneco