Teoria dos Jogos Marcio Mattos Borges de Oliveira FEARP - 2007 Dilema do prisioneiro • O Dilema do prisioneiro foi originalmente formulado por Merrill Flood e Melvin Dresher enquanto trabalhavam na RAND em 1950. Mais tarde, Albert W. Tucker o formalizou com o tema da sentença de tempo de prisão e deu ao problema geral esse nome específico. O Dilema do Prisioneiro (DP) clássico funciona da seguinte forma • Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para condenálos, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros testemunhar para a procuradoria contra o outro e o outro permanecer em silêncio, o dedo-duro sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 2 anos de cadeia. Cada prisioneiro faz sua decisão sem saber que decisão o outro vai tomar e nenhum tem certeza da decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai reagir? Análise • O fato é que pode haver dois vencedores no jogo, sendo esta última solução a melhor para ambos, quando analisada em conjunto. Entretanto, os jogadores confrontam-se com alguns problemas: Confiam no cúmplice e permanecem negando o crime, mesmo correndo o risco de serem colocados numa situação ainda pior, ou confessam e esperam ser libertados, apesar de que, se ele fizer o mesmo, ambos ficarão numa situação pior do que se permanecessem calados? Calculando • Em abstrato, não importa os valores das penas, mas o cálculo das vantagens de uma decisão cujas conseqüências estão atreladas às decisões de outros agentes, onde a confiança e traição fazem parte da estratégia em jogo. • Casos como este são recorrentes na economia, na biologia e na estratégia. O estudo das táticas mais vantajosas num cenário onde esse dilema se repita é um dos temas da teoria dos jogos. Teoria dos Jogos • É um ramo da matemática aplicada que estuda situações estratégicas onde jogadores escolhem diferentes ações na tentativa de melhorar seu retorno. Inicialmente desenvolvida como ferramenta pra compreender comportamento econômico e depois por Corporação RAND para definir estratégias nucleares, a teoria dos jogos é agora usada em diversos campos acadêmicos. A partir de 1970 a teoria dos jogos passou a ser aplicada ao estudo do comportamento animal, incluindo evolução das espécies por seleção natural. Devido a interesse em jogos como o dilema do prisioneiro, no qual interesses próprios e racionais prejudicam a todos, a teoria dos jogos vem sendo aplicada na ciência política, ética, filosofia e, recentemente, no jornalismo, área que apresenta inúmeros e diversos jogos, tanto competitivos como cooperativos. Finalmente, a teoria dos jogos despertou a atenção da ciência da computação que a vem utilizando em avanços na inteligência artificial e cibernética. Dilema do Prisioneiro Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Análise do prisioneiro 1 Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Análise do prisioneiro 1 Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Resultado • Prisioneiro 1 confessa!!! Análise do prisioneiro 2 Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Análise do prisioneiro 1 Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Resultado • Prisioneiro 2 também confessa!!! • Os dois pegam 2 anos, mas se eles trabalhassem juntos, poderiam pegar apenas seis meses cada um. • Para ambos, a confissão é a estratégia dominante: uma estratégia que é a melhor independentemente da escolha do oponente!! Dilema do prisioneiro O que os prisioneiros decidiriam se eles pudessem negociar? Eles poderiam se sair melhor se buscassem uma solução cooperativa…. É por isto que a polícia interroga suspeitos em salas separadas! O equilíbrio não precisa ser eficiente. O equilíbrio não cooperativo no caso do do Dilema do prisioneiro resulta numa solução que não é a melhor possível para as partes. Equilibrio Equilíbrio de Nash: nenhum jogador é incentivado a mudar sua estratégia, dada a escolha do outro jogador Ambos confessarem é um equilíbrio de Nash; Ambos não confessarem não é um Equilíbrio de Nash, pois o rival sempre poderá quebrar a promessa. Jogo da Firma Dominante Duas firmas, uma grande e outra pequena Ambas as firmas podem anunciar um valor de produção (liderar) ou então esperar o anúncio do outro e ai produzir uma quantidade que não sature o mercado. Jogo da Firma Dominante Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Analise da Dominante Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Jogo da Firma Dominante Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Análise da Dominante Conclusão: A forma dominante sempre anuncia…. Mas o que fará a firma menor? Analise da Menor Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Análise da Menor Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Jogo da Firma Dominante Conclusão: Não existe estratégia dominante para a firma pequena. Isto significa que é impossível prever o que ela fará? Analise da Menor Grande Anuncia Segue Pequena Anuncia ( 0.5, 4) Segue ( 1, 8) ( 3, 2) ( 0.5, 1) Jogo da Firma Dominante Conclusão: A Menor sempre seguirá, porque a dominante sempre anunciará! Equilibrio Equilíbrio de Nash: nenhum jogador tem incentivo a mudar sua estratégia, dado a escolha do outro jogador Dominante: Grande & Pequena seguem o Equilíbrio de Nash A melhor opção de um jogador é definida pela antecipação da melhor decisão do rival. Dividir e aceitar Jogo de dois estágios entre A e B que devem dividir $1.00 1) Jogador A joga primeiro e propõe como dividir o dólar. Jogador B aceita a divisão e o jogo termina, ou segue para o segundo round. 2) O valor cai para $.90. Jogador B propõe uma divisão. Jogador A aceita ou o jogo termina com os dois sem ganhar nada. Dividir e aceitar O que A deve fazer? Dividir e aceitar O tempo para o fim do jogo pode definir a estratégia a ser empregada. Se o jogo chegar ao segundo round a estratégia de A deverá mudar. Voltemos ao Dilema do Prisioneiro: Existe um meio de gerar uma solução cooperativa? Prisioneiro 2 Confessa Não Confessa Confessa (2;2) (0;10) Não Confessa (10;0) (0,5;0,5) ? Prisioneiro 1 Voltemos ao Dilema do Prisioneiro: Existe um meio de gerar uma solução cooperativa? Não é um equilíbrio de Nash Se o prisioneiro 1 concordar em não confessar, o prisioneiro 2 é incentivado a confessar Se o prisioneiro 2 concordar em não confessar, o prisioneiro 1 é incentivado a confessar A alma do contrato – para ter um acordo as partes devem acreditar que suas ações não podem ser mudadas volumtariamente Alternativa: Contrato implícito Se houver relação de longa data entre as partes (velhos parceiros no crime) pode haver mais confiança no acordo Aplicação para negociação coletiva Jogo de dois agentes Incerteza Cada parte tentará antecipar o que a outra fará Tempo limita o assunto Abilidade em acordos afeta o resultado Uma longa e contínua relação pode melhorar a eficiência do resultado