Teoria_dos_Jogos

Propaganda
Teoria dos Jogos
Marcio Mattos Borges de Oliveira
FEARP - 2007
Dilema do prisioneiro
• O Dilema do prisioneiro foi originalmente
formulado por Merrill Flood e Melvin
Dresher enquanto trabalhavam na RAND
em 1950. Mais tarde, Albert W. Tucker o
formalizou com o tema da sentença de
tempo de prisão e deu ao problema geral
esse nome específico.
O Dilema do Prisioneiro (DP) clássico
funciona da seguinte forma
• Dois suspeitos, A e B, são presos pela polícia. A
polícia tem provas insuficientes para condenálos, mas, separando os prisioneiros, oferece a
ambos o mesmo acordo: se um dos prisioneiros
testemunhar para a procuradoria contra o outro
e o outro permanecer em silêncio, o dedo-duro
sai livre enquanto o cúmplice silencioso cumpre
10 anos de sentença. Se ambos ficarem em
silêncio, a polícia só pode condená-los a 6
meses de cadeia cada um. Se ambos traírem o
comparsa, cada um leva 2 anos de cadeia.
Cada prisioneiro faz sua decisão sem saber que
decisão o outro vai tomar e nenhum tem certeza
da decisão do outro. A questão que o dilema
propõe é: o que vai acontecer? Como o
prisioneiro vai reagir?
Análise
• O fato é que pode haver dois vencedores no
jogo, sendo esta última solução a melhor para
ambos, quando analisada em conjunto.
Entretanto, os jogadores confrontam-se com
alguns problemas: Confiam no cúmplice e
permanecem negando o crime, mesmo
correndo o risco de serem colocados numa
situação ainda pior, ou confessam e esperam
ser libertados, apesar de que, se ele fizer o
mesmo, ambos ficarão numa situação pior do
que se permanecessem calados?
Calculando
• Em abstrato, não importa os valores das penas,
mas o cálculo das vantagens de uma decisão
cujas conseqüências estão atreladas às
decisões de outros agentes, onde a confiança e
traição fazem parte da estratégia em jogo.
• Casos como este são recorrentes na economia,
na biologia e na estratégia. O estudo das táticas
mais vantajosas num cenário onde esse dilema
se repita é um dos temas da teoria dos jogos.
Teoria dos Jogos
• É um ramo da matemática aplicada que estuda
situações estratégicas onde jogadores escolhem
diferentes ações na tentativa de melhorar seu retorno.
Inicialmente desenvolvida como ferramenta pra
compreender comportamento econômico e depois por
Corporação RAND para definir estratégias nucleares, a
teoria dos jogos é agora usada em diversos campos
acadêmicos. A partir de 1970 a teoria dos jogos passou
a ser aplicada ao estudo do comportamento animal,
incluindo evolução das espécies por seleção natural.
Devido a interesse em jogos como o dilema do
prisioneiro, no qual interesses próprios e racionais
prejudicam a todos, a teoria dos jogos vem sendo
aplicada na ciência política, ética, filosofia e,
recentemente, no jornalismo, área que apresenta
inúmeros e diversos jogos, tanto competitivos como
cooperativos. Finalmente, a teoria dos jogos despertou a
atenção da ciência da computação que a vem utilizando
em avanços na inteligência artificial e cibernética.
Dilema do Prisioneiro
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Análise do prisioneiro 1
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Análise do prisioneiro 1
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Resultado
• Prisioneiro 1 confessa!!!
Análise do prisioneiro 2
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Análise do prisioneiro 1
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Resultado
• Prisioneiro 2 também confessa!!!
• Os dois pegam 2 anos, mas se eles
trabalhassem juntos, poderiam pegar
apenas seis meses cada um.
• Para ambos, a confissão é a estratégia
dominante: uma estratégia que é a melhor
independentemente da escolha do
oponente!!
Dilema do prisioneiro
O que os prisioneiros decidiriam se eles
pudessem negociar?
Eles poderiam se sair melhor se
buscassem uma solução cooperativa….
É por isto que a polícia interroga suspeitos
em salas separadas!
O equilíbrio não precisa ser eficiente. O
equilíbrio não cooperativo no caso do do
Dilema do prisioneiro resulta numa solução
que não é a melhor possível para as partes.
Equilibrio
Equilíbrio de Nash: nenhum
jogador é incentivado a mudar sua
estratégia, dada a escolha do
outro jogador
Ambos confessarem é um
equilíbrio de Nash;
Ambos não confessarem não é
um Equilíbrio de Nash, pois o
rival sempre poderá quebrar a
promessa.
Jogo da Firma Dominante
Duas firmas, uma grande e outra
pequena
Ambas as firmas podem anunciar um
valor de produção (liderar) ou então
esperar o anúncio do outro e ai produzir
uma quantidade que não sature o
mercado.
Jogo da Firma Dominante
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Analise da Dominante
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Jogo da Firma Dominante
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Análise da Dominante
Conclusão:
A forma dominante sempre anuncia….
Mas o que fará a firma menor?
Analise da Menor
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Análise da Menor
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Jogo da Firma Dominante
Conclusão:
Não existe estratégia dominante para a firma
pequena.
Isto significa que é impossível prever o
que ela fará?
Analise da Menor
Grande
Anuncia
Segue
Pequena
Anuncia
( 0.5,
4)
Segue
( 1, 8)
( 3, 2)
( 0.5, 1)
Jogo da Firma Dominante
Conclusão:
A Menor sempre seguirá, porque a dominante
sempre anunciará!
Equilibrio
Equilíbrio de Nash: nenhum jogador tem
incentivo a mudar sua estratégia, dado a
escolha do outro jogador
Dominante: Grande & Pequena seguem o Equilíbrio
de Nash
A melhor opção de um jogador é definida pela
antecipação da melhor decisão do rival.
Dividir e aceitar
Jogo de dois estágios entre A e B que
devem dividir $1.00
1) Jogador A joga primeiro e propõe como
dividir o dólar. Jogador B aceita a
divisão e o jogo termina, ou segue para
o segundo round.
2) O valor cai para $.90. Jogador B propõe
uma divisão. Jogador A aceita ou o jogo
termina com os dois sem ganhar nada.
Dividir e aceitar
O que A deve fazer?
Dividir e aceitar
O tempo para o fim do jogo pode definir a
estratégia a ser empregada. Se o jogo
chegar ao segundo round a estratégia de
A deverá mudar.
Voltemos ao Dilema do Prisioneiro:
Existe um meio de gerar uma solução cooperativa?
Prisioneiro 2
Confessa
Não
Confessa
Confessa
(2;2)
(0;10)
Não
Confessa
(10;0)
(0,5;0,5)
?
Prisioneiro
1
Voltemos ao Dilema do Prisioneiro:
Existe um meio de gerar uma solução cooperativa?
Não é um equilíbrio de Nash
Se o prisioneiro 1 concordar em não confessar, o prisioneiro 2 é
incentivado a confessar
Se o prisioneiro 2 concordar em não confessar, o prisioneiro 1 é
incentivado a confessar
A alma do contrato – para ter um acordo as partes devem acreditar
que suas ações não podem ser mudadas volumtariamente
Alternativa: Contrato implícito
Se houver relação de longa data entre as partes (velhos parceiros
no crime) pode haver mais confiança no acordo
Aplicação para negociação coletiva
Jogo de dois agentes
Incerteza
Cada parte tentará antecipar o que a outra
fará
Tempo limita o assunto
Abilidade em acordos afeta o resultado
Uma longa e contínua relação pode
melhorar a eficiência do resultado
Download