N - DAELT

Propaganda
Prof. Alvaro Augusto
Pag. 1
UTFPR
O que é a Teoria dos Jogos?
• Uma teoria que estuda
as interações entre
agentes (jogadores) que
atuam em estruturas
formais de incentivo
(jogos).
• O foco da teoria são os
jogos de estratégia, não
os jogos de azar.
Prof. Alvaro Augusto
Pag. 2
UTFPR
Aplicações da Teoria dos Jogos
• Relações interpessoais.
• Relações econômicas.
• Estratégias militares.
• Estratégias de negociação.
• Operação de sistemas.
• Comportamento animal.
• Teoria da evolução.
• Esportes, etc.
Prof. Alvaro Augusto
Pag. 3
UTFPR
Os jogos mais interessantes
• “O que será que ele está
pensando sobre o que
estou pensando que ele
está pensando?”
Prof. Alvaro Augusto
Pag. 4
UTFPR
Participantes excluídos dos jogos
• Loucos.
• Crianças.
Prof. Alvaro Augusto
Pag. 5
UTFPR
Jogos de Soma Zero
• John von Neumann e Oskar
Morgenstern, 1944: “Theory
of Games and Economic
Behavior”.
• Jogos de “Soma Zero”: o
ganho de um jogador é
igual à perda do outro.
• Ex.: xadrez, pôquer, truco.
Prof. Alvaro Augusto
Pag. 6
UTFPR
Não confunda...
• John von
Neumann
com Alfred E.
Newman!
Prof. Alvaro Augusto
Pag. 7
UTFPR
Jogos de Soma Não Zero
• John Forbes Nash, 1950.
• Jogos de “Soma Não
Zero”: os ganhos totais
dos jogadores são não
nulos.
• Equilíbrio de Nash.
• “A Beautiful Mind” (2002).
Prof. Alvaro Augusto
Pag. 8
UTFPR
WallStreet (1987)
It's
It'saazero-sum
zero-sum
game,
game,pal:
pal:somesomebody
bodywins
winsand
and
somebody
somebodyloses!
loses!
Prof. Alvaro Augusto
Pag. 9
UTFPR
A Rua do Muro (1987)
ÉÉum
umjogo
jogode
desoma
soma
zero,
zero,meu
meuchapa:
chapa:
alguém
alguémganha
ganhaee
alguém
alguémperde!
perde!
Prof. Alvaro Augusto
Pag. 10
UTFPR
WallStreet (1987)
Prof. Alvaro Augusto
Pag. 11
UTFPR
Uma área fértil em Nobeis
• 1994: John F. Nash,
Reinhard Selten e
John Harsanyi.
• “Pela análise pioneira do
equilíbrio na teoria
dos jogos não
cooperativos”.
Prof. Alvaro Augusto
Pag. 12
UTFPR
Uma área fértil em Nobeis
• 2005: Robert Aumann e
Thomas Schelling.
• “Por terem melhorado o
conhecimento do conflito e da
cooperação por meio de análise
via teoria dos jogos”.
Prof. Alvaro Augusto
Pag. 13
UTFPR
Uma área fértil em Nobeis
• 2007: Roger Myerson,
Leonid Hurwicz e
Eric Maskin (2007).
• “Por terem estabelecido
os fundamentos da teoria
do projeto de
mecanismos”.
Prof. Alvaro Augusto
Pag. 14
UTFPR
Prof. Alvaro Augusto
Pag. 15
UTFPR
Dilema do Prisioneiro
• Protótipo para jogos
de soma não zero.
• Cada jogador tenta
maximizar os seus
resultados, sem
conhecimento das
escolhas do outro
jogador.
Prof. Alvaro Augusto
Pag. 16
UTFPR
Estrutura do Dilema do Prisioneiro
• Dois indivíduos cometem um crime em conjunto e são
capturados.
• A polícia interroga cada um deles separadamente e
oferece as seguintes opções:
– Se ficarem calados (cooperação), ambos são
condenados a um ano de cadeia.
– Se ambos confessarem (falta de cooperação), ambos
são condenados a dois anos.
– Se apenas um confessar (traição), aquele que
confessou ganha liberdade e o outro é condenado a
cinco anos .
Prof. Alvaro Augusto
Pag. 17
UTFPR
Matriz de Pay-Offs
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 18
UTFPR
A melhor estratégia para ambos
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 19
UTFPR
Qual a melhor estratégia?
• A estratégia anterior
depende de absoluta
confiança entre os dois
participantes.
• Mas, rapidamente, “V”
perceberá que pode
trair “D” e sair em
liberdade.
Prof. Alvaro Augusto
Pag. 20
UTFPR
A melhor estratégia para “V”
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 21
UTFPR
Problemas
• O problema é que “V”
não sabe o que “D”
fará.
• Além disso, “D”
também chegou à
conclusão que é
melhor trair “V” e sair
em liberdade...
Prof. Alvaro Augusto
Pag. 22
UTFPR
A melhor estratégia para “D”
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 23
UTFPR
A melhor estratégia estável
• Como “V” não sabe o
que “D” fará, e viceversa, a informação é
restrita.
• A “melhor” solução
ocorre quando ambos
os jogadores tentam
maximizar seus
resultados, traindo o
companheiro.
Prof. Alvaro Augusto
Pag. 24
UTFPR
O Equilíbrio de Nash
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 25
UTFPR
Nomeando os quadrantes (ref. “D”)
Prisioneiro V
Coopera (C)
Não Coopera (N)
Coopera (C)
Prisioneiro D
Não Coopera (N)
Fraternidade
Universal
(CC)
Prof. Alvaro Augusto
Pag. 26
UTFPR
Nomeando os quadrantes (ref. “D”)
Prisioneiro V
Não Coopera (N)
Coopera (C)
Rivalidade
Universal
(NN)
Coopera (C)
Prisioneiro D
Não Coopera (N)
Fraternidade
Universal
(CC)
Prof. Alvaro Augusto
Pag. 27
UTFPR
Nomeando os quadrantes (ref. “D”)
Prisioneiro V
Não Coopera (N)
Rivalidade
Universal
(NN)
Coopera (C)
Prisioneiro D
Não Coopera (N)
Coopera (C)
Caroneiro
(NC)
Fraternidade
Universal
(CC)
Prof. Alvaro Augusto
Pag. 28
UTFPR
Nomeando os quadrantes (ref. “D”)
Prisioneiro V
Não Coopera (N)
Coopera (C)
Prisioneiro D
Não Coopera (N)
Coopera (C)
Rivalidade
Universal
(NN)
Caroneiro
(NC)
Trouxa
(CN)
Fraternidade
Universal
(CC)
Prof. Alvaro Augusto
Pag. 29
UTFPR
Estratégia Dominante
• Uma estratégia
dominante é aquela
que dá os melhores
resultados para
determinado jogador,
independentemente
das estratégias dos
demais jogadores.
Prof. Alvaro Augusto
Pag. 30
UTFPR
Estratégia Dominante e Equilíbrio
• Uma combinação de N
estratégias dominantes,
para N jogadores, é
denominada equilíbrio
de Nash.
Prof. Alvaro Augusto
Pag. 31
UTFPR
O Equilíbrio de Nash
Prisioneiro V
Confessa
(não coopera)
Não confessa
(coopera)
Prisioneiro D
Confessa
(não coopera)
Não confessa
(coopera)
2 anos
5 anos
2 anos
Liberdade
Liberdade
1 ano
5 anos
1 ano
Prof. Alvaro Augusto
Pag. 32
UTFPR
O papel da banca
• Qualquer jogo de soma não zero pode ser
transformado em um jogo de soma zero,
bastando adicionar-se um jogador extra, que
assume o ganho ou prejuizo: a “banca”.
• No caso do Dilema do Prisioneiro, por
exemplo, os prisioneiros perdem, mas alguém
ganha. Quem?
Prof. Alvaro Augusto
Pag. 33
UTFPR
Prof. Alvaro Augusto
Pag. 34
UTFPR
O Falcão e o Pombo (Chicken)
• Nesse jogo, “Falcão” e
“Pombo” são papeis
desempenhados pelos
jogadores.
• O falcão sempre ataca.
• O pombo sempre se defende.
• “Chicken”: nome dado por
causa do filme “Juventude
Transviada” (1955).
Prof. Alvaro Augusto
Pag. 35
UTFPR
O Falcão e o Pombo (Chicken)
Jogador 2
Falcão
Pombo
Paz
Universal
Pombo
Jogador 1
Falcão
Prof. Alvaro Augusto
Pag. 36
UTFPR
O Falcão e o Pombo (Chicken)
Jogador 2
Falcão
Pombo
Jogador 1
Falcão
Pombo
Reputações
Feridas
Reputações
Feridas
Prof. Alvaro Augusto
Paz
Universal
Pag. 37
UTFPR
O Falcão e o Pombo (Chicken)
Jogador 2
Falcão
Pombo
Destruição
Mútua
Assegurada
(M.A.D.)
Reputações
Feridas
Pombo
Jogador 1
Falcão
Reputações
Feridas
Paz
Universal
Prof. Alvaro Augusto
Pag. 38
UTFPR
Características do Jogo
• Não há custo em ser pombo.
• Já os falcões têm de arcar com os custos do vôo
e do ataque.
• Em geral, os falcões proliferarão quando esses
custos forem baixos.
• Quando os custos superarem os benefícios da
refeição obtida, os pombos passarão a dominar.
Prof. Alvaro Augusto
Pag. 39
UTFPR
Lições do Falcão e do Pombo
É melhor ser um falcão vivo do que
um pombo morto...
Prof. Alvaro Augusto
Pag. 40
UTFPR
Lições do Falcão e do Pombo
...mas é ainda melhor ser um pombo
vivo, e, frequentemente, mais fácil!
Prof. Alvaro Augusto
Pag. 41
UTFPR
O Jogo do Despacho Hidrotérmico
• O Sistema Interligado
Nacional é dito
hidrotérmico com
predomínio hidráulico.
• As vazões são aleatórias.
• Como garantir o
atendimento da demanda
com menor custo?
Prof. Alvaro Augusto
Pag. 42
UTFPR
O Despacho Hidrotérmico
Hidrologia (instante 2)
Despacha
térmicas
Não chove
OK!
Não despacha
térmicas
ONS (instante 1)
Chove
Prof. Alvaro Augusto
Pag. 43
UTFPR
O Despacho Hidrotérmico
Hidrologia (instante 2)
Despacha
térmicas
Não despacha
térmicas
ONS (instante 1)
Chove
Não chove
OK!
OK!
Prof. Alvaro Augusto
Pag. 44
UTFPR
O Despacho Hidrotérmico
Hidrologia (instante 2)
Despacha
térmicas
Não despacha
térmicas
ONS (instante 1)
Chove
Vertimento
Não chove
OK!
OK!
Prof. Alvaro Augusto
Pag. 45
UTFPR
O Despacho Hidrotérmico
Hidrologia (instante 2)
Despacha
térmicas
Vertimento
Não despacha
térmicas
ONS (instante 1)
Chove
OK!
(custo baixo)
Prof. Alvaro Augusto
Não chove
OK!
(custo alto)
Racionamento
Pag. 46
UTFPR
Forma Extensiva
Chove
Despacha
Térmicas
Hidro
ONS
Não
Despacha
Térmicas
NOK Vertimento
Não
Chove
OK!
Chove
OK!
Não
Chove
NOK Racionamento
Hidro
Prof. Alvaro Augusto
Pag. 47
UTFPR
Prof. Alvaro Augusto
Pag. 48
UTFPR
A Tragédia dos Comuns
• “Commons”, na Inglaterra
medieval, eram terrenos
baldios, de uso comum.
• Quando os camponeses
levavam suas vaquinhas
para pastar, tentavam
maximizar o resultado
individual, em
detrimento do resultado
dos demais.
Prof. Alvaro Augusto
Pag. 49
UTFPR
Exemplos da Tragédia dos Comuns
• Jantar ou almoço comunitário, com
equipartição de despesas (rateio).
• Consumo de combustível fóssil.
• Pesca em águas internacionais.
• Envio de e-mails não solicitados (spam).
• Recarga excessiva de celulares.
• Conta de Resultados a Compensar (CRC).
Prof. Alvaro Augusto
Pag. 50
UTFPR
Soluções para a tragédia
• Privatize o pasto.
• Regulamente o uso
do pasto.
• Cobre multas dos
infratores.
Prof. Alvaro Augusto
Pag. 51
UTFPR
O Leilão da Nota de US$ 1,00
• Martin Shubik (1971):
universitários como
cobaias.
• Leilão clássico:
– Uma nota de US$ 1,00 é
posta em leilão.
– Qual será o lance
máximo ofertado por
ela?
Prof. Alvaro Augusto
Pag. 52
UTFPR
O leilão modificado de Shubik
• A nota de US$ 1,00 é posta em leilão.
• O maior lance paga e leva a nota, mas...
• O segundo maior lance paga, mas não leva.
• Coalisões são proibidas.
• Qual o resultado?
Prof. Alvaro Augusto
Pag. 53
UTFPR
Sunk Costs
• Quando não há mais esperanças
de ter lucro, as pessoas tentam
minimizar o prejuízo.
• Os custos incorridos nessa
situação são denominados Sunk
Costs (Custos Afundados).
• Raciocínio: “Investi demais para
desistir agora!”
Prof. Alvaro Augusto
Pag. 54
UTFPR
Prof. Alvaro Augusto
Pag. 55
UTFPR
Os torneios de Axelrod
• Robert Axelrod: professor de
Ciência Política na
Universidade de Michigan.
• Torneio cibernético de
estratégias para o Dilema do
Prisioneiro Iterado.
• “The Evolution of Cooperation”
(1984).
Prof. Alvaro Augusto
Pag. 56
UTFPR
Sistema de pontos do torneio
Estratégia 2
Não coopera
Coopera
1;1
5;0
Coopera
Estratégia 1
Não Coopera
0;5
3;3
Prof. Alvaro Augusto
Pag. 57
UTFPR
And the winner is...
• Tit for Tat, idealizada por Anatol Rapoport.
• “Retaliação equivalente” (“Tip for Tap”).
• “Olho por olho, dente por dente”.
• Tit for Tat inicia cooperando, e depois imita a
atuação do adversário:
– Se o adversário cooperou, Tit for Tat coopera.
– Se o adversário traiu, Tit for Tat trai.
Prof. Alvaro Augusto
Pag. 58
UTFPR
Características de Tit for Tat
• Simplicidade.
• Transparência.
• Generosidade.
• Rapidez na retaliação.
• Capacidade de
estabelecer uma
reputação.
Prof. Alvaro Augusto
Pag. 59
UTFPR
Exemplo da “vida real”
• “Live and let live”: estratégia surgida nas
trincheiras da 1ª Grande Guerra.
Prof. Alvaro Augusto
Pag. 60
UTFPR
Lições de Tit for Tat
• Não seja invejoso.
• Continue cooperando.
• Não se deixe
explorar!
Prof. Alvaro Augusto
Pag. 61
UTFPR
Um único probleminha...
• O que acontece quando
Tit for Tat encontra a si
mesma?
Prof. Alvaro Augusto
Pag. 62
UTFPR
Para saber mais
• Duilio de Avila Bêrni,
“Teoria dos Jogos – Jogos
de Estratégia, Estratégia
Decisória, Teoria da
Decisão” (2004), 138
páginas.
Prof. Alvaro Augusto
Pag. 63
UTFPR
Para saber mais
• Ronaldo Fiani,
“Teoria dos Jogos – Com
Aplicações em Economia,
Administração e Ciências
Sociais” (2006), 388
páginas.
Prof. Alvaro Augusto
Pag. 64
UTFPR
Prof. Alvaro Augusto
Pag. 65
UTFPR
Download