Prof. Alvaro Augusto Pag. 1 UTFPR O que é a Teoria dos Jogos? • Uma teoria que estuda as interações entre agentes (jogadores) que atuam em estruturas formais de incentivo (jogos). • O foco da teoria são os jogos de estratégia, não os jogos de azar. Prof. Alvaro Augusto Pag. 2 UTFPR Aplicações da Teoria dos Jogos • Relações interpessoais. • Relações econômicas. • Estratégias militares. • Estratégias de negociação. • Operação de sistemas. • Comportamento animal. • Teoria da evolução. • Esportes, etc. Prof. Alvaro Augusto Pag. 3 UTFPR Os jogos mais interessantes • “O que será que ele está pensando sobre o que estou pensando que ele está pensando?” Prof. Alvaro Augusto Pag. 4 UTFPR Participantes excluídos dos jogos • Loucos. • Crianças. Prof. Alvaro Augusto Pag. 5 UTFPR Jogos de Soma Zero • John von Neumann e Oskar Morgenstern, 1944: “Theory of Games and Economic Behavior”. • Jogos de “Soma Zero”: o ganho de um jogador é igual à perda do outro. • Ex.: xadrez, pôquer, truco. Prof. Alvaro Augusto Pag. 6 UTFPR Não confunda... • John von Neumann com Alfred E. Newman! Prof. Alvaro Augusto Pag. 7 UTFPR Jogos de Soma Não Zero • John Forbes Nash, 1950. • Jogos de “Soma Não Zero”: os ganhos totais dos jogadores são não nulos. • Equilíbrio de Nash. • “A Beautiful Mind” (2002). Prof. Alvaro Augusto Pag. 8 UTFPR WallStreet (1987) It's It'saazero-sum zero-sum game, game,pal: pal:somesomebody bodywins winsand and somebody somebodyloses! loses! Prof. Alvaro Augusto Pag. 9 UTFPR A Rua do Muro (1987) ÉÉum umjogo jogode desoma soma zero, zero,meu meuchapa: chapa: alguém alguémganha ganhaee alguém alguémperde! perde! Prof. Alvaro Augusto Pag. 10 UTFPR WallStreet (1987) Prof. Alvaro Augusto Pag. 11 UTFPR Uma área fértil em Nobeis • 1994: John F. Nash, Reinhard Selten e John Harsanyi. • “Pela análise pioneira do equilíbrio na teoria dos jogos não cooperativos”. Prof. Alvaro Augusto Pag. 12 UTFPR Uma área fértil em Nobeis • 2005: Robert Aumann e Thomas Schelling. • “Por terem melhorado o conhecimento do conflito e da cooperação por meio de análise via teoria dos jogos”. Prof. Alvaro Augusto Pag. 13 UTFPR Uma área fértil em Nobeis • 2007: Roger Myerson, Leonid Hurwicz e Eric Maskin (2007). • “Por terem estabelecido os fundamentos da teoria do projeto de mecanismos”. Prof. Alvaro Augusto Pag. 14 UTFPR Prof. Alvaro Augusto Pag. 15 UTFPR Dilema do Prisioneiro • Protótipo para jogos de soma não zero. • Cada jogador tenta maximizar os seus resultados, sem conhecimento das escolhas do outro jogador. Prof. Alvaro Augusto Pag. 16 UTFPR Estrutura do Dilema do Prisioneiro • Dois indivíduos cometem um crime em conjunto e são capturados. • A polícia interroga cada um deles separadamente e oferece as seguintes opções: – Se ficarem calados (cooperação), ambos são condenados a um ano de cadeia. – Se ambos confessarem (falta de cooperação), ambos são condenados a dois anos. – Se apenas um confessar (traição), aquele que confessou ganha liberdade e o outro é condenado a cinco anos . Prof. Alvaro Augusto Pag. 17 UTFPR Matriz de Pay-Offs Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 18 UTFPR A melhor estratégia para ambos Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 19 UTFPR Qual a melhor estratégia? • A estratégia anterior depende de absoluta confiança entre os dois participantes. • Mas, rapidamente, “V” perceberá que pode trair “D” e sair em liberdade. Prof. Alvaro Augusto Pag. 20 UTFPR A melhor estratégia para “V” Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 21 UTFPR Problemas • O problema é que “V” não sabe o que “D” fará. • Além disso, “D” também chegou à conclusão que é melhor trair “V” e sair em liberdade... Prof. Alvaro Augusto Pag. 22 UTFPR A melhor estratégia para “D” Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 23 UTFPR A melhor estratégia estável • Como “V” não sabe o que “D” fará, e viceversa, a informação é restrita. • A “melhor” solução ocorre quando ambos os jogadores tentam maximizar seus resultados, traindo o companheiro. Prof. Alvaro Augusto Pag. 24 UTFPR O Equilíbrio de Nash Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 25 UTFPR Nomeando os quadrantes (ref. “D”) Prisioneiro V Coopera (C) Não Coopera (N) Coopera (C) Prisioneiro D Não Coopera (N) Fraternidade Universal (CC) Prof. Alvaro Augusto Pag. 26 UTFPR Nomeando os quadrantes (ref. “D”) Prisioneiro V Não Coopera (N) Coopera (C) Rivalidade Universal (NN) Coopera (C) Prisioneiro D Não Coopera (N) Fraternidade Universal (CC) Prof. Alvaro Augusto Pag. 27 UTFPR Nomeando os quadrantes (ref. “D”) Prisioneiro V Não Coopera (N) Rivalidade Universal (NN) Coopera (C) Prisioneiro D Não Coopera (N) Coopera (C) Caroneiro (NC) Fraternidade Universal (CC) Prof. Alvaro Augusto Pag. 28 UTFPR Nomeando os quadrantes (ref. “D”) Prisioneiro V Não Coopera (N) Coopera (C) Prisioneiro D Não Coopera (N) Coopera (C) Rivalidade Universal (NN) Caroneiro (NC) Trouxa (CN) Fraternidade Universal (CC) Prof. Alvaro Augusto Pag. 29 UTFPR Estratégia Dominante • Uma estratégia dominante é aquela que dá os melhores resultados para determinado jogador, independentemente das estratégias dos demais jogadores. Prof. Alvaro Augusto Pag. 30 UTFPR Estratégia Dominante e Equilíbrio • Uma combinação de N estratégias dominantes, para N jogadores, é denominada equilíbrio de Nash. Prof. Alvaro Augusto Pag. 31 UTFPR O Equilíbrio de Nash Prisioneiro V Confessa (não coopera) Não confessa (coopera) Prisioneiro D Confessa (não coopera) Não confessa (coopera) 2 anos 5 anos 2 anos Liberdade Liberdade 1 ano 5 anos 1 ano Prof. Alvaro Augusto Pag. 32 UTFPR O papel da banca • Qualquer jogo de soma não zero pode ser transformado em um jogo de soma zero, bastando adicionar-se um jogador extra, que assume o ganho ou prejuizo: a “banca”. • No caso do Dilema do Prisioneiro, por exemplo, os prisioneiros perdem, mas alguém ganha. Quem? Prof. Alvaro Augusto Pag. 33 UTFPR Prof. Alvaro Augusto Pag. 34 UTFPR O Falcão e o Pombo (Chicken) • Nesse jogo, “Falcão” e “Pombo” são papeis desempenhados pelos jogadores. • O falcão sempre ataca. • O pombo sempre se defende. • “Chicken”: nome dado por causa do filme “Juventude Transviada” (1955). Prof. Alvaro Augusto Pag. 35 UTFPR O Falcão e o Pombo (Chicken) Jogador 2 Falcão Pombo Paz Universal Pombo Jogador 1 Falcão Prof. Alvaro Augusto Pag. 36 UTFPR O Falcão e o Pombo (Chicken) Jogador 2 Falcão Pombo Jogador 1 Falcão Pombo Reputações Feridas Reputações Feridas Prof. Alvaro Augusto Paz Universal Pag. 37 UTFPR O Falcão e o Pombo (Chicken) Jogador 2 Falcão Pombo Destruição Mútua Assegurada (M.A.D.) Reputações Feridas Pombo Jogador 1 Falcão Reputações Feridas Paz Universal Prof. Alvaro Augusto Pag. 38 UTFPR Características do Jogo • Não há custo em ser pombo. • Já os falcões têm de arcar com os custos do vôo e do ataque. • Em geral, os falcões proliferarão quando esses custos forem baixos. • Quando os custos superarem os benefícios da refeição obtida, os pombos passarão a dominar. Prof. Alvaro Augusto Pag. 39 UTFPR Lições do Falcão e do Pombo É melhor ser um falcão vivo do que um pombo morto... Prof. Alvaro Augusto Pag. 40 UTFPR Lições do Falcão e do Pombo ...mas é ainda melhor ser um pombo vivo, e, frequentemente, mais fácil! Prof. Alvaro Augusto Pag. 41 UTFPR O Jogo do Despacho Hidrotérmico • O Sistema Interligado Nacional é dito hidrotérmico com predomínio hidráulico. • As vazões são aleatórias. • Como garantir o atendimento da demanda com menor custo? Prof. Alvaro Augusto Pag. 42 UTFPR O Despacho Hidrotérmico Hidrologia (instante 2) Despacha térmicas Não chove OK! Não despacha térmicas ONS (instante 1) Chove Prof. Alvaro Augusto Pag. 43 UTFPR O Despacho Hidrotérmico Hidrologia (instante 2) Despacha térmicas Não despacha térmicas ONS (instante 1) Chove Não chove OK! OK! Prof. Alvaro Augusto Pag. 44 UTFPR O Despacho Hidrotérmico Hidrologia (instante 2) Despacha térmicas Não despacha térmicas ONS (instante 1) Chove Vertimento Não chove OK! OK! Prof. Alvaro Augusto Pag. 45 UTFPR O Despacho Hidrotérmico Hidrologia (instante 2) Despacha térmicas Vertimento Não despacha térmicas ONS (instante 1) Chove OK! (custo baixo) Prof. Alvaro Augusto Não chove OK! (custo alto) Racionamento Pag. 46 UTFPR Forma Extensiva Chove Despacha Térmicas Hidro ONS Não Despacha Térmicas NOK Vertimento Não Chove OK! Chove OK! Não Chove NOK Racionamento Hidro Prof. Alvaro Augusto Pag. 47 UTFPR Prof. Alvaro Augusto Pag. 48 UTFPR A Tragédia dos Comuns • “Commons”, na Inglaterra medieval, eram terrenos baldios, de uso comum. • Quando os camponeses levavam suas vaquinhas para pastar, tentavam maximizar o resultado individual, em detrimento do resultado dos demais. Prof. Alvaro Augusto Pag. 49 UTFPR Exemplos da Tragédia dos Comuns • Jantar ou almoço comunitário, com equipartição de despesas (rateio). • Consumo de combustível fóssil. • Pesca em águas internacionais. • Envio de e-mails não solicitados (spam). • Recarga excessiva de celulares. • Conta de Resultados a Compensar (CRC). Prof. Alvaro Augusto Pag. 50 UTFPR Soluções para a tragédia • Privatize o pasto. • Regulamente o uso do pasto. • Cobre multas dos infratores. Prof. Alvaro Augusto Pag. 51 UTFPR O Leilão da Nota de US$ 1,00 • Martin Shubik (1971): universitários como cobaias. • Leilão clássico: – Uma nota de US$ 1,00 é posta em leilão. – Qual será o lance máximo ofertado por ela? Prof. Alvaro Augusto Pag. 52 UTFPR O leilão modificado de Shubik • A nota de US$ 1,00 é posta em leilão. • O maior lance paga e leva a nota, mas... • O segundo maior lance paga, mas não leva. • Coalisões são proibidas. • Qual o resultado? Prof. Alvaro Augusto Pag. 53 UTFPR Sunk Costs • Quando não há mais esperanças de ter lucro, as pessoas tentam minimizar o prejuízo. • Os custos incorridos nessa situação são denominados Sunk Costs (Custos Afundados). • Raciocínio: “Investi demais para desistir agora!” Prof. Alvaro Augusto Pag. 54 UTFPR Prof. Alvaro Augusto Pag. 55 UTFPR Os torneios de Axelrod • Robert Axelrod: professor de Ciência Política na Universidade de Michigan. • Torneio cibernético de estratégias para o Dilema do Prisioneiro Iterado. • “The Evolution of Cooperation” (1984). Prof. Alvaro Augusto Pag. 56 UTFPR Sistema de pontos do torneio Estratégia 2 Não coopera Coopera 1;1 5;0 Coopera Estratégia 1 Não Coopera 0;5 3;3 Prof. Alvaro Augusto Pag. 57 UTFPR And the winner is... • Tit for Tat, idealizada por Anatol Rapoport. • “Retaliação equivalente” (“Tip for Tap”). • “Olho por olho, dente por dente”. • Tit for Tat inicia cooperando, e depois imita a atuação do adversário: – Se o adversário cooperou, Tit for Tat coopera. – Se o adversário traiu, Tit for Tat trai. Prof. Alvaro Augusto Pag. 58 UTFPR Características de Tit for Tat • Simplicidade. • Transparência. • Generosidade. • Rapidez na retaliação. • Capacidade de estabelecer uma reputação. Prof. Alvaro Augusto Pag. 59 UTFPR Exemplo da “vida real” • “Live and let live”: estratégia surgida nas trincheiras da 1ª Grande Guerra. Prof. Alvaro Augusto Pag. 60 UTFPR Lições de Tit for Tat • Não seja invejoso. • Continue cooperando. • Não se deixe explorar! Prof. Alvaro Augusto Pag. 61 UTFPR Um único probleminha... • O que acontece quando Tit for Tat encontra a si mesma? Prof. Alvaro Augusto Pag. 62 UTFPR Para saber mais • Duilio de Avila Bêrni, “Teoria dos Jogos – Jogos de Estratégia, Estratégia Decisória, Teoria da Decisão” (2004), 138 páginas. Prof. Alvaro Augusto Pag. 63 UTFPR Para saber mais • Ronaldo Fiani, “Teoria dos Jogos – Com Aplicações em Economia, Administração e Ciências Sociais” (2006), 388 páginas. Prof. Alvaro Augusto Pag. 64 UTFPR Prof. Alvaro Augusto Pag. 65 UTFPR