Unidade III Unidade III 5 TAXONOMIAS DOS JOGOS A teoria dos jogos dedica-se a elucidar os aspectos da lógica na tomada de decisão em situações competitivas ou cooperativas. Os modelos atuariais utilizados espelham problemas reais do cotidiano, como economia ou exércitos em guerra, e observa-se que são melhores sucedidos quando aplicados às técnicas descritas nesta unidade, pois apontam soluções analíticas bastante satisfatórias. Após essa digressão, ficam definidos os principais ingredientes para a montagem do cenário do jogo: quem são os jogadores, quais são as regras e quais seus pay-offs (recompensas ou prêmios). A teoria dos jogos justifica a pesquisa da racionalidade da ação no ato da escolha, por meio de sua influência nas opções de modelagem estratégica, usando como fundamento a interação entre os jogadores, que poderá resultar ou não em equilíbrio. Os jogos são classificados de acordo com as características do cenário que se apresenta (jogadores, regras e pay-offs). Essas taxonomias apontam métodos para resolvê-los. Vamos expor as naturezas taxonômicas: • Natureza da escolha: escolha sincera e escolha estratégica. Segundo Bêrni (2004), a diferença entre os tipos de escolha é a motivação do agente. Na escolha estratégica há indubitável racionalização para o curso da ação que destina a alcançar determinado objetivo, enquanto a escolha sincera é espontânea. De acordo com essa área específica, uma escolha “sincera” é espontânea, instintiva e/ou aleatória e, na maioria das vezes, leva à um resultado indesejado. Isso ocorre porque a ação do agente não causa impacto no resultado. Já na escolha racional ou estratégica, a ação do agente influencia diretamente o resultado esperado. • Tipos de jogos: jogos de estratégia e jogos de azar. Há situações que não podem ser previstas, pois estão sujeitas ao acaso. Portanto, nesse caso, mesmo que uma pessoa seja racional, não conseguirá alterar o resultado. São chamados jogos de azar aqueles em que o pay-off não depende da ação direta (habilidade em responder) do agente; por esse motivo, o resultado não pode ser modificado. Nessa categoria, podemos incluir jogos de apostas, como roleta, caça-níquel, pôquer, bingo, loteria etc. Mas vale lembrar que todos os tipos de jogos estão sujeitos aos cálculos probabilísticos, ou seja, estatísticas de acordo com as combinações escolhidas. 84 ESTRATÉGIA COMPETITIVA O EV (Expected value – valor esperado) da aposta será o pay-off ganho ou perdido, ou seja, o EV é que definirá a percepção de sucesso ou fracasso na partida. Por exemplo, se você tiver 25% de chance de ganhar pelo cálculo probabilístico e precisa apostar R$100,00 para um EV igual a R$ 500,00, então, você perderia R$100,00 três vezes (75%) e ganharia, supostamente, R$500,00 na quarta vez. Lembrete Jogos de azar em geral guardam vantagem para a banca de 0,5% a 3,5%. Por isso, resulta em um EV positivo(+) muito pequeno, pois, ao criar essa regra de acordo com a posta do jogador, cria um EV negativo(-). Observação Aposta: similar a um palpite para se ganhar ou perder um prêmio. Variável aleatória1 É a função que associa um resultado numérico real para cada elemento amostral do resultado. O número real opera um mecanismo ou experiência não determinística e gera resultados aleatórios. Figura 12 S s IR X(s) Em que: S → espaço amostral s → elemento do espaço amostral S Suponha: E → jogar uma moeda três vezes Em que: c = coroa k = cara S = {(ccc), (kcc), (ckc), (cck), (kkk), (kkc), (kck), (ckk)} Adaptado de WALPOLE, R. et al. Probabilidade & estatística para engenharia e ciências. 8ª ed. São Paulo: Prentice Hall Brasil, 2008. 1 85 Unidade III Variável aleatória diz respeito à característica do experimento que queremos estudar. Suponha que esse aspecto seja igual ao número de caras nos 3 lançamentos da moeda. Quais os valores assumidos pela variável aleatória? x = 0 {(kkk)} x = 1 {(kkc)(kck)(ckk)} x = 2 {(kcc)(ckc)(cck)} x = 3 {(ccc)} • Condição de entrada: jogos fracos e jogos fortes. De acordo com o conceito estabelecido pela teoria dos jogos, o jogo fraco ou forte nada tem a ver com a força ou preparo físico empregado pelo jogador, e sim com a obrigatoriedade de participação ou não. Por exemplo, você pode escolher entrar na “pelada” (jogo de futebol informal de domingo ou não), não obstante, um jogador profissional tem a obrigatoriedade da participar por força maior, prevista em contrato. O jogo fraco é aquele no qual o agente pode escolher participar ou não, como uma aposta na loteria, ou desistir de certa rodada de pôquer. Já no jogo forte, a participação é compulsória, como homens engajarem-se nas forças armadas (BÊRNI, 2004, p. 20). • Quantidade de jogadores: um, dois, três etc. O mais simples jogo imaginável consiste em conceber ações estratégicas que dependem apenas de determinados estados da natureza, como chover. Um jogo com um jogador é chamado de jogo contra a natureza. Se a estratégia da natureza é determinada, o jogo é trivial; se a estratégia da natureza é probabilística, estes jogos são chamados de problemas de decisão; se é indeterminada, pode-se tratar o jogo como sendo de duas pessoas, se for atribuída alguma perversidade à natureza. • Número de estratégias: duas ou mais estratégias. Os pay-offs podem ser percebidos como favoráveis ou desfavoráveis, de acordo com as estratégias aplicadas. Quando se aplica uma única estratégia, diz-se estratégia pura, pois o jogo será formado por um único lance. Para mais de uma, denomina-se estratégia mista, posto que o jogo é composto de múltiplos lances. • Maneira de jogar: jogo determinado e jogo indeterminado. “A melhor maneira da de jogar” é uma expressão utilizada para jogos de estratégia, como o xadrez. Jogos de tabuleiro em geral são determinados, pois, apesar de todos os jogadores atuantes 86 ESTRATÉGIA COMPETITIVA estarem submetidos à um conjunto de regras em que o blefe não é permitido, isso não exclui a possibilidade do fator surpresa. No futebol, isso acontece com certa frequência. Contando com a sabedoria coletiva, o legendário ponta-direita Garrincha, por exemplo, era o mestre desse tipo de desdobramento. O pôquer, por sua vez, não possui essa característica, pois mesmo jogadores oniscientes são incapazes de prever seus próprios resultados, já que o blefe é permitido pela regra. Então, qual seria a natureza da informação em comum? Essa consideração anula qualquer eventual vantagem, desvanecendo qualquer impacto no resultado esperado. • Distribuição de resultados: jogo de soma zero e jogo de soma positiva ou negativa. No jogos de soma zero, um agente só poderá ganha se o(s) outro(s) perderem, ou seja, há sempre um vencedor. Na teoria dos jogos, dizemos que cada jogador ganha precisamente o que o outro perde. No xadrez ou no pôquer, o vencedor ganha a partida e, por sua vez, o(s) outro(s) jogador(es) perde(m) a partida. Nos jogos de soma positiva ou negativa, temos mais de um vencedor ou perdedor respectivamente. São interações estratégicas que permitem desfechos bons e maus para os envolvidos, como decisões políticas, econômicas etc. Quando se diz que mais de um jogador pode ganhar ou perder, não significa necessariamente que ganhem ou percam exatamente as mesmas coisas, mas ficam satisfeitos com os pay-offs. Nesse caso, os economistas chamam esse fenômeno de troca justa. • Estilos de interação: jogo cooperativo e jogo não cooperativo. O foco para atitude cooperativa ou não cooperativa é a motivação do agente pelos pay-offs. Simplificando o raciocínio, se a chance de recompensa aumenta quando o jogador coopera, a natureza do jogo é cooperativa, portanto, também será condicionalmente um jogo de soma positiva negativa. Num jogo competitivo, as chances de recompensa se reduz com a postura cooperativa, ou seja, compartilhar a recompensa não é um atrativo, então, é condição sine qua non que o jogo seja de soma zero. Observação Todas as vezes que o jogador decidir seu curso de ação não respeitando a natureza taxonômica do jogo, a chance de conquistar o resultado esperado cai drasticamente. • Quantidade de interações: jogo estático e jogo dinâmico. O jogo estático é aquele no qual só há uma interação entre os agentes. Quando há mais de um lance, diz-se que os agentes estão envolvidos em um jogo dinâmico ou em um superjogo. 87 Unidade III • Simetria das ações: jogo simétrico e jogo assimétrico. No jogo simétrico, o jogador precisa aguardar a finalização do lance do outro participante para iniciar seu lance, por consequência, o número igualitário de lances está estabelecido por regra (xadrez, tênis etc.) Por contraste, no jogo assimétrico, a adoção de determinada estratégia por parte de um jogador é ilimitada, ou seja, dependerá da eficiência de sua aplicação. Por isso, a regra não determina a equivalência de lances para todos os jogadores (futebol, basquete etc.). • Ordem de movimentação: jogo simultâneo e jogo sequencial. No jogo simultâneo, os jogadores manifestam suas decisões ao mesmo tempo (futebol, basquete etc.). Outra consideração é que os jogos estáticos de dois ou mais jogadores serão sempre simultâneos (par ou ímpar). As decisões sequenciais estão condicionadas aos superjogos (dinâmicos), como ocorre no xadrez. • Conteúdo informacional: jogo de informação completa e incompleta, jogo de informação perfeita e imperfeita. Em um jogo de informação completa, cada jogador detém toda a informação relevante para escolher sua jogada, ou seja, conhece completamente o cenário do jogo (jogadores, regras e pay-offs). Basta que um dos itens do cenário seja desconhecido no lance do jogo para ser de informação incompleta. Já em um jogo de informação perfeita, o jogador conhece todas as informações do jogo, desde o início da partida até o momento atual. Portanto, aplica-se apenas aos jogos dinâmicos. • Jogos repetidos e infinitamente longos: há jogos em que o tempo para o término da partida é infinito, matematicamente falando. Ou seja, não se sabe quando vai acabar. Outro atributo importante é que essa taxonomia só se aplica aos jogos cooperativos. Por exemplo, relações entre fornecedores e clientes, crises econômicas ou políticas, guerras etc. são denominadas jogos repetidos ou infinitamente longos. Toda espécie de cooperação pacífica entre homens se baseia, em primeiro lugar, na confiança mútua e, apenas em segundo lugar, em instituições, tais como cortes de justiça e polícia (EINSTEIN, 1879 – 1955). Dizemos que são repetidos porque fundamentam-se em uma história que evolui com o tempo e é de conhecimento comum dos jogadores. Por exemplo, em uma relação comercial entre duas empresas, uma que adquire um insumo especial de outra, que precisa ser entregue com determinadas especificações para que não prejudique o processo produtivo da compradora. Ao mesmo tempo, a produtora precisa realizar certos investimentos para atender ao pedido especial. Portanto, estabelece-se por contrato algumas condições de pagamentos para não terem prejuízos. Ainda que não haja certeza acerca do comportamento de ambos, são observadas as histórias das relações comerciais já realizadas para compromissos anteriores que, por sinal, é uma prática bastante utilizada no mundo dos negócios. 88 ESTRATÉGIA COMPETITIVA Quando estamos defrontando esse tipo de situação, podemos utilizar a modelagem de jogos repetidos para avaliar o gênero de interação estratégica, pois sempre haverá o interesse de se induzir à cooperação, por exemplo, entre políticos, especialmente entre congressistas que devam realizar com frequência acordos para que suas plataformas políticas se transformem efetivamente em leis. 5.1 Um mundo equilibrado: o Dilema dos prisioneiros Cooperarão ambos os prisioneiros para minimizar a perda da liberdade, ou um dos presos, confiando na cooperação do outro, o trairá para ganhar a liberdade? O Dilema dos prisioneiros foi originalmente formulado por Merrill Flood e Melvin Dresher, enquanto trabalhavam na Rand, em 1950. Mais tarde, Albert W. Tucker o formalizou com o tema da sentença de tempo de prisão e deu ao problema geral esse nome específico. O Dilema dos prisioneiros (DP) clássico funciona da seguinte forma: Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para condená-los, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros testemunhar para a procuradoria contra o outro e o outro permanecer em silêncio, o dedo-duro sai livre, enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 2 anos de cadeia. Cada prisioneiro faz sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como os prisioneiros vão reagir? O fato é que pode haver dois vencedores no jogo, sendo essa a melhor solução para ambos, quando analisada em conjunto. Entretanto, os jogadores defrontam-se com alguns problemas: confiam no cúmplice e permanecem negando o crime (mesmo correndo o risco de serem colocados em uma situação ainda pior), ou confessam e esperam ser libertados. Apesar de que, se o outro fizer o mesmo, ambos ficarão em uma situação pior do que se permanecessem calados. De fato, não importa os valores das penas, mas sim o cálculo das vantagens de uma decisão cujas consequências estão atreladas às decisões de outros agentes, em que a confiança e a traição fazem parte da estratégia em jogo. Casos como este são recorrentes na economia, na biologia e na estratégia. O estudo das táticas mais vantajosas em um cenário em que esse dilema se repete é um dos temas da teoria dos jogos. Para analisar um jogo, é comum o uso de quadros, como o seguinte: Quadro 3 Jogador 2 Caro Jogador 1 Barato Caro 11,15 2,25 Barato 20,4 6,55 89 Unidade III O quadro 3 representa uma situação em que dois jogadores concorrem no mesmo mercado. Ambos oferecem serviços similares e têm a opção de cobrar caro ou barato. Existem dois números dentro de cada quadrado: esses são os resultados que cada jogador recebe por sua estratégia. Tradicionalmente, o primeiro valor é quanto o jogador da esquerda recebe e, o segundo, quanto o de cima recebe. Esse quadro pode representar, por exemplo, os dois únicos oftalmologistas de uma pequena cidade do interior, e os números multiplicados por R$1.000,00 são os lucros ao final do mês. Há algum tempo, existia somente o jogador 1 na cidade, e seus preços eram altos devido à falta de opções. Então, chega o jogador 2 e abre um consultório em frente ao do jogador 1. O jogador 2 agora deve definir quanto cobrar por seus serviços. Se ele nivelar seu preço ao do concorrente, receberá um retorno de 10; o primeiro, por já estar estabelecido, fica com um retorno mais alto. O novo dentista também tem a opção de cobrar um preço mais barato que o primeiro. Isso fará com que grande parte da clientela mude de oftalmologista, e agora o lucro dele é bastante alto, enquanto o dentista inicial passa a viver com R$2.000,00 reais mensais. Uma ação dessas não ficará sem reação, e o primeiro oftalmologista pode também baixar seus preços. Dessa vez, ambos estão ganhando menos, mas, para o jogador 1, seis é melhor que dois. É fácil ver, nesse exemplo, a dinâmica de uma guerra de preços. O oftalmologista 2 baixa um pouco seus preços, aumentando seu lucro até receber a resposta de seu concorrente. Poderse-ia questionar por que o segundo oftalmologista mantém seus preços altos logo de início, ou por que os dois não entram em acordo e levantam seus preços juntos. Mas os dois são concorrentes, e a motivação para qualquer um deles reduzir o preço é muito alta. O primeiro oftalmologista pode resolver baixar seus preços, atraído pela perspectiva de ter seus lucros quase dobrados, enquanto seu competidor fica com mil reais por mês. O que ocorre nesse jogo é uma dinâmica conhecida por Dilema do prisioneiro. O exemplo clássico consiste em dois prisioneiros em face de entregar o outro ou alegar inocência. Se ambos negarem o crime, os dois saem livres, se um apontar o outro, o acusado recebe uma pena pesada e o delator uma leve e, se ambos acusarem um ao outro, os dois pegam penas pesadas. Infelizmente, os prisioneiros estão fadados a ficarem presos. Na pior opção possível, haverá pena máxima para ambos, pois os incentivos para trair o outro são muito altos. Como os participantes nesses jogos sabem que as chances de serem traídos pelo outro lado são muito altas, podem acabar traindo por antecipação como forma de proteção. O mercado da aviação é um exemplo do Dilema do prisioneiro na área empresarial. Como todo serviço, o problema com a passagem aérea é que, uma vez que o avião levanta voo, cada assento não vendido é uma perda. Não é possível estocar a vaga para vendê-la depois. Além de deixar de ganhar com mais uma venda, as empresas aéreas ainda têm de arcar com o prejuízo de colocar o avião no ar, que não muda muito pela lotação. Portanto, a motivação para uma empresa baixar seus preços, principalmente em voos difíceis de vender, é muito alta. Como a maioria das pessoas não faz distinção de companhias aéreas, desde que chegue a seu destino, a empresa com preços mais baixos tende a voar com a maior lotação possível, enquanto as concorrentes agonizam com os prejuízos. Essa dinâmica pode chegar ao extremo de empresas competindo por clientes enquanto sabidamente têm prejuízo em alguns voos, simplesmente por ser pior para elas voarem vazias do que com um prejuízo diminuído. Assim como os oftalmologistas ou os prisioneiros, as empresas aéreas poderiam entrar em um acordo, mas os benefícios 90 ESTRATÉGIA COMPETITIVA de trapacear o concorrente são muito altos. O Dilema do prisioneiro sugere que se tome muito cuidado quando os concorrentes começam a baixar os preços. Sem um diferencial, corre-se o risco de ser forçado a uma guerra de preços. Pode-se observar o mesmo fenômeno em uma dinâmica inversa, por exemplo, quando dois competidores passam a oferecer cada vez mais vantagens aos clientes facilmente copiáveis pelos concorrentes. Para usar o mercado de aviação, é possível observar esse efeito com os programas de milhagem e serviços adicionais. Antecipando os movimentos Nos jogos de estratégia em geral, prever como os competidores reagirão aos movimentos e anteciparse às suas próximas ações constitui uma enorme vantagem. É sob esta ótica que a teoria dos jogos adquire especial importância, uma vez que seu meio analítico visa permitir a identificação dos movimentos mais adequados a se realizar, de acordo com a movimentação da concorrência. Segundo Brandenburger e Nalebuff (1995), o jogo dos negócios deve ser jogado utilizando-se da observação e da análise dos movimentos passados do jogo, para determinar qual é a ação que, se tomada hoje, poderá conduzir a organização a uma determinada posição no futuro. Ou seja: “olhar para frente, repensando o passado”. Nesse sentido, Maital (1991) complementa afirmando que “olhar para frente, repensando o passado” implica que se deve, inicialmente, escolher a situação final que nos pareça a mais interessante para depois traçar o caminho de volta, identificando qual é a estratégia capaz de nos conduzir à situação desejada. 5.2 O equilíbrio de Nash No equilíbrio de Nash, nenhum jogador se arrepende de sua estratégia, dadas as posições de todos os outros. Ou seja, um jogador não está necessariamente feliz com as táticas dos outros jogadores, apenas está feliz com a tática que escolheu em face das escolhas dos outros. No filme Uma mente brilhante, sobre a vida de John Nash, popularizou-se o termo e levou ao conhecimento do público a teoria dos jogos, mas, infelizmente, como o economista James Miller coloca, a única indicação sobre o assunto no filme está equivocada. No filme, cinco garotas, entre elas uma especialmente atraente, entram em um bar, e Nash tem a ideia de, junto com três amigos, conversar com as quatro e evitar tanto a competição pela mais bonita quanto o ciúme das outras garotas. No filme, está subentendido que essa seria a base do equilíbrio de Nash. O problema é que o equilíbrio de Nash ocorre quando não há arrependimento e, vendo a mulher mais bonita do bar sair sozinha, alguém poderia se arrepender de não ter ido conversar com ela em primeiro lugar. O equilíbrio de Nash somente ocorreria se um dentre os quatro fosse conversar com a mais bonita e os outros evitassem a competição, partindo cada um para uma garota diferente. O que percebemos é que a genialidade do equilíbrio de Nash vem da sua constância sem os jogadores estarem cooperando. Por exemplo, seja uma estrada de cem quilômetros, de movimento igual nas duas direções, representada por uma linha graduada de 0 a 100. Coloquemos nessa estrada dois 91 Unidade III empreendedores procurando um local para abrir, cada qual, um posto de gasolina. Pode-se assumir que cada motorista irá abastecer no posto mais próximo de si. Se A coloca seu posto no quilômetro 40, e B exatamente no meio, B ficará com mais clientes que A. O jogo ainda não está em equilíbrio, pois B pode se arrepender de não estar mais perto de A, roubando mais clientes. O equilíbrio de Nash será A=X+1 e B=X-1. Se um posto estiver um pouco fora do centro, seu competidor vai ganhar mais da metade dos consumidores, colocando-se ao seu lado, mais próximo ao centro. A teoria dos jogos consegue explicar porque, nos grandes centros urbanos, farmácias, locadoras e outros competidores da mesma indústria tendem a ficarem próximos uns aos outros. Sempre que um jogador se encontra em uma situação em que até poderia estar melhor e, no entanto, está fazendo o melhor possível dada a posição de seus competidores, existirá um equilíbrio de Nash. Em 1964, o cineasta Stanley Kubrick lançava Dr. Strangelove. Nele, um oficial americano ordena um bombardeio nuclear na União Soviética, cometendo suicídio em seguida e levando consigo o código para cancelá-lo. O presidente americano busca o governo soviético na esperança de convencê-lo de que o evento é um acidente e por isso não deve haver retaliação. É, então, informado de que os soviéticos programaram uma arma de “fim do mundo” (uma rede de bombas nucleares subterrâneas), que funciona automaticamente quando o país é atacado ou quando alguém tenta desarmá-la. O Dr. Strangelove, estrategista do presidente, aponta uma falha: se os soviéticos dispunham de tal arma, por que a guardavam em segredo? Por que não contar ao mundo? A resposta do inimigo: a máquina seria anunciada na reunião do partido na próxima segunda-feira. Podemos analisar a situação criada no filme sob a ótica da teoria dos jogos: uma bomba nuclear é lançada pelo país A ao país B. A política de B consiste em rebater com todo seu arsenal, capaz de destruir a vida no planeta, se atacado. O raciocínio que levou B a tomar essa decisão é bastante simples: até o país mais fraco do mundo está seguro se criar uma “máquina de destruição do mundo”, ou seja, ao ter sua sobrevivência seriamente ameaçada, o país destrói o mundo inteiro (ou, em seu modo menos drástico, apenas os invasores). Ao elevar os custos para o país invasor, o possuidor dessa arma garante sua segurança. O problema é que de nada adianta um país possuir tal arma em segredo. Seus inimigos devem saber de sua existência e acreditar na sua disposição de usá-la. O poder da “máquina do fim do mundo” está mais na intimidação do que em seu uso. Atualmente, temos o caso do Irã (na capital, Teerã). O ministro iraniano da defesa, Mustafá Mohamad Najar, anunciou, na terça-feira (22/11/07), que seu país construiu um novo míssil balístico com um alcance de 2.000 quilômetros, denominado Ashura, em um clima de forte tensão com os países ocidentais devido às ambições nucleares de Teerã. O novo míssil, batizado com o nome da maior cerimônia de luto e penitência dos mulçumanos xiitas, tem, em teoria, o alcance suficiente para atingir as bases americanas da região e Israel, a cerca de 1.000 quilômetros do país. O conflito nuclear fornece um exemplo de uma das conclusões mais surpreendentes dentro da teoria dos jogos. O economista Thomas Schelling percebeu que, apesar do sucesso geralmente ser atribuído à maior inteligência, planejamento, racionalidade, entre outras características que retratam o vencedor como superior ao vencido, o que ocorre muitas vezes é justamente o oposto. Até mesmo o poder de um jogador, considerado no senso comum como uma vantagem, pode atuar contra seu detentor. Schelling 92 ESTRATÉGIA COMPETITIVA criou o termo brinksmanship (de brink, extremo) à estratégia de deliberadamente levar uma situação às suas consequências extremas. Um exemplo usado por Schelling é bem conhecido: o jogo do frango, que consiste em dois indivíduos acelerarem seus carros na direção um do outro em rota de colisão; o primeiro a virar o volante e sair da pista, é o perdedor. É possível ver, no quadro a seguir, os resultados desse jogo: Quadro 4 Motorista 2 Motorista 1 Reto Desvia Reto -100, -100 1, -1 Desvia -1,1 0,0 Se ambos os motoristas seguissem reto, os dois jogadores pagariam o preço mais alto com sua vida. No caso de os dois desviarem, o jogo termina em empate. Se um desviar e o outro for reto, o primeiro será o “frango” e o segundo, o vencedor. Schelling propôs que um participante desse jogo deve retirar o volante de seu carro e atirá-lo para fora, fazendo questão de mostrá-lo a todas as pessoas presentes. Ao outro jogador caberia a decisão de desistir ou causar uma catástrofe. Um jogador racional optaria pela opção que lhe causasse menos perdas, sempre perdendo o jogo. O mesmo ocorre quando se decide invadir um país sem medo de usar armas nucleares. É possível ver no dumping entre concorrentes uma aplicação direta da “máquina do fim do mundo”. Uma empresa pode decidir vender com prejuízo, caso seu concorrente ultrapasse determinados limites. O exemplo de Schelling fornece ainda uma instância em que, ao se retirar o volante e, portanto, o poder de decidir, o jogador tem suas chances de ganhar aumentadas. Em situações de negociação é comum se abrir mão do poder e ainda assim sair ganhando. Muitas vezes, advogados dizem que estão autorizados por seus clientes a ir somente até um valor, enquanto vendedores atribuem aos gerentes a decisão de não fornecer desconto. Se a outra parte acredita na limitação desses profissionais, o limite de preço imposto ganha credibilidade. Eliminar opções pode ser útil em situações como a negociação de um aumento. Por que deveria um superior conceder um aumento, se acredita que seu empregado não possui outra opção melhor? Se o empregado ameaçar ir embora caso não receba um aumento, pode-se simplesmente dizer não, pois a ameaça não é confiável. Uma forma de o empregado tornar a ameaça digna de crédito seria espalhar a notícia de que, caso não receba um aumento, sairá da firma, a todos que trabalham na empresa. O objetivo do empregado é tornar a sua estada na firma sem um aumento totalmente humilhante, obrigando-o a pedir demissão. Agora sua ameaça faz efeito, e o chefe será obrigado a conceder um aumento ou procurar outro para o serviço. Ao arriscar sua própria credibilidade com os colegas, o empregado aumenta as chances de um resultado favorável. 93 Unidade III Limitar as opções pode significar simplesmente cortar as comunicações. Durante as negociações, para convencer um vendedor a aceitar um preço, um comprador pode fazer uma oferta e, em seguida, tornar-se propositalmente indisponível. Ao não aceitar ligações, estar sempre em reuniões ou em viagens, o comprador aumenta a credibilidade de sua ameaça. Uma ligação atendida sinaliza interesse e pode fazer com que a ameaça seja ignorada. Quando pensaram em utilizar os jogos de estratégia para analisar o mundo social, Von Neumann e Morgenstein retornaram a uma prática milenar. Ao fazer isso, criaram uma ciência com uma grande capacidade de generalização e precisão matemática. A teoria dos jogos promete tornar-se um prisma cada vez mais poderoso sob o qual as relações humanas podem ser analisadas. Praticantes e acadêmicos de administração, rodeados rotineiramente pelos conflitos e complexidade da sociedade, somente têm a ganhar com essa visão. Ou, como disse certa vez o fundador da Atari, Alan Bushnell: “a área de negócios é um bom jogo – muita competição e um mínimo de regras”. Necessitamos de um conceito mais geral de solução de jogos simultâneos, que permita tratar tanto de jogos que possuem estratégias estritamente dominadas e que, portanto, podem ser resolvidos pela eliminação iterativa de estratégias estritamente dominadas, como também de jogos nos quais não é possível identificar esse tipo de estratégia. Esse conceito é o chamado equilíbrio de Nash. Diz-se que uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores. O que a definição que apresentamos do equilíbrio de Nash está exigindo é que todas as estratégias adotadas por todos os jogadores sejam as melhores respostas às estratégias dos demais. Em termos um pouco mais formais, para que uma dada combinação de estratégias seja considerada um equilíbrio de Nash é necessário que, para cada estratégia si* que pertença à combinação, tenhamos: πi (s*i , s*- i) ≥ πi (si , s*- i) para todo si e todo i Para melhor compreensão, vejamos um exemplo para visualizarmos mais facilmente as características de um equilíbrio de Nash. Nesse caso, nosso exemplo será o jogo de prevenção de entrada no mercado nacional, um exemplo de jogo que não possui equilíbrio em estratégias estritamente dominantes: Quadro 5 Empresa dominante Entrante potencial Não exporta Exporta em pequena escala Exporta em larga escala Investe 2,1 1,0 0,-1 Não investe 1,0 2,1 -1,2 Nesse jogo, a visualização do equilíbrio de Nash não é imediata. Por exemplo, se a empresa dominante não investe, a melhor resposta para a entrante potencial é {exporta em larga escala}. Contudo, a recíproca não é verdadeira: {não investe} não é a melhor resposta a {exporta em larga escala}. Assim, 94 ESTRATÉGIA COMPETITIVA {não investe} resulta em uma recompensa de -1 para a empresa dominante, caso a entrante potencial jogue {exporta em larga escala}, enquanto {investe} resultaria em uma recompensa de 0 na mesma situação. Dessa forma, a condição do equilíbrio de Nash não é satisfeita. Se a empresa entrante exporta em larga escala, a melhor resposta para a empresa dominante é {investe}. Novamente, porém, {exporta em larga escala} deixa de ser a melhor resposta para a entrante potencial e, mais uma vez, a condição do equilíbrio de Nash não é satisfeita. Na verdade, há somente uma combinação de estratégias que satisfaz a condição do equilíbrio de Nash (de serem as melhores respostas umas às outras): a combinação de estratégias formada pelo par ordenado (investe, não exporta). Se a empresa dominante decidir investir, o melhor que a entrante potencial tem a fazer é não exportar e, uma vez que a entrante potencial tenha decidido não exportar, o melhor para a empresa dominante é investir. Contudo, mesmo em uma forma estratégica relativamente simples como a do quadro 5, pode-se levar algum tempo para identificar se há algum equilíbrio de Nash. No caso de jogos envolvendo um maior número de estratégias, a identificação pode se tornar ainda mais demorada. Pode ser prático, portanto, adotar algum artifício que ajude a visualizar com maior rapidez se há algum equilíbrio de Nash em uma forma estratégica. A ideia do equilíbrio de Nash é a de que cada jogador está adotando a melhor resposta em relação ao que os demais jogadores estão fazendo, e isso é válido para todos os jogadores ao mesmo tempo. Temos apenas de encontrar um meio mais rápido de identificar se há alguma combinação de estratégias que satisfaça esse critério. Algo que poderia facilitar muito no momento de identificar o equilíbrio de Nash seria indicar, dada a estratégia adotada pelo outro jogador, qual a melhor escolha para o jogador em questão. Em seguida, repetiríamos o processo para o outro jogador, até que conseguíssemos identificar uma combinação de estratégias em que cada uma delas fosse a melhor resposta à outra e vice-versa. Uma das formas de se fazer isso seria indicar a estratégia que resulta na maior recompensa ao jogador que está nas linhas, para cada uma das colunas da forma estratégica. Poderíamos fazer isso, por exemplo, colocando a letra “I” entre parênteses (I) ao lado da recompensa que corresponde à melhor resposta do jogador que está nas linhas, para o que o jogador que está nas colunas está fazendo. Esse procedimento seria repetido para cada estratégia que o jogador representado nas colunas pode adotar. Como podemos ver no quadro 6: Quadro 6: O jogo de prevenção da entrada no comércio nacional Empresa dominante Entrante potencial Não exporta Exporta em pequena escala Exporta em larga escala Investe (I) 2,1 1,0 (I)0,-1 Não investe 1,0 (I)2,1 -1,2 95 Unidade III A melhor resposta para a empresa dominante A indicação (I) na recompensa para o jogador que está nas linhas (empresa dominante), na combinação de estratégias (investe, não exporta), significa que a melhor resposta da empresa dominante, para a estratégia {não exporta} da entrante potencial, é {investe}, pois essa escolha dá uma recompensa superior (no caso, 2) à recompensa resultante da adoção de {não investe} (no caso, 1). O mesmo raciocínio se aplica às combinações assinaladas: {não investe, exporta em pequena escala} e {investe, exporta em larga escala}. O passo seguinte no nosso artifício de determinação do equilíbrio de Nash consiste em proceder da mesma forma com as estratégias do jogador que se encontra nas colunas. Para isso, assinalamos com a letra “c” entre parênteses (c) a maior recompensa para o jogador que está nas colunas, que corresponde a uma dada linha e que identifica a melhor resposta desse jogador para uma dada estratégia do jogador que está nas linhas. O processo de identificação da melhor resposta é repetido, agora para cada uma das linhas. Com isso, indicaremos as melhores respostas do jogador que está nas colunas para cada uma das estratégias que o jogador que se encontra nas linhas pode vir a escolher. A aplicação desse método ao jogo de prevenção da entrada no comércio nacional pode ser visto no quadro 7: Quadro 7: O jogo de prevenção da entrada no comércio nacional – a melhor resposta para a entrante potencial Empresa Dominante Investe Não investe Entrante potencial Não exporta (I) 2,1(c) 1,0 Exporta em pequena escala Exporta em larga escala 1,0 (I)0,-1 (I)2,1 -1,2(c) Assim, a indicação (c) na recompensa para o jogador que está nas colunas (entrante potencial), na combinação de estratégias {investe, não exporta}, significa que a melhor resposta da entrante potencial para a estratégia {investe} da empresa dominante é {não exporta}. Assim, {não exporta} é a melhor resposta da entrante potencial para a estratégia {investe} da empresa dominante, porque essa escolha dá um prêmio superior (no caso, 1) à recompensa resultante da adoção de {exporta em pequena escala} (no caso, 0) e ainda maior do que {exporta em larga escala} (no caso, -1). O mesmo raciocínio se aplica quando consideramos a melhor reposta da entrante potencial à adoção, pela empresa dominante, da estratégia {não investe}: assinalamos a opção de exportar em larga escala, que fornece uma recompensa melhor do que exportar em pequena escala e melhor ainda do que não exportar. Observando o quadro 7, vemos que a combinação de estratégias que satisfaz a condição do equilíbrio de Nash, de serem as melhores respostas umas às outras, ou seja, a combinação de 96 ESTRATÉGIA COMPETITIVA estratégias formada pelo par ordenado {investe, não exporta} é a única que se encontra assinalada tanto com um (I) como com um (c). Assim, encontramos nosso método de identificação de equilíbrios de Nash. Após aplicarmos o método de assinalar com (I) a melhor resposta do jogador nas linhas para cada estratégia do jogador nas colunas, e assinalar com um (c) a melhor resposta do jogador nas colunas para cada estratégia do jogador nas linhas, sempre que uma combinação de estratégias estiver assinalada simultaneamente com (I) e (c), essa combinação de estratégias será um equilíbrio de Nash. Condição de equilíbrio As ações (do participante de uma economia social de trocas) serão influenciadas por suas expectativas das ações dos demais participantes, e essas, por sua vez, refletem as expectativas das ações do primeiro (NEUMANN e MORGENSTERN, 1944, p.12). No equilíbrio de Nash, em um sistema, pode ocorrer equilíbrio com estratégias puras e equilíbrio com estratégias mistas. O jogo encontra-se em equilíbrio quando as forças que atuam sobre ele não lhe provocam modificações. À medida que o tempo passa, a situação inicial repete-se período após período. Haverá equilíbrio estável no sistema se, mesmo experimentando um abalo causado pela entrada em ação de nova força, o sistema retornar à situação inicialmente descrita. Quando o sistema não retornar a esta situação, diz-se que seu equilíbrio era instável. Em um jogo de estratégia, há equilíbrio quando cada um dos jogadores está oferecendo a melhor resposta, sob o seu ponto de vista, às ações dos demais jogadores. Esta conjunção de fatores os mantêm satisfeitos com o curso de ação escolhido e não há incentivos originando-se de dentro do sistema que lhes retire esta condição. Quando esta conclusão pode ser retirada diretamente da matriz de recompensas do jogo, dizse que o equilíbrio foi alcançado com a adoção de estratégias puras. Por contraste, em um jogo de dois jogadores e duas estratégias, às vezes, não se observa equilíbrio diretamente na matriz de recompensas, mas essa pode ser alcançada com a adoção de distribuição de probabilidades para orientar a ação. Neste caso, diz-se que o jogo possui equilíbrio com estratégias mistas. Gintis (2000, p.13) refere-se a esse conceito fundamental da seguinte forma: o conceito de equilíbrio de Nash é importante porque, em muitas circunstâncias, podemos de forma acurada (ou razoavelmente acurada) predizer como as pessoas jogarão um jogo, admitindo que elas escolham estratégias que implementam um equilíbrio de Nash. Deixaremos claro que, nos jogos dinâmicos que modelam um processo evolucionário, segundo o qual as estratégias bem-sucedidas eliminam as menos eficientes ao longo do tempo, os estados estacionários são, com algumas exceções óbvias e pouco interessantes, equilíbrios de Nash. 97 Unidade III Ainda mais os sistemas dinâmicos evolucionários que, frequentemente, ou convergem para um equilíbrio de Nash (levando-nos a dizer que são assintomaticamente estáveis) ou seguem órbitas fechadas em torno de uma exposição de equilíbrio de Nash (quando dizemos que são neutramente estáveis). Também veremos que muitos equilíbrios de Nash que parecem intuitivamente implausíveis são, de fato, equilíbrios instáveis pertinentes a um processo evolucionário, de sorte que não esperamos vê-los no mundo real. Nos contextos em que os agentes parecem desviar-se sistematicamente de implementar posições de equilíbrio de Nash e absolutamente não parecem ignorantes ou irracionais por fazê-lo, em geral, iremos descobrir que não criamos uma especificação adequada do jogo que eles estão jogando ou definimos equivocadamente os pay-offs atribuídos a eles. Ademais, este conceito põe em ação uma das mais formidáveis características humanas: cada um deseja o melhor para si próprio, mas sabe que, em uma interação, o melhor para cada jogador só é perene se combinar com o que o outro considera como sendo o melhor para si. O jogo do apadrinhamento Vamos analisar agora outro jogo estritamente competitivo, para ilustrar algumas aplicações desse tipo de jogo a situações de interação estratégica, assim como a forma de analisá-lo. Estudaremos o “jogo do apadrinhamento”, que é uma aplicação interessante de jogos estritamente competitivos à análise política. Vamos, portanto, analisar o seguinte jogo, segundo Fiani (2010): dois candidatos a um cargo majoritário (por exemplo, um governo federal) estão decidindo se devem se comprometer ou não a apadrinhar seus cabos eleitorais, oferecendo a eles empregos públicos, caso vençam as eleições. Se os candidatos prometem a seus cabos eleitorais empregos públicos, isso faz com que eles trabalhem com muito mais empenho na eleição, o que contribui para aumentar as chances dos candidatos de serem eleitos. Por outro lado, uma parcela do eleitorado não aprova esse tipo de promessa, pois esses eleitores zelam pela eficiência e qualidade do serviço público. Suponha que, uma vez que o candidato tenha prometido empregos públicos a seus cabos eleitorais, ele não tenha como deixar de cumprir a promessa. Podemos supor que há um efeito de reputação muito negativo, e o candidato que não honra sua promessa pode ter dificuldades na próxima eleição para conseguir cabos eleitorais dispostos a trabalhar em sua campanha. Um dos candidatos é de oposição, o que significa que ele precisa de um apoio significativo dos cabos eleitorais para ser conhecido pela população. O candidato da situação não precisa tanto desse apoio, pois tem a seu favor as obras executadas pelo governo de seu partido. Esse jogo se encontra descrito na forma estratégica a seguir, na qual apresentamos apenas 98 ESTRATÉGIA COMPETITIVA as recompensas do candidato de oposição, expressas como porcentual de chance de vitória em função das suas escolhas e do candidato da situação: Quadro 8 Candidato da oposição Candidato da situação Promete Não promete Promete 50% 60% Não promete 20% 40% Podemos perceber por que os jogos estritamente competitivos são chamados de jogos de soma zero. Basta considerar, inicialmente, que a soma dos porcentuais de votos dos dois candidatos necessariamente é 100%. Assim, se o candidato da oposição e o candidato da situação prometem empregos públicos, cada um terá 50% de chances de ganhar a eleição. Dado esse valor constante das somas das recompensas, se tivéssemos colocado as recompensas dos dois candidatos, teríamos: Quadro 9 Candidato da oposição Candidato da situação Promete Não promete Promete 50%, 50% 60%, 40% Não promete 20%, 80% 40%, 60% Agora, ao subtrairmos das recompensas do segundo jogador, o valor constante da soma das recompensas, isto é, 100%, obtemos: Quadro 10 Candidato da oposição Candidato da situação Promete Não promete Promete 50%, -50% 60%, -60% Não promete 20%, -20% 40%, -40% No quadro 10, a soma das recompensas dos jogadores, para qualquer combinação de estratégias, é sempre zero. Desse modo, mais uma vez percebemos que é possível apresentar um jogo estritamente competitivo, como um jogo de soma zero, subtraindo das recompensas de um jogador (preferencialmente o segundo) o valor constante da soma das recompensas. Contudo, também vamos optar aqui pela representação mais simples do quadro 8, deixando implícita a recompensa do segundo jogador. Vejamos como interpretar a forma estratégica do quadro 8. Nele, vemos que, se o candidato da oposição não promete empregos públicos a seus cabos eleitorais enquanto 99 Unidade III o candidato da situação promete, na célula inferior esquerda as chances do candidato de oposição ganhar a eleição são de 20%. Por que não apresentamos as chances do candidato da situação? Simplesmente porque, se naquela situação as chances do candidato de oposição são de apenas 20%, isso significa que as chances do candidato da situação são de 100% - 20%= 80%, uma vez que ambos os candidatos concorrem ao mesmo cargo e apenas um será eleito. Não precisamos, assim, apresentar as recompensas dos dois candidatos: basta apresentar as recompensas do jogador que está nas linhas (o candidato da oposição) e não esquecer que, enquanto o jogador que das linhas busca maximizar essas recompensas, o jogador que está nas colunas busca minimizá-las. Vejamos agora como resolver esse jogo. Cada candidato sabe que o outro busca minimizar sua recompensa. Isso significa que o jogador que se encontra nas linhas (o candidato da oposição) sabe que o jogador que está nas colunas (o candidato da situação) busca as estratégias que, dada a estratégia escolhida do candidato da oposição, minimizam a recompensa deste último. O candidato da situação sabe, por outro lado, que, dada uma escolha sua, o jogador que está nas linhas (o candidato da oposição) buscará aquela estratégia que, dada a escolha do candidato da situação por uma estratégia, ou seja, por uma coluna, maximiza a recompensa do seu adversário, ou seja, a recompensa do candidato da oposição. Esses valores estão identificados no quadro a seguir: Quadro 11 Candidato da oposição Candidato da situação Promete Não promete Promete 50% 60% Não promete 20% 40% Assim, assinalamos com um asterisco no quadro 12 os valores mínimos em cada linha do candidato da oposição, que ele identifica como sendo os objetivos que norteariam as escolhas do candidato da situação para minimizar as chances do candidato da oposição de ser eleito, de acordo com as escolhas desse último: Quadro 12 Candidato da oposição 100 Candidato da situação Promete Não promete Promete 50%* 60% Não promete 20%* 40% ESTRATÉGIA COMPETITIVA Como os jogadores devem agir nessa situação? Como o candidato da situação sabe que, para cada estratégia que escolher nas colunas, o candidato da oposição irá escolher a linha que maximize suas recompensas, ele deve selecionar aquela coluna que, quando o candidato da oposição escolher a linha que maximiza suas recompensas dada a coluna escolhida, proporcione ao candidato da situação as maiores chances de vitória. Em outras palavras, o candidato da situação deve escolher a coluna que apresenta o menor valor entre os valores máximos, ou seja, o minimax. De forma inversa, como o candidato da oposição sabe que, para cada estratégia que escolher nas linhas, o candidato da situação tentará escolher a coluna que minimize suas recompensas, ele prudentemente deve selecionar aquela linha que, quando o candidato da situação escolher a coluna que minimiza as suas recompensas dada a linha escolhida, proporcione ao candidato da oposição as maiores chances de sucesso. Dessa forma, o candidato de oposição deve escolher a linha que apresenta o maior valor entre os valores mínimos que ele pode obter, ou seja, o seu maximin. É fácil perceber que o equilíbrio nesse jogo estritamente competitivo, conforme vimos, é dado quando maximin = minimax, que são encontrados quando os dois jogadores decidem prometer apadrinhar os seus cabos eleitorais, e que corresponde à célula localizada na primeira linha e na primeira coluna da forma estratégica do quadro 13: Quadro 13 Candidato da oposição Candidato da situação Promete Não promete Promete * 50% 60% Não promete 20%* 40% Exemplo de aplicação Reflita sobre o texto a seguir e a aplicação da taxonomia proposta pela teoria dos jogos: Guerra, teoria de jogos e terrorismo2 Isaac Epstein3 A guerra é a origem de todas as coisas. E de todas elas é soberana. A uns ela apresenta-os como deuses, a outros, como homens; de uns ela faz escravos, de outros, homens livres (HERÁCLITO, Frag. 53, Hipólito). Disponível em: <http://www.comciencia.br/reportagens/guerra/guerra14.htm>. Acesso em: 5 nov. 2011. Isaac Epstein é engenheiro e pesquisador em filosofia, comunicação e linguagem. É professor do programa de pós-graduação em comunicação da Universidade Metodista de São Paulo. 2 3 101 Unidade III Os saberes sempre estiveram a serviço da guerra; seja desenvolvendo estratégias e táticas, seja inventando objetos e artefatos militares. Os espelhos com que o sábio Arquimedes, diz a história ou a lenda, queimou a frota romana, a “Nova Física” do século XVII, cuja influência da carência de métodos exatos de cálculo das trajetórias dos projéteis dos canhões é inegável, até o projeto Manhatan de construção da primeira bomba atômica, aconselhado por um sábio pacifista, Einstein, para deter a barbárie nazista, são apenas alguns dos inúmeros momentos históricos em que a guerra inspirou o desenvolvimento da ciência e da tecnologia. Bacon reconhecia na ciência um método de subjugar a natureza e também, em consequência, a subjugação do homem pelo homem. Neste sentido precedeu de alguns séculos os autores da Teoria Crítica, especificamente seu herdeiro, Herbert Marcuse. Desde a antiguidade, muitos filósofos têm sido ambíguos [1] na sua valorização da guerra: negativa, pelo sofrimento causado e positiva na celebração das virtudes marciais dela decorrentes. Apenas recentemente, tem sido questionada concretamente a inevitabilidade da guerra e proposta a possibilidade de uma paz permanente [2]. O saber da guerra, das disputas, das batalhas, dos conflitos, dos enganos e astúcias da persuasão e dissuasão, se constitui historicamente num segmento à parte das grandes divisões tradicionais da filosofia e da ciência. No sentido aristotélico, esse saber seria uma técnica e, como tal, algo superior à experiência, mas inferior à razão. Não obstante, essa técnica, ou melhor, técnicas, foram sempre valorizadas estudadas e comentadas devido à frequência histórica dos conflitos, guerras e lutas pelas várias formas de hegemonia e domínio. Com Maquiavel, esse segmento da tecnologia do poder teve seu status recuperado a ponto de esse pensador ser considerado, por muitos, como o primeiro filósofo político da modernidade. O livro clássico Da Guerra (Von Kriege), de Clausewitz (1968), exerceu enorme influência no pensamento militar e político durante e após o século XIX. Clausewitz definia a guerra como “um ato de violência cuja intenção é compelir nosso oponente a realizar nosso desejo”. Dentro dessa linha, decorria logicamente que cada guerra deveria terminar com a completa vitória de um lado sobre o outro e que a “moderação na guerra é um absurdo”, desde que a falha em utilizar toda a força de que se dispõe contradiz o objetivo da guerra. A importância da obra de Clausewitz é ressaltada no denso estudo que lhe dedica Raymond Aron (1986). Atualmente, muitos autores sublinham a importância das aplicações das novas tecnologias à problemática das estratégias, aspectos psicológicos das estratégias dos conflitos etc. (FAYARD, 2000). Em termos de teoria de jogos, a guerra seria então um jogo soma zero, isto é, aquele no qual o que uma parte ganha é precisamente o que a outra perde e vice-versa. A teoria dos jogos, desenvolvida por Von Neumann e Morgenstern (1944) para dar conta de problemas econômicos, cedo tornou-se paradigmática para determinadas situações de conflito militar. 102 ESTRATÉGIA COMPETITIVA A produção de milhares de ogivas nucleares pelas duas superpotências mudou o paradigma clássico da guerra descrito por Clausewitz. Se os dois lados possuem meios, cada qual de liquidar o oponente simultânea e reciprocamente, instala-se uma conjuntura formalmente semelhante à uma situação paradoxal descrita ainda pela teoria de jogos com o nome de Dilema do prisioneiro (EPSTEIN, 1995). A corrida armamentista nuclear, ao contrário de uma corrida armamentista tradicional, não poderia causar a vitória de qualquer das partes, mas a destruição de ambas. Rapoport (1969), em plena guerra fria, assume duas alternativas estratégicas para as duas potências que se enfrentavam: a alternativa do desarmamento (X) ou do armamento crescente (Y). A estratégia Y é determinada pelo interesse de cada parte visto o “jogo” como de soma zero, e a estratégia X pelo interesse comum. Essa última demanda um fator novo que não existe nos jogos de soma zero: a confiança mútua. Haverá uma possibilidade de se racionalizar a escolha cooperativa? Em outras palavras, é possível racionalizar a confiança mútua? Confiar no oponente significa supor que ele não escolherá a estratégia (Y), e isto é o mesmo que lhe negar a racionalidade da estratégia dos jogos soma zero. De outro lado, ser digno de confiança significa descartar a estratégia (Y) em favor da estratégia (X), o que, por sua vez não é um desempenho racional à luz de um jogo de soma zero. O último tratado de desarmamento entre os Estados Unidos e Rússia parece ter mostrado a decisão de ambos os países em dar mais um passo para superar o Dilema do prisioneiro em que estavam envolvidos no momento em que um novo e ameaçador inimigo instaurava um novo tipo de guerra: o terrorismo. O chamado terrorismo tem se revelado uma técnica de combate eficiente e barata. O atentado às torres de Nova Iorque que causou um prejuízo de cerca de bilhões de dólares custou algumas centenas de milhares de dólares (RUTHVEN, 2001). A forte orientação religiosa dos seguidores de Bin Laden, aliada à sua estrutura difusa, torna a organização Al Queda difícil de ser penetrada. A importância do fator religioso como motivação de seus seguidores tem sido ignorada (WILCOX, 2001). A Al Queda tem uma rede organizacional semelhante a uma multinacional, cujos braços vão das Filipinas até os Estados Unidos. Um grupo central móvel presidido por Bin Laden formula a política geral, e outros comitês subordinados respondem por ações terroristas, interesses comerciais, consultoria legal etc. Os seguidores mais pedestres das ordens as seguem cegamente sem mesmo saber como elas se enquadram na estratégia mais global. O ataque de Nova Iorque foi executado com grande proficiência técnica (MAKIYA e MNEIMNEH, 2002). O terrorismo, por sua vez, tem raízes estratégicas numa modalidade de guerra que tem uma longa tradição histórica, a guerrilha (CHALIAND, 1990). A guerrilha se opõe a exércitos regulares bem armados e equipados, com uma direção central, grupos dispersos, extremamente móveis e altamente motivados. Esta motivação pode ser a de libertação nacional contra o dominador estrangeiro, como ocorreu com os resistentes da segunda guerra mundial, com os vitoriosos vietcongs, com os combatentes da guerra de libertação da Algéria e tantos outros. Os guerrilheiros podem estar também motivados na luta contra governos nacionais ditatoriais, como ocorreu em Cuba, em 1959. Um dos comandantes da guerrilha cubana, Che Guevara, chegou a escrever um livro sobre este tema (GUEVARA, 1989). Diz Guevara que “frente à rigidez dos métodos clássicos de guerrear, o guerrilheiro inventa sua própria tática e surpreende constantemente o inimigo”. Frente à enorme superioridade hard (armamento e efetivos) do exército regular, a guerrilha opõe recursos soft 103 Unidade III de astúcia, uma enorme mobilidade e pequenos efetivos altamente motivados. Antonio Conselheiro, o comandante fanático da guerra dos Canudos, é um belo exemplo dos métodos da guerrilha na descrição de Os sertões, de Euclides da Cunha. O terror desencadeou uma reação mundial e uma dispendiosa operação militar americana no Afeganistão de eficácia ainda a comprovar. A contínua ação dos homens (e mulheres) bomba no Estado de Israel parecem comprovar, até o momento, a ineficácia da imensa superioridade armada de Israel sobre os palestinos, na supressão dos homens-bomba. Uma estranha aliança entre o pré-moderno das crenças religiosas, em matiz fundamentalista, a extrema juventude ou a formação em disciplinas técnicas (engenheiros e técnicos dos engajados nos atos terroristas) compõem a personalidade destes cognominados “mártires”, por um lado, e abomináveis “terroristas”, por outro. Para se compreender um pouco essas mentes, será necessário fugir desse maniqueísmo. O discurso do presidente Bush, em setembro de 2001, anunciou que os Estados Unidos “não distinguiriam entre os terroristas que cometeram o atentado e os países que os acolheram”. Esta declaração que preparava a invasão do Afeganistão vinha em oposição às normas aprovadas pelas Nações Unidas que, no caso de uma agressão, o Conselho de Segurança precisaria autorizar uma resposta armada de uma ou mais nações. As leis de guerra, tradicionalmente sancionadas por convenções internacionais, proíbem danos à não combatentes em caso de ações militares. A confusão entre a ação de polícia contra criminosos comuns e o combate militar entre nações inimigas provoca inevitavelmente mortes e danos a civis não combatentes. Foi o que ocorreu no Afeganistão e na invasão de Janin, na faixa ocidental. O fanatismo e o ódio suicida dos terroristas islâmicos e sua crença no martírio e até no prêmio divino tornam as ações de retaliação em massa pouco efetivas. O que é capaz de intimidar ou deter um homem-bomba? As teorias tradicionais das estratégias e táticas dos combates militares têm pouco a dizer sobre o que parece constituir a principal preocupação militar do século XXI, o terrorismo. O que se necessita com urgência são teorias compreensivas do fenômeno do terror suicida e os fatores que o propiciam. Ainda mais, quando se pensa que cada vez mais é viável a sua posse dos meios de destruição em massa. Notas 1. Platão, por exemplo, via os dois lados da guerra, se bem que não lhes dava o mesmo peso. Kant, embora vendo a paz permanente como o ideal e objetivo da lei moral, isto não o impedia de dizer que “a paz prolongada favorece o predomínio de um espírito meramente comercial e, com isso, o desenvolvimento do egoísmo e a covardia cuja tendência seria a degradação da nação”. Hegel não era nem ambivalente, pois considerava a guerra como um corretivo para a corrosiva influência da paz. 2. Foi necessária a Primeira Guerra Mundial, com seus milhões de mortos, aleijados e feridos, para que a humanidade despertasse em direção a um projeto capaz de dirimir os conflitos, evitando as guerras: a Liga das Nações. Sabemos dos resultados de sua ineficácia: uma guerra ainda mais feroz e sangrenta. Mais uma tentativa, a Organização das Nações Unidas, cuja eficácia se limita, 104 ESTRATÉGIA COMPETITIVA quando muito, a guerras locais. A Terceira Guerra Mundial, afinal, só foi evitada devido ao enorme poder de aniquilação de cada super potência. 5.3 O modelo de Cournot O modelo de Cournot deriva do nome do matemático, filósofo e economista francês Antoine Augustin Cournot (1801-1877), que publicou, em 1838, uma análise do comportamento de duas empresas que decidiam simultaneamente que quantidade produzir. Alguns autores consideram sua análise um primeiro ensaio do método que seria depois elaborado e refinado na forma da teoria dos jogos. O que é certo, contudo, é que esse modelo é um dos modelos clássicos de análise de mercados com poucas empresas, ou oligopólios, e, por isso, merece ser estudado com atenção. O Modelo de Cournot com duas empresas Nesse jogo, temos dois jogadores, segundo Fiani (2010): empresa 1 e empresa 2. As duas empresas fabricam produtos homogêneos, disputando, portanto, o mesmo mercado. Diz-se que dois produtos fabricados por empresas diferentes são homogêneos quando os consumidores não percebem diferenças na qualidade dos dois produtos e, portanto, baseiam suas decisões sobre qual produto adquirir considerando apenas o preço, independentemente do fabricante. Como hipótese de conduta, adotaremos o pressuposto de que cada empresa busca maximizar seu lucro, o que, nesse jogo, é a recompensa. O lucro de cada empresa é a diferença entre sua receita e seus custos. Desse modo, temos de definir a receita e os custos de cada empresa, de forma a construir uma função de recompensa para cada uma delas. Vamos iniciar a função de recompensa pela receita de cada empresa. A receita é o produto do preço de mercado pela quantidade vendida por cada empresa. Para simplificar, vamos supor que o preço de mercado é dado por uma função de demanda linear, do tipo: p(q)=A - b(q1+ q2) Em que p(q) é o preço de mercado como função da quantidade, q é a quantidade total produzida e vendida no mercado, A e b são constantes, q1 é a quantidade produzida e vendida pela empresa 1, e q2 é a quantidade produzida e vendida pela empresa 2. Obviamente, q = q1 + q2. A receita total de uma empresa é o produto do preço de mercado pela quantidade produzida e vendida. Conclui-se, então, que as receitas totais da empresa 1 (RT1) e da empresa 2 (RT2) são dadas, respectivamente, por: RT1 = p(q)q1 = Aq1 - bq12 - bq1q2 RT2 = p(q)q2 = Aq2 - bq1q2 – bq22 105 Unidade III Para chegarmos à função de recompensa de cada empresa, temos de subtrair das receitas os custos, de forma a obter os lucros de cada empresa. Vamos supor, também para simplificar, que as funções custo das duas empresas (C1 e C2) são idênticas, e dadas por: C1= cq1 C2= cq2 Se c é uma constante estritamente maior que zero. Não é indispensável ao modelo de Cournot supor que as empresas possuem os mesmos custos, como estamos fazendo, mas essa hipótese simplificadora permite obter algumas relações muito interessantes. Agora podemos escrever a função de recompensa de cada empresa, ou seja, seus lucros, (π1 e π2) como sendo: π1 = Aq1 - bq12 - bq1q2 - cq1 π2 = Aq2 - bq1q2 – bq22 - cq2 O passo seguinte é tomar a primeira derivada de cada uma das equações anteriores e igualar à zero, de acordo com a condição de primeira ordem para maximização: _π1 = A - 2bq1 – bq2 - c = 0 �q1 _π2 = A— bq1 — 2bq2 — c =0 �q2 Colocando q1 e q2 em evidência em π1/�q1 e π2/�q2, temos então duas novas equações: q1 = A – bq2e - c 2b q2 = A – bq1e - c 2b As duas equações descrevem quanto cada uma das empresas irá produzir para maximizar seus lucros, dada a produção esperada de sua concorrente (o fato de a quantidade produzida ser a esperada é indicado pelo superíndice e). Por que a produção esperada e não a efetiva? Porque cada empresa toma sua decisão sobre quanto produzir sem conhecer a decisão da outra empresa (lembre-se de que se trata de um jogo simultâneo); portanto, somente pode utilizar como parâmetro o valor esperado da produção da outra empresa. As duas equações nos dão as funções de reação das empresas 1 e 2, respectivamente. Dado esse valor esperado, a empresa escolhe a quantidade que maximiza seus lucros. Em outras 106 ESTRATÉGIA COMPETITIVA palavras, a quantidade que ela irá produzir será sua melhor resposta à decisão que ela espera que sua concorrente tome. De acordo com o conceito de equilíbrio de Nash, para atingir um equilíbrio, as estratégias dos jogadores devem ser as melhores respostas umas das outras. Assim, q1 deve ser igual a q1e, e q2 deve ser igual q2e. Dessa forma, a estratégia adotada por cada empresa (a quantidade que decidiu produzir) deve ser igual ao que a outra empresa esperava dela, e vice-versa. Algebricamente, isso significa resolver as duas equações anteriores como um sistema em que q1 = q1 e q2 = q2e. Isso nos leva a: e q1* = A – c 3b q2* = A – c 3b O asterisco (*) sobre os valores de q1* e q2* indica que se trata de valores que correspondem a equilíbrios de Nash. Para esses valores, nenhum dos dois jogadores tem qualquer incentivo para alterar suas estratégias, porque uma é a melhor resposta à outra, e vice-versa. A consistência entre o equilíbrio no modelo de Cournot e a noção de equilíbrio do conceito de Nash levou alguns autores a chamarem esse equilíbrio de Cournot-Nash, para enfatizar a coerência entre as duas análises. 5.4 O modelo de Bertrand Outro tipo de jogo simultâneo clássico na análise de mercados é o conhecido como modelo de Bertrand, que resultou do nome do matemático francês Joseph Louis François Bertrand (1822-1900), também conhecido como modelo de determinação simultânea de preços (para contrastar com o modelo de determinação simultânea de quantidades — o modelo de Cournot). O modelo de Bertrand sem restrição de capacidade Considere duas empresas produzindo bens da mesma natureza (em que os consumidores não percebem diferença entre os produtos das duas empresas) e estabelecendo seus preços ao mesmo tempo. Como os consumidores não percebem diferença entre os dois produtos, se uma empresa estabelece um preço superior ao preço da outra, as vendas da empresa com preço mais alto se reduzem a zero. Se os preços forem iguais, as empresas dividem o mercado igualmente. Admitamos que cada empresa possa sozinha atender a todo o mercado, caso seja imprescindível, desde que o preço seja igual ou maior que o custo marginal de produção. Qual será o preço de equilíbrio a ser fixado pelas empresas? Para entendermos melhor as várias opções estratégicas de que as empresas dispõem, vamos estabelecer as funções de recompensa para um exemplo ilustrativo desenvolvido por Fiani (2010). 107 Unidade III Suponha que a curva de demanda do mercado em que as duas empresas atuam é dada por: q(p) = 100 – p Note que nesse caso estamos expressando a quantidade demandada em função do preço, enquanto no modelo de Cournot estávamos expressando o preço em função da quantidade. Na curva de demanda de mercado anterior, q é a quantidade total produzida e ofertada, e p é o preço. Mas como q irá se distribuir entre as duas empresas? E qual delas irá determinar o preço de mercado p? Para responder a essa pergunta, temos de conhecer as funções de recompensa das duas empresas. Como as funções de recompensa de ambas serão idênticas, podemos escrever, de forma genérica, a função de recompensa da empresa i, que pode ser qualquer uma das duas empresas, considerando suas decisões e as da outra empresa. Chamaremos, genericamente, essa última empresa de empresa j. Finalmente, seja a função de custo de qualquer uma das duas empresas dada por C(qi) = cq1, com c > 0. As funções de recompensa dessa empresa i, πi, são dadas por: (pi – c) ( 100 – pi) se pi < pj πi= (pi – c) ( 100 – pi) se pi = pj 2 0 se pi > pj O que a primeira função de recompensa após a chave nos diz é que o lucro da empresa i será dado pelo produto da quantidade total demandada pelo mercado ao preço pi, ou (100 – pi), multiplicada pela margem de lucro obtida pela empresa i em cada unidade produzida (o termo (pi - c) da expressão). Isso, desde que o preço estabelecido pela empresa i, pi, seja menor do que o preço estabelecido pela outra empresa, pj. A segunda função de recompensa nos informa que o lucro da empresa i é metade do lucro que ela obtém no caso anterior, considerando que os preços das duas empresas sejam iguais; uma vez dada nossa hipótese de que: se pi = pj, as empresas dividem igualmente o mercado. Note que, no caso anterior, a empresa i atendia a todo o mercado a seu preço, ou seja, ela vendia (100 – pi), e que, se os preços forem iguais, ela venderá metade dessa quantidade, (100 – pi)/2. Finalmente, se o preço da empresa i for maior do que o da outra empresa, ela nada produz, ou vende, e seus lucros se reduzem a zero. Vendo pelos parâmetros do equilíbrio de Nash, se uma das empresas estabelece um preço p, tal que p > c, qual é a melhor resposta para a outra empresa? Sem dúvida, é estabelecer outro p’, tal que p’ seja ligeiramente inferior a p (apenas o suficiente para os consumidores perceberem a diferença e abandonarem o produto da concorrente, ainda que seja apenas um centavo), desde que p’> c. 108 ESTRATÉGIA COMPETITIVA Fazendo isso, a empresa que estabelecesse p’ estaria capturando todo o mercado da outra empresa, e seus lucros seriam maiores (estaria capturando todo o mercado com uma redução de apenas um centavo no preço). A outra empresa, por sua vez, teria seu lucro reduzido à zero. Mas se p’ é a melhor resposta a p, então, p não é a melhor resposta a p’. A melhor resposta a p’, seria um p ligeiramente inferior a p’ e superior a c, e assim por diante. Desse modo, só existe um par de preços que é a melhor resposta um ao outro e vice-versa: é o par (pi*, pj*), tal que pi* = p2* = c Qualquer preço acima do valor c deixaria a empresa que o adotou vulnerável a um preço que fosse ligeiramente inferior ao seu, ainda que maior que c; e capturaria todo o mercado. Qualquer preço inferior a c também não seria adequado, pois o valor recebido pela última unidade produzida seria inferior ao seu custo, e a empresa que tivesse adotado esse preço inferior a c teria prejuízo. Melhor do que ter prejuízo é ter lucro zero. A melhor resposta a um preço igual ao custo de produzir mais uma unidade, portanto, é outro preço igual ao custo de produzir mais uma unidade. O resultado que acabamos de obter é consequência da aplicação da lógica do equilíbrio de Nash ao modelo de determinação simultânea de preços. Dadas as hipóteses inicialmente assumidas, a única combinação de estratégias que é, recíproca e simultaneamente, a melhor resposta possível uma à outra é pi*= pj* = c, com ambas as empresas tendo lucro zero. Esse resultado é conhecido como o paradoxo de Bertrand, pois temos um mercado caracterizado como um duopólio, produzindo o mesmo resultado de um mercado competitivo: preços idênticos ao nível do custo de produzir mais uma unidade e lucros nulos. Algo que, em princípio, só deveria ocorrer em mercados nos quais as empresas fossem suficientemente pequenas para que suas decisões individuais não afetassem o preço de mercado. É importante enfatizar que esse estranho resultado (um duopólio se comportando como um mercado em concorrência perfeita, isto é, com as empresas estabelecendo preços iguais a seus custos) é consequência das três hipóteses (muito restritivas) adotadas: a hipótese de que não há diferenciação de produto, a de que não há restrição de capacidade produtiva (daí os custos marginais serem constantes) e a de que as decisões são simultâneas em um único momento do tempo. Assim, vamos voltar ao exemplo empregado na discussão do modelo de Cournot, de duas empresas de cimento, a empresa 1 e a empresa 2. Como as funções de custo das duas empresas são dadas, respectivamente, por C1 = 4q1 e C2 = 4q2, segue-se que, se as duas empresas não estiverem determinando simultaneamente as quantidades produzidas (como é o caso analisado no modelo de Cournot), mas sim seus preços (como é o caso analisado no modelo de Bertrand), o equilíbrio nesse último caso será dado por: P1 = P2 = c = 4 Em que P1 é o preço do cimento produzido e vendido pela empresa 1, P2 é o preço do cimento produzido e vendido pela empresa 2, e 4 reais é o custo marginal4 c da produção de cimento, idêntico para as duas empresas. 109 Unidade III Observação Cournot ou Bertrand? Você deve estar surpreso com as diferenças nos resultados dos modelos de Cournot e Bertrand. Com efeito, no caso do modelo de Cournot com duas empresas, o resultado em termos de quantidade produzida é inferior à quantidade que seria obtida com um mercado perfeitamente competitivo. Já no caso do modelo de Bertrand com duas empresas sem restrição de capacidade, o resultado é idêntico ao que seria obtido se o mercado fosse perfeitamente competitivo. Dado que os dois modelos apresentam resultados tão diferentes, quando cada um deles deve ser usado? Luís M. B. Cabral, em seu livro Introduction to industrial organization, oferece uma sugestão: é importante avaliar que tipo de indústria está sendo considerada. Existem indústrias em que é mais difícil para as empresas ajustar as quantidades produzidas do que os preços. Isso acontece em indústrias nas quais o investimento leva mais tempo para resultar em um aumento da capacidade produtiva. Esse seria o caso de indústrias como a siderúrgica, a automobilística, a de cimento etc. 5.5 O modelo de Stackelberg O economista alemão Heinrich Von Stackelberg (1905-1946) contribuiu para a teoria dos jogos no contexto dos oligopólios. Sua principal produção intelectual foi Marktform und Gleichgewicht (A estrutura do mercado e do equilíbrio, publicado em 1934), que se inicia descrevendo o comportamento de modelos de duopólio. Segundo Stackelberg (1934) a essência do comportamento estratégico está na antecipação que uma empresa pode fazer relativamente às rivais, criando assim uma situação de assimetria entre as empresas no mercado. O modelo de Stackelberg é do tipo Cournot: as empresas decidem sobre as quantidades, com a diferença de que, em vez de decidirem simultaneamente, as empresas decidem uma após a outra. Tal como o modelo de Cournot, este modelo pode ser interpretado envolvendo decisões iniciais sobre capacidades de produção, seguidas de concorrência de preços à Bertrand. (BÊRNI, 2004). O Modelo de Stackelberg foi mais difundido a partir de 1952, quando se percebeu que ele não era ingênuo e revela a reação do oponente (concorrente) em sua própria curva, ou seja, demonstrando o impacto do mercado no próprio negócio, pois parte-se do princípio de que cada um quer o melhor para si próprio, portanto, cada qual que ser líder do mercado. Isso significa que, resultante dessas forças, pode Custo marginal é a variação do custo total em função da variação na quantidade produzida. Algebricamente, é expresso pela derivada do custo em função da quantidade, dC/dq. É fácil ver que, para qualquer uma das duas empresas, dCi/dq1 = 4. 4 110 ESTRATÉGIA COMPETITIVA acontecer o desequilíbrio, convertendo-se em uma guerra preços, ou acabando em outro extremo, uma coalizão. 5.6 O modelo de Bain-Sylos-Modigliani O modelo de Bain-Sylos-Modigliani também segue o formato de relação entre a função variável estabelecida por Cournot, inclusive por ser percebido como um resgate de ponto de Cournot aplicado aos oligopólios na formação dos preços. São seis os pressupostos estabelecidos nesse conceito: 1. período prévio à entrada no mercado e período posterior a essa entrada; 2. no período prévio à entrada havia o monopólio; 3. a demanda é estável nos dois períodos; 4. a maximização dos lucros ocorre para o monopolista; 5. o monopolista mantém a quantidade a ser produzida, e o novo entrante no mercado tem essa informação; 6. as funções de custos do monopolista e do novo entrante são idênticas. Esses pressupostos culminam em uma função linear, em que a receita média (preço), de acordo com o modelo de Cournot, permite pensarmos que o monopolista manterá uma margem invejável em sua lucratividade. Observando essa realidade, o novo entrante, então, resolve ofertar três unidades do produto por um preço inferior, o que lhe permite obter a elevação de seus lucros em relação à quantidade. A consequência prevista para esse tipo de decisão é que o preço de mercado cai. O ex-monopolista percebe que este fato não é nada bom, por isso, reavalia suas preferências e decide concorrer até um determinado limite, porque, se o novo entrante tiver a possibilidade de prospectar com lucro nulo, o ex-monopolista decide não competir. Contudo, o ex-monopolista estrategicamente faz uma oferta de 8 unidades, com preço inferior ao novo entrante, porém, mantendo uma margem mínima aceitável para o negócio. Isso significa que ele chega a um preço que barra a entrada de novos concorrentes no mercado. Esta resolução não deve ser negligenciada, pois demonstra uma situação de interação estratégica que se repete em vários segmentos de mercado: o preço vigente não era tão alto caso se mantivesse o monopólio puro, e nem tão baixo quanto seria se houvesse várias empresas ofertando produtos similares. Portanto, o teorema do modelo de Bain-Sylos-Modigliani ficou conhecido por ser uma barreira estratégica aos novos entrantes de mercado, que trabalham especificamente com as variações de tempo 111 Unidade III (médio e longo prazo) e as quantidade produzidas. Podemos observar essa aplicação frequentemente no marketing de varejo, no “atacarejo”, e nas vendas por atacado. Vantagens do uso dos modelos matemáticos na tomada de decisão A teoria dos jogos preocupa-se em construir modelos matemáticos capazes de simular situações reais na empresa, voltadas principalmente para a resolução de problemas de tomada de decisão. Esses modelos são analisados como simuladores das situações futuras e avaliação da probabilidade de sua ocorrência. Em resumo, os modelos servem para representar simplificações da realidade. Sua vantagem reside em: manipular as complexas e difíceis situações reais por meio da simplificação dos fatos. Vejam algumas vantagens em seu emprego: • permitem o entendimento dos fatos de uma forma melhor que a descrição verbal; • descobrem relações (funções) existentes entre vários aspectos do problema, não percebidas na descrição verbal; • permitem tratar o problema em seu conjunto e com todas as variáveis simultaneamente; • podem ser aplicados por etapas e considerar outros fatores não descritos verbalmente; • utilizam técnicas matemáticas e lógicas; • conduzem a soluções quantitativas; • permitem uso de computadores para processar grandes volumes de dados. A pesquisa operacional adota o método científico como estrutura para a solução de problemas, dando maior ênfase ao julgamento objetivo do que ao julgamento subjetivo. Tem o objetivo de capacitar a administração a resolver problemas e tomar decisões, e pode ser desenvolvido em seis fases: • formular o problema: uma análise dos sistemas, dos objetivos e das alternativas; • construir um modelo matemático para representar o sistema: esse modelo expressa a eficácia do sistema como função de um conjunto de variáveis, das quais pelo menos uma esta sujeita a controle; • deduzir uma solução do modelo: existem essencialmente dois tipos de procedimentos para derivar uma solução, a perspectiva do processo e a perspectiva do problema; • testar o modelo e a solução: o modelo é uma representação da realidade, o modelo é bom quando for capaz de prever, com exatidão, o efeito que as mudanças no sistema têm sobre a eficácia geral do sistema; • estabelecer controle sobre a solução; • implantar a solução: a solução testada precisa ser transformada em uma série de processos operacionais suscetíveis de ser entendidos e aplicados pelo pessoal que será responsável pelo seu emprego. 112 ESTRATÉGIA COMPETITIVA 6 LEILÃO: FUNDAMENTOS E CARACTERÍSTICAS A dúvida não é uma condição agradável, mas a certeza é absurdo (VOLTAIRE, pseudônimo de François Marie Arquet, filósofo e humanista francês, 1694 – 1778). Partindo da suposição de que um jogador conhece o objetivo do outro jogador, ou seja, que a recompensa desejada é de conhecimento de todos, então, hipoteticamente, pode-se ter uma ideia de sua importância para ambos. Assim, é possível prever a disposição de cada um para conquistá-las, evidenciando-se as características individuais. Na realidade, de fato, o que ocorre é que o desconhecimento em relação ao perfil dos agentes envolvidos no dilema pode ter consequências sérias, porque revela a necessidade de escolher saídas que sejam contraditórias e/ou dicotômicas. Observação Dicotomia: modalidade de classificação em que cada uma das divisões e subdivisões contém apenas dois termos. Na dialética platônica (diálogo com possibilidade de refutação), é a repartição de um conceito em dois outros, geralmente contrários e complementares. Portanto, é um princípio que afirma a existência de dois elementos essenciais, já que um abarca o outro (luz e escuridão). Adaptado de: <http://houaiss.uol.com.br/busca.jhtm?verbete=dicotomi a&stype=k>. Acesso em: 19 nov. 2011. Percebemos o mundo, por exemplo, com variações coloridas, contudo, o sistema de formação das cores é binário e, dicotomicamente, suas combinações são múltiplas, pois a maneira como enxergamos está diretamente relacionada com a ausência da luz e a sua presença. Um exemplo organizacional típico disso acontece quando, no último dia do mês, Andrea, funcionária da empresa Voyager Corporation, tem por objetivo atingir a meta de vendas estabelecida por sua diretoria. Andrea sabe que, se conquistar este desafio, ganhará um prêmio em dinheiro, além de poder folgar por cinco dias úteis consecutivos. Andrea é uma vendedora experiente, arrojada e conhecedora de sua carteira de clientes. Neste momento, pressionada pelo tempo e pela motivação da recompensa, liga para seus clientes potenciais. Fecha a negociação às 16h30, com o cliente Star Explore. A empresa Star Explore está estabelecida no mercado há 45 anos e acaba de passar por um processo de sucessão, posto que seu fundador Eugênio Tibérios faleceu, e seus 5 filhos herdaram seu patrimônio. Corre uma especulação pelo mercado de que uma desavença entre o primogênito João Lucas e o caçula 113 Unidade III Jonatas provocou uma separação familiar, abalando a boa administração dos negócios e colocando em risco a saúde financeira da organização. Regularmente, a empresa Voyager Corporation, encerra seu expediente às 17h. Andrea sabe que a entrada do pedido de seu cliente precisa ser processada o mais rapidamente possível, por isso, checa o sistema várias vezes e percebe que seu pedido está retido no departamento de crédito. Nessa situação, entra em contato com a gerente de crédito Ana Paula, para averiguar a possibilidade de liberação. Ana Paula, por sua vez, refuta, arguindo os rumores a respeito do cliente Star Explore, e também leva em consideração que o valor envolvido nesta transação é bastante significativo e com prazo de pagamento extenso, o que representa o aumento do risco financeiro desta transação de grande porte. Tanto Andrea quanto Ana Paula estão defendendo seus próprios interesses profissionais individuais, simultaneamente aos interesses organizacionais (sociais). Essa espécie de rede de poderes, informação e tempo pode assumir proporções gigantescas. As consequências da diversidade cultural interna e do desconhecimento (neste caso, falta de informação sobre os jogadores) não tardarão a surgir, especialmente no que diz respeito aos aspectos de clima organizacional e ambiental na atividade empresarial. O problema é que o dilema pode propagar-se negativamente, afetando a todos os participantes dessa interação estratégica: a reputação das funcionárias, o fornecedor Star Explore, o cliente Voyager Corporation e o segmento de mercado em que atuam. Esse é um problema típico estudado pela teoria dos jogos. É obvio que não será possível conseguir total segurança sobre o que diz respeito à negociação descrita. Como saber então, ao negociar, qual seria a melhor opção? A extensão dos fatores de composição das forças relacionadas à estimativa e à estatística pode minimizar o risco da decisão. Assim, embora não seja possível obter absoluta certeza do que seria o melhor a se fazer, vamos ilustrar a aplicação da teoria dos jogos na forma estratégica, conforme segue: Quadro 14 Matriz de pay-offs Voyager Corporation (comprador) Star Explore (fornecedor) Vende Não vende Age responsavelmente (paga) 2,2 0,1 Não age responsavelmente (não paga) -1,-2 -1,0 Observação Os valores de recompensa têm sentido simbólico. São explicitados apenas para refletir as preferências dos agentes interativos. 114 ESTRATÉGIA COMPETITIVA Quadro 15 Valores simbólicos Consequência simbólica 2 Fornecedor vende, cliente paga. 1 Fornecedor não vende e o cliente paga (no caso, para a concorrência). 0 Fornecedor vende e o cliente paga parcialmente, ou seja, pelo menos cobre os custos. -1 Fornecedor não vende e o cliente não compra. -2 Fornecedor vende e o cliente não paga. Analisando a representação estratégica do jogo, fica evidente que, para o fornecedor, é mais interessante vender em qualquer que seja a situação. Diz-se, então, que essa estratégia para o fornecedor é estritamente dominante. Segundo Fiani (2003): [...] em alguns casos, os jogadores têm mais de uma opção que lhes proporcionem bons resultados, não importando o que os outros jogadores façam. Considerando a racionalidade da escolha, eliminam-se as estratégias menos interessantes do que outras. Portanto, essa situação de interação estratégica torna-se estritamente dominante (FIANI, 2003, p. 81). A grande questão nessa decisão é saber justamente identificar onde o fornecedor se encontra. Contudo, o fornecedor deve considerar que não conhece as características verdadeiras do cliente, que passa por um momento transitório de instabilidade. Então, qual deve ser a decisão? Bem, sendo um jogo de estratégia estritamente dominante, há 25% de chance de perda. Isso se justifica por se tratar de um jogo de informação incompleta. Ao tomar a decisão, tanto Andrea como Ana Paula devem considerar a capacidade da empresa de suportar o impacto financeiro dessa perda, aumentando a acuracidade do risco calculado. Observação Jogo de informação incompleta: o perfil dos jogadores não é de conhecimento comum, propagando consequências nas respectivas recompensas. Por meio das recompensas é que seriamos capazes de identificar as reais características dos jogadores, ou seja, até onde estariam dispostos a agir estrategicamente pela conquista do pay-off. Na economia, é bastante corriqueira a presença de leilões. No Brasil, há leilões de explorações de petróleo, obras de arte, equipamentos etc. De fato, trata-se de um fenômeno generalizado ao longo da história. Isso torna ainda mais interessante a dialética anterior, pois prossegue com o desenho de leilões (auction desing), como é conhecido na teoria dos jogos . A ideia é favorecer a maximização dos ganhos do leiloeiro. As características básicas dos leilões podem 115 Unidade III variar muito e precisam ser consideradas com relevância para a aplicação da estratégia mais assertiva. As características básicas e fundamentais dos leilões são: • as regras do leilão definem quem pode fazer lances; • como esses lances podem ser efetuados; • como são aceitos; • como o leilão (a partida) se desenvolve; • como o vencedor é determinado; • o ambiente do leilão é constituído pelos arrematadores (jogadores); • o valor é atribuído pelos arrematadores aos objetos. Combinados às características fundamentais, acrescentam-se os tipos de leilões, como segue: • leilão aberto: não há definição de lance prévio; • leilão fechado: os arrematadores definem um lance mínimo (o objetivo é proteger o leiloeiro de complôs); • leilões de envelopes lacrados: os arrematadores têm direito a um único lance por escrito em segredo; • leilão oral: as ofertas são feitas em público verbalmente. Os tipos de leilões citados têm características distintas, mas são similares no que tange à ascendência dos lances, ou seja, até que os arrematadores desistam e reste o vencedor (aquele que ofereceu o maior lance). • leilão descendente: anuncia preços gradativamente menores, até que o arrematador sinalize que deseja o objeto; • leilão de lances simultâneos: os arrematadores verbalizam seus lances simultaneamente; Lembrete Em relação à percepção dos jogadores, podemos verificar que podem ser representadas por variáveis aleatórias independentes, com avaliações idênticas; confirmando que não há correlação com o tipo de leilão e o conhecimento prévio dos jogadores. Portanto, analogicamente, é um exemplo clássico de jogo de informação incompleta. 116 ESTRATÉGIA COMPETITIVA Exemplo de aplicação Figura 13 Vamos observar a similaridade estrutural do jogo estratégico na interação entre as empresas Star Explore e Voyager Corporation e as características fundamentais e/ou combinatórias dos variados tipos de leilões. Podemos verificar que são jogos que oferecem certo grau de incerteza, porque são compostos por informação incompleta. 6.1 O equilíbrio de Nash Bayesiano O verdadeiro conhecimento é saber a extensão da própria ignorância (CONFÚCIO, sábio chinês, 551-479 a.c.) Segundo Fiani: O equilíbrio de Nash Bayesiano é aquele em que a combinação da estratégia adotada pelos jogadores maximiza as recompensas de cada jogador, dadas às estratégias dos demais jogadores, seus tipos e as probabilidades atribuídas à eles (FIANI, 2003, p. 312). Talvez nesse momento você se pergunte: a teoria dos jogos não poderia instituir as normas para a administração, a economia, a política etc.? É interessante notar que não é incomum que um dos agentes possa vir a definir os termos a serem desenvolvidos na interatividade estratégica. Em outras palavras, no mundo macroeconômico, ou mesmo por meio dos empresários, observamos que esses agentes podem definir as regras dos jogos. Há múltiplos exemplos, como quando o governo, por alguma razão, decide privatizar uma de suas empresas (ele passa a ser vendedor), mas simultaneamente também é o agente que determina as regras do jogo, ou seja, publica as normas a serem acatadas para que a privatização (no caso a compra pelo setor privado) seja possível. Outra situação análoga ocorre quando o Banco Central fixa suas normas para os leilões dos títulos públicos. Infelizmente, há um ponto controverso comum em todas as ocorrências exemplificadas até esse momento, porque alguns agentes têm informação privada. A detenção de informação privada 117 Unidade III essencial é determinante para a definição de regras consistentes para maximizar os pay-offs dos interessados. Por sinal, a informação privada é valiosa, pois não é de conhecimento notório e comum de todos os agentes envolvidos na interação estratégica. Dessa forma, quando se vai vender algo, como um título público, não se sabe ao certo quanto o comprador estaria disposto a pagar. Então, podemos dizer que o preço que o comprador está disposto a pagar é a informação privada. O objetivo dessa discussão é conscientizar de como as regras, ou mecanismos ou desenhos do jogo levam ao resultado esperado. Contudo, mesmo que um agente tenha o poder de desenhar um jogo, ele enfrentará restrições, como: • Quem desenha as regras não pode adotar mecanismos de coerção. Os agentes envolvidos devem agir de acordo com seus próprios interesses. • O responsável pela articulação das regras do jogo deve ser razoável com suas expectativas. Isso, porque os jogadores não participarão de algo que não ofereça algum equilíbrio. Dessa forma, se promoverá a desmotivação do agente. Consideramos então que qualquer equilíbrio de Nash Bayesiano pode ser representado por um mecanismo direto (ou mecanismo de revelação direta) compatível e compensador, afim de que os agentes informem suas características e disposição. Assim, podemos conseguir, por meio de um árbitro, uma estratégia que favoreça a combinação para que todos ganhem. Entretanto, para que esse mecanismo funcione, é imprescindível que um dos principais conceitos do jogo seja que, em seu desenho, ele seja simultâneo. 6.2 O equilíbrio bayesiano perfeito Vamos lapidar o conceito do sistema com a contribuição do teorema de Bayes, por meio do equilíbrio bayesiano perfeito. Para tal, a taxonomia do jogo será superjogo de informação incompleta. Paradoxalmente, a cada passo, aumentamos a complexidade. Em compensação, o retorno se dá pela luz da consciência, pois as predições são cada vez mais nítidas. O conceito de equilíbrio de Nash foi uma grande conquista que mudou a forma da sociedade observar suas decisões e contribuiu para que administradores, economistas, políticos etc. pudessem compreender e predizer melhores escolhas para resultados de soma positiva ou negativa. Adaptando o conceito do equilíbrio de Nash, podemos concluir que, se conseguirmos chegar a uma resolução admissível para um equilíbrio em um jogo conforme a taxonomia anterior, essa solução certamente contemplará os ingredientes necessários para resolvermos outros problemas mais simples. Em outras palavras, trata-se de aplicar o “equilíbrio de Nash perfeito” em um subjogo, ou seja, esse ponto de vista vê o subjogo como jogo continuado. O mecanismo nada mais é que aplicar o equilíbrio de Nash de acordo com as características estáticas, contudo, agrega-se a dificuldade da ausência de conteúdo informacional. Segundo Fiani: 118 ESTRATÉGIA COMPETITIVA [...] o equilíbrio Bayesiano perfeito é uma combinação de estratégia entre jogadores, assim como as crenças em relação a nós em todos os conjuntos de informação são chamadas de um equilíbrio bayesiano perfeito se: (a) as estratégias de cada jogar resultam em ações ótimas, dadas as crenças do jogador e as estratégias dos demais jogadores; e (b) as crenças dos jogadores são consistentes com o teorema de Bayes sempre que possível (FIANI, 2003, p. 352). Ressaltamos a evidência de que, quando um jogo comporta tal solução, também atende aos pré-requisitos do equilíbrio de Nash, do “equilíbrio de Nash perfeito”, portanto, do equilíbrio de Nash bayesiano. O papel das crenças Nesse tipo de jogo, o papel dos sinais e mensagens passa a ter muita relevância, pois essa comunicação subjetiva, ou falta de comunicação, pode sair bastante cara para os jogadores. O que os demais jogadores acreditam, em relação ao transcurso do jogo por meio das ações, é de suma importância para que se possa traçar os próprios estratagemas. Cada indivíduo fará a sua escolha racional de acordo com suas convicções, isso ocorre em mais de uma etapa do jogo, o que significa, consequentemente, que se trata de estratégia mista. Em seu turno, o agente em ação passa a considerar as probabilidades e a circunstâncias em que está enredado, por conta das decisões que já foram tomadas por outros jogadores. O fato é que acrescentamos a variável de que os agentes adotarão necessariamente escolhas racionais críveis de acordo com suas respectivas crenças e valores, sobre as quais as trajetórias levarão ao equilíbrio. Em síntese, a solução desse jogo vem ao retomar e analisar os resultados de jogos percorridos anteriormente. Para tal, devemos fazer a matriz de pay-offs para cada etapa do jogo e verificar o padrão de comportamento dos agentes. Bem, refinando a aplicação do conceito, devemos então determinar distintos subjogos e, nessa particularidade, obteremos a posição do equilíbrio bayesiano perfeito. Saiba mais Visite o site do Profº. Duilio Ávila Bêrni. Disponível em: <https://sites.google.com/site/19ganges47/arquivos>. Acesso em: 23 nov. 2011. 119 Unidade III 6.3 O teorema de Bayes O teorema de Bayes foi concebido pelo ministro inglês presbiteriano, matemático e filósofo Thomas Bayes (1702-1761). Neto e filho de clérigos, formou-se em teologia e foi admitido na Royal Society de Londres (Reino Unido) como cientista renomado. Todos os jogos estão ligados às probabilidades matemáticas. Cálculos sobre prováveis vencedores são feitos desde o século XV, mas somente no século XVIII foi publicado o Ensaio voltado para a solução de um problema na doutrina do acaso, por Bayes, que passou a ser difundido como o teorema de Bayes. O estudo tratava do palpite calculado: técnica aplicada à estatística que transformou-se em uma lei fundamental para a ciência matemática. Como o que o reverendo propôs para a época era inovador e de caráter subjetivo, sua obra foi publicada anos depois de seu falecimento. O que Bayes desenvolveu foi a ideia de que a manipulação dos números depende diretamente da quantidade de informação que se dispõe, o que impacta diretamente na acuracidade da previsão. Em suma, se você for jogar cara ou coroa, todos concordarão que as chances serão de 50% para cada jogador. Contudo, se o acordo for jogar a moeda quatro vezes, ou seja, uma partida com quatro lances, então, o que Bayes afirmou é que a informação se refinará a cada lance. De acordo com essa metodologia, supondo dois jogadores: Adriano x Bruno Com o objetivo vencer Bruno, Adriano deverá considerar as informações (neste caso, resultados) que se apresentam desde o início da partida até o momento, por exemplo: quantas vezes Adriano venceu Bruno? O cálculo do palpite passa a ser considerado uma ciência, porque se dedica ao estudo da lógica e da racionalidade das chances de determinado evento ocorrer. Essa foi mais uma razão para que Bayes, em seu tempo e posição, causasse controvérsias e, por isso, até hoje é criticado por pesquisadores de linhas conservadoras, que acreditam que esse método resulta em subjetividade por considerar a opinião das pessoas. Com a modernidade, se faz premente a necessidade de prever riscos e benefícios, por exemplo: uma aplicação financeira; a compra de um imóvel; a venda de ações na bolsa de valores; ou se chegarei ao trabalho a tempo de carro, metrô ou motocicleta. Hoje, o teorema de Bayes tem utilidade cotidiana e tem sido aplicado em muitas áreas. Em suspeitas de epidemia, por exemplo, os responsáveis pela saúde pública calculam seu possível alcance em relação a um determinado tempo por meio do teorema; a economia aplica-o em estimativas inflacionárias; e corretores o utilizam para predizerem sobre altas ou baixas de ações na bolsa de valores. Consumando seu legado, o revendo prescreve três axiomas clássicos, como vocês poderão verificar no próximo tópico. 120 ESTRATÉGIA COMPETITIVA Lembrete Segundo o dicionário Aurélio, axioma é uma proposição que se admite como verdadeira porque dela se podem deduzir as proposições de uma teoria ou de um sistema lógico ou matemático. Axiomas dos cálculos de probabilidades 1º axioma: os valores de um evento “A” não podem ser inferiores a zero, nem maiores que um, portanto, a probabilidade do evento será igual a 1. O valor zero refere-se a um evento impossível, enquanto que os valores que se apresentam nesse intervalo, refletem situações que serão consideradas possíveis ou incertas. 0 �≤ P(A) ≤�1 Legenda: (A) = evento P = probabilidade 2º axioma: a probabilidade de qualquer evento acontecer, dentre um número n de eventos alternativos mutuamente exclusivos a A e B, é igual à soma das probabilidades dos eventos individuais. P(A ou B) = P(A) + P(B) Legenda: (A) = evento (B) = evento alternativo P = probabilidade 3º axioma: a probabilidade de dois eventos A e B ocorrerem é igual à multiplicação da probabilidade condicional P(A/B) (lê-se “probabilidade de A dado B”) pela probabilidade de B, sendo: P(A e B) = P(A/B) × P(B) Então: P(B e A) = P(B/A) × P(A) Por comutação que P(A e B) = P(B e A), deduz-se o teorema de Bayes, que tem a seguinte formulação básica: P(A/B) = P(B/A) / P(B) x P(A) Legenda: (A) = evento (B) = evento alternativo P = probabilidade 121 Unidade III Avaliando esse modelo matemático estatístico, observa-se que a chance do evento A acontecer em vista do evento B(P(A/B) se dá por três razões: 1. a verossimilhança de A; 2. a probabilidade prévia de B; 3. a probabilidade prévia de A. Lembrete Verossimilhança é uma função da probabilidade condicional (estimador estatístico). O Maxver (máxima verossimilhança) baseia-se no cálculo em que, ao se derivar uma equação e igualá-la a zero, pode-se chegar ao(s) valor(es) mínimo(s) e/ou máximo(s). Adaptado de BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5ª ed. São Paulo: Saraiva, 2002. Um exemplo tradicional para explicar o teorema de Bayes é o seguinte: Dr. Mário faz a anamnese completa e avalia duas possibilidades que podem estar acontecendo com a paciente Heloísa. Ela reclama de problemas respiratórios. Simplificando, vamos considerar que sejam asma e pneumonia. O raciocínio empregado para esses acontecimentos em termos bayesianos partirá das probabilidades prévias desses eventos, tal como dadas estatisticamente. Assim, é plausível admitir que a incidência de pneumonia (P(pn)) é muito mais rara que a de asma (P(as)), digamos 100 vezes menos frequente, segundo os registros. Em termos matemáticos: P(as) = 100/101 e P(pn) = 1/100 Digamos, porém, que o paciente apresente um sintoma e1, que ocorra em 1 de cada 2 pacientes com pneumonia, mas apenas em 1 de cada 500 pacientes com asma. Assim, a verossimilhança de cada um dos eventos será: P(e1/pn) = 1/2 e P(e1/as) = 1/500 Lembrete Na matemática, a probabilidade condicionada refere-se à probabilidade de ocorrer um evento A sabendo que ocorreu outro evento B e representase por P(A/B). 122 ESTRATÉGIA COMPETITIVA P (A ∩ B) P (A | B) = -------------------------P (B) Fonte: JULIANELLI, J. R. et al. Curso de análise combinatória e probabilidade - aprendendo com a resolução de problemas. Rio de Janeiro: Ciência Moderna, 2009. Resumo Nesta unidade, pudemos conhecer de maneira mais detalhada a teoria da decisão estratégica, que também é conhecida como teoria dos jogos. Tivemos a oportunidade de nos inteirar da importância de sua aplicação ao lermos sobre o desenvolvimento do raciocínio por parte do empresário, o que envolve diretamente taxonomia dos jogos, jogadores, regras e pay-offs. Observamos o funcionamento da lógica e como os indivíduos são impelidos a escolhas irracionais, denominadas “escolhas sinceras”. Vimos como os participantes do cenário de interação estratégica pensam em relação à cooperação e à competitividade. Tratamos também das escolhas racionais e pudemos constatar o princípio econômico de Adam Smith, em que cada um faz o que é melhor pra si de acordo com suas preferências. Ainda, analisando os padrões comportamentais humanos, vimos que as preferências variam como completa (quando se tem certeza do que se quer), transitiva (quando isso é tão bom quanto aquilo) e intransitiva (quando a escolha é feita coletivamente e se chega ao consenso). A relação de preferência é feita por meio da análise binária e vimos que, por essa lógica, se explicam os paradoxos sociais (em que as escolhas individuais são contrastantes com as coletivas). Mais uma vez, ratificamos a importância da informação para o raciocínio e a aplicação da teoria. Dando uma abordagem ampla, tivemos o prazer de compartilhar as ideias dos conceitos apresentados por economistas renomados, como John Nash, Robert Aumann, Roger Myerson e Eric Maskin. Na próxima unidade, vamos desenvolver os conceitos dessa teoria aplicados aos sistemas de informação, utilizando essa ferramenta como inteligência competitiva. 123 Unidade III Exercícios Quanto mais gente, melhor5 Grandes gurus da administração, como Ram Charam, dizem que o melhor lugar para se aprender a fazer negócios é na feira. Concordo, mas acrescentaria que também se pode aprender com o camelô, o pipoqueiro e com todo mundo que lida diretamente com o freguês comprando e vendendo. Estes profissionais podem nos mostrar na prática como as teorias do mundo dos negócios funcionam de verdade. Observando o comportamento de um sorveteiro na praia, pode-se chegar a conclusões interessantes sobre estratégia de localização com base na teoria dos jogos. Mais do que isso, é possível concluir novos aspectos sobre nossa própria localização: por que é vantajoso morar e trabalhar em uma cidade grande como São Paulo? Imagine uma praia relativamente pequena, com uns 300 metros, onde seus frequentadores encontram-se espalhados igualmente na areia. Neste cenário, imagine um sorveteiro que chega à praia onde já se encontra um concorrente vendendo o mesmo produto com o mesmo preço que o seu. Como o outro sorveteiro está sozinho, ele está bem no meio da praia. Onde você irá estacionar o seu carrinho de sorvetes e onde você acha que seu concorrente o fará? À primeira vista, parece que o mais óbvio é cada um ficar a uma distância de 100 metros do fim da praia e deles mesmos. Esta seria uma estratégia de mútua cooperação, em que cada um dos vendedores teria um terço da praia praticamente exclusiva e um terço dividido equitativamente. Eles estariam posicionados da melhor forma para que qualquer banhista possa chegar até eles andando o mínimo possível. Mas... Se você já teve a oportunidade de presenciar uma situação parecida com esta na realidade, provavelmente você notou os dois sorveteiros juntos no meio da praia. Será que eles fazem isso para poder ficar conversando? Ou será que esta é realmente a melhor alternativa? Na verdade, eles ficam juntos no meio da praia porque este é o único equilíbrio de Nash possível no sistema. Na teoria dos jogos, o equilíbrio de Nash é atingido quando cada jogador faz o melhor possível em função do que seus concorrentes fazem. Voltando a imaginar-se sorveteiro: se o seu concorrente ficasse a 100 metros do fim direito da praia, o melhor que você poderia fazer seria se posicionar logo à sua esquerda. Desta forma, você abrangeria dois terços da praia contra um terço para ele. Seria a sua deserção, vantajosa frente à cooperação dele. No momento seguinte, porém, seu concorrente se moveria mais para o centro, logo à sua esquerda. Dali a pouco, seria você que iria para a esquerda dele e, momentos depois, ambos estariam juntos no meio da praia. Em uma sucessão de deserções MARINHO, R. Quanto mais gente, melhor. Gestão de Carreira, 24/02/2007. Disponível em: <http://www. gestaodecarreira.com.br/coaching/carreira/quanto-mais-gente-melhor.html>. Acesso em: 17 nov. 2011. 5 124 ESTRATÉGIA COMPETITIVA de parte a parte, você e seu concorrente iriam ficar bem no centro da praia, dividindo a clientela meio a meio. Repare que é muito comum encontrar postos de gasolina, floriculturas e bancos localizados um em frente ao outro. Isto acontece pelo mesmo motivo, o equilíbrio de Nash. A questão da localização do carrinho de sorvete também pode ser entendida como uma estratégia de localização profissional. Recentemente, a revista Você S.A. publicou uma pesquisa sobre as melhores cidades para fazer carreira, em que São Paulo foi apontada como a primeira colocada. Coincidentemente, São Paulo também é a cidade mais próxima da maior parte do mercado nacional em termos de concentração de PIB. Pode-se dizer que São Paulo é exatamente o “meio da praia”, o lugar onde é mais vantajoso você estar se quiser atingir o maior número de pessoas possível e aumentar sua exposição pessoal. Mas São Paulo é a cidade onde se encontra a maior concorrência profissional do Brasil. Mesmo assim, é considerada a melhor cidade para fazer carreira, o que é uma aparente contradição. Por que não fazer carreira em uma pequena cidade do interior, para onde quase ninguém vai? Simplesmente porque isto representaria ir para o “canto da praia”. Você conquistaria uma clientela local, sem dúvida, mas quem fica no centro divide quase a totalidade do mercado. Como o ambiente de negócios brasileiro é bem mais complexo que em uma praia, este raciocínio tem de ser entendido levando-se em conta inúmeras outras particularidades, desde o ramo de atividade em que se trabalha até questões de qualidade de vida que cada cidade oferece. Mas o “jogo do sorveteiro” é, sem dúvida, um exercício interessante para refletir sobre posicionamento profissional. 1) Identifique no texto trechos que reflitam a teoria do equilíbrio de Nash. Comentário: • Sorveteria na praia: “Na verdade, eles ficam juntos no meio da praia porque este é o único Equilíbrio de Nash possível no sistema. Em Teoria dos jogos, o Equilíbrio de Nash é atingido quando cada jogador faz o melhor possível em função do que seus concorrentes fazem.” • Posicionamento profissional: “Mas São Paulo é a cidade onde se encontra a maior concorrência profissional do Brasil. Mesmo assim, é considerada a melhor cidade para fazer carreira, o que é uma aparente contradição.” 125 Unidade III 2) Quais são as taxonomias possíveis sobre a sorveteria na praia? Comentário: Escolha racional, jogo de estratégia, o número de jogadores tende a infinito, forte, determinado, cooperativo, de soma positiva negativa, dinâmico, assimétrico, simultâneo e informação completa e imperfeita. 3) Reflita sobre conclusões possíveis para o posicionamento profissional. Comentário: Pessoas competitivas, quando entendem que a chance de recompensa aumenta com a cooperação, deixam de competir e passam a cooperar, mantendo o foco no resultado. 126