estrategia_competitiva 1.indb

Unidade III
Unidade III
5 TAXONOMIAS DOS JOGOS
A teoria dos jogos dedica-se a elucidar os aspectos da lógica na tomada de decisão em situações
competitivas ou cooperativas. Os modelos atuariais utilizados espelham problemas reais do cotidiano,
como economia ou exércitos em guerra, e observa-se que são melhores sucedidos quando aplicados às
técnicas descritas nesta unidade, pois apontam soluções analíticas bastante satisfatórias.
Após essa digressão, ﬁcam deﬁnidos os principais ingredientes para a montagem do cenário do jogo:
quem são os jogadores, quais são as regras e quais seus pay-offs (recompensas ou prêmios).
A teoria dos jogos justiﬁca a pesquisa da racionalidade da ação no ato da escolha, por meio de
sua inﬂuência nas opções de modelagem estratégica, usando como fundamento a interação entre os
jogadores, que poderá resultar ou não em equilíbrio.
Os jogos são classiﬁcados de acordo com as características do cenário que se apresenta (jogadores, regras
e pay-offs). Essas taxonomias apontam métodos para resolvê-los. Vamos expor as naturezas taxonômicas:
• Natureza da escolha: escolha sincera e escolha estratégica.
Segundo Bêrni (2004), a diferença entre os tipos de escolha é a motivação do agente. Na escolha
estratégica há indubitável racionalização para o curso da ação que destina a alcançar determinado
objetivo, enquanto a escolha sincera é espontânea.
De acordo com essa área especíﬁca, uma escolha “sincera” é espontânea, instintiva e/ou aleatória e,
na maioria das vezes, leva à um resultado indesejado. Isso ocorre porque a ação do agente não causa
impacto no resultado. Já na escolha racional ou estratégica, a ação do agente inﬂuencia diretamente o
resultado esperado.
• Tipos de jogos: jogos de estratégia e jogos de azar.
Há situações que não podem ser previstas, pois estão sujeitas ao acaso. Portanto, nesse caso, mesmo
que uma pessoa seja racional, não conseguirá alterar o resultado. São chamados jogos de azar aqueles
em que o pay-off não depende da ação direta (habilidade em responder) do agente; por esse motivo, o
resultado não pode ser modiﬁcado.
Nessa categoria, podemos incluir jogos de apostas, como roleta, caça-níquel, pôquer, bingo, loteria
etc. Mas vale lembrar que todos os tipos de jogos estão sujeitos aos cálculos probabilísticos, ou seja,
estatísticas de acordo com as combinações escolhidas.
84
ESTRATÉGIA COMPETITIVA
O EV (Expected value – valor esperado) da aposta será o pay-off ganho ou perdido, ou seja, o EV é
que deﬁnirá a percepção de sucesso ou fracasso na partida. Por exemplo, se você tiver 25% de chance
de ganhar pelo cálculo probabilístico e precisa apostar R$100,00 para um EV igual a R$ 500,00, então,
você perderia R$100,00 três vezes (75%) e ganharia, supostamente, R$500,00 na quarta vez.
Lembrete
Jogos de azar em geral guardam vantagem para a banca de 0,5% a
3,5%. Por isso, resulta em um EV positivo(+) muito pequeno, pois, ao criar
essa regra de acordo com a posta do jogador, cria um EV negativo(-).
Observação
Aposta: similar a um palpite para se ganhar ou perder um prêmio.
Variável aleatória1
É a função que associa um resultado numérico real para cada elemento amostral do
resultado. O número real opera um mecanismo ou experiência não determinística e gera
resultados aleatórios.
Figura 12
S
s
IR
X(s)
Em que:
S → espaço amostral
s → elemento do espaço amostral S
Suponha:
E → jogar uma moeda três vezes
Em que: c = coroa
k = cara
S = {(ccc), (kcc), (ckc), (cck), (kkk), (kkc), (kck), (ckk)}
Adaptado de WALPOLE, R. et al. Probabilidade & estatística para engenharia e ciências. 8ª ed. São Paulo: Prentice
Hall Brasil, 2008.
1
85
Unidade III
Variável aleatória diz respeito à característica do experimento que queremos estudar.
Suponha que esse aspecto seja igual ao número de caras nos 3 lançamentos da moeda.
Quais os valores assumidos pela variável aleatória?
x = 0 {(kkk)}
x = 1 {(kkc)(kck)(ckk)}
x = 2 {(kcc)(ckc)(cck)}
x = 3 {(ccc)}
• Condição de entrada: jogos fracos e jogos fortes.
De acordo com o conceito estabelecido pela teoria dos jogos, o jogo fraco ou forte nada tem a ver com
a força ou preparo físico empregado pelo jogador, e sim com a obrigatoriedade de participação ou não. Por
exemplo, você pode escolher entrar na “pelada” (jogo de futebol informal de domingo ou não), não obstante,
um jogador proﬁssional tem a obrigatoriedade da participar por força maior, prevista em contrato.
O jogo fraco é aquele no qual o agente pode escolher participar ou não,
como uma aposta na loteria, ou desistir de certa rodada de pôquer. Já no
jogo forte, a participação é compulsória, como homens engajarem-se nas
forças armadas (BÊRNI, 2004, p. 20).
• Quantidade de jogadores: um, dois, três etc.
O mais simples jogo imaginável consiste em conceber ações estratégicas que dependem apenas de
determinados estados da natureza, como chover. Um jogo com um jogador é chamado de jogo contra
a natureza. Se a estratégia da natureza é determinada, o jogo é trivial; se a estratégia da natureza é
probabilística, estes jogos são chamados de problemas de decisão; se é indeterminada, pode-se tratar o
jogo como sendo de duas pessoas, se for atribuída alguma perversidade à natureza.
• Número de estratégias: duas ou mais estratégias.
Os pay-offs podem ser percebidos como favoráveis ou desfavoráveis, de acordo com as estratégias
aplicadas. Quando se aplica uma única estratégia, diz-se estratégia pura, pois o jogo será formado por
um único lance. Para mais de uma, denomina-se estratégia mista, posto que o jogo é composto de
múltiplos lances.
• Maneira de jogar: jogo determinado e jogo indeterminado.
“A melhor maneira da de jogar” é uma expressão utilizada para jogos de estratégia, como o
xadrez. Jogos de tabuleiro em geral são determinados, pois, apesar de todos os jogadores atuantes
86
ESTRATÉGIA COMPETITIVA
estarem submetidos à um conjunto de regras em que o blefe não é permitido, isso não exclui a
possibilidade do fator surpresa. No futebol, isso acontece com certa frequência. Contando com a
sabedoria coletiva, o legendário ponta-direita Garrincha, por exemplo, era o mestre desse tipo de
desdobramento.
O pôquer, por sua vez, não possui essa característica, pois mesmo jogadores oniscientes são incapazes
de prever seus próprios resultados, já que o blefe é permitido pela regra. Então, qual seria a natureza da
informação em comum? Essa consideração anula qualquer eventual vantagem, desvanecendo qualquer
impacto no resultado esperado.
• Distribuição de resultados: jogo de soma zero e jogo de soma positiva ou negativa.
No jogos de soma zero, um agente só poderá ganha se o(s) outro(s) perderem, ou seja, há sempre
um vencedor. Na teoria dos jogos, dizemos que cada jogador ganha precisamente o que o outro perde.
No xadrez ou no pôquer, o vencedor ganha a partida e, por sua vez, o(s) outro(s) jogador(es) perde(m)
a partida.
Nos jogos de soma positiva ou negativa, temos mais de um vencedor ou perdedor respectivamente.
São interações estratégicas que permitem desfechos bons e maus para os envolvidos, como decisões
políticas, econômicas etc. Quando se diz que mais de um jogador pode ganhar ou perder, não signiﬁca
necessariamente que ganhem ou percam exatamente as mesmas coisas, mas ﬁcam satisfeitos com os
pay-offs. Nesse caso, os economistas chamam esse fenômeno de troca justa.
• Estilos de interação: jogo cooperativo e jogo não cooperativo.
O foco para atitude cooperativa ou não cooperativa é a motivação do agente pelos pay-offs.
Simpliﬁcando o raciocínio, se a chance de recompensa aumenta quando o jogador coopera, a natureza
do jogo é cooperativa, portanto, também será condicionalmente um jogo de soma positiva negativa.
Num jogo competitivo, as chances de recompensa se reduz com a postura cooperativa, ou seja,
compartilhar a recompensa não é um atrativo, então, é condição sine qua non que o jogo seja de
soma zero.
Observação
Todas as vezes que o jogador decidir seu curso de ação não respeitando a
natureza taxonômica do jogo, a chance de conquistar o resultado esperado
cai drasticamente.
• Quantidade de interações: jogo estático e jogo dinâmico.
O jogo estático é aquele no qual só há uma interação entre os agentes. Quando há mais de um lance,
diz-se que os agentes estão envolvidos em um jogo dinâmico ou em um superjogo.
87
Unidade III
• Simetria das ações: jogo simétrico e jogo assimétrico.
No jogo simétrico, o jogador precisa aguardar a ﬁnalização do lance do outro participante para
iniciar seu lance, por consequência, o número igualitário de lances está estabelecido por regra (xadrez,
tênis etc.) Por contraste, no jogo assimétrico, a adoção de determinada estratégia por parte de um
jogador é ilimitada, ou seja, dependerá da eﬁciência de sua aplicação. Por isso, a regra não determina a
equivalência de lances para todos os jogadores (futebol, basquete etc.).
• Ordem de movimentação: jogo simultâneo e jogo sequencial.
No jogo simultâneo, os jogadores manifestam suas decisões ao mesmo tempo (futebol, basquete
etc.). Outra consideração é que os jogos estáticos de dois ou mais jogadores serão sempre simultâneos
(par ou ímpar). As decisões sequenciais estão condicionadas aos superjogos (dinâmicos), como ocorre
no xadrez.
• Conteúdo informacional: jogo de informação completa e incompleta, jogo de informação
perfeita e imperfeita.
Em um jogo de informação completa, cada jogador detém toda a informação relevante para escolher
sua jogada, ou seja, conhece completamente o cenário do jogo (jogadores, regras e pay-offs). Basta que
um dos itens do cenário seja desconhecido no lance do jogo para ser de informação incompleta. Já em
um jogo de informação perfeita, o jogador conhece todas as informações do jogo, desde o início da
partida até o momento atual. Portanto, aplica-se apenas aos jogos dinâmicos.
• Jogos repetidos e inﬁnitamente longos: há jogos em que o tempo para o término da partida
é inﬁnito, matematicamente falando. Ou seja, não se sabe quando vai acabar. Outro atributo
importante é que essa taxonomia só se aplica aos jogos cooperativos. Por exemplo, relações
entre fornecedores e clientes, crises econômicas ou políticas, guerras etc. são denominadas jogos
repetidos ou inﬁnitamente longos.
Toda espécie de cooperação pacíﬁca entre homens se baseia, em primeiro
lugar, na conﬁança mútua e, apenas em segundo lugar, em instituições, tais
como cortes de justiça e polícia (EINSTEIN, 1879 – 1955).
Dizemos que são repetidos porque fundamentam-se em uma história que evolui com o tempo e é
de conhecimento comum dos jogadores.
Por exemplo, em uma relação comercial entre duas empresas, uma que adquire um insumo especial
de outra, que precisa ser entregue com determinadas especiﬁcações para que não prejudique o processo
produtivo da compradora. Ao mesmo tempo, a produtora precisa realizar certos investimentos para
atender ao pedido especial. Portanto, estabelece-se por contrato algumas condições de pagamentos para
não terem prejuízos. Ainda que não haja certeza acerca do comportamento de ambos, são observadas
as histórias das relações comerciais já realizadas para compromissos anteriores que, por sinal, é uma
prática bastante utilizada no mundo dos negócios.
88
ESTRATÉGIA COMPETITIVA
Quando estamos defrontando esse tipo de situação, podemos utilizar a modelagem de jogos
repetidos para avaliar o gênero de interação estratégica, pois sempre haverá o interesse de se induzir
à cooperação, por exemplo, entre políticos, especialmente entre congressistas que devam realizar com
frequência acordos para que suas plataformas políticas se transformem efetivamente em leis.
5.1 Um mundo equilibrado: o Dilema dos prisioneiros
Cooperarão ambos os prisioneiros para minimizar a perda da liberdade, ou um dos presos, conﬁando
na cooperação do outro, o trairá para ganhar a liberdade?
O Dilema dos prisioneiros foi originalmente formulado por Merrill Flood e Melvin Dresher, enquanto
trabalhavam na Rand, em 1950. Mais tarde, Albert W. Tucker o formalizou com o tema da sentença de
tempo de prisão e deu ao problema geral esse nome especíﬁco.
O Dilema dos prisioneiros (DP) clássico funciona da seguinte forma:
Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuﬁcientes para condená-los, mas,
separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros testemunhar para a
procuradoria contra o outro e o outro permanecer em silêncio, o dedo-duro sai livre, enquanto o cúmplice
silencioso cumpre 10 anos de sentença. Se ambos ﬁcarem em silêncio, a polícia só pode condená-los a 6
meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 2 anos de cadeia. Cada prisioneiro
faz sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro. A
questão que o dilema propõe é: o que vai acontecer? Como os prisioneiros vão reagir?
O fato é que pode haver dois vencedores no jogo, sendo essa a melhor solução para ambos, quando
analisada em conjunto. Entretanto, os jogadores defrontam-se com alguns problemas: conﬁam no
cúmplice e permanecem negando o crime (mesmo correndo o risco de serem colocados em uma situação
ainda pior), ou confessam e esperam ser libertados. Apesar de que, se o outro ﬁzer o mesmo, ambos
ﬁcarão em uma situação pior do que se permanecessem calados.
De fato, não importa os valores das penas, mas sim o cálculo das vantagens de uma decisão cujas
consequências estão atreladas às decisões de outros agentes, em que a conﬁança e a traição fazem
parte da estratégia em jogo.
Casos como este são recorrentes na economia, na biologia e na estratégia. O estudo das táticas mais
vantajosas em um cenário em que esse dilema se repete é um dos temas da teoria dos jogos.
Para analisar um jogo, é comum o uso de quadros, como o seguinte:
Quadro 3
Jogador 2
Caro
Jogador 1
Barato
Caro
11,15
2,25
Barato
20,4
6,55
89
Unidade III
O quadro 3 representa uma situação em que dois jogadores concorrem no mesmo mercado. Ambos
oferecem serviços similares e têm a opção de cobrar caro ou barato.
Existem dois números dentro de cada quadrado: esses são os resultados que cada jogador recebe por
sua estratégia. Tradicionalmente, o primeiro valor é quanto o jogador da esquerda recebe e, o segundo,
quanto o de cima recebe.
Esse quadro pode representar, por exemplo, os dois únicos oftalmologistas de uma pequena cidade
do interior, e os números multiplicados por R$1.000,00 são os lucros ao ﬁnal do mês. Há algum tempo,
existia somente o jogador 1 na cidade, e seus preços eram altos devido à falta de opções. Então, chega
o jogador 2 e abre um consultório em frente ao do jogador 1. O jogador 2 agora deve deﬁnir quanto
cobrar por seus serviços. Se ele nivelar seu preço ao do concorrente, receberá um retorno de 10; o
primeiro, por já estar estabelecido, ﬁca com um retorno mais alto. O novo dentista também tem a
opção de cobrar um preço mais barato que o primeiro. Isso fará com que grande parte da clientela
mude de oftalmologista, e agora o lucro dele é bastante alto, enquanto o dentista inicial passa a viver
com R$2.000,00 reais mensais. Uma ação dessas não ﬁcará sem reação, e o primeiro oftalmologista
pode também baixar seus preços. Dessa vez, ambos estão ganhando menos, mas, para o jogador 1, seis
é melhor que dois. É fácil ver, nesse exemplo, a dinâmica de uma guerra de preços. O oftalmologista 2
baixa um pouco seus preços, aumentando seu lucro até receber a resposta de seu concorrente. Poderse-ia questionar por que o segundo oftalmologista mantém seus preços altos logo de início, ou por
que os dois não entram em acordo e levantam seus preços juntos. Mas os dois são concorrentes, e a
motivação para qualquer um deles reduzir o preço é muito alta. O primeiro oftalmologista pode resolver
baixar seus preços, atraído pela perspectiva de ter seus lucros quase dobrados, enquanto seu competidor
ﬁca com mil reais por mês.
O que ocorre nesse jogo é uma dinâmica conhecida por Dilema do prisioneiro. O exemplo clássico
consiste em dois prisioneiros em face de entregar o outro ou alegar inocência. Se ambos negarem o crime,
os dois saem livres, se um apontar o outro, o acusado recebe uma pena pesada e o delator uma leve e, se
ambos acusarem um ao outro, os dois pegam penas pesadas. Infelizmente, os prisioneiros estão fadados
a ﬁcarem presos. Na pior opção possível, haverá pena máxima para ambos, pois os incentivos para trair
o outro são muito altos. Como os participantes nesses jogos sabem que as chances de serem traídos pelo
outro lado são muito altas, podem acabar traindo por antecipação como forma de proteção.
O mercado da aviação é um exemplo do Dilema do prisioneiro na área empresarial. Como todo
serviço, o problema com a passagem aérea é que, uma vez que o avião levanta voo, cada assento não
vendido é uma perda. Não é possível estocar a vaga para vendê-la depois. Além de deixar de ganhar com
mais uma venda, as empresas aéreas ainda têm de arcar com o prejuízo de colocar o avião no ar, que não
muda muito pela lotação. Portanto, a motivação para uma empresa baixar seus preços, principalmente
em voos difíceis de vender, é muito alta. Como a maioria das pessoas não faz distinção de companhias
aéreas, desde que chegue a seu destino, a empresa com preços mais baixos tende a voar com a maior
lotação possível, enquanto as concorrentes agonizam com os prejuízos. Essa dinâmica pode chegar ao
extremo de empresas competindo por clientes enquanto sabidamente têm prejuízo em alguns voos,
simplesmente por ser pior para elas voarem vazias do que com um prejuízo diminuído. Assim como os
oftalmologistas ou os prisioneiros, as empresas aéreas poderiam entrar em um acordo, mas os benefícios
90
ESTRATÉGIA COMPETITIVA
de trapacear o concorrente são muito altos. O Dilema do prisioneiro sugere que se tome muito cuidado
quando os concorrentes começam a baixar os preços. Sem um diferencial, corre-se o risco de ser forçado
a uma guerra de preços. Pode-se observar o mesmo fenômeno em uma dinâmica inversa, por exemplo,
quando dois competidores passam a oferecer cada vez mais vantagens aos clientes facilmente copiáveis
pelos concorrentes. Para usar o mercado de aviação, é possível observar esse efeito com os programas
de milhagem e serviços adicionais.
Antecipando os movimentos
Nos jogos de estratégia em geral, prever como os competidores reagirão aos movimentos e anteciparse às suas próximas ações constitui uma enorme vantagem. É sob esta ótica que a teoria dos jogos adquire
especial importância, uma vez que seu meio analítico visa permitir a identiﬁcação dos movimentos mais
adequados a se realizar, de acordo com a movimentação da concorrência.
Segundo Brandenburger e Nalebuff (1995), o jogo dos negócios deve ser jogado utilizando-se da
observação e da análise dos movimentos passados do jogo, para determinar qual é a ação que, se
tomada hoje, poderá conduzir a organização a uma determinada posição no futuro. Ou seja: “olhar para
frente, repensando o passado”.
Nesse sentido, Maital (1991) complementa aﬁrmando que “olhar para frente, repensando o passado”
implica que se deve, inicialmente, escolher a situação ﬁnal que nos pareça a mais interessante para
depois traçar o caminho de volta, identiﬁcando qual é a estratégia capaz de nos conduzir à situação
desejada.
5.2 O equilíbrio de Nash
No equilíbrio de Nash, nenhum jogador se arrepende de sua estratégia, dadas as posições de todos os
outros. Ou seja, um jogador não está necessariamente feliz com as táticas dos outros jogadores, apenas
está feliz com a tática que escolheu em face das escolhas dos outros. No ﬁlme Uma mente brilhante,
sobre a vida de John Nash, popularizou-se o termo e levou ao conhecimento do público a teoria dos
jogos, mas, infelizmente, como o economista James Miller coloca, a única indicação sobre o assunto no
ﬁlme está equivocada.
No ﬁlme, cinco garotas, entre elas uma especialmente atraente, entram em um bar, e Nash tem a
ideia de, junto com três amigos, conversar com as quatro e evitar tanto a competição pela mais bonita
quanto o ciúme das outras garotas. No ﬁlme, está subentendido que essa seria a base do equilíbrio de
Nash. O problema é que o equilíbrio de Nash ocorre quando não há arrependimento e, vendo a mulher
mais bonita do bar sair sozinha, alguém poderia se arrepender de não ter ido conversar com ela em
primeiro lugar. O equilíbrio de Nash somente ocorreria se um dentre os quatro fosse conversar com a
mais bonita e os outros evitassem a competição, partindo cada um para uma garota diferente.
O que percebemos é que a genialidade do equilíbrio de Nash vem da sua constância sem os
jogadores estarem cooperando. Por exemplo, seja uma estrada de cem quilômetros, de movimento igual
nas duas direções, representada por uma linha graduada de 0 a 100. Coloquemos nessa estrada dois
91
Unidade III
empreendedores procurando um local para abrir, cada qual, um posto de gasolina. Pode-se assumir que
cada motorista irá abastecer no posto mais próximo de si. Se A coloca seu posto no quilômetro 40, e B
exatamente no meio, B ﬁcará com mais clientes que A. O jogo ainda não está em equilíbrio, pois B pode
se arrepender de não estar mais perto de A, roubando mais clientes. O equilíbrio de Nash será A=X+1 e
B=X-1. Se um posto estiver um pouco fora do centro, seu competidor vai ganhar mais da metade dos
consumidores, colocando-se ao seu lado, mais próximo ao centro.
A teoria dos jogos consegue explicar porque, nos grandes centros urbanos, farmácias, locadoras e
outros competidores da mesma indústria tendem a ﬁcarem próximos uns aos outros. Sempre que um
jogador se encontra em uma situação em que até poderia estar melhor e, no entanto, está fazendo o
melhor possível dada a posição de seus competidores, existirá um equilíbrio de Nash.
Em 1964, o cineasta Stanley Kubrick lançava Dr. Strangelove. Nele, um oﬁcial americano ordena um
bombardeio nuclear na União Soviética, cometendo suicídio em seguida e levando consigo o código
para cancelá-lo. O presidente americano busca o governo soviético na esperança de convencê-lo
de que o evento é um acidente e por isso não deve haver retaliação. É, então, informado de que os
soviéticos programaram uma arma de “ﬁm do mundo” (uma rede de bombas nucleares subterrâneas),
que funciona automaticamente quando o país é atacado ou quando alguém tenta desarmá-la. O Dr.
Strangelove, estrategista do presidente, aponta uma falha: se os soviéticos dispunham de tal arma, por
que a guardavam em segredo? Por que não contar ao mundo? A resposta do inimigo: a máquina seria
anunciada na reunião do partido na próxima segunda-feira.
Podemos analisar a situação criada no ﬁlme sob a ótica da teoria dos jogos: uma bomba nuclear é
lançada pelo país A ao país B. A política de B consiste em rebater com todo seu arsenal, capaz de destruir
a vida no planeta, se atacado. O raciocínio que levou B a tomar essa decisão é bastante simples: até
o país mais fraco do mundo está seguro se criar uma “máquina de destruição do mundo”, ou seja, ao
ter sua sobrevivência seriamente ameaçada, o país destrói o mundo inteiro (ou, em seu modo menos
drástico, apenas os invasores). Ao elevar os custos para o país invasor, o possuidor dessa arma garante
sua segurança. O problema é que de nada adianta um país possuir tal arma em segredo. Seus inimigos
devem saber de sua existência e acreditar na sua disposição de usá-la. O poder da “máquina do ﬁm do
mundo” está mais na intimidação do que em seu uso.
Atualmente, temos o caso do Irã (na capital, Teerã). O ministro iraniano da defesa, Mustafá Mohamad
Najar, anunciou, na terça-feira (22/11/07), que seu país construiu um novo míssil balístico com um
alcance de 2.000 quilômetros, denominado Ashura, em um clima de forte tensão com os países ocidentais
devido às ambições nucleares de Teerã. O novo míssil, batizado com o nome da maior cerimônia de luto e
penitência dos mulçumanos xiitas, tem, em teoria, o alcance suﬁciente para atingir as bases americanas
da região e Israel, a cerca de 1.000 quilômetros do país.
O conﬂito nuclear fornece um exemplo de uma das conclusões mais surpreendentes dentro da teoria
dos jogos. O economista Thomas Schelling percebeu que, apesar do sucesso geralmente ser atribuído à
maior inteligência, planejamento, racionalidade, entre outras características que retratam o vencedor
como superior ao vencido, o que ocorre muitas vezes é justamente o oposto. Até mesmo o poder de um
jogador, considerado no senso comum como uma vantagem, pode atuar contra seu detentor. Schelling
92
ESTRATÉGIA COMPETITIVA
criou o termo brinksmanship (de brink, extremo) à estratégia de deliberadamente levar uma situação às
suas consequências extremas.
Um exemplo usado por Schelling é bem conhecido: o jogo do frango, que consiste em dois indivíduos
acelerarem seus carros na direção um do outro em rota de colisão; o primeiro a virar o volante e sair da
pista, é o perdedor.
É possível ver, no quadro a seguir, os resultados desse jogo:
Quadro 4
Motorista 2
Motorista 1
Reto
Desvia
Reto
-100, -100
1, -1
Desvia
-1,1
0,0
Se ambos os motoristas seguissem reto, os dois jogadores pagariam o preço mais alto com sua vida.
No caso de os dois desviarem, o jogo termina em empate. Se um desviar e o outro for reto, o primeiro
será o “frango” e o segundo, o vencedor. Schelling propôs que um participante desse jogo deve retirar
o volante de seu carro e atirá-lo para fora, fazendo questão de mostrá-lo a todas as pessoas presentes.
Ao outro jogador caberia a decisão de desistir ou causar uma catástrofe. Um jogador racional optaria
pela opção que lhe causasse menos perdas, sempre perdendo o jogo. O mesmo ocorre quando se decide
invadir um país sem medo de usar armas nucleares. É possível ver no dumping entre concorrentes uma
aplicação direta da “máquina do ﬁm do mundo”. Uma empresa pode decidir vender com prejuízo, caso
seu concorrente ultrapasse determinados limites.
O exemplo de Schelling fornece ainda uma instância em que, ao se retirar o volante e, portanto, o
poder de decidir, o jogador tem suas chances de ganhar aumentadas. Em situações de negociação é
comum se abrir mão do poder e ainda assim sair ganhando.
Muitas vezes, advogados dizem que estão autorizados por seus clientes a ir somente até um valor,
enquanto vendedores atribuem aos gerentes a decisão de não fornecer desconto. Se a outra parte
acredita na limitação desses proﬁssionais, o limite de preço imposto ganha credibilidade.
Eliminar opções pode ser útil em situações como a negociação de um aumento. Por que deveria um
superior conceder um aumento, se acredita que seu empregado não possui outra opção melhor? Se o
empregado ameaçar ir embora caso não receba um aumento, pode-se simplesmente dizer não, pois a
ameaça não é conﬁável.
Uma forma de o empregado tornar a ameaça digna de crédito seria espalhar a notícia de que, caso
não receba um aumento, sairá da ﬁrma, a todos que trabalham na empresa. O objetivo do empregado é
tornar a sua estada na ﬁrma sem um aumento totalmente humilhante, obrigando-o a pedir demissão.
Agora sua ameaça faz efeito, e o chefe será obrigado a conceder um aumento ou procurar outro para o
serviço. Ao arriscar sua própria credibilidade com os colegas, o empregado aumenta as chances de um
resultado favorável.
93
Unidade III
Limitar as opções pode signiﬁcar simplesmente cortar as comunicações. Durante as negociações,
para convencer um vendedor a aceitar um preço, um comprador pode fazer uma oferta e, em seguida,
tornar-se propositalmente indisponível. Ao não aceitar ligações, estar sempre em reuniões ou em viagens,
o comprador aumenta a credibilidade de sua ameaça. Uma ligação atendida sinaliza interesse e pode
fazer com que a ameaça seja ignorada.
Quando pensaram em utilizar os jogos de estratégia para analisar o mundo social, Von Neumann
e Morgenstein retornaram a uma prática milenar. Ao fazer isso, criaram uma ciência com uma grande
capacidade de generalização e precisão matemática. A teoria dos jogos promete tornar-se um prisma
cada vez mais poderoso sob o qual as relações humanas podem ser analisadas. Praticantes e acadêmicos
de administração, rodeados rotineiramente pelos conﬂitos e complexidade da sociedade, somente têm a
ganhar com essa visão. Ou, como disse certa vez o fundador da Atari, Alan Bushnell: “a área de negócios
é um bom jogo – muita competição e um mínimo de regras”.
Necessitamos de um conceito mais geral de solução de jogos simultâneos, que permita tratar
tanto de jogos que possuem estratégias estritamente dominadas e que, portanto, podem ser
resolvidos pela eliminação iterativa de estratégias estritamente dominadas, como também de jogos
nos quais não é possível identificar esse tipo de estratégia. Esse conceito é o chamado equilíbrio
de Nash.
Diz-se que uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a
melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores.
O que a deﬁnição que apresentamos do equilíbrio de Nash está exigindo é que todas as estratégias
adotadas por todos os jogadores sejam as melhores respostas às estratégias dos demais. Em termos um
pouco mais formais, para que uma dada combinação de estratégias seja considerada um equilíbrio de
Nash é necessário que, para cada estratégia si* que pertença à combinação, tenhamos:
πi (s*i , s*- i) ≥ πi (si , s*- i) para todo si e todo i
Para melhor compreensão, vejamos um exemplo para visualizarmos mais facilmente as características
de um equilíbrio de Nash. Nesse caso, nosso exemplo será o jogo de prevenção de entrada no mercado
nacional, um exemplo de jogo que não possui equilíbrio em estratégias estritamente dominantes:
Quadro 5
Empresa dominante
Entrante potencial
Não exporta
Exporta em pequena escala
Exporta em larga escala
Investe
2,1
1,0
0,-1
Não investe
1,0
2,1
-1,2
Nesse jogo, a visualização do equilíbrio de Nash não é imediata. Por exemplo, se a empresa dominante
não investe, a melhor resposta para a entrante potencial é {exporta em larga escala}. Contudo, a
recíproca não é verdadeira: {não investe} não é a melhor resposta a {exporta em larga escala}. Assim,
94
ESTRATÉGIA COMPETITIVA
{não investe} resulta em uma recompensa de -1 para a empresa dominante, caso a entrante potencial
jogue {exporta em larga escala}, enquanto {investe} resultaria em uma recompensa de 0 na mesma
situação. Dessa forma, a condição do equilíbrio de Nash não é satisfeita.
Se a empresa entrante exporta em larga escala, a melhor resposta para a empresa dominante é
{investe}. Novamente, porém, {exporta em larga escala} deixa de ser a melhor resposta para a entrante
potencial e, mais uma vez, a condição do equilíbrio de Nash não é satisfeita.
Na verdade, há somente uma combinação de estratégias que satisfaz a condição do equilíbrio de
Nash (de serem as melhores respostas umas às outras): a combinação de estratégias formada pelo par
ordenado (investe, não exporta). Se a empresa dominante decidir investir, o melhor que a entrante
potencial tem a fazer é não exportar e, uma vez que a entrante potencial tenha decidido não exportar,
o melhor para a empresa dominante é investir.
Contudo, mesmo em uma forma estratégica relativamente simples como a do quadro 5, pode-se
levar algum tempo para identiﬁcar se há algum equilíbrio de Nash. No caso de jogos envolvendo um
maior número de estratégias, a identiﬁcação pode se tornar ainda mais demorada. Pode ser prático,
portanto, adotar algum artifício que ajude a visualizar com maior rapidez se há algum equilíbrio de
Nash em uma forma estratégica.
A ideia do equilíbrio de Nash é a de que cada jogador está adotando a melhor resposta em relação
ao que os demais jogadores estão fazendo, e isso é válido para todos os jogadores ao mesmo tempo.
Temos apenas de encontrar um meio mais rápido de identiﬁcar se há alguma combinação de estratégias
que satisfaça esse critério.
Algo que poderia facilitar muito no momento de identiﬁcar o equilíbrio de Nash seria indicar, dada
a estratégia adotada pelo outro jogador, qual a melhor escolha para o jogador em questão. Em seguida,
repetiríamos o processo para o outro jogador, até que conseguíssemos identiﬁcar uma combinação de
estratégias em que cada uma delas fosse a melhor resposta à outra e vice-versa.
Uma das formas de se fazer isso seria indicar a estratégia que resulta na maior recompensa ao
jogador que está nas linhas, para cada uma das colunas da forma estratégica. Poderíamos fazer isso, por
exemplo, colocando a letra “I” entre parênteses (I) ao lado da recompensa que corresponde à melhor
resposta do jogador que está nas linhas, para o que o jogador que está nas colunas está fazendo. Esse
procedimento seria repetido para cada estratégia que o jogador representado nas colunas pode adotar.
Como podemos ver no quadro 6:
Quadro 6: O jogo de prevenção da entrada no comércio nacional
Empresa dominante
Entrante potencial
Não exporta
Exporta em pequena escala
Exporta em larga escala
Investe
(I) 2,1
1,0
(I)0,-1
Não investe
1,0
(I)2,1
-1,2
95
Unidade III
A melhor resposta para a empresa dominante
A indicação (I) na recompensa para o jogador que está nas linhas (empresa dominante), na combinação
de estratégias (investe, não exporta), signiﬁca que a melhor resposta da empresa dominante, para a
estratégia {não exporta} da entrante potencial, é {investe}, pois essa escolha dá uma recompensa
superior (no caso, 2) à recompensa resultante da adoção de {não investe} (no caso, 1).
O mesmo raciocínio se aplica às combinações assinaladas: {não investe, exporta em pequena escala}
e {investe, exporta em larga escala}.
O passo seguinte no nosso artifício de determinação do equilíbrio de Nash consiste em proceder da
mesma forma com as estratégias do jogador que se encontra nas colunas. Para isso, assinalamos com a
letra “c” entre parênteses (c) a maior recompensa para o jogador que está nas colunas, que corresponde
a uma dada linha e que identiﬁca a melhor resposta desse jogador para uma dada estratégia do jogador
que está nas linhas.
O processo de identiﬁcação da melhor resposta é repetido, agora para cada uma das linhas. Com isso,
indicaremos as melhores respostas do jogador que está nas colunas para cada uma das estratégias que
o jogador que se encontra nas linhas pode vir a escolher.
A aplicação desse método ao jogo de prevenção da entrada no comércio nacional pode ser visto no
quadro 7:
Quadro 7: O jogo de prevenção da entrada no comércio nacional – a melhor resposta para a entrante potencial
Empresa Dominante
Investe
Não investe
Entrante potencial
Não exporta
(I) 2,1(c)
1,0
Exporta em pequena escala Exporta em larga escala
1,0
(I)0,-1
(I)2,1
-1,2(c)
Assim, a indicação (c) na recompensa para o jogador que está nas colunas (entrante potencial), na
combinação de estratégias {investe, não exporta}, signiﬁca que a melhor resposta da entrante potencial
para a estratégia {investe} da empresa dominante é {não exporta}. Assim, {não exporta} é a melhor
resposta da entrante potencial para a estratégia {investe} da empresa dominante, porque essa escolha
dá um prêmio superior (no caso, 1) à recompensa resultante da adoção de {exporta em pequena escala}
(no caso, 0) e ainda maior do que {exporta em larga escala} (no caso, -1).
O mesmo raciocínio se aplica quando consideramos a melhor reposta da entrante potencial à adoção,
pela empresa dominante, da estratégia {não investe}: assinalamos a opção de exportar em larga escala,
que fornece uma recompensa melhor do que exportar em pequena escala e melhor ainda do que não
exportar.
Observando o quadro 7, vemos que a combinação de estratégias que satisfaz a condição do
equilíbrio de Nash, de serem as melhores respostas umas às outras, ou seja, a combinação de
96
ESTRATÉGIA COMPETITIVA
estratégias formada pelo par ordenado {investe, não exporta} é a única que se encontra assinalada
tanto com um (I) como com um (c). Assim, encontramos nosso método de identificação de equilíbrios
de Nash.
Após aplicarmos o método de assinalar com (I) a melhor resposta do jogador nas linhas para cada
estratégia do jogador nas colunas, e assinalar com um (c) a melhor resposta do jogador nas colunas para
cada estratégia do jogador nas linhas, sempre que uma combinação de estratégias estiver assinalada
simultaneamente com (I) e (c), essa combinação de estratégias será um equilíbrio de Nash.
Condição de equilíbrio
As ações (do participante de uma economia social de trocas) serão
inﬂuenciadas por suas expectativas das ações dos demais participantes, e
essas, por sua vez, reﬂetem as expectativas das ações do primeiro (NEUMANN
e MORGENSTERN, 1944, p.12).
No equilíbrio de Nash, em um sistema, pode ocorrer equilíbrio com estratégias puras e equilíbrio com
estratégias mistas.
O jogo encontra-se em equilíbrio quando as forças que atuam sobre ele não lhe provocam
modiﬁcações. À medida que o tempo passa, a situação inicial repete-se período após período. Haverá
equilíbrio estável no sistema se, mesmo experimentando um abalo causado pela entrada em ação de
nova força, o sistema retornar à situação inicialmente descrita.
Quando o sistema não retornar a esta situação, diz-se que seu equilíbrio era instável. Em um jogo
de estratégia, há equilíbrio quando cada um dos jogadores está oferecendo a melhor resposta, sob o seu
ponto de vista, às ações dos demais jogadores. Esta conjunção de fatores os mantêm satisfeitos com
o curso de ação escolhido e não há incentivos originando-se de dentro do sistema que lhes retire esta
condição. Quando esta conclusão pode ser retirada diretamente da matriz de recompensas do jogo, dizse que o equilíbrio foi alcançado com a adoção de estratégias puras.
Por contraste, em um jogo de dois jogadores e duas estratégias, às vezes, não se observa equilíbrio
diretamente na matriz de recompensas, mas essa pode ser alcançada com a adoção de distribuição de
probabilidades para orientar a ação. Neste caso, diz-se que o jogo possui equilíbrio com estratégias
mistas.
Gintis (2000, p.13) refere-se a esse conceito fundamental da seguinte forma: o conceito de equilíbrio
de Nash é importante porque, em muitas circunstâncias, podemos de forma acurada (ou razoavelmente
acurada) predizer como as pessoas jogarão um jogo, admitindo que elas escolham estratégias que
implementam um equilíbrio de Nash. Deixaremos claro que, nos jogos dinâmicos que modelam um
processo evolucionário, segundo o qual as estratégias bem-sucedidas eliminam as menos eﬁcientes
ao longo do tempo, os estados estacionários são, com algumas exceções óbvias e pouco interessantes,
equilíbrios de Nash.
97
Unidade III
Ainda mais os sistemas dinâmicos evolucionários que, frequentemente, ou convergem para um
equilíbrio de Nash (levando-nos a dizer que são assintomaticamente estáveis) ou seguem órbitas
fechadas em torno de uma exposição de equilíbrio de Nash (quando dizemos que são neutramente
estáveis).
Também veremos que muitos equilíbrios de Nash que parecem intuitivamente implausíveis são, de
fato, equilíbrios instáveis pertinentes a um processo evolucionário, de sorte que não esperamos vê-los
no mundo real. Nos contextos em que os agentes parecem desviar-se sistematicamente de implementar
posições de equilíbrio de Nash e absolutamente não parecem ignorantes ou irracionais por fazê-lo, em
geral, iremos descobrir que não criamos uma especiﬁcação adequada do jogo que eles estão jogando ou
deﬁnimos equivocadamente os pay-offs atribuídos a eles.
Ademais, este conceito põe em ação uma das mais formidáveis características humanas: cada um
deseja o melhor para si próprio, mas sabe que, em uma interação, o melhor para cada jogador só é
perene se combinar com o que o outro considera como sendo o melhor para si.
O jogo do apadrinhamento
Vamos analisar agora outro jogo estritamente competitivo, para ilustrar algumas
aplicações desse tipo de jogo a situações de interação estratégica, assim como a forma de
analisá-lo. Estudaremos o “jogo do apadrinhamento”, que é uma aplicação interessante de
jogos estritamente competitivos à análise política.
Vamos, portanto, analisar o seguinte jogo, segundo Fiani (2010): dois candidatos a um
cargo majoritário (por exemplo, um governo federal) estão decidindo se devem se comprometer ou não a apadrinhar seus cabos eleitorais, oferecendo a eles empregos públicos, caso
vençam as eleições.
Se os candidatos prometem a seus cabos eleitorais empregos públicos, isso faz com
que eles trabalhem com muito mais empenho na eleição, o que contribui para aumentar
as chances dos candidatos de serem eleitos. Por outro lado, uma parcela do eleitorado não
aprova esse tipo de promessa, pois esses eleitores zelam pela eﬁciência e qualidade do
serviço público.
Suponha que, uma vez que o candidato tenha prometido empregos públicos a seus
cabos eleitorais, ele não tenha como deixar de cumprir a promessa. Podemos supor que há
um efeito de reputação muito negativo, e o candidato que não honra sua promessa pode
ter diﬁculdades na próxima eleição para conseguir cabos eleitorais dispostos a trabalhar em
sua campanha.
Um dos candidatos é de oposição, o que signiﬁca que ele precisa de um apoio signiﬁcativo
dos cabos eleitorais para ser conhecido pela população. O candidato da situação não precisa
tanto desse apoio, pois tem a seu favor as obras executadas pelo governo de seu partido.
Esse jogo se encontra descrito na forma estratégica a seguir, na qual apresentamos apenas
98
ESTRATÉGIA COMPETITIVA
as recompensas do candidato de oposição, expressas como porcentual de chance de vitória
em função das suas escolhas e do candidato da situação:
Quadro 8
Candidato da oposição
Candidato da situação
Promete
Não promete
Promete
50%
60%
Não promete
20%
40%
Podemos perceber por que os jogos estritamente competitivos são chamados de jogos
de soma zero. Basta considerar, inicialmente, que a soma dos porcentuais de votos dos dois
candidatos necessariamente é 100%. Assim, se o candidato da oposição e o candidato da
situação prometem empregos públicos, cada um terá 50% de chances de ganhar a eleição.
Dado esse valor constante das somas das recompensas, se tivéssemos colocado as
recompensas dos dois candidatos, teríamos:
Quadro 9
Candidato da oposição
Candidato da situação
Promete
Não promete
Promete
50%, 50%
60%, 40%
Não promete
20%, 80%
40%, 60%
Agora, ao subtrairmos das recompensas do segundo jogador, o valor constante da soma
das recompensas, isto é, 100%, obtemos:
Quadro 10
Candidato da oposição
Candidato da situação
Promete
Não promete
Promete
50%, -50%
60%, -60%
Não promete
20%, -20%
40%, -40%
No quadro 10, a soma das recompensas dos jogadores, para qualquer combinação de
estratégias, é sempre zero. Desse modo, mais uma vez percebemos que é possível apresentar
um jogo estritamente competitivo, como um jogo de soma zero, subtraindo das recompensas
de um jogador (preferencialmente o segundo) o valor constante da soma das recompensas.
Contudo, também vamos optar aqui pela representação mais simples do quadro 8, deixando
implícita a recompensa do segundo jogador.
Vejamos como interpretar a forma estratégica do quadro 8. Nele, vemos que, se o
candidato da oposição não promete empregos públicos a seus cabos eleitorais enquanto
99
Unidade III
o candidato da situação promete, na célula inferior esquerda as chances do candidato de
oposição ganhar a eleição são de 20%. Por que não apresentamos as chances do candidato
da situação?
Simplesmente porque, se naquela situação as chances do candidato de oposição são de apenas 20%, isso significa que as chances do candidato da situação são
de 100% - 20%= 80%, uma vez que ambos os candidatos concorrem ao mesmo
cargo e apenas um será eleito. Não precisamos, assim, apresentar as recompensas
dos dois candidatos: basta apresentar as recompensas do jogador que está nas
linhas (o candidato da oposição) e não esquecer que, enquanto o jogador que das
linhas busca maximizar essas recompensas, o jogador que está nas colunas busca
minimizá-las.
Vejamos agora como resolver esse jogo. Cada candidato sabe que o outro busca
minimizar sua recompensa. Isso signiﬁca que o jogador que se encontra nas linhas (o
candidato da oposição) sabe que o jogador que está nas colunas (o candidato da situação)
busca as estratégias que, dada a estratégia escolhida do candidato da oposição, minimizam
a recompensa deste último.
O candidato da situação sabe, por outro lado, que, dada uma escolha sua, o jogador que
está nas linhas (o candidato da oposição) buscará aquela estratégia que, dada a escolha do
candidato da situação por uma estratégia, ou seja, por uma coluna, maximiza a recompensa
do seu adversário, ou seja, a recompensa do candidato da oposição. Esses valores estão
identiﬁcados no quadro a seguir:
Quadro 11
Candidato da oposição
Candidato da situação
Promete
Não promete
Promete
50%
60%
Não promete
20%
40%
Assim, assinalamos com um asterisco no quadro 12 os valores mínimos em cada linha
do candidato da oposição, que ele identiﬁca como sendo os objetivos que norteariam as
escolhas do candidato da situação para minimizar as chances do candidato da oposição de
ser eleito, de acordo com as escolhas desse último:
Quadro 12
Candidato da oposição
100
Candidato da situação
Promete
Não promete
Promete
50%*
60%
Não promete
20%*
40%
ESTRATÉGIA COMPETITIVA
Como os jogadores devem agir nessa situação?
Como o candidato da situação sabe que, para cada estratégia que escolher nas colunas,
o candidato da oposição irá escolher a linha que maximize suas recompensas, ele deve
selecionar aquela coluna que, quando o candidato da oposição escolher a linha que
maximiza suas recompensas dada a coluna escolhida, proporcione ao candidato da situação
as maiores chances de vitória. Em outras palavras, o candidato da situação deve escolher a
coluna que apresenta o menor valor entre os valores máximos, ou seja, o minimax.
De forma inversa, como o candidato da oposição sabe que, para cada estratégia que
escolher nas linhas, o candidato da situação tentará escolher a coluna que minimize suas
recompensas, ele prudentemente deve selecionar aquela linha que, quando o candidato
da situação escolher a coluna que minimiza as suas recompensas dada a linha escolhida,
proporcione ao candidato da oposição as maiores chances de sucesso. Dessa forma, o
candidato de oposição deve escolher a linha que apresenta o maior valor entre os valores
mínimos que ele pode obter, ou seja, o seu maximin.
É fácil perceber que o equilíbrio nesse jogo estritamente competitivo, conforme vimos, é
dado quando maximin = minimax, que são encontrados quando os dois jogadores decidem
prometer apadrinhar os seus cabos eleitorais, e que corresponde à célula localizada na
primeira linha e na primeira coluna da forma estratégica do quadro 13:
Quadro 13
Candidato da oposição
Candidato da situação
Promete
Não promete
Promete
*
50%
60%
Não promete
20%*
40%
Exemplo de aplicação
Reﬂita sobre o texto a seguir e a aplicação da taxonomia proposta pela teoria dos jogos:
Guerra, teoria de jogos e terrorismo2
Isaac Epstein3
A guerra é a origem de todas as coisas. E de todas elas é soberana. A uns
ela apresenta-os como deuses, a outros, como homens; de uns ela faz
escravos, de outros, homens livres (HERÁCLITO, Frag. 53, Hipólito).
Disponível em: <http://www.comciencia.br/reportagens/guerra/guerra14.htm>. Acesso em: 5 nov. 2011.
Isaac Epstein é engenheiro e pesquisador em ﬁlosoﬁa, comunicação e linguagem. É professor do programa de
pós-graduação em comunicação da Universidade Metodista de São Paulo.
2
3
101
Unidade III
Os saberes sempre estiveram a serviço da guerra; seja desenvolvendo estratégias e táticas, seja
inventando objetos e artefatos militares. Os espelhos com que o sábio Arquimedes, diz a história ou a
lenda, queimou a frota romana, a “Nova Física” do século XVII, cuja inﬂuência da carência de métodos
exatos de cálculo das trajetórias dos projéteis dos canhões é inegável, até o projeto Manhatan de
construção da primeira bomba atômica, aconselhado por um sábio paciﬁsta, Einstein, para deter a
barbárie nazista, são apenas alguns dos inúmeros momentos históricos em que a guerra inspirou o
desenvolvimento da ciência e da tecnologia.
Bacon reconhecia na ciência um método de subjugar a natureza e também, em consequência, a
subjugação do homem pelo homem. Neste sentido precedeu de alguns séculos os autores da Teoria
Crítica, especiﬁcamente seu herdeiro, Herbert Marcuse.
Desde a antiguidade, muitos ﬁlósofos têm sido ambíguos [1] na sua valorização da guerra: negativa,
pelo sofrimento causado e positiva na celebração das virtudes marciais dela decorrentes. Apenas
recentemente, tem sido questionada concretamente a inevitabilidade da guerra e proposta a possibilidade
de uma paz permanente [2].
O saber da guerra, das disputas, das batalhas, dos conﬂitos, dos enganos e astúcias da persuasão
e dissuasão, se constitui historicamente num segmento à parte das grandes divisões tradicionais da
ﬁlosoﬁa e da ciência. No sentido aristotélico, esse saber seria uma técnica e, como tal, algo superior
à experiência, mas inferior à razão. Não obstante, essa técnica, ou melhor, técnicas, foram sempre
valorizadas estudadas e comentadas devido à frequência histórica dos conﬂitos, guerras e lutas pelas
várias formas de hegemonia e domínio.
Com Maquiavel, esse segmento da tecnologia do poder teve seu status recuperado a ponto de esse
pensador ser considerado, por muitos, como o primeiro ﬁlósofo político da modernidade.
O livro clássico Da Guerra (Von Kriege), de Clausewitz (1968), exerceu enorme inﬂuência no
pensamento militar e político durante e após o século XIX. Clausewitz deﬁnia a guerra como “um ato de
violência cuja intenção é compelir nosso oponente a realizar nosso desejo”. Dentro dessa linha, decorria
logicamente que cada guerra deveria terminar com a completa vitória de um lado sobre o outro e que
a “moderação na guerra é um absurdo”, desde que a falha em utilizar toda a força de que se dispõe
contradiz o objetivo da guerra.
A importância da obra de Clausewitz é ressaltada no denso estudo que lhe dedica Raymond Aron
(1986). Atualmente, muitos autores sublinham a importância das aplicações das novas tecnologias
à problemática das estratégias, aspectos psicológicos das estratégias dos conﬂitos etc. (FAYARD,
2000).
Em termos de teoria de jogos, a guerra seria então um jogo soma zero, isto é, aquele no qual o que
uma parte ganha é precisamente o que a outra perde e vice-versa. A teoria dos jogos, desenvolvida por Von
Neumann e Morgenstern (1944) para dar conta de problemas econômicos, cedo tornou-se paradigmática
para determinadas situações de conﬂito militar.
102
ESTRATÉGIA COMPETITIVA
A produção de milhares de ogivas nucleares pelas duas superpotências mudou o paradigma clássico
da guerra descrito por Clausewitz. Se os dois lados possuem meios, cada qual de liquidar o oponente
simultânea e reciprocamente, instala-se uma conjuntura formalmente semelhante à uma situação
paradoxal descrita ainda pela teoria de jogos com o nome de Dilema do prisioneiro (EPSTEIN, 1995).
A corrida armamentista nuclear, ao contrário de uma corrida armamentista tradicional, não poderia
causar a vitória de qualquer das partes, mas a destruição de ambas. Rapoport (1969), em plena guerra
fria, assume duas alternativas estratégicas para as duas potências que se enfrentavam: a alternativa do
desarmamento (X) ou do armamento crescente (Y). A estratégia Y é determinada pelo interesse de cada
parte visto o “jogo” como de soma zero, e a estratégia X pelo interesse comum. Essa última demanda
um fator novo que não existe nos jogos de soma zero: a conﬁança mútua. Haverá uma possibilidade de
se racionalizar a escolha cooperativa? Em outras palavras, é possível racionalizar a conﬁança mútua?
Conﬁar no oponente signiﬁca supor que ele não escolherá a estratégia (Y), e isto é o mesmo que lhe
negar a racionalidade da estratégia dos jogos soma zero. De outro lado, ser digno de conﬁança signiﬁca
descartar a estratégia (Y) em favor da estratégia (X), o que, por sua vez não é um desempenho racional
à luz de um jogo de soma zero. O último tratado de desarmamento entre os Estados Unidos e Rússia
parece ter mostrado a decisão de ambos os países em dar mais um passo para superar o Dilema do
prisioneiro em que estavam envolvidos no momento em que um novo e ameaçador inimigo instaurava
um novo tipo de guerra: o terrorismo.
O chamado terrorismo tem se revelado uma técnica de combate eﬁciente e barata. O atentado às
torres de Nova Iorque que causou um prejuízo de cerca de bilhões de dólares custou algumas centenas
de milhares de dólares (RUTHVEN, 2001). A forte orientação religiosa dos seguidores de Bin Laden,
aliada à sua estrutura difusa, torna a organização Al Queda difícil de ser penetrada. A importância
do fator religioso como motivação de seus seguidores tem sido ignorada (WILCOX, 2001). A Al Queda
tem uma rede organizacional semelhante a uma multinacional, cujos braços vão das Filipinas até os
Estados Unidos. Um grupo central móvel presidido por Bin Laden formula a política geral, e outros
comitês subordinados respondem por ações terroristas, interesses comerciais, consultoria legal etc. Os
seguidores mais pedestres das ordens as seguem cegamente sem mesmo saber como elas se enquadram
na estratégia mais global. O ataque de Nova Iorque foi executado com grande proﬁciência técnica
(MAKIYA e MNEIMNEH, 2002).
O terrorismo, por sua vez, tem raízes estratégicas numa modalidade de guerra que tem uma longa
tradição histórica, a guerrilha (CHALIAND, 1990).
A guerrilha se opõe a exércitos regulares bem armados e equipados, com uma direção central,
grupos dispersos, extremamente móveis e altamente motivados. Esta motivação pode ser a de libertação
nacional contra o dominador estrangeiro, como ocorreu com os resistentes da segunda guerra mundial,
com os vitoriosos vietcongs, com os combatentes da guerra de libertação da Algéria e tantos outros.
Os guerrilheiros podem estar também motivados na luta contra governos nacionais ditatoriais, como
ocorreu em Cuba, em 1959. Um dos comandantes da guerrilha cubana, Che Guevara, chegou a escrever
um livro sobre este tema (GUEVARA, 1989). Diz Guevara que “frente à rigidez dos métodos clássicos de
guerrear, o guerrilheiro inventa sua própria tática e surpreende constantemente o inimigo”. Frente à
enorme superioridade hard (armamento e efetivos) do exército regular, a guerrilha opõe recursos soft
103
Unidade III
de astúcia, uma enorme mobilidade e pequenos efetivos altamente motivados. Antonio Conselheiro, o
comandante fanático da guerra dos Canudos, é um belo exemplo dos métodos da guerrilha na descrição
de Os sertões, de Euclides da Cunha.
O terror desencadeou uma reação mundial e uma dispendiosa operação militar americana no
Afeganistão de eﬁcácia ainda a comprovar. A contínua ação dos homens (e mulheres) bomba no Estado
de Israel parecem comprovar, até o momento, a ineﬁcácia da imensa superioridade armada de Israel
sobre os palestinos, na supressão dos homens-bomba. Uma estranha aliança entre o pré-moderno
das crenças religiosas, em matiz fundamentalista, a extrema juventude ou a formação em disciplinas
técnicas (engenheiros e técnicos dos engajados nos atos terroristas) compõem a personalidade destes
cognominados “mártires”, por um lado, e abomináveis “terroristas”, por outro. Para se compreender um
pouco essas mentes, será necessário fugir desse maniqueísmo.
O discurso do presidente Bush, em setembro de 2001, anunciou que os Estados Unidos “não
distinguiriam entre os terroristas que cometeram o atentado e os países que os acolheram”. Esta
declaração que preparava a invasão do Afeganistão vinha em oposição às normas aprovadas
pelas Nações Unidas que, no caso de uma agressão, o Conselho de Segurança precisaria autorizar
uma resposta armada de uma ou mais nações. As leis de guerra, tradicionalmente sancionadas
por convenções internacionais, proíbem danos à não combatentes em caso de ações militares.
A confusão entre a ação de polícia contra criminosos comuns e o combate militar entre nações
inimigas provoca inevitavelmente mortes e danos a civis não combatentes. Foi o que ocorreu no
Afeganistão e na invasão de Janin, na faixa ocidental.
O fanatismo e o ódio suicida dos terroristas islâmicos e sua crença no martírio e até no prêmio
divino tornam as ações de retaliação em massa pouco efetivas. O que é capaz de intimidar ou deter um
homem-bomba?
As teorias tradicionais das estratégias e táticas dos combates militares têm pouco a dizer sobre o que
parece constituir a principal preocupação militar do século XXI, o terrorismo. O que se necessita com
urgência são teorias compreensivas do fenômeno do terror suicida e os fatores que o propiciam. Ainda
mais, quando se pensa que cada vez mais é viável a sua posse dos meios de destruição em massa.
Notas
1. Platão, por exemplo, via os dois lados da guerra, se bem que não lhes dava o mesmo peso. Kant,
embora vendo a paz permanente como o ideal e objetivo da lei moral, isto não o impedia de dizer
que “a paz prolongada favorece o predomínio de um espírito meramente comercial e, com isso, o
desenvolvimento do egoísmo e a covardia cuja tendência seria a degradação da nação”. Hegel não era
nem ambivalente, pois considerava a guerra como um corretivo para a corrosiva inﬂuência da paz.
2. Foi necessária a Primeira Guerra Mundial, com seus milhões de mortos, aleijados e feridos,
para que a humanidade despertasse em direção a um projeto capaz de dirimir os conflitos, evitando
as guerras: a Liga das Nações. Sabemos dos resultados de sua ineficácia: uma guerra ainda mais
feroz e sangrenta. Mais uma tentativa, a Organização das Nações Unidas, cuja eficácia se limita,
104
ESTRATÉGIA COMPETITIVA
quando muito, a guerras locais. A Terceira Guerra Mundial, afinal, só foi evitada devido ao enorme
poder de aniquilação de cada super potência.
5.3 O modelo de Cournot
O modelo de Cournot deriva do nome do matemático, ﬁlósofo e economista francês Antoine Augustin
Cournot (1801-1877), que publicou, em 1838, uma análise do comportamento de duas empresas que
decidiam simultaneamente que quantidade produzir. Alguns autores consideram sua análise um primeiro
ensaio do método que seria depois elaborado e reﬁnado na forma da teoria dos jogos.
O que é certo, contudo, é que esse modelo é um dos modelos clássicos de análise de mercados com
poucas empresas, ou oligopólios, e, por isso, merece ser estudado com atenção.
O Modelo de Cournot com duas empresas
Nesse jogo, temos dois jogadores, segundo Fiani (2010): empresa 1 e empresa 2. As duas empresas
fabricam produtos homogêneos, disputando, portanto, o mesmo mercado. Diz-se que dois produtos
fabricados por empresas diferentes são homogêneos quando os consumidores não percebem diferenças
na qualidade dos dois produtos e, portanto, baseiam suas decisões sobre qual produto adquirir considerando apenas o preço, independentemente do fabricante.
Como hipótese de conduta, adotaremos o pressuposto de que cada empresa busca maximizar seu
lucro, o que, nesse jogo, é a recompensa. O lucro de cada empresa é a diferença entre sua receita e seus
custos. Desse modo, temos de deﬁnir a receita e os custos de cada empresa, de forma a construir uma
função de recompensa para cada uma delas.
Vamos iniciar a função de recompensa pela receita de cada empresa. A receita é o produto do preço
de mercado pela quantidade vendida por cada empresa. Para simpliﬁcar, vamos supor que o preço de
mercado é dado por uma função de demanda linear, do tipo:
p(q)=A - b(q1+ q2)
Em que p(q) é o preço de mercado como função da quantidade, q é a quantidade total produzida e
vendida no mercado, A e b são constantes, q1 é a quantidade produzida e vendida pela empresa 1, e q2
é a quantidade produzida e vendida pela empresa 2. Obviamente, q = q1 + q2.
A receita total de uma empresa é o produto do preço de mercado pela quantidade produzida e
vendida. Conclui-se, então, que as receitas totais da empresa 1 (RT1) e da empresa 2 (RT2) são dadas,
respectivamente, por:
RT1 = p(q)q1 = Aq1 - bq12 - bq1q2
RT2 = p(q)q2 = Aq2 - bq1q2 – bq22
105
Unidade III
Para chegarmos à função de recompensa de cada empresa, temos de subtrair das receitas os custos,
de forma a obter os lucros de cada empresa. Vamos supor, também para simpliﬁcar, que as funções custo
das duas empresas (C1 e C2) são idênticas, e dadas por:
C1= cq1
C2= cq2
Se c é uma constante estritamente maior que zero. Não é indispensável ao modelo de Cournot supor
que as empresas possuem os mesmos custos, como estamos fazendo, mas essa hipótese simpliﬁcadora
permite obter algumas relações muito interessantes.
Agora podemos escrever a função de recompensa de cada empresa, ou seja, seus lucros, (π1 e π2)
como sendo:
π1 = Aq1 - bq12 - bq1q2 - cq1
π2 = Aq2 - bq1q2 – bq22 - cq2
O passo seguinte é tomar a primeira derivada de cada uma das equações anteriores e igualar à zero,
de acordo com a condição de primeira ordem para maximização:
_π1 = A - 2bq1 – bq2 - c = 0
�q1
_π2 = A— bq1 — 2bq2 — c =0
�q2
Colocando q1 e q2 em evidência em π1/�q1 e π2/�q2, temos então duas novas equações:
q1 = A – bq2e - c
2b
q2 = A – bq1e - c
2b
As duas equações descrevem quanto cada uma das empresas irá produzir para maximizar seus
lucros, dada a produção esperada de sua concorrente (o fato de a quantidade produzida ser a esperada
é indicado pelo superíndice e).
Por que a produção esperada e não a efetiva? Porque cada empresa toma sua decisão sobre
quanto produzir sem conhecer a decisão da outra empresa (lembre-se de que se trata de um jogo
simultâneo); portanto, somente pode utilizar como parâmetro o valor esperado da produção da outra
empresa. As duas equações nos dão as funções de reação das empresas 1 e 2, respectivamente.
Dado esse valor esperado, a empresa escolhe a quantidade que maximiza seus lucros. Em outras
106
ESTRATÉGIA COMPETITIVA
palavras, a quantidade que ela irá produzir será sua melhor resposta à decisão que ela espera que sua
concorrente tome.
De acordo com o conceito de equilíbrio de Nash, para atingir um equilíbrio, as estratégias dos
jogadores devem ser as melhores respostas umas das outras. Assim, q1 deve ser igual a q1e, e q2 deve ser
igual q2e. Dessa forma, a estratégia adotada por cada empresa (a quantidade que decidiu produzir) deve
ser igual ao que a outra empresa esperava dela, e vice-versa.
Algebricamente, isso signiﬁca resolver as duas equações anteriores como um sistema em que q1 =
q1 e q2 = q2e. Isso nos leva a:
e
q1* = A – c
3b
q2* = A – c
3b
O asterisco (*) sobre os valores de q1* e q2* indica que se trata de valores que correspondem a
equilíbrios de Nash. Para esses valores, nenhum dos dois jogadores tem qualquer incentivo para alterar
suas estratégias, porque uma é a melhor resposta à outra, e vice-versa. A consistência entre o equilíbrio
no modelo de Cournot e a noção de equilíbrio do conceito de Nash levou alguns autores a chamarem
esse equilíbrio de Cournot-Nash, para enfatizar a coerência entre as duas análises.
5.4 O modelo de Bertrand
Outro tipo de jogo simultâneo clássico na análise de mercados é o conhecido como modelo de
Bertrand, que resultou do nome do matemático francês Joseph Louis François Bertrand (1822-1900),
também conhecido como modelo de determinação simultânea de preços (para contrastar com o modelo
de determinação simultânea de quantidades — o modelo de Cournot).
O modelo de Bertrand sem restrição de capacidade
Considere duas empresas produzindo bens da mesma natureza (em que os consumidores não
percebem diferença entre os produtos das duas empresas) e estabelecendo seus preços ao mesmo tempo.
Como os consumidores não percebem diferença entre os dois produtos, se uma empresa estabelece um
preço superior ao preço da outra, as vendas da empresa com preço mais alto se reduzem a zero. Se os
preços forem iguais, as empresas dividem o mercado igualmente.
Admitamos que cada empresa possa sozinha atender a todo o mercado, caso seja imprescindível,
desde que o preço seja igual ou maior que o custo marginal de produção. Qual será o preço de equilíbrio
a ser ﬁxado pelas empresas?
Para entendermos melhor as várias opções estratégicas de que as empresas dispõem, vamos
estabelecer as funções de recompensa para um exemplo ilustrativo desenvolvido por Fiani (2010).
107
Unidade III
Suponha que a curva de demanda do mercado em que as duas empresas atuam é dada por:
q(p) = 100 – p
Note que nesse caso estamos expressando a quantidade demandada em função do preço, enquanto
no modelo de Cournot estávamos expressando o preço em função da quantidade. Na curva de demanda
de mercado anterior, q é a quantidade total produzida e ofertada, e p é o preço. Mas como q irá se
distribuir entre as duas empresas? E qual delas irá determinar o preço de mercado p?
Para responder a essa pergunta, temos de conhecer as funções de recompensa das duas empresas.
Como as funções de recompensa de ambas serão idênticas, podemos escrever, de forma genérica, a
função de recompensa da empresa i, que pode ser qualquer uma das duas empresas, considerando suas
decisões e as da outra empresa. Chamaremos, genericamente, essa última empresa de empresa j.
Finalmente, seja a função de custo de qualquer uma das duas empresas dada por C(qi) = cq1, com c
> 0. As funções de recompensa dessa empresa i, πi, são dadas por:
(pi – c) ( 100 – pi) se pi < pj
πi= (pi – c) ( 100 – pi) se pi = pj
2
0 se pi > pj
O que a primeira função de recompensa após a chave nos diz é que o lucro da empresa i será dado
pelo produto da quantidade total demandada pelo mercado ao preço pi, ou (100 – pi), multiplicada pela
margem de lucro obtida pela empresa i em cada unidade produzida (o termo (pi - c) da expressão). Isso,
desde que o preço estabelecido pela empresa i, pi, seja menor do que o preço estabelecido pela outra
empresa, pj.
A segunda função de recompensa nos informa que o lucro da empresa i é metade do lucro que
ela obtém no caso anterior, considerando que os preços das duas empresas sejam iguais; uma vez
dada nossa hipótese de que: se pi = pj, as empresas dividem igualmente o mercado. Note que, no
caso anterior, a empresa i atendia a todo o mercado a seu preço, ou seja, ela vendia (100 – pi), e
que, se os preços forem iguais, ela venderá metade dessa quantidade, (100 – pi)/2. Finalmente, se o
preço da empresa i for maior do que o da outra empresa, ela nada produz, ou vende, e seus lucros
se reduzem a zero.
Vendo pelos parâmetros do equilíbrio de Nash, se uma das empresas estabelece um preço p,
tal que p > c, qual é a melhor resposta para a outra empresa? Sem dúvida, é estabelecer outro p’,
tal que p’ seja ligeiramente inferior a p (apenas o suficiente para os consumidores perceberem a
diferença e abandonarem o produto da concorrente, ainda que seja apenas um centavo), desde que
p’> c.
108
ESTRATÉGIA COMPETITIVA
Fazendo isso, a empresa que estabelecesse p’ estaria capturando todo o mercado da outra empresa,
e seus lucros seriam maiores (estaria capturando todo o mercado com uma redução de apenas um
centavo no preço). A outra empresa, por sua vez, teria seu lucro reduzido à zero.
Mas se p’ é a melhor resposta a p, então, p não é a melhor resposta a p’. A melhor resposta a p’, seria
um p ligeiramente inferior a p’ e superior a c, e assim por diante. Desse modo, só existe um par de preços
que é a melhor resposta um ao outro e vice-versa: é o par (pi*, pj*), tal que pi* = p2* = c
Qualquer preço acima do valor c deixaria a empresa que o adotou vulnerável a um preço que fosse
ligeiramente inferior ao seu, ainda que maior que c; e capturaria todo o mercado. Qualquer preço
inferior a c também não seria adequado, pois o valor recebido pela última unidade produzida seria inferior ao seu custo, e a empresa que tivesse adotado esse preço inferior a c teria prejuízo. Melhor do que
ter prejuízo é ter lucro zero. A melhor resposta a um preço igual ao custo de produzir mais uma unidade,
portanto, é outro preço igual ao custo de produzir mais uma unidade.
O resultado que acabamos de obter é consequência da aplicação da lógica do equilíbrio de Nash
ao modelo de determinação simultânea de preços. Dadas as hipóteses inicialmente assumidas, a única
combinação de estratégias que é, recíproca e simultaneamente, a melhor resposta possível uma à outra
é pi*= pj* = c, com ambas as empresas tendo lucro zero.
Esse resultado é conhecido como o paradoxo de Bertrand, pois temos um mercado caracterizado
como um duopólio, produzindo o mesmo resultado de um mercado competitivo: preços idênticos ao
nível do custo de produzir mais uma unidade e lucros nulos. Algo que, em princípio, só deveria ocorrer em
mercados nos quais as empresas fossem suﬁcientemente pequenas para que suas decisões individuais
não afetassem o preço de mercado.
É importante enfatizar que esse estranho resultado (um duopólio se comportando como um
mercado em concorrência perfeita, isto é, com as empresas estabelecendo preços iguais a seus custos) é
consequência das três hipóteses (muito restritivas) adotadas: a hipótese de que não há diferenciação de
produto, a de que não há restrição de capacidade produtiva (daí os custos marginais serem constantes)
e a de que as decisões são simultâneas em um único momento do tempo.
Assim, vamos voltar ao exemplo empregado na discussão do modelo de Cournot, de duas empresas
de cimento, a empresa 1 e a empresa 2. Como as funções de custo das duas empresas são dadas,
respectivamente, por C1 = 4q1 e C2 = 4q2, segue-se que, se as duas empresas não estiverem determinando
simultaneamente as quantidades produzidas (como é o caso analisado no modelo de Cournot), mas sim
seus preços (como é o caso analisado no modelo de Bertrand), o equilíbrio nesse último caso será dado
por:
P1 = P2 = c = 4
Em que P1 é o preço do cimento produzido e vendido pela empresa 1, P2 é o preço do cimento
produzido e vendido pela empresa 2, e 4 reais é o custo marginal4 c da produção de cimento, idêntico
para as duas empresas.
109
Unidade III
Observação
Cournot ou Bertrand?
Você deve estar surpreso com as diferenças nos resultados dos modelos
de Cournot e Bertrand. Com efeito, no caso do modelo de Cournot com
duas empresas, o resultado em termos de quantidade produzida é inferior à
quantidade que seria obtida com um mercado perfeitamente competitivo.
Já no caso do modelo de Bertrand com duas empresas sem restrição
de capacidade, o resultado é idêntico ao que seria obtido se o mercado
fosse perfeitamente competitivo. Dado que os dois modelos apresentam
resultados tão diferentes, quando cada um deles deve ser usado?
Luís M. B. Cabral, em seu livro Introduction to industrial organization,
oferece uma sugestão: é importante avaliar que tipo de indústria está sendo
considerada. Existem indústrias em que é mais difícil para as empresas
ajustar as quantidades produzidas do que os preços. Isso acontece em
indústrias nas quais o investimento leva mais tempo para resultar em um
aumento da capacidade produtiva. Esse seria o caso de indústrias como a
siderúrgica, a automobilística, a de cimento etc.
5.5 O modelo de Stackelberg
O economista alemão Heinrich Von Stackelberg (1905-1946) contribuiu para a teoria dos jogos
no contexto dos oligopólios. Sua principal produção intelectual foi Marktform und Gleichgewicht (A
estrutura do mercado e do equilíbrio, publicado em 1934), que se inicia descrevendo o comportamento
de modelos de duopólio.
Segundo Stackelberg (1934) a essência do comportamento estratégico está na antecipação que uma
empresa pode fazer relativamente às rivais, criando assim uma situação de assimetria entre as empresas
no mercado. O modelo de Stackelberg é do tipo Cournot: as empresas decidem sobre as quantidades,
com a diferença de que, em vez de decidirem simultaneamente, as empresas decidem uma após a outra.
Tal como o modelo de Cournot, este modelo pode ser interpretado envolvendo decisões iniciais sobre
capacidades de produção, seguidas de concorrência de preços à Bertrand. (BÊRNI, 2004).
O Modelo de Stackelberg foi mais difundido a partir de 1952, quando se percebeu que ele não era
ingênuo e revela a reação do oponente (concorrente) em sua própria curva, ou seja, demonstrando o
impacto do mercado no próprio negócio, pois parte-se do princípio de que cada um quer o melhor para
si próprio, portanto, cada qual que ser líder do mercado. Isso signiﬁca que, resultante dessas forças, pode
Custo marginal é a variação do custo total em função da variação na quantidade produzida. Algebricamente, é expresso
pela derivada do custo em função da quantidade, dC/dq. É fácil ver que, para qualquer uma das duas empresas, dCi/dq1 = 4.
4
110
ESTRATÉGIA COMPETITIVA
acontecer o desequilíbrio, convertendo-se em uma guerra preços, ou acabando em outro extremo, uma
coalizão.
5.6 O modelo de Bain-Sylos-Modigliani
O modelo de Bain-Sylos-Modigliani também segue o formato de relação entre a função variável
estabelecida por Cournot, inclusive por ser percebido como um resgate de ponto de Cournot aplicado
aos oligopólios na formação dos preços.
São seis os pressupostos estabelecidos nesse conceito:
1. período prévio à entrada no mercado e período posterior a essa entrada;
2. no período prévio à entrada havia o monopólio;
3. a demanda é estável nos dois períodos;
4. a maximização dos lucros ocorre para o monopolista;
5. o monopolista mantém a quantidade a ser produzida, e o novo entrante no mercado tem essa
informação;
6. as funções de custos do monopolista e do novo entrante são idênticas.
Esses pressupostos culminam em uma função linear, em que a receita média (preço), de acordo
com o modelo de Cournot, permite pensarmos que o monopolista manterá uma margem invejável
em sua lucratividade. Observando essa realidade, o novo entrante, então, resolve ofertar três unidades
do produto por um preço inferior, o que lhe permite obter a elevação de seus lucros em relação à
quantidade.
A consequência prevista para esse tipo de decisão é que o preço de mercado cai. O ex-monopolista
percebe que este fato não é nada bom, por isso, reavalia suas preferências e decide concorrer até um
determinado limite, porque, se o novo entrante tiver a possibilidade de prospectar com lucro nulo, o
ex-monopolista decide não competir.
Contudo, o ex-monopolista estrategicamente faz uma oferta de 8 unidades, com preço inferior ao
novo entrante, porém, mantendo uma margem mínima aceitável para o negócio. Isso signiﬁca que ele
chega a um preço que barra a entrada de novos concorrentes no mercado.
Esta resolução não deve ser negligenciada, pois demonstra uma situação de interação estratégica
que se repete em vários segmentos de mercado: o preço vigente não era tão alto caso se mantivesse
o monopólio puro, e nem tão baixo quanto seria se houvesse várias empresas ofertando produtos
similares.
Portanto, o teorema do modelo de Bain-Sylos-Modigliani ﬁcou conhecido por ser uma barreira
estratégica aos novos entrantes de mercado, que trabalham especiﬁcamente com as variações de tempo
111
Unidade III
(médio e longo prazo) e as quantidade produzidas. Podemos observar essa aplicação frequentemente no
marketing de varejo, no “atacarejo”, e nas vendas por atacado.
Vantagens do uso dos modelos matemáticos na tomada de decisão
A teoria dos jogos preocupa-se em construir modelos matemáticos capazes de simular situações
reais na empresa, voltadas principalmente para a resolução de problemas de tomada de decisão. Esses
modelos são analisados como simuladores das situações futuras e avaliação da probabilidade de sua
ocorrência. Em resumo, os modelos servem para representar simpliﬁcações da realidade. Sua vantagem
reside em: manipular as complexas e difíceis situações reais por meio da simpliﬁcação dos fatos. Vejam
algumas vantagens em seu emprego:
• permitem o entendimento dos fatos de uma forma melhor que a descrição verbal;
• descobrem relações (funções) existentes entre vários aspectos do problema, não percebidas na
descrição verbal;
• permitem tratar o problema em seu conjunto e com todas as variáveis simultaneamente;
• podem ser aplicados por etapas e considerar outros fatores não descritos verbalmente;
• utilizam técnicas matemáticas e lógicas;
• conduzem a soluções quantitativas;
• permitem uso de computadores para processar grandes volumes de dados.
A pesquisa operacional adota o método científico como estrutura para a solução de problemas,
dando maior ênfase ao julgamento objetivo do que ao julgamento subjetivo. Tem o objetivo de
capacitar a administração a resolver problemas e tomar decisões, e pode ser desenvolvido em
seis fases:
• formular o problema: uma análise dos sistemas, dos objetivos e das alternativas;
• construir um modelo matemático para representar o sistema: esse modelo expressa a eﬁcácia do
sistema como função de um conjunto de variáveis, das quais pelo menos uma esta sujeita a controle;
• deduzir uma solução do modelo: existem essencialmente dois tipos de procedimentos para derivar
uma solução, a perspectiva do processo e a perspectiva do problema;
• testar o modelo e a solução: o modelo é uma representação da realidade, o modelo é bom quando
for capaz de prever, com exatidão, o efeito que as mudanças no sistema têm sobre a eﬁcácia geral
do sistema;
• estabelecer controle sobre a solução;
• implantar a solução: a solução testada precisa ser transformada em uma série de processos
operacionais suscetíveis de ser entendidos e aplicados pelo pessoal que será responsável pelo seu
emprego.
112
ESTRATÉGIA COMPETITIVA
6 LEILÃO: FUNDAMENTOS E CARACTERÍSTICAS
A dúvida não é uma condição agradável, mas a certeza é absurdo (VOLTAIRE,
pseudônimo de François Marie Arquet, ﬁlósofo e humanista francês, 1694
– 1778).
Partindo da suposição de que um jogador conhece o objetivo do outro jogador, ou seja,
que a recompensa desejada é de conhecimento de todos, então, hipoteticamente, pode-se ter
uma ideia de sua importância para ambos. Assim, é possível prever a disposição de cada um
para conquistá-las, evidenciando-se as características individuais. Na realidade, de fato, o que
ocorre é que o desconhecimento em relação ao perfil dos agentes envolvidos no dilema pode ter
consequências sérias, porque revela a necessidade de escolher saídas que sejam contraditórias
e/ou dicotômicas.
Observação
Dicotomia: modalidade de classiﬁcação em que cada uma das divisões
e subdivisões contém apenas dois termos. Na dialética platônica (diálogo
com possibilidade de refutação), é a repartição de um conceito em dois
outros, geralmente contrários e complementares. Portanto, é um princípio
que aﬁrma a existência de dois elementos essenciais, já que um abarca o
outro (luz e escuridão).
Adaptado de: <http://houaiss.uol.com.br/busca.jhtm?verbete=dicotomi
a&stype=k>. Acesso em: 19 nov. 2011.
Percebemos o mundo, por exemplo, com variações coloridas, contudo, o sistema de formação das
cores é binário e, dicotomicamente, suas combinações são múltiplas, pois a maneira como enxergamos
está diretamente relacionada com a ausência da luz e a sua presença.
Um exemplo organizacional típico disso acontece quando, no último dia do mês, Andrea, funcionária
da empresa Voyager Corporation, tem por objetivo atingir a meta de vendas estabelecida por sua
diretoria.
Andrea sabe que, se conquistar este desafio, ganhará um prêmio em dinheiro, além de
poder folgar por cinco dias úteis consecutivos. Andrea é uma vendedora experiente, arrojada
e conhecedora de sua carteira de clientes. Neste momento, pressionada pelo tempo e pela
motivação da recompensa, liga para seus clientes potenciais. Fecha a negociação às 16h30, com
o cliente Star Explore.
A empresa Star Explore está estabelecida no mercado há 45 anos e acaba de passar por um processo
de sucessão, posto que seu fundador Eugênio Tibérios faleceu, e seus 5 ﬁlhos herdaram seu patrimônio.
Corre uma especulação pelo mercado de que uma desavença entre o primogênito João Lucas e o caçula
113
Unidade III
Jonatas provocou uma separação familiar, abalando a boa administração dos negócios e colocando em
risco a saúde ﬁnanceira da organização.
Regularmente, a empresa Voyager Corporation, encerra seu expediente às 17h. Andrea sabe que a
entrada do pedido de seu cliente precisa ser processada o mais rapidamente possível, por isso, checa o
sistema várias vezes e percebe que seu pedido está retido no departamento de crédito. Nessa situação,
entra em contato com a gerente de crédito Ana Paula, para averiguar a possibilidade de liberação.
Ana Paula, por sua vez, refuta, arguindo os rumores a respeito do cliente Star Explore, e também
leva em consideração que o valor envolvido nesta transação é bastante signiﬁcativo e com prazo
de pagamento extenso, o que representa o aumento do risco ﬁnanceiro desta transação de grande
porte.
Tanto Andrea quanto Ana Paula estão defendendo seus próprios interesses proﬁssionais individuais,
simultaneamente aos interesses organizacionais (sociais). Essa espécie de rede de poderes, informação
e tempo pode assumir proporções gigantescas. As consequências da diversidade cultural interna e
do desconhecimento (neste caso, falta de informação sobre os jogadores) não tardarão a surgir,
especialmente no que diz respeito aos aspectos de clima organizacional e ambiental na atividade
empresarial.
O problema é que o dilema pode propagar-se negativamente, afetando a todos os participantes
dessa interação estratégica: a reputação das funcionárias, o fornecedor Star Explore, o cliente Voyager
Corporation e o segmento de mercado em que atuam.
Esse é um problema típico estudado pela teoria dos jogos. É obvio que não será possível conseguir
total segurança sobre o que diz respeito à negociação descrita. Como saber então, ao negociar, qual
seria a melhor opção? A extensão dos fatores de composição das forças relacionadas à estimativa e à
estatística pode minimizar o risco da decisão. Assim, embora não seja possível obter absoluta certeza
do que seria o melhor a se fazer, vamos ilustrar a aplicação da teoria dos jogos na forma estratégica,
conforme segue:
Quadro 14
Matriz de pay-offs
Voyager Corporation
(comprador)
Star Explore (fornecedor)
Vende
Não vende
Age responsavelmente (paga)
2,2
0,1
Não age responsavelmente (não paga)
-1,-2
-1,0
Observação
Os valores de recompensa têm sentido simbólico. São explicitados
apenas para reﬂetir as preferências dos agentes interativos.
114
ESTRATÉGIA COMPETITIVA
Quadro 15
Valores
simbólicos
Consequência simbólica
2
Fornecedor vende, cliente paga.
1
Fornecedor não vende e o cliente paga (no caso, para a concorrência).
0
Fornecedor vende e o cliente paga parcialmente, ou seja, pelo menos cobre os custos.
-1
Fornecedor não vende e o cliente não compra.
-2
Fornecedor vende e o cliente não paga.
Analisando a representação estratégica do jogo, ﬁca evidente que, para o fornecedor, é mais
interessante vender em qualquer que seja a situação. Diz-se, então, que essa estratégia para o fornecedor
é estritamente dominante. Segundo Fiani (2003):
[...] em alguns casos, os jogadores têm mais de uma opção que lhes
proporcionem bons resultados, não importando o que os outros
jogadores façam. Considerando a racionalidade da escolha, eliminam-se
as estratégias menos interessantes do que outras. Portanto, essa situação
de interação estratégica torna-se estritamente dominante (FIANI, 2003,
p. 81).
A grande questão nessa decisão é saber justamente identiﬁcar onde o fornecedor se encontra.
Contudo, o fornecedor deve considerar que não conhece as características verdadeiras do cliente, que
passa por um momento transitório de instabilidade. Então, qual deve ser a decisão?
Bem, sendo um jogo de estratégia estritamente dominante, há 25% de chance de perda. Isso se
justiﬁca por se tratar de um jogo de informação incompleta. Ao tomar a decisão, tanto Andrea como
Ana Paula devem considerar a capacidade da empresa de suportar o impacto ﬁnanceiro dessa perda,
aumentando a acuracidade do risco calculado.
Observação
Jogo de informação incompleta: o perﬁl dos jogadores não é
de conhecimento comum, propagando consequências nas respectivas
recompensas. Por meio das recompensas é que seriamos capazes de
identiﬁcar as reais características dos jogadores, ou seja, até onde estariam
dispostos a agir estrategicamente pela conquista do pay-off.
Na economia, é bastante corriqueira a presença de leilões. No Brasil, há leilões de explorações
de petróleo, obras de arte, equipamentos etc. De fato, trata-se de um fenômeno generalizado
ao longo da história. Isso torna ainda mais interessante a dialética anterior, pois prossegue
com o desenho de leilões (auction desing), como é conhecido na teoria dos jogos . A ideia é
favorecer a maximização dos ganhos do leiloeiro. As características básicas dos leilões podem
115
Unidade III
variar muito e precisam ser consideradas com relevância para a aplicação da estratégia mais
assertiva.
As características básicas e fundamentais dos leilões são:
• as regras do leilão deﬁnem quem pode fazer lances;
• como esses lances podem ser efetuados;
• como são aceitos;
• como o leilão (a partida) se desenvolve;
• como o vencedor é determinado;
• o ambiente do leilão é constituído pelos arrematadores (jogadores);
• o valor é atribuído pelos arrematadores aos objetos.
Combinados às características fundamentais, acrescentam-se os tipos de leilões, como segue:
• leilão aberto: não há deﬁnição de lance prévio;
• leilão fechado: os arrematadores deﬁnem um lance mínimo (o objetivo é proteger o leiloeiro de
complôs);
• leilões de envelopes lacrados: os arrematadores têm direito a um único lance por escrito em
segredo;
• leilão oral: as ofertas são feitas em público verbalmente.
Os tipos de leilões citados têm características distintas, mas são similares no que tange à ascendência
dos lances, ou seja, até que os arrematadores desistam e reste o vencedor (aquele que ofereceu o maior
lance).
• leilão descendente: anuncia preços gradativamente menores, até que o arrematador sinalize que
deseja o objeto;
• leilão de lances simultâneos: os arrematadores verbalizam seus lances simultaneamente;
Lembrete
Em relação à percepção dos jogadores, podemos veriﬁcar que podem
ser representadas por variáveis aleatórias independentes, com avaliações
idênticas; conﬁrmando que não há correlação com o tipo de leilão e o
conhecimento prévio dos jogadores. Portanto, analogicamente, é um
exemplo clássico de jogo de informação incompleta.
116
ESTRATÉGIA COMPETITIVA
Exemplo de aplicação
Figura 13
Vamos observar a similaridade estrutural do jogo estratégico na interação entre as empresas Star
Explore e Voyager Corporation e as características fundamentais e/ou combinatórias dos variados tipos
de leilões. Podemos veriﬁcar que são jogos que oferecem certo grau de incerteza, porque são compostos
por informação incompleta.
6.1 O equilíbrio de Nash Bayesiano
O verdadeiro conhecimento é saber a extensão da própria ignorância
(CONFÚCIO, sábio chinês, 551-479 a.c.)
Segundo Fiani:
O equilíbrio de Nash Bayesiano é aquele em que a combinação da estratégia
adotada pelos jogadores maximiza as recompensas de cada jogador, dadas
às estratégias dos demais jogadores, seus tipos e as probabilidades atribuídas
à eles (FIANI, 2003, p. 312).
Talvez nesse momento você se pergunte: a teoria dos jogos não poderia instituir as normas para a
administração, a economia, a política etc.?
É interessante notar que não é incomum que um dos agentes possa vir a deﬁnir os termos a serem
desenvolvidos na interatividade estratégica. Em outras palavras, no mundo macroeconômico, ou mesmo
por meio dos empresários, observamos que esses agentes podem deﬁnir as regras dos jogos. Há múltiplos
exemplos, como quando o governo, por alguma razão, decide privatizar uma de suas empresas (ele passa
a ser vendedor), mas simultaneamente também é o agente que determina as regras do jogo, ou seja,
publica as normas a serem acatadas para que a privatização (no caso a compra pelo setor privado) seja
possível.
Outra situação análoga ocorre quando o Banco Central ﬁxa suas normas para os leilões dos títulos
públicos. Infelizmente, há um ponto controverso comum em todas as ocorrências exempliﬁcadas até
esse momento, porque alguns agentes têm informação privada. A detenção de informação privada
117
Unidade III
essencial é determinante para a deﬁnição de regras consistentes para maximizar os pay-offs dos
interessados.
Por sinal, a informação privada é valiosa, pois não é de conhecimento notório e comum de todos os
agentes envolvidos na interação estratégica. Dessa forma, quando se vai vender algo, como um título
público, não se sabe ao certo quanto o comprador estaria disposto a pagar. Então, podemos dizer que o
preço que o comprador está disposto a pagar é a informação privada.
O objetivo dessa discussão é conscientizar de como as regras, ou mecanismos ou desenhos do jogo
levam ao resultado esperado. Contudo, mesmo que um agente tenha o poder de desenhar um jogo, ele
enfrentará restrições, como:
• Quem desenha as regras não pode adotar mecanismos de coerção. Os agentes envolvidos devem
agir de acordo com seus próprios interesses.
• O responsável pela articulação das regras do jogo deve ser razoável com suas expectativas. Isso,
porque os jogadores não participarão de algo que não ofereça algum equilíbrio. Dessa forma, se
promoverá a desmotivação do agente.
Consideramos então que qualquer equilíbrio de Nash Bayesiano pode ser representado por um
mecanismo direto (ou mecanismo de revelação direta) compatível e compensador, aﬁm de que os agentes
informem suas características e disposição. Assim, podemos conseguir, por meio de um árbitro, uma
estratégia que favoreça a combinação para que todos ganhem. Entretanto, para que esse mecanismo
funcione, é imprescindível que um dos principais conceitos do jogo seja que, em seu desenho, ele seja
simultâneo.
6.2 O equilíbrio bayesiano perfeito
Vamos lapidar o conceito do sistema com a contribuição do teorema de Bayes, por meio do
equilíbrio bayesiano perfeito. Para tal, a taxonomia do jogo será superjogo de informação incompleta.
Paradoxalmente, a cada passo, aumentamos a complexidade. Em compensação, o retorno se dá pela luz
da consciência, pois as predições são cada vez mais nítidas.
O conceito de equilíbrio de Nash foi uma grande conquista que mudou a forma da sociedade observar
suas decisões e contribuiu para que administradores, economistas, políticos etc. pudessem compreender
e predizer melhores escolhas para resultados de soma positiva ou negativa.
Adaptando o conceito do equilíbrio de Nash, podemos concluir que, se conseguirmos chegar a
uma resolução admissível para um equilíbrio em um jogo conforme a taxonomia anterior, essa solução
certamente contemplará os ingredientes necessários para resolvermos outros problemas mais simples.
Em outras palavras, trata-se de aplicar o “equilíbrio de Nash perfeito” em um subjogo, ou seja, esse
ponto de vista vê o subjogo como jogo continuado. O mecanismo nada mais é que aplicar o equilíbrio
de Nash de acordo com as características estáticas, contudo, agrega-se a diﬁculdade da ausência de
conteúdo informacional. Segundo Fiani:
118
ESTRATÉGIA COMPETITIVA
[...] o equilíbrio Bayesiano perfeito é uma combinação de estratégia entre
jogadores, assim como as crenças em relação a nós em todos os conjuntos
de informação são chamadas de um equilíbrio bayesiano perfeito se: (a) as
estratégias de cada jogar resultam em ações ótimas, dadas as crenças do
jogador e as estratégias dos demais jogadores; e (b) as crenças dos jogadores
são consistentes com o teorema de Bayes sempre que possível (FIANI, 2003,
p. 352).
Ressaltamos a evidência de que, quando um jogo comporta tal solução, também atende aos pré-requisitos
do equilíbrio de Nash, do “equilíbrio de Nash perfeito”, portanto, do equilíbrio de Nash bayesiano.
O papel das crenças
Nesse tipo de jogo, o papel dos sinais e mensagens passa a ter muita relevância, pois essa comunicação
subjetiva, ou falta de comunicação, pode sair bastante cara para os jogadores. O que os demais jogadores
acreditam, em relação ao transcurso do jogo por meio das ações, é de suma importância para que se
possa traçar os próprios estratagemas.
Cada indivíduo fará a sua escolha racional de acordo com suas convicções, isso ocorre em mais de
uma etapa do jogo, o que signiﬁca, consequentemente, que se trata de estratégia mista. Em seu turno,
o agente em ação passa a considerar as probabilidades e a circunstâncias em que está enredado, por
conta das decisões que já foram tomadas por outros jogadores.
O fato é que acrescentamos a variável de que os agentes adotarão necessariamente escolhas
racionais críveis de acordo com suas respectivas crenças e valores, sobre as quais as trajetórias levarão
ao equilíbrio.
Em síntese, a solução desse jogo vem ao retomar e analisar os resultados de jogos percorridos
anteriormente. Para tal, devemos fazer a matriz de pay-offs para cada etapa do jogo e veriﬁcar o padrão
de comportamento dos agentes.
Bem, reﬁnando a aplicação do conceito, devemos então determinar distintos subjogos e, nessa
particularidade, obteremos a posição do equilíbrio bayesiano perfeito.
Saiba mais
Visite o site do Profº. Duilio Ávila Bêrni.
Disponível em: <https://sites.google.com/site/19ganges47/arquivos>.
Acesso em: 23 nov. 2011.
119
Unidade III
6.3 O teorema de Bayes
O teorema de Bayes foi concebido pelo ministro inglês presbiteriano, matemático e ﬁlósofo Thomas
Bayes (1702-1761). Neto e ﬁlho de clérigos, formou-se em teologia e foi admitido na Royal Society de
Londres (Reino Unido) como cientista renomado.
Todos os jogos estão ligados às probabilidades matemáticas. Cálculos sobre prováveis vencedores são
feitos desde o século XV, mas somente no século XVIII foi publicado o Ensaio voltado para a solução de
um problema na doutrina do acaso, por Bayes, que passou a ser difundido como o teorema de Bayes.
O estudo tratava do palpite calculado: técnica aplicada à estatística que transformou-se em uma lei
fundamental para a ciência matemática.
Como o que o reverendo propôs para a época era inovador e de caráter subjetivo, sua obra foi
publicada anos depois de seu falecimento. O que Bayes desenvolveu foi a ideia de que a manipulação dos
números depende diretamente da quantidade de informação que se dispõe, o que impacta diretamente
na acuracidade da previsão.
Em suma, se você for jogar cara ou coroa, todos concordarão que as chances serão de 50% para cada
jogador. Contudo, se o acordo for jogar a moeda quatro vezes, ou seja, uma partida com quatro lances,
então, o que Bayes aﬁrmou é que a informação se reﬁnará a cada lance.
De acordo com essa metodologia, supondo dois jogadores:
Adriano x Bruno
Com o objetivo vencer Bruno, Adriano deverá considerar as informações (neste caso, resultados) que
se apresentam desde o início da partida até o momento, por exemplo: quantas vezes Adriano venceu
Bruno?
O cálculo do palpite passa a ser considerado uma ciência, porque se dedica ao estudo da lógica e da
racionalidade das chances de determinado evento ocorrer. Essa foi mais uma razão para que Bayes, em
seu tempo e posição, causasse controvérsias e, por isso, até hoje é criticado por pesquisadores de linhas
conservadoras, que acreditam que esse método resulta em subjetividade por considerar a opinião das
pessoas.
Com a modernidade, se faz premente a necessidade de prever riscos e benefícios, por exemplo: uma
aplicação ﬁnanceira; a compra de um imóvel; a venda de ações na bolsa de valores; ou se chegarei ao
trabalho a tempo de carro, metrô ou motocicleta.
Hoje, o teorema de Bayes tem utilidade cotidiana e tem sido aplicado em muitas áreas. Em suspeitas
de epidemia, por exemplo, os responsáveis pela saúde pública calculam seu possível alcance em relação
a um determinado tempo por meio do teorema; a economia aplica-o em estimativas inﬂacionárias; e
corretores o utilizam para predizerem sobre altas ou baixas de ações na bolsa de valores. Consumando seu
legado, o revendo prescreve três axiomas clássicos, como vocês poderão veriﬁcar no próximo tópico.
120
ESTRATÉGIA COMPETITIVA
Lembrete
Segundo o dicionário Aurélio, axioma é uma proposição que se admite
como verdadeira porque dela se podem deduzir as proposições de uma
teoria ou de um sistema lógico ou matemático.
Axiomas dos cálculos de probabilidades
1º axioma: os valores de um evento “A” não podem ser inferiores a zero, nem maiores que um,
portanto, a probabilidade do evento será igual a 1. O valor zero refere-se a um evento impossível,
enquanto que os valores que se apresentam nesse intervalo, reﬂetem situações que serão consideradas
possíveis ou incertas.
0 �≤ P(A) ≤�1
Legenda: (A) = evento
P = probabilidade
2º axioma: a probabilidade de qualquer evento acontecer, dentre um número n de eventos
alternativos mutuamente exclusivos a A e B, é igual à soma das probabilidades dos eventos individuais.
P(A ou B) = P(A) + P(B)
Legenda: (A) = evento
(B) = evento alternativo
P = probabilidade
3º axioma: a probabilidade de dois eventos A e B ocorrerem é igual à multiplicação da probabilidade
condicional P(A/B) (lê-se “probabilidade de A dado B”) pela probabilidade de B, sendo:
P(A e B) = P(A/B) × P(B)
Então: P(B e A) = P(B/A) × P(A)
Por comutação que P(A e B) = P(B e A), deduz-se o teorema de Bayes, que tem a seguinte formulação
básica:
P(A/B) = P(B/A) / P(B) x P(A)
Legenda: (A) = evento
(B) = evento alternativo
P = probabilidade
121
Unidade III
Avaliando esse modelo matemático estatístico, observa-se que a chance do evento A acontecer em
vista do evento B(P(A/B) se dá por três razões:
1. a verossimilhança de A;
2. a probabilidade prévia de B;
3. a probabilidade prévia de A.
Lembrete
Verossimilhança é uma função da probabilidade condicional (estimador
estatístico). O Maxver (máxima verossimilhança) baseia-se no cálculo em
que, ao se derivar uma equação e igualá-la a zero, pode-se chegar ao(s)
valor(es) mínimo(s) e/ou máximo(s).
Adaptado de BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5ª ed.
São Paulo: Saraiva, 2002.
Um exemplo tradicional para explicar o teorema de Bayes é o seguinte:
Dr. Mário faz a anamnese completa e avalia duas possibilidades que podem estar acontecendo com
a paciente Heloísa. Ela reclama de problemas respiratórios. Simpliﬁcando, vamos considerar que sejam
asma e pneumonia. O raciocínio empregado para esses acontecimentos em termos bayesianos partirá
das probabilidades prévias desses eventos, tal como dadas estatisticamente.
Assim, é plausível admitir que a incidência de pneumonia (P(pn)) é muito mais rara que a de asma
(P(as)), digamos 100 vezes menos frequente, segundo os registros. Em termos matemáticos:
P(as) = 100/101 e P(pn) = 1/100
Digamos, porém, que o paciente apresente um sintoma e1, que ocorra em 1 de cada 2 pacientes com
pneumonia, mas apenas em 1 de cada 500 pacientes com asma. Assim, a verossimilhança de cada um
dos eventos será:
P(e1/pn) = 1/2 e P(e1/as) = 1/500
Lembrete
Na matemática, a probabilidade condicionada refere-se à probabilidade
de ocorrer um evento A sabendo que ocorreu outro evento B e representase por P(A/B).
122
ESTRATÉGIA COMPETITIVA
P (A ∩ B)
P (A | B) = -------------------------P (B)
Fonte: JULIANELLI, J. R. et al. Curso de análise combinatória e
probabilidade - aprendendo com a resolução de problemas. Rio de Janeiro:
Ciência Moderna, 2009.
Resumo
Nesta unidade, pudemos conhecer de maneira mais detalhada a
teoria da decisão estratégica, que também é conhecida como teoria
dos jogos. Tivemos a oportunidade de nos inteirar da importância
de sua aplicação ao lermos sobre o desenvolvimento do raciocínio
por parte do empresário, o que envolve diretamente taxonomia dos
jogos, jogadores, regras e pay-offs. Observamos o funcionamento
da lógica e como os indivíduos são impelidos a escolhas irracionais,
denominadas “escolhas sinceras”. Vimos como os participantes do
cenário de interação estratégica pensam em relação à cooperação e à
competitividade.
Tratamos também das escolhas racionais e pudemos constatar o
princípio econômico de Adam Smith, em que cada um faz o que é melhor
pra si de acordo com suas preferências. Ainda, analisando os padrões
comportamentais humanos, vimos que as preferências variam como
completa (quando se tem certeza do que se quer), transitiva (quando
isso é tão bom quanto aquilo) e intransitiva (quando a escolha é feita
coletivamente e se chega ao consenso).
A relação de preferência é feita por meio da análise binária e
vimos que, por essa lógica, se explicam os paradoxos sociais (em que
as escolhas individuais são contrastantes com as coletivas). Mais uma
vez, ratificamos a importância da informação para o raciocínio e a
aplicação da teoria. Dando uma abordagem ampla, tivemos o prazer
de compartilhar as ideias dos conceitos apresentados por economistas
renomados, como John Nash, Robert Aumann, Roger Myerson e Eric
Maskin.
Na próxima unidade, vamos desenvolver os conceitos dessa teoria
aplicados aos sistemas de informação, utilizando essa ferramenta como
inteligência competitiva.
123
Unidade III
Exercícios
Quanto mais gente, melhor5
Grandes gurus da administração, como Ram Charam, dizem que o melhor lugar para
se aprender a fazer negócios é na feira. Concordo, mas acrescentaria que também se pode
aprender com o camelô, o pipoqueiro e com todo mundo que lida diretamente com o
freguês comprando e vendendo. Estes proﬁssionais podem nos mostrar na prática como
as teorias do mundo dos negócios funcionam de verdade. Observando o comportamento
de um sorveteiro na praia, pode-se chegar a conclusões interessantes sobre estratégia
de localização com base na teoria dos jogos. Mais do que isso, é possível concluir novos
aspectos sobre nossa própria localização: por que é vantajoso morar e trabalhar em uma
cidade grande como São Paulo?
Imagine uma praia relativamente pequena, com uns 300 metros, onde seus frequentadores
encontram-se espalhados igualmente na areia. Neste cenário, imagine um sorveteiro que
chega à praia onde já se encontra um concorrente vendendo o mesmo produto com o
mesmo preço que o seu. Como o outro sorveteiro está sozinho, ele está bem no meio
da praia. Onde você irá estacionar o seu carrinho de sorvetes e onde você acha que seu
concorrente o fará?
À primeira vista, parece que o mais óbvio é cada um ficar a uma distância de
100 metros do fim da praia e deles mesmos. Esta seria uma estratégia de mútua
cooperação, em que cada um dos vendedores teria um terço da praia praticamente
exclusiva e um terço dividido equitativamente. Eles estariam posicionados da melhor
forma para que qualquer banhista possa chegar até eles andando o mínimo possível.
Mas... Se você já teve a oportunidade de presenciar uma situação parecida com esta
na realidade, provavelmente você notou os dois sorveteiros juntos no meio da praia.
Será que eles fazem isso para poder ficar conversando? Ou será que esta é realmente
a melhor alternativa?
Na verdade, eles ﬁcam juntos no meio da praia porque este é o único equilíbrio de
Nash possível no sistema. Na teoria dos jogos, o equilíbrio de Nash é atingido quando
cada jogador faz o melhor possível em função do que seus concorrentes fazem. Voltando a
imaginar-se sorveteiro: se o seu concorrente ﬁcasse a 100 metros do ﬁm direito da praia, o
melhor que você poderia fazer seria se posicionar logo à sua esquerda. Desta forma, você
abrangeria dois terços da praia contra um terço para ele. Seria a sua deserção, vantajosa
frente à cooperação dele. No momento seguinte, porém, seu concorrente se moveria mais
para o centro, logo à sua esquerda. Dali a pouco, seria você que iria para a esquerda dele e,
momentos depois, ambos estariam juntos no meio da praia. Em uma sucessão de deserções
MARINHO, R. Quanto mais gente, melhor. Gestão de Carreira, 24/02/2007. Disponível em: <http://www.
gestaodecarreira.com.br/coaching/carreira/quanto-mais-gente-melhor.html>. Acesso em: 17 nov. 2011.
5
124
ESTRATÉGIA COMPETITIVA
de parte a parte, você e seu concorrente iriam ﬁcar bem no centro da praia, dividindo a
clientela meio a meio.
Repare que é muito comum encontrar postos de gasolina, ﬂoriculturas e bancos
localizados um em frente ao outro. Isto acontece pelo mesmo motivo, o equilíbrio de
Nash.
A questão da localização do carrinho de sorvete também pode ser entendida como
uma estratégia de localização profissional. Recentemente, a revista Você S.A. publicou
uma pesquisa sobre as melhores cidades para fazer carreira, em que São Paulo foi
apontada como a primeira colocada. Coincidentemente, São Paulo também é a cidade
mais próxima da maior parte do mercado nacional em termos de concentração de
PIB. Pode-se dizer que São Paulo é exatamente o “meio da praia”, o lugar onde é mais
vantajoso você estar se quiser atingir o maior número de pessoas possível e aumentar
sua exposição pessoal.
Mas São Paulo é a cidade onde se encontra a maior concorrência proﬁssional do Brasil.
Mesmo assim, é considerada a melhor cidade para fazer carreira, o que é uma aparente
contradição. Por que não fazer carreira em uma pequena cidade do interior, para onde
quase ninguém vai? Simplesmente porque isto representaria ir para o “canto da praia”.
Você conquistaria uma clientela local, sem dúvida, mas quem ﬁca no centro divide quase a
totalidade do mercado.
Como o ambiente de negócios brasileiro é bem mais complexo que em uma praia, este
raciocínio tem de ser entendido levando-se em conta inúmeras outras particularidades,
desde o ramo de atividade em que se trabalha até questões de qualidade de vida que cada
cidade oferece. Mas o “jogo do sorveteiro” é, sem dúvida, um exercício interessante para
reﬂetir sobre posicionamento proﬁssional.
1) Identiﬁque no texto trechos que reﬂitam a teoria do equilíbrio de Nash.
Comentário:
• Sorveteria na praia:
“Na verdade, eles ﬁcam juntos no meio da praia porque este é o único Equilíbrio de Nash possível no
sistema. Em Teoria dos jogos, o Equilíbrio de Nash é atingido quando cada jogador faz o melhor possível
em função do que seus concorrentes fazem.”
• Posicionamento proﬁssional:
“Mas São Paulo é a cidade onde se encontra a maior concorrência proﬁssional do Brasil. Mesmo
assim, é considerada a melhor cidade para fazer carreira, o que é uma aparente contradição.”
125
Unidade III
2) Quais são as taxonomias possíveis sobre a sorveteria na praia?
Comentário:
Escolha racional, jogo de estratégia, o número de jogadores tende a inﬁnito, forte, determinado,
cooperativo, de soma positiva negativa, dinâmico, assimétrico, simultâneo e informação completa e
imperfeita.
3) Reﬂita sobre conclusões possíveis para o posicionamento proﬁssional.
Comentário:
Pessoas competitivas, quando entendem que a chance de recompensa aumenta com a cooperação,
deixam de competir e passam a cooperar, mantendo o foco no resultado.
126