- SelectedWorks

Universidade Federal de Santa Catarina
From the SelectedWorks of Sergio Da Silva
2010
Micro 2: Varian Passo a Passo
Sergio Da Silva, Federal University of Santa Catarina
Available at: http://works.bepress.com/sergiodasilva/129/
Micro 2: Varian Passo a Passo
Sergio Da Silva
Universidade Federal de Santa Catarina
www.sergiodasilva.com
Monopólio
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 24
O monopólio é a estrutura de mercado em que há apenas uma empresa. O monopólio fica,
portanto, no extremo oposto da concorrência perfeita, onde há um grande número de pequenas
empresas que consideram os preços dados pelo mercado. É improvável que a empresa
monopolista considere os preços dados: ela irá querer escolher o preço ou a quantidade para
maximizar seu lucro.
A escolha do monopólio é limitada pelo comportamento da demanda dos
consumidores. Se escolher o preço, o monopólio deixa que os consumidores escolham a
quantidade que desejam comprar a esse preço. Se, por exemplo, escolher um preço muito alto,
somente conseguirá vender uma pequena quantidade. Se escolher a quantidade, o monopólio
deixa que os consumidores escolham o preço que desejam pagar por essa quantidade.
Maximização de lucro
A função demanda inversa do mercado é p ( y ) . (A demanda é inversa porque é o preço p que
é colocado como função da quantidade y , e não o contrário). A função custo é c( y ) . A
função receita do monopolista é
r ( y) = p( y) ⋅ y .
(1)
O monopolista maximiza lucro π fazendo
max r ( y ) − c( y )
(2)
π ( y ) = r ( y ) − c( y ) .
(3)
y
onde
Derivando e igualando a zero, encontramos a condição de primeira ordem
r ′( y ) − c′( y ) = 0
r ′( y ) = c′( y ) .
(4)
Portanto, para maximizar lucro, o monopolista precisa igualar sua receita marginal
RM ≡ r ′( y ) a seu custo marginal CM ≡ c′( y ) :
RM = CM .
(4′)
Alternativamente, diferenciando (1):
r ′( y ) = p′( y ) ⋅ y + p ( y ) .
Substituindo (5) em (4):
(5)
p′( y ) ⋅ y + p ( y ) = c′( y ) .
(4″)
Para garantir que (4) seja um máximo (e não um mínimo), tomamos a segunda
derivada para encontrar a condição de segunda ordem:
r ′′( y ) − c′′( y ) ≤ 0 .
(6)
Ou seja,
c′′( y ) ≥ r ′′( y ) .
(7)
Portanto, a inclinação da curva de custo marginal fica maior do que a inclinação da receita
marginal depois do ponto de máximo, garantindo que este é, de fato, de maximização de
lucro.
Se, na escolha ótima, RM < CM , o monopólio teria incentivo para reduzir a
quantidade produzida: isto reduziria sua receita, mas reduziria o custo ainda mais. Se
RM > CM , a empresa monopolista teria incentivos para aumentar a quantidade produzida:
isto aumentaria sua receita, mas o custo aumentaria ainda mais. Apenas quando RM = CM a
empresa não tem incentivos para alterar a produção.
Em tempo discreto, (4) pode ser reescrita como:
∆r ∆c
=
.
∆y ∆y
(4″′)
A condição RM = CM é válida para empresas em qualquer estrutura de mercado. Em
particular, para uma pequena empresa competitiva “tomadora de preço”:
RM = CM = p .
(8)
Para maximizar seu lucro, a empresa competitiva se preocupa apenas em igualar seu custo
marginal ao preço do produto dado pelo mercado.
Para o monopólio, a receita marginal não se iguala ao preço. Se a empresa
monopolista resolver aumentar a quantidade produzida ∆y , isto alterará a receita ∆r por dois
canais: a receita aumenta em p ⋅ ∆y , mas o preço diminui em ∆p para toda a quantidade
vendida y , e não apenas para as novas unidades. O efeito total será, então,
∆ r = p ⋅ ∆y + y ⋅ ∆p .
(9)
Dividindo (9) por ∆y encontramos a receita marginal:
∆r
∆y
∆p
= p⋅
+ y⋅
∆y
∆y
∆y
∆r
∆p
= p+
⋅y.
∆y
∆y
(10)
Comparando com (5), veja que (10) é a mesma definição de receita marginal, mas agora para
o tempo discreto.
A condição de lucro máximo (4′) pode ser escrita em termos da elasticidade da
demanda (em geral negativa):
ε=
∆y
y
∆p
p
=
p ∆y
.
y ∆p
(11)
Primeiro, consideramos a expressão da receita marginal em termos da elasticidade (Capítulo
15 do livro):


1 
1
RM ( y ) = p ( y ) 1 +
 = p ( y ) 1 −
ε ( y)
 ε ( y) 


 .

(12)
Segundo, substituímos (12) em (4′):

1
p( y ) 1 −

ε ( y)


 = CM ( y ) .

(13)
De novo, (13) é válida para qualquer estrutura de mercado.
Como a empresa competitiva considera o preço determinado pelo mercado, a curva de
demanda do mercado é horizontal na altura desse preço: é infinitamente elástica, ou seja,
ε → ∞.
(14)
Isto significa que
1
1
= →0.
ε ( y) ∞
(15)
Substituindo (15) em (13):
p ( y ) = CM ( y ) ,
(16)
que é a condição de lucro máximo da empresa competitiva.
Já a empresa monopolista nunca escolhe operar onde a curva de demanda é inelástica.
Ela opera nas situações em que
1≤ ε < ∞ .
(17)
Ela não opera quando ε < 1 porque, neste caso,
1
ε
>1.
(18)
Considerando (18) em (13) vemos que a receita marginal seria negativa, sem poder se igualar
ao custo marginal.
Monopólio com curva de demanda linear
Supondo que a função demanda inversa do mercado seja
p ( y ) = a − by ,
(19)
que é linear, e onde a é o intercepto vertical da curva e −b é o coeficiente angular
(inclinação), a função receita (1) fica sendo, considerando (19),
r ( y ) = p ( y ) ⋅ y = (a − by ) y = ay − by 2 .
(20)
Diferenciando (20), encontramos a receita marginal:
RM ( y ) = a − 2by .
(21)
Para traçar as curvas, comparando (19) com (21) vemos que a receita marginal e a
demanda apresentam o mesmo intercepto vertical a , mas a receita marginal é duas vezes mais
inclinada (inclinação da receita marginal = −2b e inclinação da demanda = −b ). Depois de
desenhada a demanda (Figura 1), achamos um dado intercepto horizontal para ela. Logo, o
intercepto horizontal da RM deverá ficar na metade do intercepto da demanda. Ligando o
intercepto vertical com o horizontal encontramos a “curva” de RM .
Desenhada uma dada curva de CM podemos também fazer a curva de custo médio ( CMe ),
sabendo que a curva de CM passa sobre o ponto mínimo da curva de CMe (Capítulo 21).
A quantidade produzida ótima y * ocorre no intercepto de RM e CM , mas não o
preço. O monopólio cobra o preço mais alto que puder ao nível y * , p( y* ) , que é apenas
limitado pela demanda do mercado. A receita será
r ( y* ) = p( y* ) ⋅ y* ,
(22)
que é a área do retângulo maior na Figura 1. O custo na produção de y * será
c( y* ) = CMe( y* ) ⋅ y* ,
(23)
que é a área do retângulo menor. Logo, considerando (22), (23) e (3), a área hachurada
representa o lucro.
Escolhendo o preço por markup
Podemos reescrever a condição de lucro máximo em termos da elasticidade da demanda (13)
como
p( y) =
1
1−
CM ( y ) .
1
(13′)
ε ( y)
O preço pode então ser escolhido considerando-se CM ( y* ) e adicionando-se um montante
fixo (markup) que depende da elasticidade da demanda:
markup =
1
1−
1
.
(24)
ε ( y)
A empresa monopolista opera apenas quando ε ≥ 1 (equação (17)). Se ε = 1 , o markup será
infinito em (24). Este caso não interessa ao monopólio. Mas, para ε > 1 ,
1
ε
< 1 e, por (24),
markup > 1 . Se, além disso, ε for constante, por (24) o markup será constante. E, por (13′), o
preço será escolhido como um markup constante do nível de custo marginal de máximo lucro,
isto é, CM ( y* ) .
Podemos desenhar uma curva de demanda de elasticidade constante juntamente com a
curva de CM (Figura 2) (veja também a Figura 15.6 do Capítulo 15 do livro).
A curva de custo marginal com markup constante,
CM
1−1 ε
, é mais alta do que CM por um
montante fixo. Para atender toda a demanda do mercado a este
onde as curvas de demanda e
CM
1−1 ε
CM
1−1 ε
, a empresa produz y * ,
se cruzam. A este nível de custo marginal
CM ( y* )
1−1 ε
, por (13′)
a empresa cobra o preço p* para maximizar seu lucro.
Efeito do imposto sobre o preço cobrado pelo monopolista
No caso em que
CM = c = constante ,
(25)
a curva de CM é uma reta horizontal. Com uma demanda linear (equação (19)), podemos
analisar o efeito que um imposto t sobre a quantidade tem sobre o preço cobrado pelo
monopolista.
Esse imposto aumenta o custo marginal:
CM = c + t .
(26)
Para a demanda linear, a RM é dada por (21) e a condição de lucro máximo RM = CM fica
sendo (considerando (26)):
a − 2by = c + t .
(27)
Isolando y :
2by = a − c − t
a −c−t
y=
2b
(27′)
ou
y=−
1
( −a + c + t ) .
2b
(27″)
Diferenciando em relação a t :
dy
1
 1 
= 1⋅  −  = −
dt
2b
 2b 
(28)
que, em tempo discreto, é o mesmo que
∆y
1
=− .
∆t
2b
Diferenciando a curva de demanda
(29)
p ( y ) = a − by
(19)
em relação a t , temos:
dp
dy
= −b .
dt
dt
(30)
(28) em (30):
dp
 1  1
= −b  −  = .
dt
 2b  2
(31)
Então, se o imposto aumentar, o preço cobrado aumentará pela metade do aumento do
imposto.
Claro que se a demanda não for linear e o CM não for constante, o preço cobrado pode
aumentar mais ou menos do que o aumento do imposto.
Se a demanda inversa do mercado for de elasticidade constante, a condição de lucro
máximo será dada por (13). Com custo marginal constante, sendo introduzido o imposto ((26)
em (13)):

1 
p( y ) 1 −
 = c + t

ε
(
y
)



1
p( y ) 1 −  = c + t

ε 

c+t
p=
1 − ε1
ou
(32)
p=
1
(c + t ) .
1 − ε1
(32′)
Diferenciando em relação a t :
 1
dp
= 1⋅ 
 1 − ε1
dt


1
=
> 1,
 1 − ε1

(33)
que é igual ao markup (equação (24)) e, portanto, maior do que 1. Logo, o monopolista
repassa ao preço mais do que o valor do imposto.
Se o governo cobrar um imposto sobre o lucro, que é (considerando (1) e (3)),
π ( y ) = p ( y ) ⋅ y − c( y ) ,
(34)
o monopolista pagará uma fração τ de seu lucro ao governo, isto é, (1 − τ )π e maximizará
(considerando (34)):
max (1 − τ )( p( y ) ⋅ y − c( y ))
y
(1 − τ )( p′( y ) ⋅ y + p ( y ) − c′( y )) = 0
p′( y ) ⋅ y + p ( y ) − c′( y ) = 0
p′ ( y ) ⋅ y + p( y ) = c′( y ) ,
(35)
(4″)
que é a mesma condição de máximo lucro sem imposto dada por (4″). Assim, o imposto sobre
o lucro é ineficaz.
Ineficiência do monopólio
Como o monopólio tende a cobrar um preço mais alto do que o custo marginal, os
consumidores estariam em melhor situação na concorrência, onde o preço seria igual ao custo
marginal e, portanto, mais baixo. Mas as empresas se beneficiariam na situação de monopólio
pela mesma razão. Logo, apenas comparando o bem-estar relativo não dá para saber que
estrutura de mercado seria melhor para os dois grupos ao mesmo tempo, consumidores e
empresas.
Mas pode-se argumentar que a concorrência é melhor para ambos em termos de
eficiência. Um arranjo é eficiente no sentido de Pareto se não houver nenhuma forma de
melhorar a situação de alguém sem, com isso, piorar a de outrem. Se o arranjo melhorar a
situação de ambos, ele será ineficiente.
A quantidade produzida ótima de monopólio é eficiente? O nível eficiente de produção
é aquele em que a disposição dos consumidores de pagar por uma unidade extra do produto é
exatamente igual ao custo de produzi-la para a empresa. Podemos imaginar que, se a empresa
monopolista fosse obrigada a se comportar como uma empresa concorrencial, ela iria cobrar o
preço pc onde o custo marginal é igual à demanda do mercado por seu produto. A quantidade
produzida seria então yc , que é maior do que ym , que seria produzida na condição de
máximo lucro do monopólio onde RM = CM .
Na curva de demanda inversa, a cada quantidade y , o preço p mede quanto os
consumidores estão dispostos a pagar por uma unidade adicional do produto (Capítulo 15 do
livro). Para y = ym ,
pm > CM .
(36)
Como pm está sobre a demanda, os consumidores estão dispostos a pagar mais por uma
unidade extra do produto do que custa para produzir esta unidade ( CM m ). (Isto ocorre para
todas as unidades no intervalo ym ≤ y < yc ).
A empresa monopolista está sempre pronta para produzir uma unidade adicional e
vender por p se
pm > p > CM m .
(37)
Os consumidores ficam em melhor situação porque estavam dispostos a pagar pm e acabam
comprando por p < pm , e a empresa também fica em melhor situação porque vende a unidade
adicional por p > CM m (e continua vendendo todas as outras unidades por pm ). Na venda da
unidade extra, cada lado do mercado obtém um excedente. Logo, há uma melhoria de Pareto:
a quantidade produzida que maximiza lucro no monopólio, ym , é ineficiente.
O ônus do monopólio
A variação do excedente do produtor (alteração do lucro da empresa) mede quanto o produtor
está disposto a pagar para obter o preço mais alto de monopólio pm , enquanto a variação no
excedente do consumidor mede quanto os consumidores teriam de receber para ser
compensados pelo preço mais alto pm . A diferença entre os dois excedentes mede o ônus do
monopólio.
No equilíbrio de monopólio, a empresa vende ym unidades do produto ao preço pm
cada. Se forçada a ir até o equilíbrio competitivo, as unidades ym seriam vendidas ao preço
mais baixo pc : o lucro (excedente do produtor) se reduziria pela área A da Figura 5. Mas a
empresa agora venderia mais unidades, yc − ym , ao preço mais baixo pc : o lucro (excedente
do produtor) subiria pela área C .
Já os consumidores passariam a comprar as unidades ym ao preço mais baixo pc e,
portanto, “lucrariam” pela área A (o excedente do consumidor aumentaria). Na área A , a
redução do excedente do produtor seria exatamente compensada pelo aumento do excedente
do consumidor: o excedente total não variaria.
Mas os consumidores também “lucrariam” com o aumento das unidades, yc − ym ,
postas à venda pelo preço mais baixo pc : a área B mediria o aumento do excedente do
consumidor.
Como o excedente do produtor aumentaria pela área C e o excedente do consumidor
aumentaria pela área B , o excedente total aumentaria em B + C . B + C mediria o ônus do
monopólio pois, ao preço pm , tanto a empresa como o consumidor deixariam de ganhar.
Como exemplo, temos as patentes. Uma patente dá ao inventor o direito de beneficiarse de sua invenção por um período limitado de tempo: monopólio limitado. Acha-se que, sem
patentes, uma descoberta seria copiada pelos concorrentes e isto desencorajaria novas
descobertas. Mas o monopólio limitado tem ônus. Isto sugere um prazo de duração ótimo para
as patentes. Nos Estados Unidos a patente é válida por 17 anos. Um estudo (Nordhaus, 1969)
mostra que, com essa duração, o benefício da proteção de novas descobertas compensa em
quase 90% o ônus do monopólio. Porém, não apenas o tempo de validade de uma patente
importa: a abrangência da patente e o grau de novidade também devem ser considerados. Mas
apenas o tempo de validade é quantificado facilmente.
Monopólio natural
O monopólio natural ocorre em situações em que a tecnologia impõe grandes custos fixos e
baixos custos marginais e, assim, o intercepto das curvas de CM e de demanda ficam abaixo
da curva de CMe (Figura 6).
Se o regulador forçar o monopólio a operar onde o preço pc = CM , isto não cobre seus custos
pela área chamada de “prejuízo” na Figura 6: o monopólio abandona o negócio. Se o
regulador deixar o monopólio cobrar o preço que cobre o seu custo médio, pCMe , a quantidade
produzida yCMe fica menor do que a eficiente yc .
Exemplos de monopólio natural são os serviços de utilidade pública. Em empresas de
gás, construir (e manter) gasodutos envolve custos fixos altos, enquanto bombear gás para
dentro do gasoduto já pronto (custo marginal) custa muito pouco. Em empresas telefônicas, há
um alto custo em instalar fios e redes de comutação, mas baixo custo por unidade extra de
serviço telefônico.
Os monopólios naturais costumam ser regulados ou operados pelo governo. Quando
regulados, os monopólios são deixados operar no ponto ( pCMe , yCMe ) da Figura 6. Os custos
são cobertos, mas a produção fica abaixo da eficiente. (Mas saber o preço que cobre o custo
médio pCMe não é tarefa fácil.) Exemplos nos Estados Unidos são os serviços de gás, telefone,
eletricidade e TV a cabo.
Quando o governo opera o monopólio, ele cobra o preço igual a custo marginal pc e
compensa o prejuízo com um subsídio fixo. Exemplos nos Estados Unidos são o transporte
público de ônibus e metrô.
Causa do monopólio
Dependendo do custo médio e do tamanho da demanda podemos prever se um negócio será
monopolizado. Podemos recorrer ao conceito de “escala mínima de eficiência” ( EME ) , que
nos indica o nível de produção que minimiza o custo médio comparando-o com o tamanho da
demanda.
No caso a da Figura 7, há espaço para várias empresas operando em escala pequena: EME
baixa. No caso b, como a EME é alta, será lucrativa a instalação de apenas uma única
empresa.
A primeira causa do monopólio é, então, a EME em relação ao tamanho do mercado.
Como a tecnologia determina a EME, não há muito que fazer aqui para impedir que o
monopólio apareça, mas o governo pode ainda tentar aumentar o tamanho do mercado.
Outra causa é o cartel, quando empresas se unem para reduzir a produção, aumentar o
preço e o lucro. Mas nos Estados Unidos os carteis são ilegais.
Outra causa é a entrada pioneira de uma empresa numa indústria de custos altos.
Depois de estabelecida, a empresa cria barreiras à entrada de outras reduzindo o preço.
© Sergio Da Silva 2010
www.sergiodasilva.com
Comportamento
Monopolista
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 25
Na concorrência, muitas empresas vendem o mesmo produto: se uma aumentar o preço perde
todos os clientes. No monopólio, uma única empresa vende determinado produto: se aumentar
o preço perde alguns, mas nem todos os clientes. Se um posto de gasolina elevar o preço e
perder a maioria dos clientes, podemos inferir que a estrutura de mercado é competitiva. Se
um restaurante aumentar o preço e perder apenas alguns clientes, podemos inferir que ele
possui algum grau de poder de mercado. Empresas com algum grau de poder de mercado
praticam estratégias de fixação de preço e tentam diferenciar seus produtos para aumentar
ainda mais seu poder de mercado.
Discriminação de preços
O monopolista não deseja produzir acima de ym porque a quantidade extra forçaria a queda
do preço abaixo de pm , que ele consegue cobrar por todas as unidades ym . Mas, se for
possível, uma empresa vende diferentes unidades do produto a preços diferentes, praticando a
discriminação de preços.
Na discriminação de preços de primeiro grau (perfeita), o monopolista vende
diferentes unidades de produto a preços diferentes e os preços podem diferir de cliente para
cliente. Na discriminação de preços de segundo grau, o monopolista vende diferentes
unidades de produto a preços diferentes e os preços não podem diferir de cliente para cliente.
Na discriminação de preços de terceiro grau (mais comum), o monopolista vende a produção
a clientes diferentes a preços diferentes, mas cada unidade vendida a determinado cliente é
vendida pelo mesmo preço.
Discriminação de preços de primeiro grau
Na discriminação de preços de primeiro grau, cada unidade do produto é vendida ao
consumidor que lhe atribui maior valor e ao preço máximo que o consumidor esteja disposto a
pagar pelo produto (preço de reserva). Como cada unidade é vendida ao preço de reserva de
cada consumidor, não há excedente do consumidor, ou melhor, o monopolista apropria-se
dele, que vira o excedente do produtor (áreas hachuradas A e B da Figura 1). O lucro da
empresa (excedente do produtor) é máximo e qualquer aumento do excedente do consumidor
terá que ocorrer em detrimento da redução do excedente do produtor: este arranjo é eficiente
no sentido de Pareto, como na concorrência. Porém, utilizando a discriminação perfeita de
preços, a empresa monopolista captura todo o excedente. Portanto, o monopólio também pode
ser eficiente se praticar a discriminação perfeita de preços, que ocorre quando o monopolista
vende a quantidade x10 ao consumidor 1 ao preço igual à área A e vende a quantidade x20 ao
consumidor 2 ao preço B.
Como exemplo, temos o médico de uma cidade pequena que cobra preços diferentes
de cada paciente levando em conta a capacidade máxima de pagar de cada um. Outro exemplo
próximo seria venda de carro ou de antiguidades por negociação.
Discriminação de preços de segundo grau
Na prática, é muito difícil para a empresa monopolista conhecer as curvas de demanda dos
consumidores 1 e 2 da Figura 1. Além disso, o consumidor 1, que é propenso a pagar mais,
pode querer se passar pelo consumidor 2 que é propenso a pagar menos. Isto dificulta a
discriminação perfeita de preços.
Porém, o monopolista pode conseguir distinguir os dois consumidores dando-lhes
incentivos para que se auto-selecionem. Uma maneira seria oferecer dois pacotes diferentes de
preço-quantidade: um visando o consumidor 1 e o outro visando o consumidor 2.
Na Figura 2 juntamos os dois consumidores, os degraus das curvas de demanda foram
esticados e o CM constante da empresa foi considerado zero por simplicidade.
O monopolista sabe que deve vender a quantidade x10 ao preço A, como na Figura 1.
Mas na Figura 2 ele troca, por engano, a demanda do consumidor 1 pela do consumidor 2. Na
Figura 2, o monopolista também gostaria de vender a quantidade x20 ao preço A + B + C ,
porque assim ele captura todo o excedente do outro consumidor. O consumidor 1 então
compra as unidades x10 , pagando A e tendo um excedente igual a B. Ele não compra x20
porque, neste caso, seu excedente seria zero. A empresa, então, não consegue capturar todo o
excedente do consumidor 1.
Apesar disto, a empresa pode ainda aumentar seu excedente baixando o preço da
quantidade x20 para A + C , em vez de A + B + C . O consumidor 1 agora compra a quantidade
maior x20 , em vez de x10 , ganha A + B + C , paga A + C ao monopolista, e continua com o
excedente B. A empresa, por sua vez, aumenta seu excedente para A + C , em vez de A.
Outra estratégia da empresa seria, em vez de oferecer x10 ao preço A , oferecer um
pacote preço-quantidade, com quantidade um pouco menor do que x10 e preço um pouco
menor do que A . O excedente do produtor seria reduzido pelo triângulo cheio da Figura 3,
mas ele pode cobrar mais pela mesma quantidade x20 : a área C é acrescida (excedente do
produtor aumenta) pela região hachurada.
O monopolista, então, reduz ainda mais a quantidade x10 até que o lucro reduzido com
um consumidor se iguale ao lucro aumentado com o outro consumidor. Com isto, a empresa
reduz ainda mais o excedente B do consumidor de alta demanda, capturando-o e aumentando
o seu excedente do produtor.
Na prática, em vez de manipular as quantidades, o monopolista manipula a qualidade
do produto vendido. A empresa vende ao consumidor com maior propensão a pagar a um
preço mais alto e oferece o produto de menor qualidade ao consumidor com menor propensão
a pagar. Isto evita que o consumidor de maior propensão a pagar queira comprar o produto de
menor qualidade destinado ao outro consumidor.
Como exemplo, na discriminação de preços em passagens aéreas há a “tarifa sem
restrição” para quem viaja a negócios (preço mais alto) e há a “tarifa com restrição” para
quem viaja a passeio.
Discriminação de preços de terceiro grau
O monopolista, neste caso, vende a grupos de consumidores diferentes cobrando preços
diferentes, embora as unidades vendidas a determinado grupo sejam vendidas ao mesmo
preço. Como exemplo, temos o preço da entrada de cinema para estudantes ou os preços de
remédios para idosos. O preço cobrado a esses grupos é menor porque a sua elasticidadepreço da demanda é maior.
Para provar isto, consideremos a função demanda inversa do grupo de consumidores 1
dada por p1 ( y1 ) e a do grupo 2 dada por p2 ( y2 ) . O custo de produção é c( y1 + y2 ) . Para
maximizar lucro, o monopolista computa
max p1 ( y1 ) ⋅ y1 + p2 ( y2 ) ⋅ y2 − c( y1 + y2 )
y1 , y2
(1)
em duas partes. Primeira:
max p1 ( y1 ) y1 + p2 ( y2 ) y2 − c( y1 + y2 )
y1
p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) − c′( y1 + y2 ) ⋅1 = 0
p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) = c′( y1 + y2 )
r ′( y1 )
Do Capítulo 24 (equação (5)) sabemos que
r ′( y1 ) = p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) .
(1′)
Então,
r ′( y1 ) = c′( y1 + y2 )
(2)
Segunda parte:
max p1 ( y1 ) y1 + p2 ( y2 ) y2 − c( y1 + y2 )
y2
(1″)
p2′ ( y2 ) ⋅ y2 + p2 ( y2 ) − c′( y1 + y2 ) ⋅1 = 0
p2′ ( y2 ) ⋅ y2 + p2 ( y2 ) = c′( y1 + y2 )
r ′ ( y2 )
r ′( y2 ) = c′( y1 + y2 ) .
(3)
A solução ótima é, então,
RM1 ( y1 ) = CM ( y1 + y2 )
(2′)
RM 2 ( y2 ) = CM ( y1 + y2 ) .
(3′)
e
Combinando (2′) e (3′):
RM1 = RM 2 .
(4)
Portanto, unidades adicionais do produto devem gerar a mesma receita marginal, quer sejam
vendidas em um mercado ou no outro. Se RM1 > CM , valeria a pena aumentar a produção no
mercado do grupo 1. Se RM 2 > CM , valeria a pena aumentar a produção no mercado do
grupo 2.
Do Capítulo 24 (equação (12)) inferimos que

1
RM 1 ( y1 ) = p1 ( y1 ) 1 −

ε1 ( y1 )


 .

(5)
e

1
RM 2 ( y2 ) = p2 ( y2 ) 1 −

ε 2 ( y2 )


 .

(6)
(5) em (2′):

1
p1 ( y1 ) 1 −

ε1 ( y1 )


 = CM ( y1 + y2 ) .

(7)
(6) em (3′):

1
p2 ( y2 ) 1 −

ε 2 ( y2 )


 = CM ( y1 + y2 ) .

(8)
(7) e (8):

1
p1 ( y1 ) 1 −

ε1 ( y1 )



1
 = p2 ( y2 ) 1 −
ε 2 ( y2 )



 .

(9)
Para p1 < p2 , devemos ter, por (9),
1−
1
1
> 1−
ε1 ( y1 )
ε 2 ( y2 )
1−1+
1
1
>
ε 2 ( y2 ) ε1 ( y1 )
1
1
<
ε1 ( y1 ) ε 2 ( y2 )
ε1 > ε 2 .
(10)
Logo, o preço mais baixo deve ser cobrado no mercado de maior elasticidade-preço da
demanda. Estudantes e idosos são mais sensíveis ao preço e, assim, possuem demandas mais
elásticas. A empresa cobra deles, então, o preço mais baixo.
Discriminação de preços de terceiro grau com demanda linear
No caso especial de uma demanda linear, a quantidade produzida será a mesma, quer a
empresa discrimine preços ou não. Para provar isto, consideramos as demandas (não as
inversas):
x1 = a − bp1
(11)
x2 = c − dp2
(12)
e
(que são relacionadas às demandas inversas do Capítulo 24, Seção 2 do livro). Por
simplicidade,
CM = 0
e, no lucro máximo,
RM1 = CM = 0
(13)
RM 2 = CM = 0
RM1 = RM 2 = 0 .
(14)
Por definição,
r1 = p1 x1 .
(15)
(11) em (15):
r1 = p1 (a − bp1 )
r1 = ap1 − bp12
(16)
RM1 = a − 2bp1 .
(17)
(14) em (17):
0 = a − 2bp1*
a
p1* =
.
2b
(18)
(18) em (11):
a
2b
a 2a − a a
x1* = a − =
= .
2
2
2
x1* = a − b
(19)
Por definição,
r2 = p2 x2 .
(20)
(12) em (20):
r2 = p2 (c − dp2 )
r2 = cp2 − dp22
(21)
RM 2 = c − 2dp2 .
(22)
(14) em (22):
0 = c − 2dp2*
c
.
p2* =
2d
(23) em (12):
(23)
x2* = c − d
c
c 2c − c c
=c− =
= .
2d
2
2
2
(24)
Vendendo em ambos os mercados ao mesmo preço:
x1 + x2 = x
(25)
p1 = p2 = p .
(26)
e
(11), (12), (25) e (26):
x = a − bp + (c − dp )
x = a + c − (b + d ) p .
(27)
Por definição,
r = p⋅x.
(28)
(27) em (28):
r = p [ a + c − (b + d ) p ]
r = (a + c) p − (b + d ) p 2
(29)
RM = a + c − 2(b + d ) p .
(30)
Por (14),
RM = RM1 = RM 2 = 0 .
(14′)
(14′) em (30):
0 = a + c − 2(b + d ) p*
a+c
p* =
.
2(b + d )
(31)
(31) em (27):
x* = a + c − (b + d )
x* =
a+c
.
2
Como, por (25),
a+c
a + c 2(a + c) − (a + c)
= a+c−
=
(b + d )
2
2
(32)
x* = x1* + x2* ,
(25′)
(19) e (24) em (25′):
x* =
a c a+c
,
+ =
2 2
2
que é (32). Logo, para a demanda linear, a quantidade produzida é a mesma quer a empresa
discrimine preços ou não.
Por (11) e (17), a demanda do primeiro grupo tem intercepto vertical a igual ao da
RM1 e a inclinação da RM1 é −2b , o dobro da inclinação da demanda −b . Isto significa que
(Capítulo 24 do livro), a RM1 corta o eixo das abscissas na metade do trecho a partir do ponto
em que D1 o corta.
Na Figura 5, o equilíbrio ocorre em x1* e p1* . O preço p1* não permite a compra dos
consumidores do grupo 2. Mas, se o monopolista puder discriminar preço ele, por
maximização análoga, cobra p2* e vende menos quantidades para o grupo 2. A discriminação
de preço permite, então, que ele aumente a produção mesmo que as demandas sejam lineares.
Usando a expressão de máximo lucro em termos de elasticidade-preço (Capítulo 24):

1 
p1* 1 −
 = CM .

ε
1


Como, por (13), CM = 0 ,
(33)

1 
p1* 1 −  = 0
 ε 
1 

1
1=
ε1
ε1 = 1
(34)
ε1 = −1 ,
(35)
ou
com RM1 = CM = 0 .
Cálculo da discriminação ótima de preços
O monopolista se defronta com o mercado segmentado em dois grupos. As demandas são
D1 ( p1 ) = 100 − p1
(36)
D2 ( p2 ) = 100 − 2 p2 .
(37)
Se o custo marginal for constante e igual a
CM = 20
(38)
dólares por unidade de produto, se ele puder discriminar preços, quanto cobraria em cada
mercado para maximizar lucro? E quanto cobraria se não pudesse discriminar preço?
As demandas inversas de (36) e (37) são
y1 = 100 − p1 ( y1 )
p1 ( y1 ) = 100 − y1
(39)
e
y2 = 100 − 2 p2 ( y2 )
2 p2 ( y2 ) = 100 − y2
y
p2 ( y2 ) = 50 − 2 .
2
(40)
Para o primeiro mercado,
r1 = p1 ( y1 ) ⋅ y1 .
(41)
Considerando (39):
r1 = (100 − y1 ) y1
r1 = 100 y1 − y12
(42)
e
RM1 = 100 − 2 y1 .
(43)
Por (43) e (38), a condição de lucro máximo, RM1 = CM , é
100 − 2 y1* = 20
(44)
2 y = 100 − 20
*
1
y1* = 40 .
(45)
(45) em (39):
p1* = 100 − 40
p1* = 60 .
(46)
Para o segundo mercado,
r2 = p2 ( y2 ) ⋅ y2 .
(47)
Considerando (40):
y 

r2 =  50 − 2  ⋅ y2
2

1
r2 = 50 y2 − y22
2
(48)
e
RM 2 = 50 − y2 .
(49)
Por (49) e (38), a condição de lucro máximo, RM 2 = CM , é
50 − y2* = 20
y2* = 30 .
(50)
(50) em (40):
p2* = 50 −
30
2
p2* = 35 .
(51)
Cobrando o mesmo preço nos dois mercados,
p1 = p2 = p
(52)
e
D( p) = D1 ( p1 ) + D2 ( p2 ) .
(53)
(36), (37) e (52) em (53):
D ( p ) = 100 − p + (100 − 2 p )
D ( p ) = 200 − 3 p .
(54)
A curva de demanda inversa é
y = 200 − 3 p ( y )
3 p ( y ) = 200 − y
200 y
p( y) =
−
3
3
(55)
e
r = p( y ) ⋅ y .
(56)
(55) em (56):
 200 y 
r =
− y
3
 3
200
1
r=
y − y2
3
3
(57)
e
RM =
200 2
− y.
3
3
(58)
Considerando (58) e (38), a condição de lucro máximo, RM = CM , é
200 2 *
− y = 20
3
3
2 * 200
y =
− 20
3
3
3  200

y* = 
− 20  =
2 3

y* = 70 .
(59) em (55):
p* =
200 70 130
−
=
3
3
3
3  200 − 60  3  140  140

= 
= 2
2
3
 2 3 
(59)
p* = 43,3 .
(60)
Venda casada
As razões para a venda casada (bundling) são: (1) a redução de custos, (2) a
complementaridade entre os produtos e (3) o comportamento do consumidor. Um exemplo
seria dado pelos pacotes de software: no Office, a Microsoft reúne o Word, o Excel e o Power
Point. Digamos que a disposição a pagar de dois grupos de consumidores por dois produtos
seja como na Tabela 1.
Tabela 1
Consumidor do grupo 1
Consumidor do grupo 2
Processador de texto, $
120
100
Planilha eletrônica, $
100
120
Supondo que CM ≈ 0 , a empresa maximiza lucro maximizando apenas a receita. Supomos
ainda que a propensão a pagar por um pacote seja a soma da propensão a pagar de cada
produto. Se vender os produtos em separado por $100 cada, a empresa apura $400 de receita,
vendendo duas unidades de processador de texto e duas de planilha. O preço de venda para
consumidores diferentes é determinado pelo comportamento do comprador com menor
propensão a pagar. Cobrando $220 por cada pacote, a empresa apura $440, vendendo um
pacote para cada tipo de consumidor. A venda casada vale a pena.
Tarifa em duas partes
Considere um parque de diversões em que se cobra um preço para entrar e outro para andar
nos brinquedos. Como a empresa deve fixar os dois preços para maximizar lucro?
Ocorre o “dilema da Disneylândia”. Para entendê-lo, supomos que (1) há apenas um
brinquedo, (2) os consumidores vão à Disneylândia apenas por esse brinquedo, (3) todos têm
o mesmo gosto em relação ao brinquedo e (4) o CM é constante.
Fixando p* por cada volta nos brinquedos, o número de voltas vendidas será x* . Dado
p* , quanto cobrar de entrada no parque? O máximo que pode ser cobrado é a área do
excedente do consumidor. A área do triângulo da Figura 6 será desperdiçada. O monopolista
deve então baixar o preço das voltas p* até igualá-lo ao CM : todo o triângulo acima da reta
de CM passa a ser o excedente do consumidor. Isto significa que o monopolista deve cobrar
na entrada o preço igual a todo o excedente do consumidor, abocanhando-o.
Concorrência monopolista
Costumamos chamar de indústria ao conjunto de todas as empresas que produzem
determinado produto. Na indústria monopolista, uma única empresa grande produz
determinado produto. Porém, apenas uma grande empresa produz Coca-Cola e não é
monopolista. Precisamos então ampliar o conceito de indústria. Podemos dizer que é o
conjunto de empresas que produzem produtos que são substitutos próximos (não
necessariamente perfeitos).
Ao fixar o preço e a quantidade, cada empresa leva em conta a decisão análoga das
concorrentes. A curva de demanda da empresa depende da escolha de preço e quantidade das
concorrentes. A inclinação da curva de demanda depende do grau de substituição do seu
produto em relação ao das concorrentes.
O grau de substituição influencia a elasticidade-preço da demanda. Se a empresa
aumentar o preço, o número de consumidores que vai deixar de consumir o produto depende
do grau de substituição. Quanto mais a empresa consiga diferenciar seu produto, mais poder
de mercado terá para aumentar o preço: menos elástica fica a curva de demanda.
A Coca-Cola tem poder de mercado, mas ainda enfrenta a concorrência das empresas
que produzem substitutos imperfeitos. A indústria de refrigerantes é, então, de concorrência
monopolista: há um grande número de empresas produzindo artigos semelhantes, mas não
idênticos. Cada produto tem seus adeptos e a sua empresa desfruta de algum poder de
mercado. A indústria é monopolista porque cada empresa se defronta com uma curva de
demanda negativa (e não horizontal, como na concorrência perfeita). Cada empresa tem um
grau de monopólio e pode fixar seu preço, em vez de aceitar passivamente o preço de
mercado. Porém, a indústria também é competitiva, pois as empresas concorrem em preço e
tipo de produto e não há barreiras à entrada de outras empresas.
Quando novas empresas entram na indústria, a curva de demanda de cada empresa: (1)
desloca-se para dentro: a cada preço a empresa venderá menos unidades do seu produto e (2)
fica mais elástica, porque entram mais produtos similares.
Com novas e novas entradas, surgem três fatos: (1) cada empresa precisa ainda vender
uma combinação de preço e quantidade sobre a curva de demanda, (2) cada empresa precisa
ainda maximizar lucro, dada a demanda e (3) as entradas forçam os lucros de cada empresa
até zero (o ponto de máximo lucro é de lucro zero): a combinação de preço e quantidade tem
que ficar sobre a curva de custo médio.
Para que os fatos 1, 2 e 3 ocorram simultaneamente, a demanda de mercado de cada
empresa em concorrência monopolista (sem barreiras à entrada) deve tangenciar a curva de
CMe . Se a demanda cruzasse a curva de CMe , haveria pontos sobre a demanda acima da
curva de CMe : isto não pode ocorrer porque aí o lucro não seria zero. O preço seria maior do
que o custo médio CMe = c (yy ) , i.e. p > c (yy ) , o que significa lucro positivo: p ⋅ y − c( y ) > 0 .
A concorrência monopolista é Pareto ineficiente, já que aí p > CM . Perceba que lucro
zero é outra coisa: relaciona-se ao CMe . Na concorrência monopolista cada empresa opera à
esquerda do nível de produção que minimiza o CMe .
Diferenciação de produtos em concorrência monopolista
Pode haver pouca ou muita diferenciação de produto na concorrência monopolista. No caso
de pouca diferenciação, cada empresa vai querer tornar seu produto semelhante ao das
concorrentes para tomar seus clientes. Um exemplo que ilustra isso é o do sorveteiro na praia.
Suponha que os consumidores estejam distribuídos homogeneamente ao longo da praia. Um
sorveteiro vai escolher se localizar no meio da praia e isto é bom tanto para ele como para os
consumidores.
No caso de dois sorveteiros vendendo o mesmo tipo de sorvete, o bom para os
consumidores seria como na Figura 9.
Porém, o bom para os vendedores é se dirigir para o centro. Mas se o sorveteiro 1 se
mover para o centro, tira alguns clientes do sorveteiro 2 e não perde nenhum (Figura 10).
O sorveteiro 2 então faz o mesmo. O que é bom para os vendedores (Figura 11) não é
bom para os consumidores (Figura 9).
Outro exemplo é o de duas emissoras de rádio (Figura 12). Em equilíbrio, as duas tocariam
tanto música erudita como rock heavy metal, desagradando os consumidores de gostos
extremos.
No caso de excessiva diferenciação do produto, considerando o exemplo anterior,
imagine que a praia seja muito grande (Figura 13). O bom para os vendedores seria ficar nos
extremos da praia, embora isto não seja o bom para os consumidores (que é a situação da
Figura 9). Neste caso, cada empresa tentaria convencer o consumidor de que seu produto não
tem substituto, como no caso do sabão em pó, onde as empresas investem pesadamente para
diferenciar o produto através de propaganda.
© Sergio Da Silva 2010
www.sergiodasilva.com
Comportamento Monopolista
Hal R. Varian
no Mercado de Fatores
Intermediate Microeconomics, 8th edition
Capítulo 26
A empresa monopolista no mercado competitivo de fatores
A empresa maximizadora de lucro escolhe a quantidade de um fator de produção (como mãode-obra) de modo que a receita marginal recebida por empregar uma unidade a mais dele se
iguale ao custo marginal de empregá-lo. Supomos que há apenas um fator de produção e que a
função produção da empresa é
y = f ( x) ,
(1)
onde x representa as unidades empregadas de mão-de-obra. A receita é
r ( y) = p( y) ⋅ y .
(2)
Por (1), se x aumentar em ∆x , então y aumentará em ∆y , ou seja, ∆y = f ( x + ∆x) − f ( x) .
O produto marginal do fator é, então,
PM x =
∆y f ( x + ∆x) − f ( x)
=
.
∆x
∆x
(3)
Com o aumento da quantidade produzida e vendida y , a receita r aumenta: a receita
marginal é
RM =
∆r r ( y + ∆y ) − r ( y )
=
.
∆y
∆y
Como o aumento da receita r por causa do aumento de y ,
(4)
∆r
∆y
, se deveu ao aumento do
insumo x , ∆∆yx , medimos diretamente o efeito de ∆x em ∆r e o chamamos de produto da
receita marginal:
PRM x =
∆r ∆r ∆y
=
⋅
∆x ∆y ∆x
(5)
ou, considerando (3) e (4),
PRM x = RM ⋅ PM x .
(5′)
Derivando (2):
RM = p′( y ) ⋅ y + p( y )
que, em termos discretos, é
(6)
RM = p( y ) +
∆p
⋅y.
∆y
(6′)
(6′) em (5′):

∆p 
PRM x =  p( y ) +
⋅ y  PM x .
∆y 

(7)
Do Capítulo 15 do livro sabemos que

1
RM = p( y ) 1 −  .

ε 

(8)
(8) em (5′):

1
PRM x = p( y ) 1 −  PM x .

ε 

(9)
Na concorrência perfeita, temos que
ε =∞
(10)
porque a demanda é horizontal ao nível do preço dado pelo mercado. Substituindo (10) em
(8):
1

RM = p  1 −  = p (1 − 0)
 ∞
RM = p .
(11)
(11) em (5′):
PRM x = p ⋅ PM x ,
(12)
onde toda a expressão depois da igualdade fornece o valor do produto marginal do fator.
No monopólio, a empresa opera quando
ε ≥1,
(13)
já que sabemos do Capítulo 24 que ela não opera quando ε < 1 .
Podemos comparar o PRM x nos dois casos, concorrência e monopólio, considerando
(9) e (12). Note que

1
PRM x = p 1 −  PM x ≤ p ⋅ PM x ,

ε 

(14)
o que significa que o PRM x no monopólio é menor ou igual ao PRM x na concorrência. Para
confirmar, calibremos com ε = 2 em (14), considerando (13):
 1
p  1 −  PM x < p ⋅ PM x
 2
1
p ⋅ PM x <1 ⋅ p ⋅ PM x .
2
(15)
(15′)
O aumento marginal do emprego do fator vale menos para o monopolista do que para a
empresa competitiva. O monopolista então emprega menos mão-de-obra do que a empresa
competitiva para maximizar lucro: por isso, a quantidade produzida de máximo lucro é menor
no monopólio ( ym < yc ).
Se o mercado de trabalho for competitivo, o custo marginal para a empresa empregar
uma unidade do fator x se iguala ao preço do fator, w :
CM x = w .
(16)
Para saber quanto do fator empregar, a empresa iguala PRM x com o custo marginal do fator
CM x :
PRM x = CM x .
(17)
A empresa competitiva emprega xc unidades de mão-de-obra, fazendo ((12) e (16) em
(17)):
PRM x = p ⋅ PM x = w .
(18)
Já a empresa monopolista emprega xm trabalhadores fazendo ((9) e (16) em (17)):
PRM x = w .
(19)
Como PRM x no monopólio é menor do que PRM x na concorrência (equação (14)):
PRM x < p ⋅ PM x
(20)
e o ponto em que PRM x ( xm ) = w fica à esquerda do ponto em que p ⋅ PM x ( xc ) = w . O
monopolista emprega menos trabalhadores do que a empresa competitiva.
Monopsônio
Enquanto no monopólio há um único vendedor, no monopsônio há um único comprador. A
empresa monopsonista vende seu produto em um mercado competitivo, mas não é tomadora
de preço (price taker) no mercado de fatores: é formadora de preço (price maker). A função
produção é
y = f ( x)
(21)
e a curva de oferta inversa do fator é
w( x) > 0 .
(22)
Se a empresa monopsonista quiser empregar x unidades de mão-de-obra, terá que pagar o
preço (salário) w( x) . Quanto mais de x desejar empregar, maior o preço que precisará pagar.
A receita (em função de y ) é:
r ( y) = p( y) ⋅ y ,
(23)
onde p( y ) é a demanda inversa. A receita (em função de x ) é, considerando (21) em (23),
r ( x) = p( f ( x)) ⋅ f ( x) .
Usando a regra da cadeia, diferenciamos (24) em relação a x :
(24)
dr ( x)
= p′( y ) ⋅ f ′( x) ⋅ f ( x) + f ′( x) ⋅ p( y )
dx
dr ( x)
= f ′( x)( p′( y ) ⋅ f ( x) + p( y ))
dx
(25)
ou, considerando (21),
dr ( x)
= f ′( x)( p′( y ) ⋅ y + p( y )) .
dx
(26)
(6) em (26):
dr ( x)
= f ′( x) ⋅ RM .
dx
A definição de PM x =
∆y
∆x
(27)
em tempo contínuo é
PM x = f ′( x) .
(28)
(28) em (27):
dr ( x)
= PM x ⋅ RM .
dx
Enquanto RM captura o aumento em r devido ao aumento de y , o termo
aumento em r devido ao aumento de x . Então,
PRM x ≡
dr ( x)
.
dx
(29)
dr ( x )
dx
captura o
(30)
(30) em (29):
PRM x = RM ⋅ PM x .
(5′)
Mas como a empresa monoposonista é concorrencial no mercado do seu produto, (5′) se a
reduz a (12), como vimos na seção anterior.
O custo da empresa monopsonista é
c = w⋅ x
(31)
ou
c( x) = w( x) ⋅ x .
(31′)
O diferencial total de (31′) é
dc = dw ⋅ x + dx ⋅ w
(32)
que, em tempo discreto, dá a alteração total dos custos pelo emprego de mais ∆x de mão-deobra:
∆c = w ⋅ ∆ x + x ⋅ ∆ w .
(33)
Derivando (31′):
c′( x) = w′( x) ⋅ x + w( x) .
(34)
CM x ≡ c′( x)
(35)
Como
temos ((35) em (34)):
CM x = w( x) + w′( x) ⋅ x .
(36)
Em tempo discreto, (36) fica sendo
CM x = w +
∆w
x.
∆x
(37)
Portanto, ao aumentar o emprego da mão-de-obra em ∆x , a empresa paga mais por isto:
w ⋅ ∆x . Além disso, o aumento de ∆x significa que a empresa vai pagar mais por todas as
unidades de mão-de-obra: ∆w ⋅ x . A equação (37) pode ser reescrita como
x ∆w 

CM x = w 1 +
.
 w ∆x 
(37′)
Podemos expressar (37′) em termos da elasticidade-preço da oferta do fator:
η≡
∆x
x
∆w
w
=
∆x w w ∆x
⋅
= ⋅
.
x ∆w x ∆w
(38)
Logo,
1
η
=
w
x
1
x ∆w
= ⋅
.
∆x
⋅ ∆w w ∆x
(39)
(39) em (37′):
 1
CM x = w  1 +  .
 η
(40)
Se a empresa fosse tomadora de preços no mercado de fatores (como na seção anterior), a
curva de oferta de mão-de-obra seria perfeitamente elástica:
η =∞.
(41)
(41) em (40):
CM x = w .
(16)
Este é o caso anterior da empresa monopolista no mercado de fatores competitivo (equação
(16)). Mas, para a empresa monopsonista, a curva de oferta de mão-de-obra é positivamente
inclinada:
η > 0,
(42)
de modo que (considerando (42) em (40)), para o monopsonista
CM x > w ,
(43)
(
)
Já que seu CM x se iguala a w vezes o termo positivo 1 + η1 > 0 .
Supondo uma oferta de mão-de-obra inversa linear:
w( x) = a + bx ,
(44)
o custo é
c( x) = w( x) ⋅ x = ax + bx 2
(45)
e o custo marginal é
CM x = a + 2bx .
(46)
A empresa monopsonista maximiza lucro fazendo:
max r ( x) − c( x)
x
(47)
ou, considerando (24) e (31′) em (47):
max p ⋅ f ( x) − w( x) ⋅ x .
x
(48)
Derivando e igualando a zero:
f ′( x) ⋅ p − ( w′( x) ⋅ x + w( x)) = 0
p ⋅ f ′( x) = w( x) + w′( x) ⋅ x .
(49)
(28) e (36) em (49):
p ⋅ PM x = CM x .
(50)
Como a empresa monopsonista é concorrencial no mercado de seu produto, então
PRM x = p ⋅ PM x
(12)
pode ser substituída em (50):
PRM x = CM x .
(52)
Portanto, o lucro máximo ocorre quando o aumento da receita marginal pelo emprego de uma
unidade a mais do fator se iguala ao aumento do custo marginal com o emprego desta
unidade. Em termos da elasticidade-preço da oferta do fator, (40) em (51):
 1
PRM x = w  1 +  .
 η
(52)
Comparando com (19), a empresa monopolista emprega mão-de-obra pela regra
PRM x = w .
(19)
Este é o caso em (52) se η = ∞ (concorrência no mercado de fatores). Mas, no monopsônio,
η > 0 (equação (42)) e CM x > w (equação (43)). Como o custo marginal do emprego do fator
é maior do que seu preço, isto significa que o monopsonista emprega menos trabalhadores do
que no caso do mercado de trabalho competitivo: há ineficiência de Pareto no mercado de
trabalho.
O regulador poderia então fixar um salário-mínimo wmín = CM x fazendo com que o
monopsônio se movesse sobre a curva de oferta de mão-de-obra inversa e chegasse ao nível
de contratação eficiente: o salário-mínimo então aumentaria o emprego, ao contrário do
esperado no mercado de trabalho competitivo. Este é o caso na Figura 2, onde consideramos
os casos das funções lineares (44) e (46).
Venda de fator de produção por um monopolista a outro que vende produto
Considere a situação da Figura 3.
Para o monopolista 2 (downstream):
p ( y ) = a − by
(53)
r ( y) = p( y) ⋅ y
(54)
c( y ) = ky
(55)
y=x
(56)
max p ( y ) ⋅ y − κ y .
(57)
y
(53) em (57):
max(a − by ) ⋅ y − ky
y
max ay − by 2 − ky
y
a − 2by* − k = 0
2by* = a − k
a−k
y2* =
.
2b
(58)
(59)
(56) e (59):
x2* =
a−k
.
2b
(60)
O monopolista 1 (upstream) escolhe o x* do monopolista 2 para maximizar seu
próprio lucro:
x=
a−k
2b
(60)
ou
p = k = a − 2bx ,
(61)
que é a demanda pelo fator x . A receita é
r ( x) = p ⋅ x .
(62)
(61) em (62):
r ( x) = (a − 2bx) ⋅ x
r ( x) = ax − 2bx 2 .
(63)
A receita marginal é
RM x = a − 4bx .
(64)
No lucro máximo:
RM x = CM x = c .
(65)
(64) em (65):
a − 4bx* = c
4bx* = a − c
a−c
x1* =
.
4b
(66)
A função produção é
y = x.
(67)
(66) em (67):
y1* =
a−c
.
4b
Se as duas empresas fizerem uma fusão, com a demanda inversa
p = a − by ,
(68)
(53)
CM = c ,
(69)
r = p⋅ y .
(70)
(53) em (70):
r = (a − by ) y
r = ay − by 2 .
(71)
A receita marginal é, então,
RM = a − 2by
(72)
e o lucro máximo é atingindo quando ((69) e (72)):
RM = CM = a − 2by* = c
2by* = a − c
a−c
y* =
.
2b
(73)
(74)
Comparando (68) com (74):
a − c = 4by1*
(68′)
a − c = 2by* .
(74′)
e
(68′) e (74′):
4by1* = 2by*
2
y1*
antes da fusão
=
y*
.
(75)
depois da fusão
Portanto, a quantidade produzida será duas vezes maior depois da fusão para o monopólio
upstream. A razão é que o monopolista upstream eleva seu preço acima do CM e o
monopolista downstream eleva seu preço acima desse teto de CM : markup duplo. O preço
não apenas é alto demais do ponto de vista da concorrência, mas também do ponto de vista da
maximização de lucro total dos dois monopólios. Depois que fazem a fusão, o preço baixa e o
lucro sobe.
© Sergio Da Silva 2010
www.sergiodasilva.com
Oligopólio
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 27
Comportamento estratégico
O oligopólio é a estrutura de mercado com poucas empresas que são interdependentes. No
duopólio, duas empresas fabricam o mesmo produto e as variáveis estratégicas são os dois
preços e as duas quantidades produzidas. As interações estratégicas podem ocorrer em um
jogo sequencial (modelo de Stackelberg). Neste caso, a empresa que escolhe seu preço antes é
a líder de preço e, a outra, fica sendo a seguidora. A empresa que escolhe sua quantidade
antes é a líder de quantidade; a outra é a seguidora. Em um jogo simultâneo, as empresas
escolhem seus preços ou quantidades simultaneamente, sem que uma conheça a escolha da
outra. Em vez de competir, as empresas podem também formar um conluio e o jogo fica
cooperativo.
Liderança de quantidade
Quando há uma empresa líder em uma indústria, esta anuncia a quantidade do seu produto
antes da outra. Por exemplo, a IBM. A empresa 1 (líder) escolhe produzir y1 . A empresa 2
(seguidora) responde com a escolha de y2 . A produção total da indústria é
Y = y1 + y2 .
(1)
O preço de equilíbrio depende de Y (função demanda inversa):
p = p (Y ) = p ( y1 + y2 ) .
(2)
Para saber que y1 escolher, a líder já considera antes o problema de maximização de lucro da
seguidora. A seguidora maximiza
max = p ( y1 + y2 ) ⋅ y2 − c2 ( y2 )
y2
(3)
depois de conhecer a produção y1 da líder: y1 é constante para a empresa 2. Assim,
p′( y1 + y2 ) ⋅ y2 + p( y1 + y2 ) − c2′ ( y2 ) = 0
p( y1 + y2 ) + p′( y1 + y2 ) ⋅ y2 = c2′ ( y2 ) .
(4)
Em tempo discreto:
p ( y1 + y2 ) +
∆c
∆p
y2 = 2
∆y2
∆y2
RM 2 ≡ p( y1 + y2 ) +
∆p
y2 .
∆y2
(4′)
(5)
Como antes, quando a empresa 2 aumenta y : (1) a receita aumenta pois vende mais produtos
ao preço de mercado e (2) o preço é empurrado para baixo em ∆p e os lucros caem para todas
as unidades vendidas ao preço que agora baixou. Além disso,
CM 2 ≡
∆c2
= c2′ ( y2 )
∆y2
(6)
(5) e (6) em (4′):
RM 2 = CM 2 .
(4″)
Para outra escolha de y1 , a seguidora maximiza lucro de novo, considerando o novo valor de
y1 constante. Assim, a função de reação é
y2 = f 2 ( y1 ) .
(7)
Para a função demanda inversa linear
p ( y1 + y2 ) = a − b( y1 + y2 )
(8)
c2 = 0 ,
(9)
e custos
a função lucro
π 2 ( y1 , y2 ) = r2 − c2
(10)
fica sendo ((8) e (9) em (10)):
π 2 ( y1 , y2 ) = (a − b( y1 + y2 )) y2
π 2 ( y1 , y2 ) = ay2 − by1 y2 − by22 .
(11)
Podemos usar (11) para encontrar todas as combinações de y1 e y2 que deixam π 2 constante,
encontrando a isolucro:
π 2 = ay2 − by1 y2 − by22 .
(12)
Se a empresa líder escolher y1 = 0 , a empresa seguidora vira monopólio e aufere o lucro mais
alto possível. Logo, na Figura 1, curvas isolucro mais à esquerda representam lucros maiores
para a empresa 2.
A curva de reação corta as curvas isolucro quando as inclinações das curvas forem
verticais, porque, para cada y1 , ocorrem aí as escolhas ótimas de y2 . Para y1 em particular, a
escolha ótima da seguidora será y2 . Algebricamente, considerando (11) e (9),
r2 = ay2 − by1 y2 − by22
(13)
RM 2 ( y1 , y2 ) = a − by1 − 2by2 .
(14)
(9) implica que:
CM 2 = 0
(15)
e o máximo lucro será ((14) e (15)):
RM 2 = a − by1 − 2by2 = 0 = CM 2
2by2 = a − by1
a − by1
y2 =
,
2b
(16)
que é a curva de reação da empresa seguidora.
A empresa líder sabe que a sua escolha de y1 influencia a escolha da seguidora de y2 :
ela conhece a função de reação da seguidora ((7) e (16)). A empresa 1 então maximiza
max p ( y1 + y2 ) ⋅ y1 − c1 ( y1 )
y1
(17)
de modo que
y2 = f 2 ( y1 ) .
(7) em (17):
(7)
max p ( y1 + f 2 ( y1 ) ) ⋅ y1 − c1 ( y1 ) .
y1
(18)
Supomos, como antes, que
c1 = 0
(19)
CM 1 = 0 .
(20)
A receita é
r1 = p( y1 + y2 ) y1 .
(21)
Para a demanda inversa linear ((8) em (21)):
r1 = ( a − b( y1 + y2 ) ) y1
r1 = ay1 − by12 − by1 y2 .
(22)
(16) em (22):
a − by1
2b
 aby1 − b 2 y12 
2
r1 = ay1 − by1 − 

2b


a
b
r1 = ay1 − by12 − y1 + y12
2
2
a
b 2
r1 = y1 − y1 .
2
2
r1 = ay1 − by12 − by1
(23)
Logo,
RM 1 =
a
− by1
2
(24)
e o máximo lucro será (considerando (20)):
RM 1 =
a
− by1* = 0 = CM 1
2
a
2
a
,
y1* =
2b
by1* =
onde y1* é a quantidade produzida da líder.
Substituindo (25) na função de reação (16) da seguidora:
(25)
y2* =
a −b
a
2b
2b
a 2a − a
a
a−
2= 2 = 2 =a 1
y2* =
2b
2b
2b 2 2b
a
y2* =
,
4b
(26)
onde y2* é a quantidade produzida da seguidora.
A quantidade produzida total ((1), (25) e (26)) será, então,
Y * = y1* + y2* =
Y* =
a
a 2a + a
+
=
2b 4b
4b
3a
.
4b
(27)
As curvas isolucro da empresa 1 têm a mesma forma que as da empresa 2: há apenas
um deslocamento de 90°. A curva de reação da empresa 1 também corta as curvas isolucro
quando a inclinação das curvas for horizontal, por causa da escolha ótima de y1 na condição
de tangência zero. A curva de reação da empresa 2 (Figura 1) é também plotada na Figura 2.
Na Figura 2, curvas isolucro mais baixas representam y1 maior e, portanto, π 1 mais alto, já
que y2 → 0 e a empresa 1 se aproxima da situação de monopólio. Dada a curva de reação da
empresa 2, a empresa 1 então seleciona o ponto de tangência com a curva isolucro mais baixa.
Liderança de preço
Como os produtos são idênticos, em equilíbrio a seguidora tem que adotar o mesmo preço que
a líder. Se fosse menor, os consumidores não iriam comprar nada da líder e não haveria
duopólio. Se a líder então escolher o preço p, a seguidora considerará este preço dado ao
maximizar seu lucro, de maneira similar a uma empresa em concorrência pura. Então,
max py2 − c2 ( y2 )
(28)
p − c2′ ( y2 ) = 0
p = CM 2 .
(29)
y2
A função de oferta da seguidora depende então do preço escolhido pela líder:
y2 = S ( p ) .
(30)
A líder percebe que, ao fixar p , a seguidora oferecerá a quantidade S ( p ) . De toda a demanda
do mercado, D( p) , a líder terá que descontar a parte atendida pela seguidora, que é S ( p ) . A
demanda residual será, então,
R ( p) = D( p) − S ( p) = y1 .
(31)
A líder produz a quantidade y1 para atender a demanda residual e vende cada unidade ao
preço p . A receita será
r1 = p ⋅ y1
(32)
r1 = p ⋅ ( D( p ) − S ( p ) ) .
(32′)
Para produzir as quantidades D( p ) − S ( p ) , a líder incorre em custos constantes por cada
unidade:
c1 = c ⋅ ( D( p ) − S ( p ) ) .
(33)
Logo, o lucro será ((32′) e (33)):
π 1 ( p) = p ( D( p) − S ( p) ) − c ( D( p) − S ( p) )
π 1 ( p ) = ( p − c) ( D ( p ) − S ( p ) )
(34)
ou, considerando (31),
π 1 ( p ) = ( p − c) R ( p ) .
(34′)
Para a demanda inversa linear
D( p ) = a − bp
e custos
(35)
c2 ( y2 ) =
y22
2
c1 ( y1 ) = cy1 ,
(36)
(37)
a seguidora opera onde
p = CM 2 .
(38)
Seu custo marginal (considerando (36)) será:
CM 2 = y2 .
(39)
(39) em (38):
p = y2 .
(40)
(40) e (30):
y2 = S ( p ) = p .
(41)
(35) e (41) em (31):
R( p ) = a − bp − p
R( p) = a − (b + 1) p .
(42)
(42) em (31):
y1 = a − (b + 1) p
(b + 1) p = a − y1
a
1
p=
−
y1 ,
b +1 b +1
(43)
que é a demanda inversa (residual) da líder. A receita é ((43) em (32)):
1
 a

r1 = 
−
y1  y1
 b +1 b +1 
r1 =
a
1 2
y1 −
y1 .
b +1
b +1
(44)
A receita marginal é:
RM 1 =
a
2
−
y1 .
b +1 b +1
(45)
Comparando (43) e (45), vemos que a demanda inversa e a receita marginal têm o mesmo
intercepto ( b+a 1 ) e a RM 1 é duas vezes mais inclinada ( b+2 1 ) . O custo marginal, considerando
(37), é
CM 1 = c
(46)
e o lucro máximo ocorrerá quando ((45) e (46)):
RM 1 = CM 1 =
a
2 *
−
y1 = c
b +1 b +1
2 *
a
y1 =
−c
b +1
b +1
2 * a − c(b + 1)
y1 =
b +1
b +1
a
−
c
(
b
+
1)
.
y1* =
2
(47)
Escolha simultânea da quantidade: modelo de Cournot
Se as duas empresas decidirem simultaneamente a quantidade a ser produzida, cada uma
precisará prever a quantidade da outra. No modelo de Cournot, a empresa 1 espera que a
empresa 2 produza y2e . Ao produzir y1 , ela espera que o total produzido seja
Y = y1 + y2e
e que o preço de mercado seja
(48)
p (Y ) = p ( y1 + y2e ) .
(49)
A sua maximização de lucro será:
max p( y1 + y2e ) y1 − c( y1 ) .
y1
(50)
Logo, para cada expectativa y2e haverá uma escolha ótima de y1 . A função de reação é a
relação entre a produção esperada y2e e a escolha ótima de y1 :
y1 = f1 ( y2e ) .
(51)
Analogamente, a função de reação da empresa 2 é
y2 = f 2 ( y1e ) .
(52)
Se as expectativas das empresas se confirmarem em equilíbrio, o equilíbrio de Cournot
será dado por:
y1* = f1 ( y2* )
(53)
y2* = f 2 ( y1* ) .
(54)
Este é o ponto onde as duas curvas de reação se encontram na Figura 4.
Adaptando a função de reação linear da empresa 2 de antes (equação (16)):
y2 =
a − by1e
.
2b
(55)
Como a empresa 1 age da mesma forma, sua função de reação é análoga:
a − by2e
y1 =
.
2b
(56)
Se as expectativas se confirmarem:
y1e = y1
(57)
y2e = y2 ,
(58)
(57) em (55):
y2 =
a − by1
.
2b
(59)
(58) em (56):
y1 =
a − by2
.
2b
(60)
(59) em (60):
 a − by1* 
a b
2a − a b * a b *
a −b
 a − + y1*
+ y1
+ y1
b
2

=
2 2 = 2
2 = 2 2
y1* =
2b
2b
2b
2b
a
b
2by1* = + y1*
2 2
b
a
2by1* − y1* =
2
2
b * a

 2b −  y1 =
2
2

4b − b * a
y1 =
2
2
3b * a
y1 =
2
2
a
y1* = .
3b
(61) em (59):
(61)
a
a 3a − a 2a
a−
3b =
3= 3 = 3
y2* =
2b
2b
2b
2b
2a 1
y2* =
⋅
3 2b
a
y2* = .
3b
a −b
(62)
A produção total (48) será:
a a a+a
+
=
3b 3b
3b
2
a
Y* =
.
3b
Y* =
(63)
Se não houver equilíbrio na produção das empresas, haverá convergência desde que a
quantidade produzida fique fixa de um período para outro: o equilíbrio de Cournot é estável.
Para provar, considere que no período t as empresas produzam y1t e y2t , que não são as
quantidades de equilíbrio. Se a empresa 1 esperar que a empresa 2 vai manter a quantidade em
y2t , em t + 1 ,
y1t +1 = f1 ( y2t ) .
(64)
Se a empresa 2 pensar da mesma forma:
y2t +1 = f 2 ( y1t ) .
(65)
Na Figura 5 isto é representado pelo movimento horizontal à esquerda do ponto
( y , y ) até a função de reação da empresa 1. Para os outros períodos, o processo se repete:
subimos a escada em direção ao equilíbrio de Cournot.
t
1
t
2
Escolha simultânea da quantidade por várias empresas
Com n empresas, e não apenas duas, a quantidade produzida de toda a indústria fica sendo
Y = y1 + ... + yn .
(66)
Como no duopólio, o preço de equilíbrio depende de Y (função demanda inversa):
p = p (Y ) = p ( y1 + ... + yn ) .
(67)
A receita de uma empresa i qualquer é
ri = p(Y ) ⋅ yi .
(68)
A receita marginal é
RM i = p′(Y ) ⋅ yi + p(Y ) .
(69)
Em tempo discreto:
RM i = p(Y ) +
∆p
yi .
∆Y
(70)
∆p
yi = CM i
∆Y
(71)
No lucro máximo,
RM i = p(Y ) +
que pode ser reescrita como
 ∆p Y yi 
p(Y ) 1 +
 = CM i .
 ∆Y p(Y ) Y 
(71′)
Note que a participação da empresa i no mercado total é dada por
si =
yi
.
Y
(72)
(72) em (71′):
 ∆p Y

p(Y ) 1 +
si  = CM i .
 ∆Y p (Y ) 
Note também que a elasticidade-preço da demanda é
(73)
ε (Y ) ≡
∆Y
Y
∆p
p
=
∆Y p(Y )
⋅
< 0.
Y
∆p
(74)
Logo,
1
=
ε (Y )
1
∆Y p (Y )
⋅
Y ∆p
=
Y
∆p
∆p Y
⋅
=
⋅
< 0.
∆Y p(Y ) ∆Y p(Y )
(75)
(75) em (73):


1
p(Y ) 1 −
si  = CM i

ε (Y ) 

ou

1 
p (Y ) 1 − ε (Y )  = CM i .


si 

(76)
Se si = 1 , por (72), yi = Y , o que significa que a participação da empresa i no mercado é
total: ela é um monopólio. Fazendo si = 1 em (76) dá, portanto, a mesma condição de máximo
lucro do monopólio puro (Capítulo 24, Seção 3 do livro). O equilíbrio de Cournot vira o de
monopólio puro. Se si = 0 , por (76),

1 
p (Y ) 1 − ε (Y )  = CM i


0 

 1
p(Y ) 1 −  = CM i
 ∞
p (Y ) (1 − 0 ) = CM i
p(Y ) = CM i .
(77)
Fazendo si = 0 em (76) dá, portanto, a mesma condição de máximo lucro da concorrência
pura (Capítulo 22, Seção 3 do livro). O equilíbrio de Cournot vira o de concorrência pura.
Portanto,
ε (Y )
si
(78)
é a elasticidade da curva de demanda com a qual a empresa i se defronta. Quanto menor a
participação da empresa i na indústria, mais elástica a curva de demanda, e vice-versa.
Escolha simultânea do preço: modelo de Bertrand
Neste caso, o equilíbrio de duopólio vira o equilíbrio competitivo. Se a empresa 1 escolher
um preço acima do custo marginal, a empresa 2 fica com o preço igual ao custo marginal e
toma todos os clientes da empresa 1. Assim, a empresa 1 acaba também escolhendo o preço
igual ao custo marginal: equilíbrio de Bertrand.
Cartel
Se puderem, as empresas duopolistas formarão um cartel para virar monopolista e maximizar
a soma dos lucros das duas empresas. O cartel maximiza
max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 ) .
y1 , y2
(79)
Primeiro,
max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 )
y1
p′( y1* + y2* ) ⋅ ( y1* + y2* ) + p ( y1* + y2* ) − c1′( y1* ) = 0
∆p *
p( y1* + y2* ) +
( y1 + y2* ) = CM 1 ( y1* ) .
∆Y
(80)
Segundo,
max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 )
y2
p′( y1* + y2* ) ⋅ ( y1* + y2* ) + p( y1* + y2* ) − c2′ ( y2* ) = 0
∆p *
p( y1* + y2* ) +
( y1 + y2* ) = CM 2 ( y2* ) .
∆Y
(81)
(80) e (81):
CM 1 = CM 2 .
(82)
(80) pode ser reescrita como:
∆p * ∆p *
y1 +
y2 − CM 1 = 0
∆Y
∆Y
∆p *
∆p *
p( y1* + y2* ) +
y1 − CM 1 = −
y2 ,
∆Y
∆Y
p( y1* + y2* ) +
(80′)
onde ∆∆Yp é a inclinação da curva de demanda inversa da indústria. Como a inclinação é
negativa,
∆p
< 0.
∆Y
(83)
(83) em (80′):
p ( y1* + y2* ) +
∆p *
∆p *
y1 − CM 1 = −
y2 > 0 .
∆Y
∆Y
(80″)
Como o lucro marginal da empresa 1 é positivo em (80″), ou seja,
∆π 1
∆p *
≡ p( y1* + y2* ) +
y1 − CM 1 > 0 ,
∆y1
∆Y
(80′′′)
no equilíbrio do cartel a empresa 1 tem incentivos para aumentar unilateralmente a produção,
desde que a outra não o faça.
A receita do cartel é
r ( y1 , y2 ) = p( y1 + y2 ) ⋅ ( y1 + y2 ) .
(84)
No caso linear ((8) em (84)),
r ( y1 , y2 ) = ( a − b( y1 + y2 ) ) ( y1 + y2 )
r ( y1 , y2 ) = a( y1 + y2 ) − b( y1 + y2 ) 2 .
(84′)
A receita marginal é
RM = a − 2bY
RM = a − 2b( y1 + y2 ) .
(85)
Supondo
CM = 0 ,
(86)
o lucro máximo ((85) e (86)) será:
RM = a − 2b( y1* + y2* ) = CM = 0
2b( y1* + y2* ) = a
a
y1* + y2* =
.
2b
(87)
(88)
Como o cartel maximiza o lucro total, o lucro marginal de uma empresa precisa ser igual ao
da outra: se não for, vale a pena para a empresa mais lucrativa produzir mais. Logo, as
inclinações das curvas isolucro (lucros marginais) das duas empresas têm que ser iguais e as
curvas são tangentes ao nível de lucro máximo conjunto Y * . Na Figura 6, a solução em A, por
exemplo, é instável, porque, se a empresa 1 achar que a empresa 2 vai manter a produção
constante e ficar em A, a empresa 1 aumenta a sua produção para ir para a isolucro mais baixa
em B, onde seu lucro aumenta.
Punindo para estabilizar o cartel
No cartel, cada empresa aufere o lucro de monopólio π m . Se uma delas burlar o cartel,
aumenta seu lucro ainda mais para π d . Portanto,
πd > πm .
(89)
A outra empresa pode ameaçar punir a empresa 1 por isso e produzir no nível de equilíbrio de
Cournot, de antes do cartel. O lucro para as duas fica sendo menor, em π c . Portanto,
πc < πm .
(90)
Para a empresa 1, não burlar o cartel gera o valor presente (VP) dos dois períodos de
VPmanter = π m +
cartel
πm
,
γ
(91)
onde γ é a taxa de juros real. Para a mesma empresa, burlar o cartel gera
VPburlar = π d +
cartel
πc
.
γ
A punição funcionará para manter o cartel unido se
(92)
VPmanter > VPburlar .
cartel
(93)
cartel
(91) e (92) em (93):
πm
π
> πd + c
γ
γ
πm πc
−
> πd −πm
γ
γ
πm −πc
> πd −πm
γ
π −π
γ< m c .
πd −πm
πm +
(94)
Por (89) e (90), tanto o numerador como o denominador são positivos. Quanto menor
for a taxa de juros, mais chances de (94) ocorrer e de a punição funcionar. Mas a ameaça da
empresa 2 de retornar ao equilíbrio de Cournot pode não ter credibilidade se o jogo se repetir
por muitos períodos.
© Sergio Da Silva 2010
sergiodasilva.com
Teoria dos Jogos
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 28
Estratégias dominantes
A teoria dos jogos fornece a análise geral da interação estratégica. Por exemplo, o jogador 1
possui dois cartões. Em um deles está escrito “Alto” e, no outro, “Baixo”. O jogador 2 tem
dois cartões: um com a palavra “Esquerda” e outro com a palavra “Direita”. Cada jogador
escolhe um dos cartões e coloca-o na mesa. A matriz de resultados (payoffs) é dada pela
tabela a seguir.
Jogador 2
Esquerda Direita
Alto
1, 2
0, 1
Jogador 1
Baixo
2, 1
1, 0
Se o jogador 1 tiver escolhido “Alto” e o jogador 2 “Esquerda”, então o jogador 1
ganha 1 e o jogador 2 ganha 2. Conhecendo a matriz de resultados, o jogador 1 escolherá
“Baixo” porque (1) se o jogador 2 escolher “Esquerda”, o jogador 1 ganha 2 (e não 1) e (2) se
o jogador 2 escolher “Direita”, o jogador 1 ganha 1 (e não 0). Independentemente do que o
jogador 2 faça, é vantagem para o jogador 1 escolher “Baixo”: esta é sua estratégia
dominante.
Do ponto de vista do jogador 2, é vantagem escolher “Esquerda” independentemente
do que o jogador 1 escolha: (1) se o jogador 1 escolher “Alto”, o jogador 2 ganha 2 (e não 1) e
(2) se o jogador 1 escolher “Baixo”, o jogador 2 ganha 1 (e não 0).
Escolher “Esquerda” é a estratégia dominante do jogador 2, enquanto escolher
“Baixo” é a estratégia dominante do jogador 1. Portanto, sendo conhecida a matriz de
resultados, o equilíbrio será (“Baixo”, “Esquerda”) com o jogador 1 ganhando 2 e o jogador 2
ganhando 1.
Equilíbrio de Nash
Se a matriz de resultados for modificada, como na tabela abaixo, pode ser que não haja
estratégia dominante.
Jogador 2
Esquerda Direita
Alto
2, 1
0, 0
Jogador 1
Baixo
0, 0
1, 2
Se o jogador 2 escolher “Esquerda”, o jogador 1 escolherá “Alto”, porque ganha 2 (e
não 0). Mas se o jogador 2 escolher “Direita”, o jogador 1 agora escolherá “Baixo”, porque
ganha 1 (e não 0).
Do ponto de vista do jogador 2, se o jogador 1 escolher “Alto”, o jogador 2 escolherá
“Esquerda”, porque ganha 1 (e não 0). Mas se o jogador 1 escolher “Baixo”, o jogador 2
escolherá “Direita”, porque ganha 2 (e não 0).
Há dois equilíbrios de Nash: (“Alto”, “Esquerda”) = (2, 1) e (“Baixo”, “Direita”) =
(1, 2).
No equilíbrio de (Cournot-)Nash, a escolha de um jogador é ótima dada a escolha do
outro e a escolha do outro é ótima dada a escolha do primeiro. Isto significa que quando as
escolhas forem reveladas, ninguém vai querer alterar a escolha feita. Quando cada jogador faz
uma escolha e a mantém, isto é uma “estratégia pura”.
Se modificarmos a matriz dos resultados mais uma vez, como na tabela a seguir, pode
ser que não haja mais equilíbrio de Nash com estratégias puras.
Jogador 2
Esquerda Direita
Alto
0, 0
0, −1
Jogador 1
Baixo
1, 0
−1, 3
Estratégias mistas
Se cada jogador escolher de acordo com uma probabilidade, eles adotarão “estratégias mistas”
e poderá existir equilíbrio de Nash no jogo anterior. O jogador 1 agora escolherá “Alto” com
probabilidade π A e “Baixo” com probabilidade 1 − π A . O jogador 2 escolherá “Esquerda”
com probabilidade π E e “Direita” com probabilidade 1 − π E (tabela a seguir).
Jogador 2
Esquerda, π E Direita, 1 − π E
Jogador 1
Alto, π A
0, 0
0, −1
Baixo, 1 − π A
1, 0
−1, 3
Como achar as probabilidades? Se o jogador 2 escolher “Esquerda”, ele ganhará 0 se o
jogador 1 escolher “Alto” e ganhará 0 se o jogador 1 escolher “Baixo”. Mas o jogador 1
escolherá “Alto” com probabilidade π A e “Baixo” com probabilidade 1 − π A . Assim, o valor
esperado de escolher “Esquerda” para o jogador 2 é
VE ( E ) = 0 × π A + 0 × (1 − π A ) = 0 .
(1)
Analogamente, o valor esperado de escolher “Direita” para o jogador 2 é
VE ( D) = −1× π A + 3 × (1 − π A )
VE ( D) = −π A + 3(1 − π A ) .
(2)
No equilíbrio de Nash,
VE ( E ) = VE ( D ) .
(1) e (2) em (3):
0 = −π A + 3(1 − π A )
π A = 3 − 3π A
(3)
4π A = 3
3
πA =
4
(4)
e
1− π A =
1
.
4
(5)
O valor esperado de escolher “Alto” para o jogador 1 é
VE ( A) = 0 × π E + 0 × (1 − π E ) = 0 .
(6)
O valor esperado de escolher “Baixo” para o jogador 1 é
VE ( B) = 1× π E + (−1) × (1 − π E )
VE ( B) = π E − (1 − π E ) .
(7)
No equilíbrio de Nash,
VE ( A) = VE ( B ) .
(8)
(6) e (7) em (8):
0 = π E − (1 − π E )
0 = π E −1+ π E
1 = 2π E
1
πE =
2
(9)
e
1− π E =
1
.
2
(10)
Então, o jogador 1 adota a estratégia mista ("Alto", "Baixo") = ( 34 , 14 ) e o jogador 2 adota a
estratégia mista ("Esquerda", "Direita") = ( 12 , 12 ) , como na tabela abaixo.
Jogador 2
Esquerda, 12 Direita,
Jogador 1
Alto,
Baixo,
3
4
1
4
0, 0
0, −1
1, 0
−1, 3
1
2
Assim, ocorre o equilíbrio em (0, 0) com probabilidade
equilíbrio em (0, −1) com probabilidade 83
probabilidade
1
8
( = 34 × 12 ) .
3
8
( = 34 × 12 ) .
Ocorre o
Ocorre o equilíbrio em (1, 0) com
( = 14 × 12 ) . E ocorre o equilíbrio em (−1,3) com probabilidade 18 ( = 14 × 12 ) .
O valor médio esperado do jogador 1 é, então,
3
3
1
1
VE (1) = 0 × + 0 × + 1× + (−1) ×
8
8
8
8
1 1
VE (1) = − = 0 .
8 8
(11)
E o valor médio esperado do jogador 2 é
3
3
1
1
VE (2) = 0 × + (−1) × + 0 × + 3 ×
8
8
8
8
3
3
VE (2) = 0 − + 0 + = 0 .
8
8
(12)
Dilema dos prisioneiros
Um equilíbrio de Nash não é necessariamente Pareto-eficiente. Um exemplo disso é o dilema
dos prisioneiros da tabela a seguir.
Prisioneiro 2
Confessar Negar
Confessar
−3, −3
0, −6
Prisioneiro 1
Negar
−6, 0
−1, −1
Se o prisioneiro 2 confessar o crime, é melhor para o prisioneiro 1 confessar, pois pega três
meses de prisão ( −3) em vez de seis (−6) . Se o prisioneiro 2 negar, para o prisioneiro 1 é
melhor confessar, pois seria libertado (0) em vez de pegar um mês de prisão ( −1) . Logo,
confessar é a estratégia dominante para o jogador 1 e esta será sua escolha.
Se o prisioneiro 1 confessar, é melhor para o prisioneiro 2 confessar e pegar três meses
(−3) em vez de seis (−6) . Se o prisioneiro 1 negar, é melhor para o prisioneiro 2 também
confessar (0 é melhor do que −1). Logo, confessar também é a estratégia dominante para o
jogador 2 e esta será sua escolha.
Assim, o único equilíbrio de Nash (também em estratégias dominantes) é ambos
confessarem e cada um pegar três meses de prisão. Mas este equilíbrio é ineficiente no sentido
de Pareto, pois há outra situação em que a situação de ambos melhora: a situação em que
ambos negam (um mês para cada) seria eficiente.
Jogos repetidos
Se o jogo do dilema dos prisioneiros for repetido digamos, dez vezes, na décima rodada,
mesmo que os prisioneiros estivessem adotando a estratégia cooperativa “negar”, cada um iria
confessar. Jogar pela última vez é o mesmo que jogar apenas uma vez. Sabendo disso, cada
prisioneiro vai confessar na nona rodada, na oitava rodada e assim por diante. Com um
número fixo de rodadas, cada prisioneiro confessa em todas as rodadas e o único equilíbrio é
“confessar”, que é não-cooperativo e Pareto-ineficiente.
Se o jogo for indefinido, há a possibilidade de surgir uma solução cooperativa (Robert
Axelrod, 1984), através da estratégia “olho por olho”: o prisioneiro 1 coopera negando na
primeira rodada, esperando que o prisioneiro 2 faça o mesmo. Se este não cooperar, o
prisioneiro 1 deixa de cooperar. Se ele cooperar, o prisioneiro 1 continua cooperando e a
situação Pareto-eficiente pode ser atingida.
Um exemplo de dilema dos prisioneiros é um duopólio na estratégia de fixar o preço.
As duas empresas cobrando um preço alto alcançam conjuntamente o maior lucro: situação
cooperativa. Mas se uma cobrar o preço alto valerá a pena para a outra diminuir seu preço e
aumentar seu lucro ainda mais. Portanto, a estratégia dominante de cada empresa é reduzir o
seu preço. O equilíbrio de Nash será a situação com lucros menores. Se o jogo for repetido,
adotando a estratégia “olho por olho” pode ser que ambas as empresas alcancem o equilíbrio
cooperativo.
Jogos sequenciais
Se o jogo da tabela a seguir
Jogador 2
Esquerda Direita
Alto
1, 9
1, 9
Jogador 1
Baixo
0, 0
2, 1
deixar de ser simultâneo e passar a ser sequencial, a sua forma extensiva será como na Figura
1, onde o jogador 1 é o líder.
Para o seguidor (jogador 2), se o jogador 1 já escolheu “Alto”, então é indiferente
escolher entre “Esquerda” e “Direita”: resultados iguais a 9. Mas se o jogador 1 escolheu
“Baixo”, então o jogador 2 escolherá “Direita” (para ganhar 1 em vez de 0).
Para o líder (jogador 1), escolher “Alto” leva a um ganho de 1 sempre. Se escolher
“Baixo” ganha 2, porque o jogador 2 terá que escolher “Direita”. O equilíbrio será
(Baixo, Direita) = (2,1) . Como o jogador 2 não gosta deste resultado de equilíbrio (ele ganhou
1 mas poderia ter ganho 9, caso o jogador 1 tivesse escolhido “Alto”), o jogador 2 pode
ameaçar escolher “Esquerda” para que o jogador 1 fique com 0 em vez de 2. Mas a ameaça do
jogador 2 não tem credibilidade: se o jogador 1 escolher “Baixo”, o jogador 2 terá que
escolher “Direita”, ganhando 1 em vez de 0.
Porém, o jogador 2 pode “comprar” credibilidade limitando sua própria capacidade de
escolher. Por exemplo, ele pode passar sua decisão para um advogado que deverá, por
contrato em cartório (ou por um programa de computador), escolher sempre “Esquerda”.
Sabendo disso, o jogador 1 irá escolher “Alto” e o equilíbrio se modifica em favor do
seguidor para: (Alto, Esquerda) = (1, 9) . Um exemplo com estrutura de jogo similar é o de
uma empresa que escolhe entrar ou não em uma indústria (líder) e a empresa já estabelecida
(seguidora) resolve ou não reduzir seu preço em resposta.
Em um jogo sequencial, uma vez que uma escolha seja feita, os jogadores ficam em
um subjogo contendo as estratégias e resultados daquele ponto em diante, como descrito na
Figura 2.
© Sergio Da Silva 2010
sergiodasilva.com
Teoria dos Jogos II
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 29
Função de melhor resposta
No jogo abaixo, se o jogador 2 escolher “Esquerda”, a melhor resposta do jogador 1 é
escolher “Alto”. Se o jogador 2 escolher “Direita”, a melhor resposta do jogador 1 é escolher
“Baixo”. Por sua vez, se o jogador 1 escolher “Alto”, a melhor resposta do jogador 2 é
escolher “Esquerda”. Se o jogador 1 escolher “Baixo”, a melhor resposta do jogador 2 é
escolher “Direita”.
Jogador 2
Esquerda Direita
Alto
2, 1
0, 0
Jogador 1
Baixo
0, 0
1, 2
Resumo
Escolha do jogador 2
Melhor resposta do jogador 1
Esquerda
Alto
Direita
Baixo
Escolha do jogador 1
Melhor resposta do jogador 2
Alto
Esquerda
Baixo
Direita
As escolhas (Alto, Esquerda), por exemplo, são mutuamente consistentes: equilíbrio de Nash,
onde as crenças e as ações dos jogadores coincidem. As funções de melhor resposta são,
então,
J1* = f1 ( J 2* )
(1)
J 2* = f 2 ( J1* ) .
(2)
e
O equilíbrio de Nash é ( J1* , J 2* ) .
O par J1* e J 2* é apenas uma das possíveis melhores respostas mutuamente
consistentes, no caso (Alto, Esquerda). Note que (Baixo, Direita) também seria uma melhor
resposta.
Se houver apenas uma melhor resposta, a função de reação torna-se a função de
melhor resposta. Então, o equilíbrio de Nash nas funções de melhor resposta é um caso
particular do equilíbrio de Cournot nas funções de reação.
Encontrando o equilíbrio de Nash
Podemos generalizar o jogo anterior para considerar a possibilidade de equilíbrios de Nash em
estratégias puras e em estratégias mistas. Considere o jogo a seguir.
Jogador 2
Esquerda, π E Direita, 1 − π E
Jogador 1
Alto, π A
2,1
0, 0
Baixo, 1 − π A
0, 0
1, 2
A probabilidade de se escolher “Alto” é π A e a probabilidade de se escolher “Esquerda” é
π E . Se π A = 0 , o jogador 1 escolhe “Baixo” com certeza. Se π A = 1 , o jogador 1 escolhe
“Alto” com certeza. Se π E = 0 , o jogador 2 escolhe “Direita” com certeza. Se π E = 1 , o
jogador 2 escolhe “Esquerda” com certeza. Então, as estratégias puras ocorrem quando:
0
1
(3)
0
1
(4)
πA = 
e
πE = 
Se o jogador 1 escolher “Alto” com probabilidade π A e o jogador 2 escolher
“Esquerda” com probabilidade π E , a probabilidade de esses eventos independentes ocorrerem
ao mesmo tempo é dada por π A × π E e o ganho seria 2 para o jogador 1, e 1 para o jogador 2.
Dessa forma, podemos calcular o valor esperado para cada jogador de cada combinação
possível de escolhas. Para o jogador 1, o ganho esperado é:
VE ( J1 ) = π A × π E × 2 + π A × (1 − π E ) × 0 + (1 − π A ) × π E × 0 + (1 − π A )(1 − π E ) × 1
VE ( J1 ) = 2π Aπ E + (1 − π A )(1 − π E ) .
(5)
Para o jogador 2, o ganho esperado é:
VE ( J 2 ) = π A × π E × 1 + π A × (1 − π E ) × 0 + (1 − π A ) × π E × 0 + (1 − π A )(1 − π E ) × 2
VE ( J 2 ) = π Aπ E + 2(1 − π A )(1 − π E ) .
(6)
A expressão (5) pode ser reescrita como:
VE ( J1 ) = 2π Aπ E + 1 − π E − π A + π Aπ E
VE ( J1 ) = 3π Aπ E − π A − π E + 1 .
(5′)
Diferenciando em relação a π A :
dVE ( J1 )
= 3π E − 1 .
dπ A
(7)
Se a probabilidade de jogar “Alto” for aumentada e o jogador 1 aumentar seu ganho esperado,
ou seja,
dVE ( J1 )
>0
dπ A
(8)
então, (8) e (7):
3π E − 1 > 0
3π E > 1
1
πE > .
3
(9)
Se não aumentar, ou seja,
dVE ( J1 )
=0
dπ A
(10)
então, (10) e (7):
3π E − 1 = 0
3π E = 1
1
πE = .
3
(11)
Se a probabilidade de jogar “Alto” for aumentada e o jogador 1 reduzir seu ganho esperado:
dVE ( J1 )
<0
dπ A
(12)
então, (11) e (7):
3π E − 1 < 0
1
πE < .
3
(13)
Em resumo, se o jogador 2 escolher jogar “Esquerda” com probabilidade 13 , então a melhor
resposta para o jogador 1 é não alterar sua probabilidade de jogar “Alto” (trecho horizontal da
curva de reação da Figura 1). Se o jogador 2 escolher π E em qualquer valor acima de 13 , a
melhor resposta para o jogador 1 é aumentar sua probabilidade de jogar “Alto” (trecho
vertical da curva de reação, acima de π E = 13 ). Se o jogador 2 escolher π E em qualquer valor
abaixo de 13 , a melhor resposta para o jogador 1 é reduzir π A (trecho vertical da curva de
reação, abaixo de π E = 13 ).
Analogamente, (6) pode ser reescrita como:
VE ( J 2 ) = π Aπ E + 2 − 2π E − 2π A + 2π Aπ E
VE ( J 2 ) = 3π Aπ E − 2π E − 2π A + 2 .
(6′)
Diferenciando em relação a π E :
dVE ( J 2 )
= 3π A − 2 .
dπ E
(14)
dVE ( J 2 )
=0
dπ E
(15)
2
.
3
(16)
dVE ( J 2 )
>0
dπ E
(17)
2
.
3
(18)
dVE ( J 2 )
<0
dπ E
(19)
2
.
3
(20)
Se
→
πA =
Se
→
πA >
Se
→
πA <
Portanto, se o jogador 1 escolher jogar “Alto” com probabilidade 23 , a melhor resposta para o
jogador 2 é não alterar π E (trecho vertical da curva de reação). Se o jogador 1 escolher π A
acima de 23 , a melhor resposta para o jogador 2 é aumentar π E , pois isto aumenta seu ganho
esperado VE ( J 2 ) (trecho horizontal acima de 23 ). Se o jogador 1 escolher π A abaixo de 23 , a
melhor resposta para o jogador 2 é diminuir π E (trecho horizontal abaixo de 23 ).
Na Figura 1 há três equilíbrios de Nash: dois com estratégias puras (que já
conhecíamos) e um com estratégia mista. Note que as curvas da Figura 1 são curvas de
reação, já que, como vimos, escolhemos para a curva de melhor resposta apenas um
equilíbrio: (Alto, Esquerda).
No equilíbrio de Nash com estratégias mistas ocorre
VE ( J1* ) = VE ( J 2* )
(21)
π A = 1− π E .
(22)
e
Para provar (22), substituímos (5) e (6) em (21):
2π Aπ E + (1 − π A )(1 − π E ) = π Aπ E + 2(1 − π A )(1 − π E )
π Aπ E = (1 − π A )(1 − π E )
π Aπ E = 1 − π E − π A + π Aπ E
0 = 1− π E − π A
π A = 1− π E
(22)
ou
2
1
= 1− .
3
3
(22′)
Jogos de coordenação
Jogos de coordenação são aqueles onde os ganhos dos jogadores seriam maiores se eles
pudessem coordenar suas estratégias. Exemplos: batalha dos sexos, dilema dos prisioneiros,
corrida armamentista, jogo do amarelão.
1.
Batalha dos sexos: mesmo jogo que acabamos de analisar (Alto, Baixo, Esquerda,
Direita).
Moça
Filme de ação Filme de arte
Filme de ação
2, 1
0, 0
Rapaz
Filme de arte
0, 0
1, 2
Há três equilíbrios de Nash: (1) (Ação, Ação) = (2, 1); (2) (Arte, Arte) = (1, 2) e Rapaz
escolhe Ação com probabilidade 23 e Moça escolhe Arte com probabilidade 23 .
Se, por considerações externas, um dos equilíbrios for mais esperado, este será o ponto
focal do jogo. Por exemplo, se o cinema ficar perto da casa do rapaz, talvez ocorra o
equilíbrio no ponto focal (2, 1).
2.
Dilema dos prisioneiros.
Prisioneiro 2
Confessar Negar
Confessar
−3, −3
0, −6
Prisioneiro 1
Negar
−6, 0
−1, −1
A solução não-cooperativa (Confessar, Confessar) = (−3, −3) pode ser evitada se o jogo for
repetido indefinidamente com cada jogador adotando a estratégia “olho por olho”. Os
jogadores também podem assinar um contrato para que a escolha seja (Negar, Negar) =
(−1, −1).
3.
Corrida armamentista.
Ex-URSS
Não construir Construir
Não construir mísseis
4, 4
1, 3
EUA
Construir
3, 1
2, 2
Há dois equilíbrios de Nash com estratégias puras: (1) (Não construir, Não construir) = (4, 4)
e (2) (Construir, Construir) = (2, 2). Para se chegar ao melhor equilíbrio em (4, 4) um jogador
pode permitir unilateralmente a inspeção.
4.
Jogo do amarelão.
John Nash
Desviar Ir em frente
Desviar o carro
0, 0
−1, 1
James Dean
Ir em frente
1, −1
−2, −2
Há dois equilíbrios de Nash com estratégias puras: (1) (Desviar, Ir em frente) = (−1, 1) e (2)
(Ir em frente, Desviar) = (1, −1). James Dean pode botar uma tranca antes de acelerar e
garantir o equilíbrio (1, −1).
Jogos de competição
Jogos de competição são jogos de soma zero, onde os ganhos de um jogador se igualam às
perdas do outro. Exemplo: maioria dos esportes.
Pênalti do futebol.
Goleiro
Pular à esquerda Pular à direita
Chutar à esquerda
50, −50
80, −80
Atacante
Chutar à direita
90, −90
20, −20
Os resultados podem ser interpretados da seguinte maneira: por exemplo, na célula superior
esquerda, o atacante faz gol em 50% das vezes.
Comecemos com o ponto de vista do atacante. É vantagem para ele adotar uma
estratégia mista: chutar à esquerda com probabilidade π E e à direita com probabilidade
1 − π E . Se o goleiro pular à esquerda,
VE (atacante) = 50π E + 90(1 − π E ) .
(23)
Se o goleiro pular à direita,
VE (atacante) = 80π E + 20(1 − π E ) .
(24)
(23) e (24):
50π E + 90(1 − π E ) = 80π E + 20(1 − π E )
30π E = 90 − 90π E − 20 + 20π E
30π E = 70 − 70π E
100π E = 70
π E = 0.70 .
(25)
Se o atacante chutar à esquerda 70% das vezes e o goleiro responder de forma ótima, ele
marcará gol em 62% das vezes. De fato, (25) em (23) (ou em (24)):
VE (atacante) = 50 × 0.7 + 90 × 0.3
= 35 + 27
VE (atacante) = 62 .
(26)
Vejamos agora o ponto de vista do goleiro, que pula à esquerda com probabilidade κ E
e à direita com probabilidade 1 − κ E . Se o atacante chutar à esquerda:
VE (goleiro) = −50κ E + (−80)(1 − κ E )
VE (goleiro) = −50κ E − 80(1 − κ E ) .
(27)
Se o atacante chutar à direita:
VE (goleiro) = −90κ E + (−20)(1 − κ E )
VE (goleiro) = −90κ E − 20(1 − κ E ) .
(28)
(27) e (28):
−50κ E − 80(1 − κ E ) = −90κ E − 20(1 − κ E )
−50κ E + 90κ E = −20(1 − κ E ) + 80(1 − κ E )
40κ E = −20 + 20κ E + 80 − 80κ E
40κ E = 60 − 60κ E
100κ E = 60
κ E = 0.60 .
(29)
Se o goleiro pular à esquerda 60% das vezes e o atacante responder de forma ótima, o
atacante marcará gol em 62% das vezes. De fato, (29) em (27) (ou em (28)):
VE (goleiro) = −50 × 0.6 − 80 × 0.4
= −30 − 32
VE (goleiro) = −62 .
(30)
Compare (26) com (30). As curvas de reação (de melhor resposta) estão na Figura 2.
No equilíbrio de Nash, (23) = (27) ou (24) = (28). Para (23) = (27),
VE (atacante* ) = VE (goleiro* )
50π E + 90 − 90π E = −50κ E − 80 + 80κ E
−40π E + 90 = 30κ E − 80
30κ E + 40π E − 170 = 0 .
(31)
Fora do equilíbrio, para o atacante, diferenciamos (31) em relação a π E :
dVE (atacante)
= 40 > 0
dπ E
(32)
→
π E ↑ → VE (atacante) ↑ e π E ↓ → VE (atacante) ↓.
Para o goleiro, diferenciando (31) em relação a κ E :
dVE (goleiro)
= 30 > 0
dκ E
(33)
→
κ E ↑ → VE (goleiro) ↑ e κ E ↓ → VE (goleiro) ↓. As curvas de reação estão representadas na
Figura 3.
Jogos de coexistência
Jogo de falcões e pombos.
Chupacabra 2
Comportamento de
Comportamento de
falcão
pombo
Chupacabra 1
Comportamento de
falcão
Comportamento de
pombo
−2, −2
4, 0
0, 4
2, 2
Há dois equilíbrios de Nash em estratégias puras (este é o jogo do amarelão de antes), mas há
outro em estratégias mistas.
Se os dois cachorros selvagens adotarem um comportamento de falcão com
probabilidade π H , e de pombo com probabilidade 1 − π H , para o chupacabra 1, seu ganho
esperado de se comportar como falcão será:
VE ( H ) = −2π H + 4(1 − π H ) .
(34)
O seu ganho esperado de se comportar como pombo será:
VE ( D) = 0 ⋅ π H + 2(1 − π H )
VE ( D) = 2(1 − π H ) .
(35)
Cálculo similar vale para o chupacabra 2.
Se
VE ( H ) > VE ( D) ,
(36)
valerá a pena para o chupacabra 1 se comportar como falcão: ele se reproduzirá mais e os seus
descendentes herdarão a tendência de jogar falcão. Se
VE ( H ) < VE ( D) ,
(37)
a população de chupacabras que se comportam como pombos aumentará. Em equilíbrio:
VE ( H ) = VE ( D) .
(38)
(34) e (35) em (38):
−2π H + 4 − 4π H = 2 − 2π H
2 = 4π H
π H = 0.5 .
Chupacabras com comportamento de falcão em igual proporção a outros com comportamento
de pombo é o equilíbrio de Nash, que também é evolucionariamente estável (John Maynard
Smith, 1982).
Se
VE ( H ) > VE ( D) ,
então, (34) e (35) em (36):
−2π H + 4 − 4π H > 2 − 2π H
2 > 4π H
π H < 0.5 .
(36)
Quando π H < 0.5 , o ganho esperado de se comportar como falcão é maior, levando à maior
proporção de comportamento de falcão. Se
VE ( H ) < VE ( D) ,
(37)
então, (34) e (35) em (37):
−2π H + 4 − 4π H < 2 − 2π H
2 < 4π H
π H > 0.5 .
Quando π H > 0.5 , vale a pena ser pombo e a população com esse comportamento aumentará.
Note em
VE ( H ) = −2π H + 4(1 − π H )
(34)
que quando π H = 0 → VE ( H ) = 4 (intercepto da Figura 4). Veja também que em
VE ( D) = 2(1 − π H ) ,
quando π H = 0 → VE ( D) = 2 (intercepto).
(35)
Jogos de compromisso
Para alterar o resultado de um jogo sequencial em seu favor, um jogador pode comprar
credibilidade através de uma escolha que envolva compromisso. Esta escolha precisa ser
observada pelo outro jogador para que este se convença de alterar o comportamento.
Exemplo: o sapo e o escorpião.
Como o jogo é sequencial, se o sapo escolher carregar o escorpião, o escorpião
escolherá ferroar o sapo, pois o ganho do escorpião de 5 superará o de 3. Equilíbrio: (Sapo,
Escorpião) = (−10, 5). O sapo poderia ter feito um acordo para que, antes, o escorpião
amarrasse sua cauda. Equilíbrio: (Sapo, Escorpião) = (5, 3)
Outro exemplo é o jogo “sequestrador e refém”. O refém pede para ser libertado e em
troca promete não identificar o sequestrador.
Porém, se o sequestrador libertar o refém, este vai identificá-lo depois, já que o ganho
de 5 supera o de 3. Equilíbrio: (Sequestrador, Refém) = (−5, 5). Mas o refém pode comprar
credibilidade impondo a si mesmo um custo. Equilíbrio: (Sequestrador, Refém) = (5, 3).
Ainda outro exemplo é o jogo do porco subordinado e do porco dominador (Figura 7).
Porco dominador
Não pressiona a alavanca Pressiona
Não pressiona a alavanca
9, 0
5, 1
Porco subordinado
Pressiona
−1, 6
1, 5
Não pressionar a alavanca é a estratégia dominante do porco subordinado. Equilíbrio
de Nash: (5, 1). Se o porco fosse racional, ele talvez resolvesse comprar pela ACME uma
alavanca que desse choque: não pressionar viraria a estratégia dominante para ele, mas aí
ninguém comeria. Alguma outra sugestão?
Um exemplo final seria o jogo da extorsão (Figura 8), onde um vendedor de uma loja
acha melhor extorquir o cliente, que escolhe ceder: equilíbrio em (1300, 0). Porém, a
resultante má reputação da loja dificultaria a manutenção desse equilíbrio no futuro.
Jogo do ultimato
Os jogadores 1 e 2 precisam dividir $1 (digamos, em moedas de um cent (penny): ¢1) entre si
em três dias de negociação. Se um jogador for indiferente entre duas propostas, por hipótese
ele aceita a preferida pelo oponente.
Jogo sequencial: no primeiro dia, o jogador 1 faz uma oferta.
O jogador 2 a aceita ou não.
Recusando-a, ele faz uma contra-oferta no segundo dia.
O jogador 1 a aceita ou não.
Recusando-a, ele faz a última oferta no terceiro dia.
Se não chegarem a um acordo no terceiro dia, os dois jogadores nada ganham.
O valor futuro de $1 é dado por
VF ($1) = $1(1 + r ) ,
onde r é a taxa de juros real. A utilidade diária da taxa de desconto para o jogador 1 é
u (1 + r ) = α
e, para o jogador 2, é
u (1 + r ) = β .
Assim,
VFpróximo ($1) = $1× α = α para o jogador 1
dia
e
VFpróximo ($1) = $1× β = β para o jogador 2.
dia
Comecemos a análise pelo final do jogo. No terceiro dia, o jogador oferece ¢1 e fica
com ¢99. O jogador 2 prefere ¢1 a ¢0 e o subjogo acaba. Se o jogador 2 for indiferente entre
¢1 e nada, o equilíbrio fica sendo:
( Ganho do jogador 1, Ganho do jogador 2 ) = ($1,
0) .
Por causa disso, no segundo dia o jogador 2 sabe que o jogador 1 vai rejeitar sua oferta
para, no terceiro dia, ficar com $1.
VFpróximo ($1) = α para o jogador 1.
dia
Logo, qualquer oferta do jogador 2 menor do que α será rejeitada pelo jogador 1. Sobra
1 − α para o jogador 2 no segundo dia, que é melhor do que zero no terceiro dia. O jogador 2
oferece α e o jogador 1 aceita. O equilíbrio do subjogo (terceiro dia e segundo dia) fica
sendo:
( Ganho do jogador 1, Ganho do jogador 2 ) = (α , 1 − α ) .
No primeiro dia, o jogador 1 sabe que o jogador 2 garante 1 − α no segundo dia se ele
recusar sua oferta. O jogador 1 então oferece
VFpróximo (1 − α ) = β (1 − α ) para o jogador 2
dia
e fica com 1 − β (1 − α ) . O equilíbrio deste subjogo (terceiro dia, segundo dia e primeiro dia)
fica sendo:
( Ganho do jogador 1, Ganho do jogador 2 ) = (1 − β (1 − α ), β (1 − α )) .
O jogo então se resolve no primeiro dia e, assim, existe o único equilíbrio perfeito de subjogo
acima.
Ariel Rubinstein (1982) mostrou que, para uma negociação sem tempo definido, o
equilíbrio perfeito de subjogo fica sendo:
 1 − β β (1 − α ) 
,
.
1 − αβ 
 1 − αβ
( Ganho do jogador 1, Ganho do jogador 2 ) = 
Note que a soma dos ganhos dos dois jogadores em todos os subjogos é igual a 1.
© Sergio Da Silva 2010
sergiodasilva.com
Economia
Comportamental
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 30
Apresentação das escolhas
O modelo da escolha do consumidor é o melhor ponto de partida de análise, mas incompleto.
Precisamos adicionalmente levar em conta as descobertas da economia comportamental, que
recorre à psicologia.
O modo como as escolhas são apresentadas (framed) ao consumidor pode afetar sua
escolha. Uma calça rasgada sendo vendida em uma loja exclusiva vende mais do que a mesma
calça em uma loja comum. Comprar uma ação vendendo outra deixa o portfólio inalterado,
mas o consumidor quando compra se comporta de forma diferente da situação em que vende.
Se um livro for etiquetado em $29.95 vende mais do que se for em $29.00. Os efeitos da
apresentação da escolha são bem capitalizados pelas técnicas de marketing.
O dilema da doença
Apresentando um tratamento para uma doença de modo positivo pode fazer com que o
consumidor o escolha. Mas ele não o escolheria se fosse apresentado de modo negativo.
Exemplo: uma doença séria ameaça 600 pessoas. Uma apresentação positiva seria:
Tratamento A
salva 200 vidas com certeza
Tratamento B
salva 600 vidas com
1
3
de chance e nenhuma vida com
2
3
de chance
Uma apresentação negativa seria:
Tratamento C
400 pessoas morrem com certeza
Tratamento D
600 pessoas morrem com
2
3
de chance e ninguém morre com
1
3
de chance
O consumidor tende a escolher o tratamento A em vez do B, mas incorre em
inconsistência ao escolher o tratamento D em vez do C. Note que tudo é uma questão de
apresentação porque os tratamentos A e C geram o mesmo resultado. O tratamento A salva
200 vidas com certeza e, portanto, 400 pessoas morrem com certeza, que é como o tratamento
C é apresentado. Os tratamentos B e D são similares também. No tratamento B, o valor
esperado de vidas salvas é:
1
2
VE = 600 + 0 = 200 .
3
3
Portanto, espera-se que 400 pessoas morram. Isto é o valor esperado no tratamento D:
VE =
2
1
1200
600 + 0 =
= 400 .
3
3
3
Se o consumidor for avesso ao risco e escolher salvar 200 vidas com certeza
(tratamento A) em vez de apostar em 200 vidas salvas (tratamento B), espera-se que ele
também escolha o tratamento C em vez da aposta (tratamento D). Porém, quando perdas estão
envolvidas, parece que o consumidor busca o risco.
Mesmo médicos incorrem nesse viés cognitivo: em um experimento, 72% escolheram
o tratamento A, mas apenas 22% escolheram também o equivalente tratamento C.
Efeito-disposição
Um consumidor que recebe de presente ações de uma empresa que ele jamais compraria tende
a demorar muito para vendê-las em caso de baixa contínua. Além disso, tende a vender
apressadamente ações em alta.
Efeito-âncora
A escolha do consumidor pode ser influenciada por informação irrelevante. Em um
experimento, os participantes giravam uma roda da fortuna e depois eram perguntados se o
número de países africanos nas Nações Unidas era maior ou menor do que o número que saiu.
Em seguida, os participantes diziam quais eram suas estimativas do número de países
africanos nas Nações Unidas. O número que saiu na roda da fortuna, apesar de inteiramente
aleatório, influenciava a estimativa do número de países.
Em outro experimento, uma garrafa de vinho cara era mostrada a alunos de MBA.
Depois estes eram perguntados se pagariam pela garrafa o equivalente aos dois últimos dígitos
do seu número de Seguridade Social. Em seguida, os alunos informavam o valor máximo que
estariam dispostos a pagar pela garrafa. O número de Seguridade Social influenciava as
respostas. Aqueles com dígitos 50 ou abaixo queriam pagar $11.62 em média; os com dígitos
acima de 50 queriam pagar $19.95 em média.
Fora do laboratório há outros exemplos. Três empregadores ofereciam entrada
automática em determinado fundo de pensão. Os empregados poderiam optar por sair depois.
Mais de 85% dos trabalhadores aceitaram a entrada automática. O problema é que os
trabalhadores também escolhiam ao mesmo tempo o associado investimento: um fundo de
baixa contribuição e baixo retorno. Os empregadores escolhiam um investimento conservador
para evitar risco e ação judicial.
Escolha de uma só vez
Um professor oferecia a seus alunos a escolha de seis diferentes tipos de lanche. Em uma
escolha, os alunos tinham que escolher logo o lanche das três semanas seguintes. Em outra
escolha, os alunos escolhiam o lanche a ser consumido a cada dia. Na escolha de uma só vez
para o futuro, os alunos escolhiam lanches mais diversificados.
Excesso de variedade
Mais escolha é melhor. Mas isto ignora o custo de se escolher. Em um experimento, dois
estandes de geleia foram expostos em um supermercado. No primeiro, havia 24 sabores e, no
segundo, apenas 6. Embora mais pessoas parassem em frente ao estande com mais variedade,
acabavam comprando mais no estande de menos sabores. Excesso variedade dificulta a
escolha do consumidor.
Em decisões de investimento também ocorre o problema da escolha excessiva.
Descobriu-se que pessoas montando portfólios para a aposentadoria tendiam a ficar satisfeitas
em copiar o portfólio de colegas. Ter autonomia para escolher tem custo.
Preferências construídas
Na microeconomia, as preferências preexistentes explicam o comportamento. Mas os
economistas comportamentais acham que o consumidor cria preferências no ato de escolher:
as preferências são construídas. Exemplo: uma consumidora pega um tomate em uma banca.
Coloca-o de volta. Pega-o de novo. Ela o quer ou não? Talvez ela esteja descobrindo sua
preferência.
Contudo, uma vez descobertas, as preferências ficam embutidas em qualquer escolha.
Uma vez que a escolha seja feita, ela tende a ancorar futuras decisões. Se você tentar comprar
o tomate da consumidora que finalmente resolveu comprá-lo, provavelmente irá pagar mais.
Lei dos pequenos números
Pela lei dos grandes números, a média de uma amostra grande de uma população tende a se
aproximar da média da população. Psicologicamente, porém, os consumidores tendem a ser
influenciados por pequenas amostras. Eles esperam que as amostras sejam iguais à
distribuição de onde elas são extraídas. Exemplo: uma cidadezinha possui dois hospitais. Em
média, nascem por dia 45 bebês no hospital grande e 15 no pequeno. Em 50% das vezes
nascem meninos. Mas isto pode variar de dia para dia. Cada hospital registra os dias em que
nascem mais meninos (> 60%). Que hospital registra mais essas saídas da média em,
digamos, um ano?
Em um questionário para estudantes, 56% responderam que os dois hospitais
registrariam aproximadamente o mesmo número de dias nascendo mais meninos, 22%
responderam que o hospital grande registraria mais dias e apenas 22% responderam
corretamente que o hospital menor registraria mais dias. Para entender, suponha agora que
ocorram em média, por dia, 2 nascimentos no hospital pequeno e 100 no grande. No hospital
pequeno, a probabilidade de que os dois nascimentos sejam de meninos é
1
1
1
2 × 2 = 4 = 0.25 = 25% . Seria bem mais difícil esperar que 25% de todos os 100 nascimentos
do hospital grande fossem de meninos.
O consumidor também não reconhece bem a aleatoridade. Jogando uma moeda, a
chance de sair “cara” três vezes seguidas é 12 × 12 × 12 = 18 = 0.125 . A de sair “coroa” três vezes
seguidas é 0.125. Como os dois eventos “cara três vezes seguidas” ou “coroa três vezes
seguidas” são mutuamente excludentes, a probabilidade é dada por 0.125 + 0.125 = 0.25. Em
um experimento onde pessoas escreviam uma sequência de 150 lances de moeda, somente em
15% das vezes escreveram cara, cara, cara ou coroa, coroa, coroa. Mas deveria ser em 25%
das vezes para ser aleatório. Analogamente, a probabilidade de aparecer cara, cara, cara, cara
ou coroa, coroa, coroa, coroa é
( 12 × 12 × 12 × 12 ) + ( 12 × 12 × 12 × 12 ) = 161 + 161 = 0.0625 + 0.0625 = 0.125 .
No experimento, apenas em 3% das vezes as pessoas escreveram quatro caras ou quatro
coroas em seguida. Já que o correto é 12.5%, as pessoas parecem não entender a teoria de
probabilidade.
Talvez as pessoas, então, não consigam aleatorizar suas decisões nas estratégias mistas
da teoria dos jogos. Em um estudo com jogadores de tênis em Wimbledon, percebeu-se que
eles não conseguiam aleatorizar os serviços de saque, tendendo a mudar de saques à esquerda
e à direita em excesso com relação ao aleatoriamente correto.
Excesso de aversão ao risco
Se sair cara, ganha-se $14; se sair coroa, perde-se $10. Vale a pena para alguém com renda de
$100 mil por ano entrar nessa aposta? Sim, porque
VE = (14 × 12 ) + ( −10 × 12 ) = 7 − 5 = 2 .
Além de o valor esperado ser positivo, a aposta é muito pequena em relação à renda.
Surpreendentemente, poucas pessoas entram em apostas desse tipo, demonstrando um excesso
de aversão ao risco.
Os consumidores também tendem a fazer seguro de pequenos eventos. Exemplo:
seguro de perda de telefone celular. Se o seguro custar $36 por ano e o aparelho novo custar
36
$180, o correto é observar a house odds de 180
= 0.2 . O seguro valerá a pena apenas se a
chance de se perder o celular durante o ano ficar acima de 20%.
Efeito-dotação
Em um experimento, metade dos participantes ganhou canecos de café. Depois, eles
reportaram o preço mais baixo que venderiam os canecos. O preço mediano foi $5.79. Para
aqueles da outra metade do grupo que não ganhou caneco foi pedido que fosse reportado o
preço máximo que eles comprariam caneco. O preço mediano foi $2.25. Como os grupos
foram formados aleatoriamente, esperava-se que os preços medianos de venda e compra
fossem próximos. Parece que quem possui um item atribui um valor a mais para ele do que
quem não o possui.
Falácia dos custos irrecuperáveis
Ao se comprar um item, o montante pago é irrecuperável (sunk cost). Por esta razão, o
comportamento futuro não deve depender do valor pago. Mas, na prática, um estudo em
Boston mostrou que os preços de apartamentos em condomínios cobrados por proprietários
eram fortemente correlacionados aos preços de compra. Porém, para donos que compraram
para investir, e não para morar, os preços eram menos correlacionados.
Desconto semi-hiperbólico
A teoria convencional estabelece que os consumidores descontam o futuro a uma fração
constante δ t . Se u (c) for a utilidade do consumo de hoje, a utilidade do consumo em t anos
no futuro será δ t u (c) , onde 0 < δ < 1 . Este desconto exponencial é o único em que o
comportamento é consistente ao longo do tempo. Para um consumidor com horizonte de
planejamento de três períodos, a função utilidade será
u (c1 ) + δ u (c2 ) + δ 2u (c3 ) ,
a taxa marginal de substituição entre os períodos 1 e 2 será
TMS1,2 =
δ UM (c2 )
UM (c1 )
e a taxa marginal de substituição entre os períodos 2 e 3 será
TMS2,3 =
δ 2UM (c3 ) δ UM (c3 )
=
.
δ UM (c2 ) UM (c2 )
Portanto, a taxa à qual o consumidor deseja substituir o consumo no período 2 pelo consumo
no período 3 é a mesma que a taxa que ele deseja substituir o consumo no período 1 pelo
consumo no período 2.
Na prática, porém, parece ocorrer o desconto semi-hiperbólico ( 1+1kt ). Isto significa que
o consumidor desconta mais o futuro de longo prazo do que o futuro de curto prazo. Pode,
então, ocorrer inconsistência temporal na escolha. Um consumidor que resolve gastar $5000
em uma viagem à Europa pensa em começar a poupar no próximo verão. Quando o verão
chega, ele decide que vai poupar no próximo, e assim por diante: ele protela sempre com o
desconto semi-hiperbólico.
Autocontrole
Protelar pode significar falta de autocontrole. Uma consumidora decide fazer uma dieta, mas
não para hoje e sim para a próxima semana. Também ocorre a tendência para excesso de
comprometimento. Como há a tendência a protelar, o certo seria não deixar para amanhã o
que se pode fazer hoje. Para evitar excesso de comprometimento o certo seria dizer “não”
com mais freqüência. A maneira mais eficaz de lidar com problemas de autocontrole, porém,
é adotar esquemas de comprometimento para ações futuras. Exemplos: pronunciamento
público de comportamento futuro e contratos consigo mesmo e com os outros. Pode-se
comprar autocontrole como no caso de se consumir o serviço de spas, personal trainers e
professores particulares.
Excesso de confiança
Investidores do sexo masculino tendem a transacionar com ativos de modo excessivo. Isto
leva a menores retornos. Em um estudo com 66465 investidores, os que fizeram mais
transações receberam um retorno médio de 11.3% no período contra 18% de retorno para os
que fizeram menos transações. Homens transacionaram 45% a mais do que mulheres na
amostra e, portanto, ficaram com menores retornos. Isto ocorre porque os homens costumam
apresentar mais excesso de confiança em suas próprias habilidades do que as mulheres.
Teoria comportamental dos jogos
Em jogos de ultimato, como vimos, onde o jogador proponente divide $10 entre ele e o outro
jogador, a estratégia dominante para este último é aceitar qualquer oferta maior do que zero.
Sabendo disso, o proponente oferece o mínimo para o outro jogador. O resultado do jogo será
uma divisão em que o proponente fica com quase tudo.
Em experimentos práticos, porém, ofertas abaixo de 30% tendem a ser rejeitadas em
mais da metade das vezes. Porém, quando o proponente sabe que o respondente vai rejeitar
propostas consideradas “injustas”, tende a oferecer 45% do valor e a rejeição cai para cerca de
16%. Mulheres oferecem divisões mais iguais para homens. Algumas culturas valorizam mais
divisões iguais do que outras. Com valores mais altos, divisões mais desiguais costumam ser
aceitas: com $10 sendo dividido pode-se não querer $1; mas com $1000 dificilmente se rejeita
$100. As divisões ficam mais iguais também quando os respondentes anunciam
antecipadamente o mínimo valor que irão aceitar.
As pessoas então possuem um viés para distribuições não desiguais (fairness). Jogos
de punição generalizam jogos de ultimato introduzindo uma terceira parte que observa as
escolhas do proponente e pode resolver reduzir seu ganho. Em experimentos, 60% dos
observadores costumam punir os proponentes que fazem distribuições desiguais. O desejo de
punir também varia de cultura para cultura.
© Sergio Da Silva 2010
sergiodasilva.com
Equilíbrio Geral: Troca
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 31
Na análise de equilíbrio parcial, a demanda e a oferta são afetadas apenas pelo preço do bem.
Mas os preços dos bens substitutos e complementares também afetam a demanda pelo bem e
os preços dos bens vendidos aumentam ou diminuem a renda, que, por sua vez, afeta a
quantidade demandada de outros bens. Assim, no equilíbrio geral consideramos as demandas
e ofertas de vários mercados interagindo para determinar os preços de muitos bens.
Para simplificar, consideramos apenas: (1) mercados competitivos, (2) dois bens e dois
consumidores e (3) duas etapas de análise: troca pura (onde as pessoas não produzem e
possuem dotações de bens fixas) e produção.
Caixa de Edgeworth
Na caixa de Edgeworth representamos as dotações e preferências de dois consumidores, A e
B , em relação a dois bens, 1 e 2 , em um único diagrama. A cesta de consumo do
consumidor A é
X A = ( x1A , x A2 ) ,
(1)
onde x1A é a quantidade consumida por A do bem 1 e xA2 é a quantidade consumida por A do
bem 2 .
Analogamente, a cesta de consumo do consumidor B é
X B = ( x1B , xB2 ) .
(2)
O par de cestas X A e X B é uma alocação. A alocação será factível se a quantidade
total de cada bem for igual ao total disponível. Para a alocação da dotação inicial de cada
consumidor (que cada um traz ao mercado),
ω
A
= (ω1A , ω A2 )
(3)
ω
B
= (ω1B , ωB2 ) .
(4)
e
A alocação factível será
x1A + x1B = ω1A + ω1B
(5)
para o bem 1 , e
xA2 + xB2 = ω A2 + ωB2
(6)
para o bem 2 .
Os consumidores A e B trocarão quantidades dos bens até chegarem às suas
alocações finais. Por exemplo (Figura 1), se houver, inicialmente, 10 unidades do bem 1 e 20
unidades do bem 2 (não há produção), então a alocação na dotação inicial será
ω1A + ω1B = 10
(7)
ω A2 + ωB2 = 20 .
(8)
e
Se a dotação do consumidor A for
ω
A
= (ω1A , ω A2 ) = (7, 12) ,
(9)
então a dotação do consumidor B será
ω
B
= (ω1B , ωB2 ) = (3, 8) .
(10)
Qualquer alocação depois da troca não pode ultrapassar a alocação factível ((7) em (5) e (8)
em (6)):
x1A + x1B = 10
(11)
xA2 + xB2 = 20 .
(12)
e
A caixa de Edgeworth não passa de eixos convencionais que são encaixados, depois de
se rotar os eixos do consumidor B . Qualquer alocação resultante de trocas X A e X B precisa
ser representada dentro da caixa de Edgeworth, já que aquela não pode ultrapassar a alocação
factível. Para cada consumidor, na alocação de dotação inicial passa uma curva de
indiferença, uma vez que à dotação está associado um número de utilidade. A caixa de
Edgeworth representa as dotações e as preferências dos dois consumidores e, assim, captura
as características essenciais que tornam possível a troca.
Troca
Do ponto de vista do consumidor A , todas as combinações de bens situadas acima da curva
de indiferença que passa pelo seu ponto de dotação
são preferíveis. O mesmo ocorre com
o consumidor B . Na caixa de Edgeworth, as combinações que são preferíveis para ambos ao
mesmo tempo situam-se na área hachurada da Figura 2. Quando ocorrer a interseção das
curvas de indiferença, não será possível melhorar a situação de um consumidor sem, com isto,
piorar a do outro: ocorre a eficiência de Pareto na troca. Na Figura 2, esta situação acontece
no ponto M , onde o consumidor A abre mão de 2 unidades do bem 1 para adquirir 1
ω
unidade adicional do bem 2 , enquanto o consumidor B abre mão de 1 unidade do bem 2 para
adquirir 2 unidades do bem 1 . No ponto M ,
TMS A = TMS B .
(13)
Alocações eficientes de Pareto
Em uma alocação eficiente de Pareto: (1) não há como melhorar a situação dos dois
consumidores conjuntamente, ou (2) não há como melhorar a situação de um consumidor
sem, com isto, piorar a do outro, ou (3) todos os ganhos advindos das trocas se esgotaram, ou
ainda (4) não há mais trocas mutuamente vantajosas.
Há muitas situações em que as curvas de indiferença dos dois consumidores se
tangenciam dentro da caixa de Edgeworth. Todos os pontos eficientes perfazem o conjunto de
Pareto. Ligando os pontos encontramos a curva de contrato (Figura 3). A origem para cada
consumidor também é um ponto eficiente, apesar de não haver tangência: caso de fronteira.
Na origem do consumidor A , por exemplo, este não possui nada dos dois bens e o
consumidor B possui tudo: esta situação é eficiente porque a situação de A somente poderá
ser melhorada tirando-se de B . Portanto, a curva de contrato passa pelas origens.
Trocas com leiloeiro
Podemos imaginar muitos consumidores e que um deles se torne um leiloeiro que escolhe um
preço para o bem 1, um preço para o bem 2 , e os anuncia aos consumidores do tipo A e do
tipo B . Cada grupo calcula quanto vale sua dotação aos preços ( p1 , p2 ) e decide quanto de
cada bem comprar. A esses preços, a demanda do grupo A não necessariamente se iguala à
oferta do grupo B para cada um dos bens. A demanda bruta do grupo A pelo bem 1 , x1A , é a
quantidade desejada ao preço anunciado. Para o consumidor A , a demanda líquida (ou
demanda excedente), e1A , é o que fica depois de retirarmos da demanda bruta a dotação inicial
do bem 1 :
e1A = x1A − ω1A .
Para o bem 2 :
(14)
eA2 = x A2 − ω A2 .
(15)
Para o consumidor B :
e1B = x1B − ω1B
(16)
eB2 = xB2 − ωB2 .
(17)
e
A demanda excedente é, portanto, a diferença entre o que um consumidor deseja consumir de
um bem e o que inicialmente possui do bem.
Na Figura 4, para a relação de preços
p1
p2
, as TMS dos dois grupos são diferentes. Os
preços anunciados p1 e p2 não levam, portanto, os mercados ao equilíbrio. O leiloeiro então
aumenta o preço do bem com demanda excedente (e a reta orçamentária rota em torno da
dotação
) até que a demanda excedente desapareça. No equilíbrio de mercado competitivo
resultante (Figura 5), o conjunto de preços ( p1* , p2* ) permite que cada grupo escolha a cesta
mais preferida pela qual pode pagar e as escolhas dos dois grupos se compatibilizam, já que a
demanda se iguala à oferta nos dois mercados e
ω
TMS A = TMS B =
p1
.
p2
(18)
Monopólio na caixa de Edgeworth
Sem leiloeiro, o consumidor A (monopolista) fixa o preço para B , que resolve quanto trocar
ao preço fixado. O consumidor A conhece o comportamento da demanda de B através da
sua curva de preço-consumo, que representa todas as escolhas ótimas de B a diferentes
preços (Capítulo 6). O consumidor A escolhe a sua curva de indiferença mais alta sobre a
curva de preço-consumo de B : a curva de indiferença de A tangencia a curva de preço-
consumo de B . Escolher o preço no ponto de tangência equivale a escolher a reta
orçamentária passando por ele até o ponto de dotação (Figura 6).
Como a curva de indiferença de A não tangencia a curva de indiferença de B , o
equilíbrio geral de monopólio é ineficiente. Porém, o consumidor A pode também ser um
monopolista discriminador perfeito de preço se conseguir vender cada unidade do bem 1 pelo
preço de reserva de B . Na curva de indiferença de B que passa pelo ponto de dotação, o
consumidor A vende a primeira unidade do bem 1 à esquerda de
a certo preço (Figura 7).
Depois vende outra unidade a outro preço no ponto mais à esquerda da curva de indiferença
de B . A consegue ficar sobre a curva de indiferença de B , pois cada preço é escolhido de
modo a deixar B exatamente indiferente entre comprar ou não a unidade do bem 1 . A deixa
de vender quando as curvas de indiferença se tangenciarem. A consegue extrair todo o
excedente do consumidor de B , enquanto este continua no equilíbrio na mesma situação em
que começou no ponto de dotação. O equilíbrio é eficiente no sentido de Pareto.
ω
A álgebra do equilíbrio
A função demanda do consumidor A pelo bem 1 é
x1A = x1A ( p1 , p2 )
(19)
e a função demanda do consumidor B pelo bem 1 é
x1B = x1B ( p1 , p2 ) .
(20)
As funções demanda de A e B pelo bem 2 são
xA2 = x A2 ( p1 , p2 )
e
(21)
xB2 = xB2 ( p1 , p2 ) .
(22)
No equilíbrio geral, a demanda total de cada bem 1 e 2 deve se igualar à oferta total:
x1A ( p1* , p2* ) + x1B ( p1* , p2* ) = ω1A + ω1B
(23)
xA2 ( p1* , p2* ) + xB2 ( p1* , p2* ) = ω A2 + ωB2
(24)
x1A ( p1* , p2* ) − ω1A + x1B ( p1* , p2* ) − ω1B = 0
(23′)
xA2 ( p1* , p2* ) − ω A2 + xB2 ( p1* , p2* ) − ωB2 = 0 .
(24′)
e
ou
e
Considerando (14), (15), (16) e (17) em (23′) e (24′):
e1A ( p1* , p2* ) + e1B ( p1* , p2* ) = 0
(25)
eA2 ( p1* , p2* ) + eB2 ( p1* , p2* ) = 0 .
(26)
e
A soma das demandas excedentes é igual a zero ou o excesso de demanda (oferta) do
consumidor A se iguala ao excesso de oferta (demanda) do consumidor B.
Em geral (mesmo fora do equilíbrio), a demanda excedente agregada pelo bem 1 é
dada por:
z1 ( p1 , p2 ) = e1A ( p1 , p2 ) + e1B ( p1 , p2 )
(27)
ou, considerando (14) e (15),
z1 ( p1 , p2 ) = x1A ( p1 , p2 ) + x1B ( p1 , p2 ) − ω1A − ω1B .
(28)
Similarmente, para o bem 2 , a demanda excedente agregada é
z2 ( p1 , p2 ) = eA2 ( p1 , p2 ) + eB2 ( p1 , p2 )
(29)
z2 ( p1 , p2 ) = x A2 ( p1 , p2 ) + xB2 ( p1 , p2 ) − ω A2 − ωB2 .
(30)
ou
No equilíbrio, a demanda agregada excedente de cada bem é zero, ou seja, (25) e (26) em (29)
e (30):
z1 ( p1* , p2* ) = 0
(31)
z2 ( p1* , p2* ) = 0 .
(32)
e
Lei de Walras
Pela lei de Walras, o valor da demanda agregada excedente dos dois bens em conjunto é
idêntico a zero. Isto vale para quaisquer preços p1 e p2 , e não apenas para os de equilíbrio:
p1 z1 ( p1 , p2 ) + p2 z2 ( p1 , p2 ) ≡ 0 .
(33)
Para provar, somamos as restrições orçamentárias dos dois consumidores. Quando o
conjunto orçamentário do consumidor A se reduz à reta orçamentária, temos
p1 x1A ( p1 , p2 ) + p2 x A2 ( p1 , p2 ) ≡ p1 ω1A + p2ω A2
(34)
p1 ( x1A ( p1 , p2 ) − ω1A ) + p2 ( x A2 ( p1 , p2 ) − ω A2 ) ≡ 0 .
(35)
ou
(14) e (15) em (35):
p1e1A ( p1 , p2 ) + p2 eA2 ( p1 , p2 ) ≡ 0 .
(36)
Logo, o valor da demanda excedente do consumidor A é zero: o valor da quantidade
excedente que ele deseja comprar do bem 1 (bem 2 ) tem que ser igual ao valor da quantidade
excedente que ele deseja vender do bem 2 (bem 1 ).
Para o consumidor B , temos equações semelhantes:
p1 ( x1B ( p1 , p2 ) − ω1B ) + p2 ( xB2 ( p1 , p2 ) − ωB2 ) ≡ 0
(37)
p1e1B ( p1 , p2 ) + p2 eB2 ( p1 , p2 ) ≡ 0 .
(38)
e
Somando (35) e (37):
(
p (x
) (
( p , p ) −ω ) ≡ 0
)
(
)
p1 x1A ( p1 , p2 ) − ω1A + p1 x1B ( p1 , p2 ) − ω1B + p2 x A2 ( p1 , p2 ) − ω A2 +
2
2
B
1
2
2
B
(39)
(14), (15), (16) e (17) em (39):
p1e1A ( p1 , p2 ) + p1e1B ( p1 , p2 ) + p2eA2 ( p1 , p2 ) + p2 eB2 ( p1 , p2 ) ≡ 0
(
)
(
)
p1 e1A ( p1 , p2 ) + e1B ( p1 , p2 ) + p2 eA2 ( p1 , p2 ) + eB2 ( p1 , p2 ) ≡ 0 .
(40)
(27) e (29) em (40):
p1 z1 ( p1 , p2 ) + p2 z2 ( p1 , p2 ) ≡ 0 ,
(33)
que é a lei de Walras.
Como o valor da demanda excedente de cada consumidor é zero, o valor da soma das
demandas excedentes dos dois consumidores é zero (lei de Walras). A lei de Walras vale para
todos os preços porque a restrição orçamentária de cada consumidor se aplica a qualquer
preço. Em particular, a lei de Walras vale para os preços de equilíbrio onde
z1 ( p1* , p2* ) = 0
(31)
z2 ( p1* , p2* ) = 0 .
(32)
e
Mas (32) fica redundante pela lei de Walras para os preços de equilíbrio:
p1 z1 ( p1* , p2* ) + p2 z2 ( p1* , p2* ) = 0
(41)
(31) em (41):
p2 z2 ( p1* , p2* ) = 0 .
(43)
Para
p2 > 0 ,
(44)
(44) em (43):
z2 ( p1* , p2* ) = 0 .
(32)
Logo, usando a lei de Walras, a descrição do equilíbrio geral por (31) é suficiente.
Se a demanda pelo bem 1 for igual à oferta do bem 1 ao preço p1* , logo a demanda
pelo bem 2 precisa ser igual à oferta do bem 2 . Ou, se o mercado do bem 2 estiver em
equilíbrio, então o mercado do bem 1 precisa também estar em equilíbrio. Em geral, se k − 1
mercados estiverem em equilíbrio, o mercado do bem k também estará com demanda igual à
oferta.
Preços relativos
Em um modelo de equilíbrio geral de k bens, a lei de Walras implica que há apenas k − 1
equações independentes. Surge o problema de encontrar os k preços do modelo com apenas
k − 1 equações. Sabemos que multiplicando os preços e a renda por um número positivo t , o
conjunto orçamentário (e a reta orçamentária) não varia e, portanto, a cesta ótima também não
(Capítulo 2). Aqui, a renda m corresponde ao valor da dotação. Por exemplo, para o
consumidor A : p1 ω1A + p2ω A2 .
Se ( p1* , p2* ,...) for equilíbrio, então (tp1* , tp2* ,...) também será. Podemos escolher
t=
1
>0
p1
(
(45)
)
e ficar com 1, pp12 , pp13 ,... , onde o primeiro bem é o numerário e os preços restantes ficam
sendo os preços relativos. Ficamos então com apenas k − 1 preços relativos e o modelo de
equilíbrio geral permite encontrá-los com as k − 1 equações independentes.
Como exemplo, tomemos a utilidade Cobb-Douglas. As funções utilidade CobbDouglas para os dois consumidores A e B são dadas por (Capítulo 6):
u A = ( x1A , x A2 ) = ( x1A ) a ( x A2 )1−a
(46)
uB = ( x1B , xB2 ) = ( x1B )b ( xB2 )1−b ,
(47)
e
onde a e b são parâmetros. As correspondentes funções demanda são (Capítulo 6), para o
consumidor A ,
x1A ( p1 , p2 , mA ) = a
mA
p1
(48)
x A2 ( p1 , p2 , mA ) = (1 − a)
mA
p2
(49)
e, para o consumidor B ,
x1B ( p1 , p2 , mB ) = b
mB
p1
xB2 ( p1 , p2 , mB ) = (1 − b)
(50)
mB
.
p2
(51)
Cada consumidor começa com as retas orçamentárias:
mA = p1ω1A + p2ω A2
(52)
mB = p1ω1B + p2ωB2 .
(53)
Considerando (48), (49), (50) e (51) em (28) e (30), encontramos as demandas agregadas
excedentes:
z1 ( p1 , p2 ) = a
mA
m
+ b B − ω1A − ωB1
p1
p1
(54)
e
z2 ( p1 , p2 ) = (1 − a)
mA
m
+ (1 − b) B − ω A2 − ωB2 .
p2
p2
(55)
(52) e (53) em (54) e (55):
p1ω1A + p2ω A2
p1ω1B + p2ωB2
z1 ( p1 , p2 ) = a
+b
− ω1A − ω1B
p1
p1
z2 ( p1 , p2 ) = (1 − a)
p1ω1A + p2ω A2
p ω1 + p2ωB2
+ (1 − b) 1 B
− ω A2 − ωB2 .
p2
p2
(56)
(57)
As funções demandas agregadas excedentes, z1 e z2 , satisfazem a lei de Walras:
p1 z1 + p2 z2 ≡ 0 .
(33)
Para provar, substituímos (48), (50), (52) e (53) em (56):
z1 = x1A + x1B − ω1A − ω1B .
(56′)
(49), (51), (52) e (53) em (57):
z2 = x A2 + xB2 − ω A2 − ωB2 .
(57′)
(56′) e (57′) em (33):
p1 ( x1A + x1B − ω1A − ω1B ) + p2 ( x A2 + xB2 − ω A2 − ωB2 ) ≡ 0 .
(58)
(14), (15), (16), (17) em (58):
p1 (e1A + e1B ) + p2 (eA2 + eB2 ) ≡ 0 .
(59)
Substituindo (25) e (26) em (59), confirmamos que a lei de Walras se aplica.
Achando o preço relativo de equilíbrio geral
Se fizermos o bem 2 o numerário, então,
p2 = 1
(60)
e p1 torna-se o preço relativo do bem 1 , ou seja,
p1 =
p1 p1
= .
p2 1
(61)
Assim, as duas equações de demanda agregada excedentes ficam apenas em função de p1 .
(60) em (56) e (57):
p1ω1A + ω A2
p ω1 + ωB2
+b 1 B
− ω1A − ωB1
p1
p1
(62)
z2 ( p1 ,1) = (1 − a)( p1ω1A + ω A2 ) + (1 − b)( p1ω1B + ωB2 ) − ω A2 − ωB2 .
(63)
z1 ( p1 ,1) = a
e
Quando o preço for de equilíbrio, a demanda excedente de cada bem será zero, como vimos
(equações (31) e (32)). Escolhendo a equação para o bem 1, (31) e (62):
p1*ω1A + ω A2
p1*ω1B + ωB2
z1 ( p ,1) = a
+b
− ω1A − ω1B = 0
*
*
p1
p1
a
b
aω1A + * ω A2 + bω1B + * ωB2 − ω1A − ω1B = 0
p1
p1
1
(aω A2 + bωB2 ) = ω1A + ω1B − aω1A − bω1B
*
p1
*
1
(64)
1
(aω A2 + bωB2 ) = (1 − a)ω1A + (1 − b)ω1B
*
p1
aω A2 + bωB2
p =
.
(1 − a)ω1A + (1 − b)ωB1
*
1
(65)
Este é o preço de equilíbrio geral com preferências Cobb-Douglas. (Note que ele também
poderia ter sido encontrado usando (32) e (63)).
Existência do equilíbrio
Contar k − 1 preços relativos em número igual a k − 1 equações garante encontrar
formalmente os preços de equilíbrio, mas isto não significa que de fato o equilíbrio exista.
Para isso, as funções demandas excedentes agregadas precisam ser contínuas. Isto significa
que pequenas alterações nos preços não levam a grandes alterações na demanda agregada.
Isto, por sua vez, exige que cada função demanda individual seja contínua, o que é garantido
se as preferências forem convexas. Ou, então, se os consumidores fizerem pequenas compras
em relação ao tamanho dos mercados, o que é garantido se houver concorrência pura.
Equilíbrio e eficiência
Na Figura 5, a alocação de equilíbrio é eficiente no sentido de Pareto, pois o conjunto das
cestas preferidas por A não intercepta o conjunto das cestas preferidas por B . Como as
curvas de indiferença se tangenciam, não há alocações que os dois consumidores prefiram à
alocação de equilíbrio. A alocação eficiente deixa cada consumidor tão bem quanto possível,
dada a utilidade do outro. Sendo o nível de utilidade de B igual a u , o consumidor A
maximiza
max u A ( x1A , x A2 )
x1A , x 2A , x1B , xB2
(66)
sujeito a
uB ( x1B , xB2 ) = u
(67)
x1A + x1B = ω1
(68)
x A2 + xB2 = ω 2 ,
(69)
onde ω1 é a quantidade total disponível do bem 1 :
ω1 = ω1A + ω1B
(70)
e ω 2 é a quantidade total disponível do bem 2 :
ω 2 = ω A2 + ωB2 .
(71)
O que encontraremos é a alocação ( x1A , x A2 , x1B , xB2 ) que torna a utilidade do consumidor A
máxima para um número fixo de utilidade de B e toda a quantidade disponível dos bens seja
utilizada.
Montando o lagrangeano:
(
)
L = u A ( x1A , x A2 ) − λ uB ( x1B , xB2 ) − u − µ1 ( x1A + x1B − ω1 ) − µ2 ( x A2 + xB2 − ω 2 ) ,
(72)
onde λ é o multiplicador de Lagrange na restrição de utilidade e µ1 e µ2 são os
multiplicadores de Lagrange na restrição dos recursos. Diferenciando parcialmente e
igualando a zero:
∂L ∂u A
=
− µ1 = 0
∂x1A ∂x1A
(73)
∂L ∂u A
=
− µ2 = 0
∂x A2 ∂x A2
(74)
∂u
∂L
= −λ 1B − µ1 = 0
1
∂xB
∂xB
(75)
∂u
∂L
= −λ B2 − µ2 = 0 .
2
∂xB
∂xB
(76)
A TMS A do consumidor A é encontrada dividindo (73) por (74):
∂u A
TMS A =
∂x1A
∂u A
=
∂x A2
µ1
.
µ2
(77)
A TMS B de B é encontrada dividindo (75) por (76):
∂u B
TMS B =
∂x1B
∂u B
∂xB2
=
µ1
.
µ2
(78)
(77) e (78):
TMS A = TMS B .
(79)
Portanto, na alocação eficiente de Pareto, as taxas marginais de substituição dos dois
consumidores coincidem: mesma inclinação das curvas de indiferença. Se não fosse assim,
haveria alguma troca que melhoraria a situação de ambos.
Além disso, se os dois consumidores se defrontarem com os mesmos preços para os
dois bens, ou seja,
∂u A
∂x1A
∂u A
=
p1
p2
(80)
=
p1
p2
(81)
∂x 2A
e
∂u B
∂x1B
∂u B
∂xB2
que vigora no equilíbrio geral competitivo, então, (77), (78), (80) e (81):
p1 µ1
=
.
p2 µ2
(82)
Por isso, os multiplicadores de Lagrange µ1 e µ2 são chamados de preços de eficiência ou
preços-sombra.
Primeiro teorema do bem-estar
Se fizermos a suposição de que o equilíbrio competitivo não é eficiente no sentido de Pareto,
isto nos levará a uma contradição. Se o equilíbrio não for eficiente, então haverá outra
alocação factível ( y1A , y A2 , y1B , yB2 ) tal que
y1A + y1B = ω1A + ω1B
(83)
y A2 + yB2 = ω A2 + ωB2
(84)
( y1A , y A2 )
A
( x1A , x A2 )
(85)
( y1B , yB2 )
B
( x1B , xB2 ) ,
(86)
e
onde o símbolo A se refere às preferências de A e B se refere às preferências de B . No
equilíbrio, cada consumidor precisa comprar a melhor cesta pela qual pode pagar, que é
( x1A , x A2 , x1B , xB2 ) . Se ( y1A , y A2 , y1B , yB2 ) for melhor do que a cesta de equilíbrio competitivo
( x1A , x A2 , x1B , xB2 ) , então os consumidores não poderão pagar por ela; ou, o que é a mesma coisa,
a cesta ( y1A , y A2 , y1B , yB2 ) custa mais do que os consumidores podem pagar:
p1 y1A + p2 y A2 > p1 ω1A + p2ω A2
(87)
p1 y1B + p2 yB2 > p1 ω1B + p2ωB2 .
(88)
Somando (87) e (88):
p1 y1A + p2 y A2 + p1 y1B + p2 yB2 > p1 ω1A + p2ω A2 + p1 ω1B + p2ωB2
(89)
p1 ( y1A + y1B ) + p2 ( y A2 + yB2 ) > p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) .
(90)
(83) e (84) em (90):
p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) > p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) .
(91)
A equação (91) não pode ser verdadeira, já que os termos à esquerda e à direita da
desigualdade são iguais.
Pelo primeiro teorema do bem-estar, uma alocação alcançada por um conjunto de
mercados competitivos será necessariamente eficiente no sentido de Pareto. Não há referência
à distribuição dos recursos: se o consumidor A tiver quase tudo na sua dotação inicial, ele
acabará tendo quase tudo após as trocas.
Limites do primeiro teorema do bem-estar
O primeiro teorema do bem-estar afirma que qualquer equilíbrio competitivo é Paretoeficiente. Se estivermos lidando com um problema de escassez que envolva muitos
consumidores, a instituição do mercado competitivo faz com que se economize na informação
que cada consumidor teria que ter em caso contrário. Os consumidores não precisam saber
como os bens são produzidos, quem é o dono dos bens ou de onde vêm os bens. Eles precisam
apenas conhecer os preços dos bens. Com eles, os consumidores determinam suas demandas
e, se os mercados forem competitivos, o resultado será eficiente.
Porém, há três hipóteses implícitas na análise de equilíbrio geral para que o primeiro
teorema funcione: (1) os consumidores não se preocupam com o consumo dos outros. Se B
estiver consumindo cigarro, mesmo no equilíbrio, A poderia melhorar sua situação pagando a
B para fumar menos. Quando houver externalidade no consumo, o equilíbrio competitivo não
será Pareto-eficiente (Capítulo 34). (2) Há muitos consumidores que agem competitivamente.
Se forem apenas dois (como na caixa de Edgeworth), os consumidores adotariam
comportamento estratégico com possíveis equilíbrios de Nash Pareto-ineficientes. (3) As
compras dos consumidores são pequenas em relação ao tamanho do mercado. Não sendo
assim, o equilíbrio competitivo não existirá.
Segundo teorema do bem-estar
Na tangência das curvas de indiferença, o equilíbrio é Pareto-eficiente. A inclinação da reta
orçamentária nesse ponto dá os preços relativos de equilíbrio. Isto é sempre verdade para
curvas de indiferença convexas (Figura 8).
Qualquer dotação, como
, que coloque os dois consumidores sobre a reta
orçamentária, levará ao equilíbrio eficiente no ponto de tangência das curvas de indiferença.
Se as preferências não forem convexas, isto não acontece (Figura 9).
Portanto, pelo segundo teorema do bem-estar, se os consumidores tiverem preferências
convexas, então haverá sempre um conjunto de preços tal que cada alocação eficiente de
Pareto será um equilíbrio de mercado competitivo para uma apropriada dotação.
ω
Implicações do segundo teorema do bem-estar
Os preços têm dois papeis: alocativo e distributivo. O papel alocativo indica a escassez
relativa e o papel distributivo determina quanto de diferentes bens os consumidores podem
comprar. O segundo teorema do bem-estar implica que esses dois papeis se encontram
separados. Pode-se redistribuir as dotações de bens para se determinar quanto de riqueza cada
consumidor fica e, depois, usar os preços para indicar a escassez relativa. Em um mercado
competitivo, a decisão marginal de se consumir mais ou menos de um bem depende do preço,
que mede como os outros consumidores valorizam o bem na margem (considerações de
eficiência). Se o governo taxar o valor das dotações, ele redistribuirá poder de compra entre os
consumidores sem alterar a eficiência. Pelo segundo teorema, a troca a partir de qualquer
dotação resultará em uma alocação Pareto-eficiente. O governo deverá, no caso, recorrer a
impostos sobre o montante global da dotação (lump-sum taxes) e evitar impostos que afetem a
escolha dos consumidores: impostos distorcionários.
© Sergio Da Silva 2010
sergiodasilva.com
Equilíbrio Geral: Produção
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 32
A economia de Robinson Crusoe
Crusoe é ao mesmo tempo consumidor e produtor. Consome lazer quando fica na praia sem
fazer nada. Produz quando resolve coletar cocos. Produzindo, mais terá para comer, mas
também terá menos tempo para lazer. A Figura 1 é semelhante à de consumo e lazer (Capítulo
9). Mas como “lazer” é substituído por “trabalho”, o formato convexo em relação à origem
das curvas de indiferença é invertido. Enquanto lazer é um bem, trabalho é um “mal”,
possuindo, portanto, curvas de indiferença de inclinação positiva.
A função produção mostra a relação entre quanto Crusoe trabalha e quantos cocos
coleta. Mais trabalho, mais cocos. À medida que as horas de trabalho são aumentadas, ele
coleta menos cocos: há retornos decrescentes. Dada a tecnologia para coletar cocos, a curva
de indiferença mais alta que tangencia a função produção determina o consumo ótimo de
cocos e as horas de trabalho escolhidas. Como a inclinação da curva de indiferença se iguala à
inclinação da função produção, a taxa marginal de substituição entre consumo de cocos e
lazer (inclinação da curva de indiferença) é igual ao produto marginal de uma hora extra de
trabalho (inclinação da função produção).
Crusoe resolve se comportar inteiramente como consumidor em um dia e, no seguinte,
inteiramente como produtor. Como consumidor, ele se comporta como trabalhador e recebe
renda. Como produtor, se comporta como gerente da empresa Crusoe S.A. e realiza lucro, que
manda para o único acionista (ele mesmo ☺), que é o consumidor.
No dia de consumir, ele escolhe quanto comprar da empresa usando seus dividendos.
Crusoe inventa uma moeda e fixa o preço de uma unidade de coco em uma unidade
monetária: o preço do coco (numerário) é, portanto, igual a um, restando saber qual é o salário
w.
No dia de produzir, seu lucro π é dado pela produção de cocos vendida C (o preço do
coco é um) menos o custo da mão-de-obra wL . Dado π , a reta isolucro é:
π = C − wL
(1)
C = π + wL ,
(1′)
ou
onde a inclinação é w e o intercepto vertical é π . O lucro é maximizado quando a reta
isolucro tangencia a função produção (Figura 2). Logo, o produto marginal do trabalho
(inclinação da função produção) se iguala ao salário (inclinação da reta isolucro) no lucro
máximo. Conhecendo o salário ótimo w* , a empresa escolhe quantas horas de mão-de-obra
contratar L* para produzir C * cocos. O lucro de π * unidades monetárias pode comprar π *
cocos, já que o preço do coco é igual a um.
No dia de consumir, a reta isolucro vira a reta orçamentária. Crusoe pode consumir sua
dotação (consumir π * cocos e sua dotação de lazer) ou pode trabalhar algumas horas até a
quantidade máxima de L horas. Dado o salário w* , ele escolhe consumir C * cocos (mais do
que os π * cocos da dotação) e trabalhar L* horas. Sua utilidade é máxima onde uma curva de
indiferença tangenciar a reta orçamentária: a TMS entre consumo e trabalho (inclinação da
curva de indiferença) se iguala ao salário (inclinação da reta orçamentária).
Superpondo as Figuras 2 e 3 (Figura 4), vemos que o comportamento de simular um
mercado de Crusoe (consumidor e produtor separados) gera o mesmo resultado de não separar
consumo e produção, dado pela Figura 1. No equilíbrio,
TMS = PML = w .
(2)
Se houvesse retornos constantes no emprego de mão-de-obra, usando duas vezes mais
horas de trabalho seria produzido o dobro. A função produção seria uma reta que passa pela
origem (Figura 5). Com retornos constantes, a empresa competitiva opera com lucro zero
(Capítulo 19, seção 10): a reta orçamentária passa pela origem também, coincidindo com a
função produção.
Se houvesse retornos crescentes no emprego de horas de trabalho, a função produção
seria côncava (Figura 6). Com retornos crescentes, os custos médios são maiores do que os
custos marginais, o que leva a lucros negativos no caso competitivo (veja o conceito de EME
do Capítulo 24). Se as empresas tiverem retornos crescentes de escala, no nível de equilíbrio
da produção elas iriam querer produzir mais aos preços do equilíbrio competitivo. Esta nãoconvexidade da função produção cria problemas para o funcionamento do mercado
competitivo: os preços não fornecem toda a informação necessária para a escolha da alocação
eficiente. Precisa-se de informação adicional com relação às inclinações das funções produção
e às curvas de indiferença em pontos afastados da escala atual de operações. Porém, se houver
apenas regiões pequenas de retornos crescentes em relação ao tamanho do mercado, a nãoconvexidade não cria problemas.
Primeiro teorema do bem-estar
Um equilíbrio competitivo é Pareto-eficiente em uma economia de pura troca. Este que é o
primeiro teorema do bem-estar também se aplica a uma economia com produção. Se todas as
empresas forem maximizadoras de lucro, o equilíbrio competitivo será Pareto-eficiente. Como
no caso da economia de troca pura, (1) o primeiro teorema diz que a maximização de lucro
assegura apenas eficiência, não justiça distributiva. (2) O primeiro teorema faz sentido apenas
se o equilíbrio competitivo realmente existir, ou seja, se não houver muitos casos de retornos
crescentes de escala. (3) O primeiro teorema é válido apenas se as escolhas de uma firma não
afetarem as possibilidades de produção das outras, o que significa que não podem ocorrer
externalidades na produção. As decisões das firmas também não podem afetar as escolhas dos
consumidores, ou seja, não podem ocorrer externalidades no consumo.
Segundo teorema do bem-estar
Para uma economia de pura troca, cada alocação eficiente de Pareto pode ser um equilíbrio
competitivo se as preferências forem convexas. Se os conjuntos de produção das empresas
forem também convexos, o segundo teorema se aplica para a economia com produção. Porém,
com retornos crescentes de escala, o segundo teorema não se aplica.
Possibilidades de produção
Supomos agora que Crusoe coleta não apenas cocos, mas também pesca. O conjunto de
possibilidades de produção mostra os conjuntos dos dois bens produzidos que são factíveis
dadas a tecnologia e as funções produção (Figura 7).
Para tecnologias com retornos constantes de escala, a fronteira de possibilidades de
produção fica linear. Exemplo (Figura 8): se Crusoe produzir 10 peixes por hora e 20 cocos
por hora, em 10 horas ele poderá dedicar LF horas na produção de 10 LF peixes e LC horas
na produção de 20 LC cocos. O conjunto de possibilidades de produção é dado por todas as
combinações de cocos C e peixes F tal que
C = 20 LC
F = 10 LF
(3)
(4)
LC + LF = 10 ,
(5)
onde (3) e (4) são as relações de produção e (5) é a restrição dos recursos. A equação (3) pode
ser reescrita como
LC =
C
20
(3′)
F
.
10
(4′)
e a (4) como
LF =
(3′) e (4′) em (5):
C F
+ = 10 ,
20 10
(6)
que é a fronteira de possibilidade de produção. Para achar os interceptos, fazemos F = 0 em
(6):
C
= 10
20
C = 200
(6′)
e fazemos C = 0 em (6):
F
= 10
10
F = 100 .
(6″)
Para encontrar a inclinação, tomamos o diferencial total de (6):
1
1
dC + dF = 0
20
10
dC
20
=−
= −2 ,
dF
10
(7)
que, em tempo discreto, é o mesmo que
TMTRC =
∆C
= −2 .
∆F
(7′)
Vantagem comparativa
Sexta-feira aparece na ilha, com habilidades diferentes. Seu conjunto de possibilidades de
produção é dado por:
C = 10 LC
(8)
F = 20 LF
(9)
LC + LF = 10 .
(10)
(8) e (9) em (10):
C F
+
= 10 ,
10 20
(11)
que é sua fronteira de possiblidades de produção (Figura 9). Os interceptos são obtidos
fazendo F = 0 em (11):
C
= 10
10
C = 100
e C = 0 em (11):
F
= 10
20
(11′)
F = 200 .
(11″)
Para achar a inclinação, tomamos o diferencial total de (11):
1
1
dC + dF = 0
10
20
1
1
dC = − dF
10
20
dC
10
1
=−
=−
dF
20
2
(12)
que, em tempo discreto, é o mesmo que
TMTSF =
∆C
1
=− .
∆F
2
(12′)
Comparando as habilidades relativas, em uma hora de trabalho Crusoe produz 10
peixes e Sexta produz 20 peixes ou Crusoe produz 20 cocos e Sexta produz 10 cocos. Logo,
Crusoe tem vantagem comparativa na produção de cocos e Sexta, na produção de peixes.
Se Crusoe e Sexta produzirem apenas cocos ((6′) e (11′)), ambos produzirão 300 cocos
(Figura 10). Se produzirem apenas peixes ((6″) e (11″)), ambos produzirão 300 peixes. Porém,
a produção pode ser aumentada se aquele com vantagem comparativa em determinado bem se
especializar. Por exemplo, mais peixes seriam pescados se Sexta não produzisse cocos e
dedicasse as 10 horas na produção de peixes. Produção total = 200 + 200 = 400, em vez de
300. Mais cocos seriam coletados se Crusoe não produzisse peixes e dedicasse as 10 horas na
produção de cocos. Produção total = 200 + 200 = 400, em vez de 300.
Equilíbrio geral na produção e na troca
O conjunto de possibilidades de produção fornece as cestas de consumo factíveis para toda a
economia. Na cesta agregada ( X F , X C ) existem X F unidades de peixe e X C unidades de
coco disponíveis para consumo. A caixa de Edgeworth pode ser, então, desenhada dentro da
fronteira de possibilidade de produção (Figura 11).
Na curva de contrato, as cestas eficientes são encontradas dados os montantes de coco
e peixes disponíveis. Na economia com produção, esses montantes são escolhidos dentro do
conjunto de possibilidades de produção. Na curva de contrato, as TMS de Crusoe e Sexta são
iguais. Se a TMS não for igual à TMT , a taxa à qual Crusoe (ou Sexta) está querendo trocar
peixe por coco é diferente da taxa à qual peixe pode ser “transformado” em coco,
redirecionando-se trabalho para produzir menos peixe e mais coco. Nesse caso, a situação de
Crusoe (ou Sexta) poderia ser melhorada rearranjando-se a produção. Por exemplo, se a
TMS = 1 , Crusoe (ou Sexta) quer trocar um peixe por um coco. Mas se TMT = 2 , Crusoe
(ou Sexta) quer reduzir a produção de uma unidade de peixe para produzir 2 unidades de
coco. Como a troca é de um peixe por apenas um coco, faz sentido então reduzir a produção
da unidade extra de coco, fazendo TMT = 1 . A alocação Pareto-eficiente é, então,
TMS RC = TMS SF = TMT .
(13)
Para provar isto, consideramos X F , a quantidade total de peixes produzida e
consumida,
F
F
X F = xRC
+ xSF
(14)
e X C , a quantidade total de cocos produzida e consumida,
C
C
.
X C = xRC
+ xSF
(15)
Para descrever a fronteira de possibilidades de produção, que se refere a todas as combinações
de X F e X C que são tecnologicamente factíveis, recorremos à função transformação
T ( X F , X C ) . Uma dada combinação ( X F , X C ) fica sobre a fronteira de possibilidades de
produção se
T(X F , X C ) = 0 .
(16)
A taxa à qual os recursos são retirados da produção de coco para se produzir mais peixe é a
taxa marginal de transformação. Isto faz com que se saia de um ponto para outro da fronteira
de possibilidades de produção: a TMT é, então, a inclinação da fronteira de possibilidades de
produção:
TMT ≡
dX C
.
dX F
(17)
Tomando o diferencial total de (16):
∂T
∂T
dX F +
dX C = 0
F
C
∂X
∂X
∂T
∂T
dX F = − C dX C
F
∂X
∂X
∂T
C
F
dX
= − ∂∂XT .
F
dX
∂X C
(17) e (18):
(18)
TMT ≡
∂T
dX C
∂X F
=
−
.
∂T
dX F
∂X C
(18′)
Como no caso da economia de pura troca, uma alocação é eficiente de Pareto quando
maximiza a utilidade de um consumidor dada a utilidade do outro:
F
xRC
max
C
F
C
, xRC , xSF , xSF
F
C
uRC ( xRC
, xRC
)
(19)
sujeita a
F
C
uSF ( xSF
, xSF
)=u
(20)
T(X F , X C ) = 0 .
(21)
e
Montando o lagrangeano:
F
C
F
C
L = uRC ( xRC
, xRC
) − λ ( uSF ( xSF
, xSF
) − u ) − µ (T ( X F , X C ) − 0 ) .
(22)
As condições de primeira ordem são:
∂u
∂L
∂T
= RC
−µ
=0
F
F
∂xRC ∂xRC
∂X F
(23)
∂u
∂L
∂T
= CRC − µ
=0
C
∂xRC ∂xRC
∂X C
(24)
∂u
∂L
∂T
= −λ SF
−µ
=0
F
F
∂xSF
∂xSF
∂X F
(25)
∂u
∂L
∂T
= −λ CSF − µ
= 0.
C
∂xSF
∂xSF
∂X C
(26)
Dividindo (23) por (24):
∂u RC
F
∂xRC
∂u RC
=
∂T
∂X F
∂T
(27)
∂X C
C
∂xRC
e dividindo (25) por (26):
∂uSF
F
∂xSF
∂uSF
C
∂xSF
=
∂T
∂X F
∂T
∂X C
(28)
.
Do Capítulo 4 sabemos que a razão das utilidades marginais é a TMS . Considerando (18) em
(27) e (28):
TMS RC = TMT
(29)
TMS SF = TMT
(30)
(29) e (30):
TMS RC = TMS SF = TMT .
(31)
Logo, a taxa à qual cada consumidor quer substituir um bem pelo outro se iguala à taxa pela
qual é tecnologicamente factível transformar um bem no outro. Se não fossem iguais, haveria
uma maneira de aumentar a utilidade de um consumidor sem afetar a utilidade do outro.
Agora Crusoe e Sexta montam a empresa Náufragos S.A. Nesta economia de dois
indivíduos, há dois fatores de produção (mão-de-obra de Crusoe, LRC , e mão-de-obra de
Sexta, LSF ) e dois bens (cocos, C , e peixes, F ). Crusoe e Sexta são os acionistas da empresa
também, além de produtores, empregados e consumidores. Como produtores, eles maximizam
lucro fazendo
max
C , F , LRC , LSF
pC C + pF F − wRC LRC − wSF LSF
(32)
onde pC é o preço da unidade de coco, pF é o preço da unidade de peixe, wRC é o salário de
Crusoe e wSF é o salário de Sexta. O lucro é maximizado sujeito às restrições tecnológicas
dadas pelo conjunto de possibilidades de produção. Fazendo a maximização suponha que a
empresa encontra que é ótimo contratar L*RC unidades de mão-de-obra de Crusoe e L*SF
unidades de trabalho de Sexta. O custo da mão-de-obra em equilíbrio é, então,
L* = wRC L*RC + wSF L*SF
(33)
e o lucro é dado por
π = pC C + pF F − L* ,
(34)
que é a linha isolucro. A equação (34) pode ser reescrita como
pC C = π − pF F + L*
pC C = π + L* − pF F
C=
π + L*
pC
−
pF
F .
pC
Logo, o intercepto vertical da linha isolucro é
(34′)
π + L*
pC
e sua inclinação é −
pF
pC
(Figura 12).
A isolucro mais alta tem que tangenciar a fronteira de possibilidades de produção e a sua
inclinação precisa se igualar à inclinação da fronteira de possibilidades de produção:
TMT = −
pF
.
pC
(35)
Se a empresa desejar produzir mais cocos, ela terá que reduzir a produção de peixes. Em
quanto? Pelo preço relativo do peixe em relação ao preço do coco.
*
*
e wSF
e dividendos da
Como consumidores, Crusoe e Sexta recebem salários wRC
empresa Náufragos S.A. Como a empresa paga suas receitas na forma de salários e
dividendos a seus trabalhadores e acionistas, estes necessariamente possuem renda para
comprar os produtos da firma. Crusoe e Sexta usam seu dinheiro para comprar as melhores
cestas que podem pagar aos preços pF e pC . O ótimo, como vimos, é, então
TMS RC = TMS SF = −
pF
.
pC
(36)
(35) e (36):
TMS RC = TMS SF = TMT = −
pF
.
pC
(37)
Por (13), esta alocação é eficiente de Pareto. Os preços dos bens dão o sinal de escassez
relativa de duas formas: (1) escassez tecnológica: quanto reduzir da produção de um bem a
fim de se produzir mais do outro e (2) escassez de consumo: quanto cada consumidor deseja
reduzir de consumo de um bem para ter mais do outro.
© Sergio Da Silva 2010
sergiodasilva.com
Bem-Estar
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 33
É possível agregar as preferências dos consumidores individuais para construir preferências
“sociais”? Não. Não existe função de bem-estar social. Apesar disto, há maneiras menos
rigorosas de ordenar as diferentes distribuições de utilidade dos consumidores.
Agregação de preferências
Definimos as preferências dos consumidores em relação à sua própria cesta de bens e fizemos
a suposição de que elas eram transitivas (Capítulo 3). Isto significa que cada consumidor é
individualista: não se preocupa com o que os outros possuem. Podemos expandir esse
conceito e supor que cada consumidor possui preferências em relação a todas as cestas de
bens. Cada consumidor pode continuar sendo individualista, mas pode também invejar o que
os outros possuem.
Sendo x uma alocação do que todos os consumidores possuem de todos os bens, dada
outra alocação y , supomos que cada consumidor i é capaz de dizer se prefere ou não x a y .
Se soubermos como todos os consumidores fazem o ordenamento das várias alocações,
poderemos procurar o seu ordenamento social.
Uma forma de agregar preferências individuais para obter as preferências sociais é
utilizar um sistema de votação. Embora pareça simples dizer que x é “socialmente preferida”
a y se a maioria dos indivíduos prefere x a y , este método pode não gerar um ordenamento
social que seja transitivo. Veja o exemplo da tabela abaixo.
Consumidor A
Consumidor B
Consumidor C
y
x
z
y
z
x
y
z
x
Note que a maioria prefere x a y , y a z , mas também z a x ! As preferências
sociais não são transitivas e, por isso, não se pode falar da “melhor” alternativa do conjunto
(x, y, z ) . O resultado escolhido pela sociedade depende da ordem da votação. Se os
consumidores escolherem primeiro entre x e y , e, depois, escolherem entre o vencedor e z ,
como a maioria prefere x a y , o segundo turno será entre x e z , com z vencendo. Porém,
decidindo primeiro entre z e x , z ganha; mas, no segundo turno entre y e z , y vence.
Outro mecanismo de votação é o ordenamento pelo rank. Cada consumidor atribui um
número a cada alternativa e depois somamos os números para encontrar os pontos agregados.
Se o número escolhido for 1 para a melhor alternativa, 2 para a segunda melhor e assim por
diante, o resultado socialmente preferido será aquele da alternativa com menos pontos. No
exemplo da tabela a seguir, se apenas as alternativas x e y forem consideradas, o consumidor
A daria 1 para x e o consumidor B daria 2 para x . Somando: 3. O consumidor A daria 2 para
y e o consumidor B daria 1 para y . Somando: 3. O resultado seria empate. Se agora z
também for considerada, o consumidor A daria 1 para x , 2 para y e 3 para z . O consumidor
B daria 1 para y , 2 para z e 3 para x . Agregando, x ficaria com 4 e y com 3. Logo, y seria
vencedora. A escolha social entre x e y depende de z . Assim, esse mecanismo de votação
pode também ser manipulado através da introdução de novas alternativas.
Consumidor A
Consumidor B
y
x
y
z
z
x
Mecanismos de decisão social, que são maneiras de agregar preferências, são todos
sujeitos à manipulação. Para um mecanismo de decisão social ser consistente, ele precisaria
satisfazer a, pelo menos, três exigências:
1.
Dados quaisquer conjuntos de preferências individuais completas, reflexivas e
transitivas, o mecanismo de decisão social deve gerar preferências sociais que satisfaçam as
mesmas propriedades.
2.
Se todo mundo preferir a alternativa x à alternativa y , então a preferência social
deverá classificar x na frente de y .
3.
As preferências entre x e y devem depender apenas de como os consumidores
ordenam x em relação a y , e não de como eles ordenam outras alternativas.
Contudo, não existe nenhum mecanismo de decisão social que satisfaça as três
exigências acima. Pelo teorema da impossibilidade de Arrow, se um mecanismo de decisão
social satisfizer as propriedades 1, 2, e 3, então ele deverá ser uma ditadura, o que significa
que todos os ordenamentos sociais coincidem com os ordenamentos de um indivíduo. É
impossível agregar preferências individuais para se chegar à preferência social. Não existe
forma perfeita de se tomar decisões sociais: a democracia é inconsistente.
Funções bem-estar social
Se descartarmos a exigência 3, podemos pensar em um second best para substituir a função
bem-estar social. Supomos que o consumidor i prefere x a y se e somente se ui (x) > ui (y ) .
Apesar de a representação das preferências pela função utilidade não ser única, consideramos
apenas uma delas. Assim, somamos as utilidades individuais de n consumidores e chamamos
o número resultante de utilidade social: x será socialmente preferível a y se
n
n
i =1
i =1
∑ ui (x) >∑ ui (y) .
(1)
Para que a exigência 2 seja mantida, supomos que (1) seja crescente em cada utilidade
individual. Então, (1) é uma função agregadora que pode ser considerada uma função bemestar social:
W = W ( u1 (x),..., un (x) ) .
(2)
No caso clássico (de Bentham), as somas são consideradas:
n
W ( u1 ,..., un ) = ∑ ui .
(3)
i =1
Uma generalização possível é considerar a soma ponderada:
n
W ( u1 ,..., un ) = ∑ ai ui ,
i =1
(4)
onde os pesos a1 , ..., an indicam a importância da utilidade de cada consumidor para o bemestar geral. Geralmente, pensa-se que
ai > 0 .
(5)
Outra função é a minimax (de Rawls):
W (u1 ,..., un ) = min {u1 ,..., un } ,
(6)
onde o bem-estar social depende apenas do bem-estar do indivíduo de menor utilidade.
A diametralmente oposta é a de Nietzsche:
W (u1 ,..., un ) = max {u1 ,..., un } ,
(7)
onde o bem-estar social depende apenas do bem-estar do indivíduo de maior utilidade.
Maximização de bem-estar
Supondo n consumidores e j bens, indicamos por xij quanto o consumidor i possui do bem
j . Portanto, a alocação x é formada da lista de quanto cada consumidor tem de cada bem. A
quantidade total do bem 1 é X 1 , a do bem 2 é X 2 ,... e a do bem j é X j . Cada quantidade
total é distribuída entre os consumidores. O problema de maximização de bem-estar é, então,
max W ( u1 (x),..., un (x) )
(8)
tal que
n
∑x
i =1
1
i
n
∑x
i =1
i
j
= X1
(9)
=Xj
A alocação factível que maximiza o bem-estar social deve ser Pareto-eficiente. Se não
fosse, teríamos que pensar em outra alocação que, pelo menos para um dos consumidores,
teria utilidade maior do que a do máximo. Como a função bem-estar social é crescente em
cada utilidade individual, esta nova alocação teria que ter um bem-estar maior. Mas isto
contradiz o fato de termos inicialmente o bem-estar máximo.
Na Figura 1, mostramos o conjunto de possibilidades de utilidade de dois
consumidores e a fronteira de possibilidades de utilidade, onde as alocações são Paretoeficientes. Se uma curva iso-bem-estar tangenciar a fronteira de possibilidades de utilidade, o
bem-estar será máximo e não existe outra alocação que gere utilidade mais alta e que seja
também factível. Além disso, uma vez que se escolha a função de bem-estar social, pode-se
encontrar a correspondente alocação eficiente de Pareto. Assim, não apenas todo máximo de
bem-estar é uma alocação Pareto-eficiente, mas também toda alocação Pareto-eficiente é um
máximo de bem-estar.
Escolhendo a função soma ponderada (4), se o conjunto de possibilidades de utilidades
for convexo, pode-se escolher uma das alocações ótimas de Pareto que fique sobre a fronteira
de possibilidades de utilidade (Figura 2).
Funções bem-estar social individualistas
No nosso modelo inicial em que cada consumidor não tem preferências sobre todas as
alocações, mas apenas sobre sua cesta, a cesta de consumo do consumidor i é xi e uma dada
representação das preferências pela utilidade é ui ( xi ) . Neste caso, a função bem-estar social
individualista (de Bergson-Samuelson)
W = W ( u1 ( x1 ),..., un ( xn ) )
(10)
é função direta das utilidades individuais e função indireta das cestas dos consumidores.
Como a utilidade de cada consumidor depende apenas do seu próprio consumo, não há
externalidade de consumo. Todo equilíbrio competitivo é Pareto-eficiente e, desde que as
preferências e a tecnologia sejam convexas, toda alocação eficiente de Pareto é um equilíbrio
competitivo. Além disso, todo bem-estar máximo é um equilíbrio competitivo e todo
equilíbrio competitivo é um máximo de bem-estar para uma certa função bem-estar. Para
provar isto, tomemos os consumidores A e B e os bens 1 e 2. Queremos
(
max W u A ( x1A , x A2 ), u B ( x1B , xB2 )
x1A , x 2A , x1B , xB2
)
(11)
sujeita à fronteira de possibilidades de produção:
T ( X 1, X 2 ) = 0 ,
(12)
onde X 1 = x1A + x1B é a quantidade total do bem 1 produzido e consumido e X 2 = x A2 + xB2 é a
quantidade total do bem 2. Formando o lagrangeano:
(
) (
)
L = W u A ( x1A , x A2 ), uB ( x1B , xB2 ) − λ T ( X 1 , X 2 ) − 0 ,
(13)
as condições de primeira ordem são:
∂L ∂W ∂u A
∂T
=
−λ 1 = 0
1
1
∂x A ∂u A ∂x A
∂X
(14)
∂L ∂W ∂u A
∂T
=
−λ
=0
2
2
∂x A ∂u A ∂x A
∂X 2
(15)
∂L ∂W ∂uB
∂T
=
−λ 1 = 0
1
1
∂xB ∂uB ∂xB
∂X
(16)
∂L ∂W ∂uB
∂T
=
−λ
=0.
2
2
∂xB ∂uB ∂xB
∂X 2
(17)
Dividindo (14) por (15):
∂u A
∂x1A
∂u A
∂x 2A
=
∂T
∂X 1
∂T
∂X 2
e dividindo (16) por (17):
(18)
∂u B
∂x1B
∂u B
∂xB2
=
∂T
∂X 1
∂T
∂X 2
.
(19)
Considerando (18) e (19):
TMS A = TMS B = TMT .
(20)
Logo, a maximização do bem-estar na função individualista leva ao mesmo resultado da
eficiência de Pareto em uma economia com produção (Capítulo 32).
Alocações justas
Como dividir bens justamente entre n consumidores que, por hipótese, os merecem
igualmente? Igualmente. Cada consumidor fica com as mesmas cestas de bens e ninguém
prefere a cesta de outrem à sua. Mas a divisão igualitária não é necessariamente Paretoeficiente. Se os consumidores tiverem gostos diferentes farão trocas e a economia sairá da
divisão igualitária. Ocorrendo troca, chega-se a uma alocação eficiente de Pareto (Capítulo
31). Esta nova alocação Pareto-eficiente continua sendo “justa”? Não necessariamente. Por
exemplo, os consumidores A e B têm os mesmos gostos e o consumidor C tem gosto
diferente. Inicialmente, os três possuem as mesmas cestas. A e C se encontram e trocam. No
final, ambos melhoram sua situação. Como B encontrou C, B agora inveja A, o que significa
que B prefere a cesta de A à sua:
( x1B , xB2 ) ≺ B ( x1A , x A2 ) .
(21)
Voltando à situação de igualdade inicial, se os consumidores estiverem transacionando
em mercados competitivos, eles escolherão as melhores cestas que puderem aos preços de
equilíbrio p1 e p2 . A alocação final deve ser Pareto-eficiente (Capítulo 31). Se A e B tiverem
a mesma cesta, B não pode invejar A. Se B preferir a cesta de A à sua, e se sua cesta fosse a
melhor que pudesse conseguir aos preços p1 e p2 , a cesta de A deveria custar mais do que B
poderia pagar:
p1ω1B + p2ωB2 < p1 x1A + p2 x A2 .
(22)
Mas isto é impossível porque se B não puder pagar pela cesta, A também não poderá, já que
possuem a mesma cesta. Se uma alocação for igualitária, não pode haver inveja. Uma
alocação é justa se for igualitária e eficiente. Então, o equilíbrio competitivo em uma divisão
igualitária é justo.
© Sergio Da Silva 2010.
sergiodasilva.com
Externalidades
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 34
Há externalidade de consumo se um consumidor for afetado pelo consumo de outro ou pela
produção de uma empresa. Exemplos de externalidade de consumo negativa são o vizinho
tocando música alta às três horas da manhã, o consumidor na mesa ao lado de um restaurante
fumando charuto ou a poluição produzida pelos carros. Um exemplo de externalidade de
consumo positiva é ter prazer em observar as flores do vizinho.
Ocorre externalidade de produção quando as possibilidades de produção de uma
empresa são afetadas pelas escolhas de outra empresa ou consumidor. Um exemplo de
externalidade de produção negativa é a situação em que uma empresa de pesca é afetada por
poluentes jogados na área de pesca. Um exemplo de externalidade de produção positiva é um
pomar de maçãs localizado próximo a uma colmeia.
O aspecto mais importante das externalidades é a existência de bens que não são
vendidos em mercados. Por exemplo, não há mercado para fumaça. É esta falta de mercados
para externalidades que causa problema.
No nosso modelo básico, conhecendo suas próprias possibilidades de consumo ou
produção, cada consumidor ou produtor toma decisões sem se preocupar com que os outros
estão fazendo. Eles interagem apenas no mercado e toda a informação necessária é dada pelos
preços. O mecanismo de mercado leva a alocações eficientes de Pareto, já que não ocorrem
externalidades. Porém, se cada consumidor ou produtor se importar com o consumo ou a
produção dos outros, ocorrem externalidades e não se chega a alocações eficientes de Pareto.
Aqui, o governo ou o sistema legal contribui para atingir a eficiência.
Externalidades de consumo negativas na caixa de Edgeworth
Dois consumidores A e B começam com $100 , sendo que A é fumante e B não. “Fumaça” é
um bem para A, mas um mal para B. As possibilidades de consumo dos dois consumidores A
e B de “dinheiro” e “fumaça” podem ser representadas na caixa de Edgeworth da Figura 1.
Enquanto o dinheiro está dividido entre os dois consumidores, há apenas uma quantia
de fumaça a ser consumida conjuntamente. Se estiverem na sala de não-fumantes de um
restaurante, na dotação inicial ambos A e B possuem (dinheiro, fumaça) = (100, 0). Isto
significa que B possui o direito de propriedade ao ar puro. A situação na dotação não é
eficiente de Pareto porque, sendo as TMS diferentes, A e B podem transacionar para
melhorar suas situações. B se deixa subornar e troca um pouco de fumaça (digamos, 0.4 ) por
dinheiro (digamos, $30 ). Em outras palavras, o consumidor A paga para fumar. O equilíbrio
ao final da troca em X é Pareto-eficiente, já que as TMS são iguais.
Se, por outro lado, estiverem na sala de fumantes, na dotação inicial ambos A e B
possuem (100, 1). Como as TMS são diferentes, há possibilidades de ganho mútuo com a
troca. Agora B suborna A, pagando para ele reduzir o número de cigarros que vai fumar. Em
X′ , há eficiência de Pareto.
O consumidor A preferiria o equilíbrio em X′ , enquanto o consumidor B preferiria o
equilíbrio em X. A teve que pagar para fumar a partir da dotação (100, 0) porque o direito ao
ar puro foi alocado para B. Observe que, se os consumidores criarem um mercado para a
fumaça, chegarão à eficiência, não importando de quem seja o direito ao ar puro. Ocorre que,
nessa barganha, eles fizeram transações ilegais.
Em vez da barganha, eles poderiam ter usado o mecanismo de preços. O leiloeiro
anunciaria um preço para o ar puro e cada consumidor escolheria o quanto comprar a esse
preço. O equilíbrio competitivo seria o mesmo da Figura 1.
Se o direito ao ar puro não estivesse bem definido nas dotações iniciais, o mercado de
fumaça não seria viabilizado e a alocação eficiente da externalidade não seria atingida.
Preferências quase-lineares e o teorema de Coase
Em X e X′ na Figura 1, a quantidade de fumaça (externalidade) na situação eficiente depende
da alocação inicial do direito de propriedade do ar puro. No caso especial de preferências
quase-lineares, o montante da externalidade torna-se independente da alocação inicial do
direito de propriedade: teorema de Coase (Figura 2). Realocar as dotações iniciais não afeta a
quantidade eficiente de fumaça.
Externalidade de produção
Uma siderúrgica S produz aço na quantidade s e poluentes na quantidade x , que joga no rio.
O seu custo é
c s = cs ( s , x ) .
(1)
Uma empresa de pesca F dos arredores produz a quantidade f de peixes e sua função custo
é
c f = c f ( f , x) .
(2)
Há externalidade de produção porque o custo da empresa F depende também da quantidade
de poluentes lançados pela empresa S . Supomos que
∆cs
≤0
∆x
(3)
CM s ( x) ≤ 0 .
(3′)
ou
Se a empresa S reduzir seus poluentes em ∆x o seu custo ∆cs seria aumentado. Para a
empresa F ,
∆c f
>0
(4)
CM f ( x) > 0 .
(4′)
∆x
ou
O aumento dos poluentes lançados pela empresa S , ∆x , aumenta o custo da empresa F em
∆c f . Este é o custo externo que é ignorado pela siderúrgica.
Não custa nada para a siderúrgica poluir. Então o preço do poluente é zero para ela:
px = 0 .
(5)
A maximização de lucro da empresa S é:
max ps s − cs ( s, x) ,
s,x
(6)
onde ps é o preço da unidade de aço laminado. A maximização de lucro da empresa F é:
max p f f − c f ( f , x) ,
(7)
f
onde p f é o preço do peixe. Para a empresa de pesca, x não é variável de escolha.
Para a siderúrgica, as condições de primeira ordem são encontradas derivando (6) em
relação a s e igualando a zero:
ps − c′s = 0
ps = c′s
ou
ps = CM S ( s* ) .
(8)
Depois, derivando (6) em relação a x e igualando a zero:
0 − c′s = 0
0 = CM s ( x* ) .
(9)
Por (9), a siderúrgica polui até que o custo de uma unidade extra do poluente seja zero.
Para a segunda empresa, a condição de primeira ordem é encontrada derivando (7) em
relação a f e igualando a zero:
p f − c′f = 0
p f = CM f ( f * ) .
(10)
Como o custo externo não está sendo levado em conta pela siderúrgica, é de se esperar
que as quantidades do poluente que ela emite no lucro máximo sejam excessivas do ponto de
vista das duas empresas tomadas em conjunto.
Fusões
Se as duas empresas fizessem uma fusão, a nova empresa resultante internalizaria o custo
externo, pois maximizaria:
max ps s + p f f − cs ( s, x) − c f ( f , x) .
s, f ,x
(11)
As condições de primeira ordem podem ser encontradas derivando (11) em relação a s e
igualando o resultado a zero:
ps − c′s = 0
ps = CM s ( s** ) .
(12)
Depois, derivando (11) em relação a f e igualando a zero:
p f − c′f = 0
p f = CM f ( f ** ) .
(13)
E finalmente derivando (11) em relação a x e igualando a zero:
0 + 0 − c′s − c′f = 0
0 = c′s + c′f
0 = CM s ( x** ) + CM f ( x** ) .
(14)
Assim, a empresa surgida da fusão polui até que a soma dos custos (custo social) das unidades
extras de poluição vinda dos dois departamentos (aço e pesca) seja zero. Isto é Paretoeficiente, pois agora não é possível reduzir um custo marginal sem, com isso, aumentar o
outro. A equação (14) pode ser reescrita como:
−CM s ( x** ) = CM f ( x** ) .
(14′)
Isto é plotado na Figura 3. Veja que a quantidade socialmente ótima de poluente é menor do
que a quantidade privada ótima (equação (9)).
O próprio mercado cria incentivos para internalização da externalidade de produção
através de fusões. Ao perceberem que o lucro é maior na fusão, as empresas se engajam nela.
O exemplo do pomar de maçãs e da colmeia é raro de se encontrar porque a externalidade de
produção somente ocorreria caso as empresas ignorassem sua interação. Por isso, o mais
comum é encontrar empresas com pomares e colmeias ao mesmo tempo.
Imposto de Pigou
Como a siderúrgica se defronta com o preço errado da poluição ( px = 0) , ela não se importa
com o custo que a poluição traz para a empresa de pesca. Para corrigir esta situação deve-se
fazer com que a siderúrgica encare o custo social correto.
Uma solução seria um imposto t por unidade de poluição gerada. A siderúrgica
maximizaria lucro fazendo
max ps s − cs ( s, x) − tx .
s,x
Derivando (15) primeiramente em relação a s e igualando a zero:
ps − c′s = 0
(15)
ps = c′s
ps = CM s ( s*** ) .
(16)
Derivando (15) em relação a x e igualando a zero:
−c′s − t = 0
t = −CM s ( x*** ) .
(17)
Levando em conta (14′) em (17):
t = CM f ( x*** ) .
(18)
Por (17) e (18), o imposto obriga a siderúrgica a internalizar o custo marginal da poluição da
empresa de pesca. Este é chamado de imposto de Pigou.
Para sabermos qual é o imposto correto, temos antes que conhecer o nível ótimo de
poluição. Mas conhecendo o nível ótimo de poluição basta obrigar a firma a produzi-lo, sem
necessidade do imposto.
Criação de mercado para a poluição
A siderúrgica se depara com o preço zero para o poluente ( px = 0) e a empresa de pesca está
disposta a pagar para reduzir a poluição. Portanto, o preço social correto da poluição deveria
ser negativo.
Atribuindo-se direitos de propriedade de água limpa a qualquer uma das empresas
seria suficiente para se criar o mercado do poluente que está faltando e se remover a
externalidade. A situação eficiente irá ocorrer independentemente de a quem seja atribuído o
direito de água limpa.
Se à empresa de pesca for concedido o direito, ela poderá vender o direito gerando o
mercado do poluente. A maximização de lucro da siderúrgica será agora
max ps s − px x − cs ( s, x)
s,x
(19)
e a da empresa de pesca será
max p f f + px x − c f ( f , x) .
f ,x
(20)
O valor da poluição px x é negativo para a siderúrgica porque ela compra o direito de água
limpa (para poluir), mas px x é positivo para a empresa de pesca porque ela arrecada receita
vendendo o direito. Maximizando (19) em relação a s :
ps − c′s = 0
ps = c′s
ps = CM s ( s**** ) .
Maximizando (19) em relação a x :
(21)
− px − c′s = 0
px = −CM s ( x**** ) .
(22)
Maximizando (20) em relação a f :
p f − c′f = 0
p f = CM f ( f **** ) .
(23)
Maximizando (20) em relação a x :
px − c′f = 0
px = CM f ( x**** ) .
(24)
Logo, cada empresa leva em conta o custo marginal de suas ações quando compra ou vende
poluição. Quando a oferta se iguala à demanda ao preço de equilíbrio px , por (22) e (24),
−CM s ( x**** ) = CM f ( x**** ) .
(25)
Esta é a mesma condição de ótimo de Pareto de antes (equação (14′)). Ela diz que o custo
marginal para a siderúrgica reduzir a poluição, CM s , deve se igualar ao benefício marginal da
empresa de pesca dessa redução, −CM f .
Se o direito a água limpa fosse concedido à siderúrgica, a empresa de pesca teria agora
que pagar à siderúrgica para esta poluir menos. Isto leva ao mesmo resultado anterior.
Supomos que poluir seja permitido até o limite x . A maximização de lucro da siderúrgica é:
max ps s + px ( x − x) − cs ( s, x) .
s,x
(26)
Derivando (26) em relação a s e igualando a zero:
ps − c′s = 0
ps = CM s ( s***** ) .
(27)
Derivando (26) em relação a x e igualando a zero:
− px − c′s = 0
px = −CM s ( x***** ) .
(28)
A maximização de lucro da empresa de pesca é:
max p f f − px ( x − x) − c f ( s, x) .
f ,x
Derivando (29) em relação a f e igualando a zero:
(29)
p f − c′f = 0
p f = CM f ( s***** ) .
(30)
Derivando (29) em relação a x e igualando a zero:
px − c′f = 0
px = CM f ( x***** ) .
(31)
As equações (27), (28), (30) e (31) são as mesmas que (21), (22), (23) e (24). Logo, a
produção ótima dos bens e do mal (poluição) independe de a quem seja atribuído o direito de
propriedade sobre a poluição e o lucro maior será daquela empresa que recebeu o direito.
A tragédia dos recursos comuns
Se os direitos de propriedade forem bem definidos, as externalidades de produção serão
internalizadas. Se um recurso de uso comum for propriedade de alguém, este pode evitar que
outros o utilizem em excesso. Ineficiências resultam apenas de situações em que não se
consegue excluir outros de usar o recurso. Um exemplo é a “tragédia” dos recursos comuns.
Vacas leiteiras pastam em um campo de uso coletivo. Nenhum proprietário possui
muitas vacas. O preço de cada vaca comprada c é $a : o custo é então ac . A receita com a
venda de leite é f (c) . A produção de leite de cada vaca dependerá de quantas outras vacas
pastam no campo coletivo. Assim, a receita por vaca é f (cc ) .
Se a pastagem tivesse dono, o lucro seria maximizado fazendo
max f (c) − ac
(32)
f ′(c* ) − a = 0
RM (c* ) = a .
(33)
c
Logo, o lucro seria máximo quando a receita marginal da venda de leite fosse igual ao preço
da vaca.
Como a pastagem não tem dono, existem c vacas no campo comum e a receita por
vaca é f (cc ) . Comprar uma vaca a mais significa aumentar a receita em f (c + 1) , mas o
número total de vacas também aumenta em c + 1 . A receita média que esta vaca a mais dará
será f (cc++11) . Se esta receita for maior do que o preço da vaca, a , valerá a pena comprá-la.
Vacas a mais serão compradas até que a receita média em leite proporcionada pela última
vaca se iguale a seu preço de compra:
f (c + 1)
=a.
c +1
(34)
O número total de vacas compradas c** será dado então por:
f (c** )
=a
c**
(35)
ou
f (c** ) − ac** = 0 .
(35′)
Portanto, quando o lucro for zero não se compra mais vaca. (35) é o equilíbrio quando o
recurso for de uso coletivo.
Em (34), (35) e (35′) cada consumidor ignora o fato de que uma vaca a mais comprada
reduzirá a receita de leite dos outros: cada um ignora o custo social de sua compra. O
resultado será que as vacas compradas superarão o número ótimo do ponto de vista social.
**
A receita média f (cc** ) diminuirá à medida que mais vacas forem compradas (curva
decrescente):
f (c** )
< 0.
c**
(36)
Derivando (36) em relação a c** :
f ′c** − f (c** )
<0
(c** ) 2
f ′c** − f < 0 .
Dividindo por c** :
f
<0
c**
f
f ′ < **
c
RM < RMe .
f ′−
(37)
Logo, o equilíbrio no caso em que o recurso é de uso coletivo, (35), é ineficiente, enquanto o
equilíbrio no caso de um único dono, (33), é eficiente.
© Sergio Da Silva 2010
sergiodasilva.com
Tecnologia de
Informação
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 35
A revolução industrial transformou a maneira de produzir, distribuir e consumir bens. Agora, a
revolução da informação está transformando a maneira de produzir, distribuir e consumir informação.
A tecnologia de informação é usada em sistemas de diversos componentes, que podem ser
bens complementares fornecidos por diferentes empresas. Esses bens possuem valor apenas se usados
em conjunto. Por exemplo, hardware não possui valor sem os correspondentes softwares. Uma CPU
(central processing unit) da Intel precisa de um sistema operacional, como o Windows. Quanto maior
for o número de softwares escritos para um hardware, maior será seu valor.
As estratégias competitivas nas indústrias de tecnologia de informação precisam, portanto,
levar em conta que os componentes dos sistemas são bens complementares.
Apreçamento dos complementos
Os vendedores dos bens complementares (Intel e Microsoft, por exemplo) sabem que a demanda
isolada por CPU ou Windows depende do preço de ambos os produtos. Sendo p1 o preço da CPU e
p2 o preço do Windows, a demanda por, digamos, CPU depende do preço desses dois componentes:
D( p1 + p2 ) .
Sendo CM 1 o custo marginal de uma CPU e F1 seu custo fixo, o problema de maximização
da Intel é:
max( p1 − CM 1 ) D( p1 + p2 ) − F1 .
p1
(1)
Analogamente, o problema de maximização da Microsoft é:
max( p2 − CM 2 ) D( p1 + p2 ) − F2 .
p2
(2)
Supondo, por simplicidade, que os custos marginais sejam irrelevantes:
CM 1 = CM 2 = 0 ,
(3)
ficamos com ( (3) em (1) e (2) ):
max p1 D( p1 + p2 ) − F1
p1
(1′)
e
max p2 D( p1 + p2 ) − F2 .
p2
(2′)
Para o caso da função demanda linear
D( p1 + p2 ) = a − b( p1 + p2 ) ,
temos, para a Intel ( (4) em (1′) ):
(4)
max p1 (a − b( p1 + p2 )) − F1
p1
max ap1 − bp12 − bp1 p2 − F1 .
p1
(1″)
Derivando em relação a p1 e igualando a zero:
a − 2bp1 − bp2 = 0
2bp1 = a − bp2
p1 =
a − bp2
.
2b
(5)
Logo, o preço da CPU ( p1 ) depende do preço do Windows ( p2 ).
Para a Microsoft, cálculos análogos se aplicam e ficamos com
p2 =
a − bp1
.
2b
(6)
Logo, o preço do Windows também depende do preço da CPU.
Se cada empresa acertar o preço que espera da outra, p1e = p1 e p2e = p2 , e poderemos
calcular o equilíbrio de Nash substituindo (6) em (5):
 a − bp1 
a −b

 2b 
p1 =
2b
p1 =
a−
ab − b 2 p1
2b
2b
2ab − ab + b 2 p1
2b
p1 =
2b
2ab − ab + b 2 p1
2bp1 =
2b
4b 2 p1 = ab + b 2 p1
3b 2 p1 = ab
p1 =
ab
3b 2
p1 =
a
.
3b
(7)
(7) em (6):
p2 =
a
3b
a −b
2b
3ab − ab
3b
p2 =
2b
2ab
p2 = 3b
2b
p2 =
2a 1
3 2b
p2 =
2a
6b
p2 =
a
.
3b
(8)
Portanto, no equilíbrio de Nash ( (7) e (8) ):
p1 = p2 =
a
.
3b
(9)
A soma dos preços dos dois produtos é:
p1 + p2 =
a a a+a
+
=
3b 3b
3b
p1 + p2 =
2a
.
3b
(10)
Se houvesse uma fusão entre Intel e Microsoft, o preço seria menor. De fato, a nova empresa
maximizaria
max p (a − bp ) − F .
p
Derivando em relação a p e igualando a zero:
a − 2bp = 0
(11)
2bp = a
p=
a
.
2b
(12)
Comparando (10) e (12) vemos que p < p1 + p2 , pois
a 2a
.
<
2b 3b
(13)
Com o preço mais baixo depois da fusão, os consumidores comprariam mais e a empresa
aumentaria as vendas e os lucros (melhoramento de Pareto). Este é o mesmo resultado geral (de
Cournot) de que a fusão de dois monopólios que produzem bens complementares baixa os preços e
aumenta os lucros.
Exemplo 1: Motorola e Apple. Mesmo sem precisar fazer uma fusão, a Apple compra a CPU
da Motorola, combina-a com seu sistema operacional (Macintosh) e vende o computador pronto para o
consumidor final.
Exemplo 2: Boeing e GE. A Boeing faz o corpo do avião e a GE faz o motor. A Boeing
compra o motor, monta o avião completo e reverte uma fração da receita para a GE.
Exemplo 3: Sony e Philips. Essas empresas possuem as patentes básicas da tecnologia do
DVD e licenciam a tecnologia para muitas outras empresas a preços baixos para viabilizar o mercado.
Lock-in
Há grandes custos de mudança (switching costs) nas indústrias de tecnologia de informação. Mudar de
um computador baseado no Windows para outro baseado no Macintosh traz custos não apenas de
hardware, mas também de toda uma inteira gama de software.
Se os custos de mudança forem muito altos, os consumidores podem não conseguir mudar de
produto: ocorre o lock-in. O lock-in é a situação na qual o custo de mudar para um diferente sistema é
tão alto que o consumidor fica preso ao atual. Isto significa uma demanda menos elástica e uma
vantagem para o vendedor, que pode extrair um excedente do consumidor maior.
Em um ambiente competitivo, o custo (= custo marginal) de um serviço de acesso à internet se
iguala ao preço do serviço p :
p =c.
(14)
Se o consumidor desejar mudar de servidor, há o custo de mudança s . Porém, o novo servidor
pode oferecer o desconto d para o primeiro período. Se o consumidor mudar de servidor,
paga p − d e o custo s no primeiro período e rp no período seguinte, onde r é a taxa de juros
real por período sendo usada como fator de desconto.
Se ele continuar com o servidor atual, paga p no primeiro período e rp no período
seguinte. Assim, o consumidor muda de servidor se
( p − d) +
p
p
+s< p+ .
r
r
O consumidor será indiferente entre mudar ou não de servidor se
( p − d) +
p
p
+s = p+
r
r
(15)
p−d +s = p
d = s.
(16)
Isto significa que ele será indiferente se o desconto fornecido pelo novo servidor exatamente
compensar o custo de mudança.
Caso o consumidor opte pelo novo servidor, este receberá o pagamento pelo serviço p
menos o desconto d que concede. O lucro será a receita p − d menos o custo c . No outro
período, o lucro será apenas pr−c .
Para o novo servidor, a concorrência força seu lucro até zero. Ou melhor, os lucros dos
dois períodos se igualarão a zero:
( p − d) − c +
p−c
= 0.
r
(17)
Como o desconto mínimo será d = s (por (16) ), substituindo (16) em (17):
( p − s) − c +
p−c+
p−c
=0
r
p−c
= s.
r
(18)
Portanto, o valor presente dos lucros do novo servidor se igualará ao custo de mudança do
consumidor.
Vendo de outra forma,
p =c−
p=
p−c
+s
r
cr − ( p − c) + sr
r
pr = cr − p + c + sr
pr + p = (1 + r )c + sr
(1 + r ) p = (1 + r )c + sr
p =c+
r
s.
1+ r
(19)
Isto significa que o preço do serviço será um mark up do custo c proporcional ao custo de
mudança s .
Se o novo servidor também tiver receita de propaganda a , a condição de lucro zero
(17) deve ser modificada para:
( p − d) + a − c +
p+a−c
= 0.
r
(20)
p+a−c
= 0.
r
(21)
(16) em (20):
( p − s) + a − c +
Neste caso, se comparado a (19), o preço do serviço será reduzido da receita de propaganda
a . De fato,
p−s+a−c+
p+a−c
=0
r
 p+a−c 
p = s−a +c−

r


p=
rs − ra + rc − p − a + c
r
rp = rs − (1 + r )a + (1 + r )c − p
rp + p = (1 + r )c − (1 + r )a + rs
(1 + r ) p = (1 + r )a − (1 + r )a + rs
p =c−a+
r
s.
1+ r
(22)
Externalidade de rede
Uma externalidade de rede (network) ocorre quando a utilidade de um bem para um
consumidor depende do número de outros consumidores do bem. Se o número de usuários de
aparelhos de fax começar a diminuir, isto reduzirá a utilidade do seu próprio aparelho. Afinal,
haverá cada vez menos pessoas capazes de receber seus faxes.
Suponha que há 1000 consumidores de um bem: v = 1,...,1000 . O preço de reserva
para o bem do consumidor v é o próprio v . Ao preço p , o número de consumidores que
acham que o bem vale pelo menos p é 1000 − p . Se p = $200 , haverá 800 consumidores
querendo pagar pelo menos $200 e o número de unidades compradas será 800. Isto gerará
uma curva de demanda negativamente inclinada (como vimos no Capítulo 1).
Se o bem for um aparelho de fax, haverá externalidade de rede e o valor do bem para a
pessoa v será vn , sendo n o número de possíveis consumidores do bem. Quanto maior for
n , maior será o valor do bem: ( v n ↑ ) ↑ .
Ao preço p , haverá o consumidor marginal v̂ exatamente indiferente entre comprar
ou não o bem. Neste caso, p se iguala à sua vontade de pagar:
ˆ .
p = vn
(23)
Logo, todos os outros consumidores v > vˆ preferirão comprar. O número de consumidores
querendo comprar o bem será:
n = 1000 − vˆ .
(24)
(24) em (23):
p = n(1000 − n) .
(25)
A equação (25) está plotada na Figura 1.
Supondo que os aparelhos de fax sejam produzidos com retornos constantes de escala,
a sua curva de oferta será a linha horizontal ao preço que se iguala ao custo médio ( CMe ),
como na Figura 2.
Reunindo demanda e oferta (Figura 3), há dois possíveis equilíbrios: com poucos
consumidores e com muitos.
Se a curva de demanda estiver acima da de oferta, a quantidade n aumentará, e viceversa. As setas próximas aos equilíbrios na Figura 4 mostram esse processo de ajustamento.
Apenas o equilíbrio com n maior é estável.
Esse modelo pode ser adaptado para incluir externalidade de rede indireta. A utilidade
de um consumidor de aparelho de DVD simples não se altera diretamente se outros estiverem
comprando aparelhos de DVD Blu-Ray. Porém, há ainda externalidade de rede de forma
indireta: quanto mais Blu-Rays forem vendidos, mais discos Blu-Ray vão aparecer, tornando
os aparelhos de Blu-Ray ainda mais populares, fato que, indiretamente, reduz o uso de
aparelhos de DVD simples.
Suponha, então, que o preço de reserva do bem 1 seja v1 e que v1 = 1,...,1000 . O preço
de reserva do bem 2 é v2 = 1,...,1000 . O valor do bem 1 depende de quantos consumidores
consomem o bem 2 e o valor do bem 2 depende de quantos consumidores consomem o bem 1.
As utilidades serão:
U1 = v1n2
(26)
U 2 = v2 n1 .
(27)
e
Ao preço p , para os consumidores marginais indiferentes entre comprar ou não os
respectivos bens, teremos:
p1 = vˆ1n2
(28)
p2 = vˆ2 n1 .
(29)
e
Todos com valores acima de v̂1 compram o bem 1 e, assim,
n1 = 1000 − vˆ1 .
(30)
Todos com valores acima de v̂2 compram o bem 2 e, assim,
n2 = 1000 − vˆ2 .
(31)
(30) em (28):
p1 = n2 (1000 − n1 ) .
(32)
(31) em (29):
p2 = n1 (1000 − n2 ) .
(33)
As equações (32) e (33) generalizam (25), que é válida quando não há externalidade de rede
indireta.
Modelos alternativos de negócios
Suponha que o lucro de um jornal online de custo irrelevante seja maximizado:
(34)
max p ( y ) y
y
e se encontre o par ótimo ( p*, y*) . O jornal fornece um período grátis de uma semana.
Porém, se o período for aumentado para um mês e, além disso, esse novo modelo de
negócio funcionar, a nova curva de demanda inversa será:
P(Y ) = ap(Y ),
a >1.
(35)
As vendas agora aumentariam e
Y = by,
b > 1.
(36)
A firma agora maximizará
max P (Y ) y .
Y
(37)
(35) e (36) em (37):
max ap(Y )
Y
max
Y
Y
b
a
p(Y )Y .
b
(38)
Já que a constante ba > 0 , esta não modifica a escolha ótima de Y em relação ao problema
(34). Podemos então concluir que Y * = y * .
Portanto,
1.
A quantidade consumida Y * independe da mudança do prazo gratuito.
2.
A quantidade produzida, que é y = Yb , fica menor, já que b > 1 e y* = Y * .
3.
Os lucros podem subir ou cair dependendo de se ba > 1 ou ba < 1 .
Quando permitir o aluguel de bens de informação?
Um produtor de vídeo produz y cópias para maximizar lucro:
max p ( y ) y − cy − F .
y
(39)
Isto leva a determinada quantidade ótima de cópias.
Se houver a possibilidade de aluguel de qualquer cópia, a quantidade de vídeos que
podem ser assistidos x pode superar a quantidade produzida:
x = ky,
k >1.
(40)
onde k é o número de consumidores que assistem ao vídeo.
Para o consumidor marginal que é indiferente entre alugar e comprar,
p( x) = p(ky ) .
(41)
Porém, há um custo de inconveniência t ao se alugar o vídeo quando se pode comprá-lo e,
portanto, possuí-lo. Por isso, a disposição a pagar do consumidor marginal deve ser p ( x) − t e
(41) deve ser reformulada para
p ( x) − t = p(ky ) − t .
(42)
A disposição a pagar da locadora (demanda inversa do ponto de vista do produtor) será k
(que é o número de usuários) vezes a disposição a pagar do consumidor marginal (equação
(42) ):
p( y ) = k ( p(ky ) − t ) .
(43)
Agora, o problema para o produtor do vídeo será:
max p ( y ) y − cy − F .
y
(44)
(43) em (44):
max k ( p (ky ) − t ) y − cy − F
y
max p (ky ) ky − kty − cy − F
y
c

max p (ky )ky −  + k  ky − F .
y
k

(45)
(40) em (45):
c 
max p ( x) x −  + t  x − F .
x
k 
(46)
Comparando o problema de maximização sem a possibilidade de alugar o vídeo (39) com o
que permite o aluguel (46), podemos notar que muda apenas o termo de custo: c em (39) e
c
k + t em (46). Por (46), o lucro será maior na situação em que o aluguel é possível se
c
+t < c
k
ou
t <c−
c
k
t<
ck − c
k
t<
c(k − 1)
k
tk < c(k − 1)
(47)
tk
<c
k −1
k
t <c.
k −1
(48)
Se o número de consumidores for grande k ≈ k − 1 , o que faz com que kk−1 → 1 . Neste casto,
(48) informa que se o custo de produzir o vídeo for mais alto do que o custo de
inconveniência ( c > t ), o lucro do produtor será maior se este permitir o aluguel do vídeo
produzido. Se c < t , o produtor terá mais lucro proibindo o aluguel.
© Sergio Da Silva 2010
sergiodasilva.com
Bens Públicos
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 36
Direitos de propriedade bem definidos para fumaça, por exemplo, são capazes de eliminar
externalidades de consumo entre dois consumidores que transacionam o direito. No caso da
externalidade de produção, os sinais dados pelos lucros podem arranjar os direitos de
propriedade da maneira mais eficiente. Quando houver propriedade comum, basta atribuir-se
direito de propriedade para uma das partes envolvidas para se remover a externalidade.
Porém, essas soluções não funcionam para mais de dois indivíduos.
Com um fumante e dois não fumantes, imagine que o direito de propriedade seja bem
definido: o direito ao ar puro é dos não fumantes, que podem transacioná-lo em troca de
apropriada compensação. Mas apenas definir o direito não resolve porque os não fumantes
precisam chegar a um acordo em relação à quantidade de fumaça que será permitida e sobre
qual deverá ser a compensação. O acordo é improvável se os não fumantes tiverem
preferências muitos diferentes e dotações distintas (um deles ser mais rico).
Esta externalidade de consumo de fumaça com três ou mais pessoas é um exemplo de
bem-público: o bem (ou o mal, no caso da fumaça para os não-fumantes) tem que ser
consumido por todos na mesma quantidade, mas cada consumidor atribui valor diferente para
ele. Outros exemplos de bens públicos são a defesa nacional, ruas e calçadas. Bens públicos
não podem ser alocados pelo mercado.
Compra de bens públicos
Um aparelho de TV na sala de dois colegas de república é um bem público. Vale a pena
comprá-lo? Cada consumidor 1 e 2 contribui com g1 e g 2 em dinheiro para comprar a TV
(bem público) e x1 e x2 é o dinheiro restante para ser gasto em bens privados. A riqueza
inicial de cada é w1 e w2 . As restrições orçamentárias são:
x1 + g1 = w1
(1)
x2 + g 2 = w2 .
(2)
A TV custa c em dinheiro. Para comprá-la, é preciso que
g1 + g 2 ≥ c .
(3)
A função utilidade do consumidor 1 é:
u1 = u1 ( x1 , G ) ,
(4)
G=0
(5)
onde
sem TV, ou
G =1
(6)
com TV. Não há subíndice, o que significa que o bem público é consumido ao mesmo tempo
pelos dois consumidores. A função utilidade do consumidor 2 é:
u2 = u2 ( x2 , G ) .
(7)
Cada consumidor valoriza os serviços da TV (programação) diferentemente.
Perguntando até quanto cada consumidor gostaria de pagar pela TV, poderíamos
conhecer seu preço de reserva r1 e r2 . Estamos, então, supondo que ambos não iriam mentir.
Ao preço de reserva r1 , o consumidor 1 seria indiferente entre pagar r1 para ter o bem público
ou não pagar e ficar sem ele.
Supomos que o preço de reserva depende da riqueza: o valor máximo que se quer
pagar depende de quanto se é capaz de pagar:
r1 ≤ w1
(8)
r2 ≤ w2 .
(9)
e
Se o consumidor 1 pagar o preço de reserva (menor do que a sua riqueza) sobra x1 em
dinheiro para ser gasto em bens privados:
x1 = w1 − r1 .
(10)
Se não pagar, ele terá toda a sua riqueza disponível para ser gasta nos bens privados:
x1 = w1 .
(11)
Se ele for indiferente entre pagar e não pagar, sua utilidade será ((4), (10) e (11)):
u1 = u1 ( x1 , G ) = u1 ( w1 − r1 ,1) = u1 ( w1 , 0 ) .
(12)
Similarmente, para o consumidor 2 temos:
x2 = w2 − r2
(13)
x2 = w2
(14)
u2 = u2 ( x2 , G ) = u2 ( w2 − r2 ,1) = u2 ( w2 , 0 ) .
(15)
Duas alocações são possíveis. Sem TV ((5), (11) e (14)):
( x1 , x2 , G ) = ( w1 , w2 , 0)
(16)
e com TV ((6)):
( x1 , x2 , G ) = ( x1 , x2 ,1) .
(17)
Substituindo (1) e (2) em (17):
( x1 , x2 , G ) = ( w1 − g1 , w2 − g 2 ,1) .
(17′)
Em (17′), o consumo privado de cada consumidor depende da riqueza que fica depois de se
gastar com o bem público.
Quando gastar com o bem público ( g1 , g 2 ) será uma melhoria de Pareto? (Sendo
possível melhoria, teremos ineficiência). Quando ((12))
u1 ( w1 , 0 ) < u1 ( x1 ,1)
(18)
u2 ( w2 , 0 ) < u2 ( x2 ,1) .
(19)
e ((15))
Se fossem indiferentes entre pagar ou não ((12) em (18)):
u1 ( w1 − r1 ,1) < u1 ( x1 ,1)
(20)
e ((15) em (19)):
u2 ( w2 − r2 ,1) < u2 ( x2 ,1) .
(21)
Pagando ((1) em (20)):
u1 ( w1 − r1 ,1) < u1 ( w1 − g1 ,1)
e ((2) em (21))
u2 ( w2 − r2 ,1) < u2 ( w2 − g 2 ,1) .
(22)
(23)
Supondo monotonicidade em (22) e (23), mais quantidades consumidas do bem privado
aumentam a utilidade dos consumidores:
w1 − r1 < w1 − g1
(24)
w2 − r2 < w2 − g 2
(25)
e
ou
r1 > g1 + w1 − w1
r1 > g1
(26)
r2 > g 2 + w2 − w2
r2 > g 2 .
(27)
e
Portanto, por (26) e (27), a contribuição de cada consumidor ( g1 e g 2 ) é menor do que o
preço máximo que cada um estaria disposto a pagar ( r1 e r2 ). Neste caso, há ineficiência e
ambos melhorariam sua situação comprando a TV.
Considerando (3), para a TV ser de fato adquirida e ambos melhorarem,
r1 + r2 > g1 + g 2 = c .
(28)
Portanto, se a soma dos preços de reserva for maior do que o preço da TV é vantajoso para
ambos comprarem o bem público. A soma das vontades de pagar deve ser pelo menos igual
ao custo.
Como os preços de reserva, r1 e r2 , dependem da riqueza, w1 e w2 , dependendo de
como a riqueza esteja distribuída pode ocorrer tanto r1 + r2 > c ou r1 + r2 < c . A compra ou
não do bem público dependerá da distribuição da riqueza. Por exemplo, se o consumidor 1
tiver toda a riqueza e gostar muito de TV e se o consumidor 2 for indiferente a TV, o
consumidor 1 comprará sozinho e ocorrerá uma melhoria de Pareto. Mas se o consumidor 2
tiver toda a riqueza, como ele não se importa com TV, poderia não comprá-la.
Descartando as hipóteses (8) e (9) e considerando preferências quase-lineares, a
compra do bem público independerá da distribuição da riqueza:
u1 ( x1 , G ) = x1 + v1 ( G )
(29)
u2 ( x2 , G ) = x2 + v2 ( G ) .
(30)
Sem TV, G = 0 e a utilidade do bem público seria zero:
v1 ( 0 ) = v2 ( 0 ) = 0 .
(31)
Sendo o consumidor 1 indiferente entre pagar ou não ((12) em (29)):
u1 ( x1 , G ) = w1 − r1 + v1 (1) = w1 + v1 ( 0 ) .
(32)
(31) em (32):
w1 − r1 + v1 (1) = w1
r1 = v1 (1) + w1 − w1
r1 = v1 (1) .
(33)
Sendo o consumidor 2 indiferente entre pagar ou não ((15) em (30)):
u2 ( x2 , G ) = w2 − r2 + v2 (1) = w2 + v2 ( 0 ) .
(34)
(31) em (34):
w2 − r2 + v2 (1) = w2
r2 = v2 (1) + w2 − w2
r2 = v2 (1) .
(35)
(33) e (35) não dependem de g1 e g 2 e, por (1) e (2), não dependem de w1 e w2 . Apesar
disto, r1 e r2 ainda dependem indiretamente de w1 e w2 por (8) e (9).
Comprar ou não o bem público
Os consumidores 1 e 2 podem não revelar seus preços de reserva verdadeiros r1 e r2 . Mesmo
que
r1 > c
(36)
r2 > c ,
(37)
e
se a riqueza dos dois consumidores for suficiente para comprar a TV, o consumidor 1 pode
mentir e dizer que
r1 = 0
(38)
e o consumidor 2 compraria a TV sozinho. Mas o consumidor 2 pode agir da mesma forma.
Há incentivos para que um consumidor tente se aproveitar do outro.
Supondo que
w1 = w2 = 500
(39)
r1 = r2 = 100
(40)
c = g1 + g 2 = 150 .
(41)
e
Neste caso,
r1 + r2 > c
(42)
e vale a pena comprar a TV.
Comprando sozinho, o consumidor 1 terá o benefício r1 = 100 e o custo g1 = c = 150
e, portanto, um prejuízo líquido igual a −50. Neste caso, o consumidor 2 terá o benefício r2 =
100 e o custo g 2 = 0 e, portanto, um benefício líquido de 100. O mesmo raciocínio se aplica
se o consumidor 2 comprar sozinho. Se ninguém comprar, não haverá benefício. A matriz de
resultados é dada a seguir. Em (0, 0) ocorre o equilíbrio de Nash com estratégias dominantes.
Ninguém compra.
Consumidor 2
Compra sozinho Não compra
Compra sozinho
−50, −50
−50, 100
Consumidor 1
Não compra
100, −50
0, 0
Compra do bem público
Em vez de simplesmente pensarmos na decisão de comprar ou não ( G = 1 ou G = 0),
podemos supor que ambos contribuam para comprar uma TV de qualidade G , tendo que
gastar c ( G ) . Quanto maior a qualidade G , maior o custo c . A restrição orçamentária fica:
x1 + x2 + c ( G ) = w1 + w2 .
(43)
Uma vez comprada a TV, chega-se à eficiência onde a utilidade de um consumidor não pode
ser mais aumentada sem, com isso, reduzir a do outro.
Maximizamos a utilidade do consumidor 1 sujeita ao fato de que a utilidade de 2 fique
fixa em u2 e de que a restrição orçamentária seja obedecida:
max u1 ( x1 , G )
(44)
u2 ( x2 , G ) = u2
(45)
x1 + x2 + c ( G ) = w1 + w2 .
(43)
x1 , x2 ,G
tal que
e
O lagrangeano é
L = u1 ( x1 , G ) − λ ( u2 ( x2 , G ) − u2 ) − µ ( x1 + x2 + c(G ) − w1 − w2 ) .
Condições de primeira ordem:
∂L ∂u1
=
−µ =0
∂x1 ∂x1
(46)
∂L
∂u
= −λ 2 − µ = 0
∂x2
∂x2
(47)
∂u
∂L ∂u1
∂c
=
−λ 2 −µ
= 0.
∂G ∂G
∂G
∂G
(48)
(48) pode ser reescrita como
∂u
∂c ∂u1
=
−λ 2
∂G ∂G
∂G
∂c 1 ∂u1 λ ∂u2
=
−
.
∂G µ ∂G µ ∂G
µ
(48′)
(46) pode ser reescrita como
µ=
∂u1
∂x1
(46′)
e (47) pode ser reescrita como
∂u2
∂x2
∂u
µ
=− 2
∂x2
λ
µ = −λ
1
(47′)
1
µ
∂u2
λ
∂x2
λ
1
=−
.
∂
u2
µ
∂x2
=−
(47″)
(46′) e (47″) em (48′):

∂c
1 ∂u
1
= ∂u ⋅ 1 −  − ∂u
∂G ∂x1 ∂G  ∂x2
1
 2
∂c
=
∂G
∂u1
∂G
∂u1
∂x1
+

 ∂u2
 ∂G

∂u2
∂G
∂u2
∂x2
CM (G ) = TMS1 + TMS 2 .
Como CM (G ) > 0 ,
(49)
CM (G ) = TMS1 + TMS 2 .
(49′)
Logo, a soma dos valores absolutos das taxas marginais de substituição entre o bem privado e
o bem público para os dois consumidores deve se igualar, no ótimo, ao custo marginal de se
comprar uma unidade a mais do bem público. Isto é eficiente, já que as TMS medem a
vontade marginal de se pagar por uma unidade extra do bem público e a soma das vontades
marginais de pagar se iguala ao custo de se produzir a unidade a mais.
Por exemplo, para
CM (G ) = 1
TMS1 = 14
TMS 2 = 12 ,
a soma
TMS1 + TMS 2 =
1 1 1+ 2 3
+ =
=
4 2
4
4
é diferente de CM (G ) = 44 . Isto deve ser ineficiente de acordo com (49′), o que significa que
se pode melhorar a situação dos dois consumidores. Se o preço do bem privado for igualado
ao preço do bem público em $1 por unidade, TMS1 = 14 significa que o consumidor 1
aceitaria $ 14 a mais do bem privado por $1 de redução do bem público. E TMS 2 =
1
2
significa
que o consumidor 2 aceitaria $ 12 a mais do bem privado por $1 de redução do bem público.
Suponha que o bem público seja reduzido de uma unidade e que, portanto, economizamos um
dólar. Para compensar, oferecemos os 34 de dólar que os consumidores desejam e sobra 14 de
dólar. Se este 14 de dólar for repartido entre os consumidores, ambos melhorariam sua
situação, o que demonstra ineficiência. Portanto, se a soma das vontades marginais de se
pagar pelo bem público for maior do que o custo marginal de produzi-lo, será apropriado
fornecer mais do bem público.
A condição de eficiência para os bens privados é que a TMS de cada consumidor se
iguale ao custo marginal, enquanto que para o bem público a condição de eficiência é que a
soma das TMS de cada consumidor se iguale ao custo marginal. Embora cada consumidor
possa consumir diferentes quantidades do bem privado, cada consumidor atribui ao bem o
mesmo valor na margem; caso contrário, eles se engajariam na troca. Porém, cada consumidor
deve consumir a mesma quantidade do bem público, embora cada um atribua um valor
diferente para ele na margem.
Compra de bens públicos com preferências quase-lineares
No caso especial em que os consumidores têm preferências quase-lineares:
ui ( xi , G ) = xi + vi ( G ) .
O problema agora é
(50)
max x1 + v1 ( G )
(51)
x2 + v2 ( G ) = u2
(52)
x1 , x2 ,G
tal que
e
x1 + x2 + c ( G ) = w1 + w2 .
(43)
Lagrangeano:
L = x1 + v1 (G ) − λ ( x2 + v2 (G ) − u2 ) − µ ( x1 + x2 + c(G ) − w1 − w2 ) .
(53)
Condições de primeira ordem:
∂L
= 1− µ = 0
∂x1
µ =1
(54)
∂L
= −λ − µ = 0
∂x2
λ = −µ .
(55)
(54) e (55):
λ = −1
(55′)
∂L ∂v1
∂v
∂c
=
−λ 2 −µ
=0
∂G ∂G
∂G
∂G
∂v
∂c ∂v1
µ
=
−λ 2 .
∂G ∂G
∂G
(56)
(54) e (55′) em (56):
∂c ∂v1 ∂v2
=
+
∂G ∂G ∂G
(57)
ou, no caso discreto,
CM (G ) =
∆v1 (G ) ∆v2 (G )
+
.
∆G
∆G
(58)
Portanto, G* pode ser encontrado independentemente de x1 e x2 , que não entram na
expressão (58). Em geral, a quantidade ótima do bem público G * é diferente para diferentes
alocações do bem privado x1 e x2 (equação (49)). Com preferências quase-lineares, há um
único nível eficiente do bem público G * , já que este independe de x1 e x2 (equação (58)).
Neste caso, todas as alocações ( x1* , x2* , G * ) eficientes de Pareto são encontradas apenas
redistribuindo x1* e x2* , já que G * é único.
Poluição como mal público
Como no caso do bem público de consumo, podemos encontrar a provisão eficiente de um
bem público de produção. Retomemos o exemplo da produção de aço, peixe e poluição.
Poluição será um mal público se houver duas empresas de pesca, além da siderúrgica que
produz aço e poluição. Podemos então achar a quantidade de poluição eficiente de Pareto. A
quantidade eficiente é aquela em que o custo externo da poluição é internalizado. Para que
isso seja possível, temos que considerar a maximização da soma dos lucros das três empresas
(como se houvesse uma fusão). Isto significa também que estamos minimizando o custo
social total da poluição. O custo cs da siderúrgica é
cs ( s , x ) ,
(59)
onde s é a quantidade de aço produzida e x é a quantidade de poluição gerada. O custo da
primeira empresa de pesca c1f é
c1f ( f1 , x) ,
(60)
onde f1 é a quantidade de peixes pescada pela primeira empresa, e o custo da segunda
empresa de pesca é
c 2f ( f 2 , x) .
(61)
A soma dos lucros das três empresas é maximizada fazendo
max ps s + p f f1 + p f f 2 − cs ( s, x) − c1f ( f1 , x) − c 2f ( f 2 , x) .
s , f1 , f 2 , x
(62)
Derivando e igualando a zero em relação a cada variável de escolha, temos, em relação a s ,
ps − cs′ = 0
ps = CM ( s ) .
(63)
Em relação a f1 :
p f − c1f ′ = 0
p f = CM 1 ( f ) .
(64)
Em relação a f 2 :
p f − c 2f ′ = 0
p f = CM 2 ( f ) .
(65)
As condições (63), (64) e (65) são as mesmas que aquelas do Capítulo 34. A novidade está na
última condição de primeira ordem. Derivando-se em relação a x :
−cs′ − c1f ′ − c 2f ′ = 0
cs′ + c1f ′ + c 2f ′ = 0
ou
CM s ( x* ) + CM f1 ( x* ) + CM f2 ( x* ) = 0
(66)
CM f1 ( x* ) + CM f2 ( x* ) = −CM s ( x* ) .
(66′)
A quantidade eficiente de poluição x* é aquela para a qual a soma dos custos marginais da
poluição para as empresas de pesca se iguala ao benefício marginal para a empresa
siderúrgica.
Free riding na compra do bem público
O consumidor 1 possui w1 , fica com a fração x1 para consumo do bem privado e tira a fração
g1 para contribuir com a compra do bem público. O consumidor 2 tem w2 e usa x2 para
comprar o bem privado e g 2 para contribuir com a compra do bem público. O provimento do
bem público custa, por hipótese,
c(G ) = G .
(67)
Logo, o custo marginal de prover uma unidade a mais do bem público é, derivando (67) em
relação a G :
c′(G ) = 1
CM (G ) = 1 .
(68)
Portanto, o custo marginal é constante e igual a 1. A quantidade total do bem público a ser
provida precisa ser
G = g1 + g 2 .
A função utilidade do consumidor 1 é
(69)
u1 = u1 ( x1 , G ) .
(70)
(69) em (70):
u1 = u1 ( x1 , g1 + g 2 ) .
(70′)
Analogamente, a função utilidade do consumidor 2 é
u2 = u2 ( x2 , G ) = u2 ( x2 , g1 + g 2 ) .
(71)
O consumidor 1 maximiza sua utilidade fazendo a previsão de que a contribuição do
consumidor 2 para a compra do bem público será g 2 :
max u1 ( x1 , g1 + g 2 )
x1 , g1
(72)
tal que
x1 + g1 = w1 .
(1)
Lagrangeano:
L = u1 ( x1 , g1 + g 2 ) − λ ( x1 + g1 − w1 ) .
(73)
Condições de primeira ordem:
∂L ∂u1
=
−λ = 0
∂x1 ∂x1
∂u1
=λ
∂x1
∂L ∂u1
=
−λ = 0
∂g1 ∂g1
∂u1
=λ
∂g1
(74)
(75)
Dividindo (76) por (75):
∂u1
∂g1
∂u1
∂x1
λ
=1
λ
(76)
TMS1 = 1 .
(77)
=
ou
Analogamente, inferimos que
TMS 2 = 1 .
(78)
(77) e (78):
TMS1 = TMS 2 = 1 .
(79)
Supomos agora que
g1 ≥ 0
(80)
g2 ≥ 0 ,
(81)
e
o que significa que nenhum consumidor pode reduzir a quantidade do bem público a ser
comprada: pode apenas aumentá-la ou deixá-la inalterada. Dado que cada consumidor
maximiza sua utilidade supondo conhecer a contribuição do outro ( g1 e g 2 ), temos um
equilíbrio de Nash. Cada consumidor pode não contribuir se a contribuição do outro for
suficiente para comprar o bem público. Free riding ocorre no equilíbrio de Nash, que é
ineficiente de Pareto.
Por exemplo, se a contribuição do consumidor 1 for suficiente,
g1 = G
(82)
e, por (69),
g2 = 0 .
(83)
Por (1) e (82), a riqueza do consumidor 1 fica sendo
x1 + g1 = x1 + G = w1
(84)
e, analogamente, a riqueza do consumidor 2 fica sendo
x2 + g 2 = x2 + 0 = w2
x2 = w2 .
(85)
O consumidor 2 pega carona com a contribuição do consumidor 1 para a compra do bem
público (Figura 1). Se o consumidor 1 contribui e o consumidor 2 não contribui, mas poderia
ter contribuído, a quantidade do bem público no equilíbrio de Nash é ineficiente, abaixo da
que seria socialmente eficiente. Free riding gera ineficiência.
Votação
Vimos que, para que haja eficiência de Pareto, não podem existir externalidades de consumo:
a utilidade de um consumidor não pode ser afetada pelo consumo de outro. Como todos
consomem a mesma quantidade do bem público, as utilidades dos consumidores são
mutuamente dependentes. Podem, então, ocorrer externalidades de consumo e o mercado
competitivo não necessariamente provê a quantidade eficiente do bem público.
Descartando-se o mecanismo de comando, resta apelar para o sistema de votação para
a escolha das quantidades do bem público. Infelizmente, o mecanismo de votação também
não garante a escolha da quantidade eficiente, já que está sujeito ao paradoxo do voto
(Capítulo 33). Ao escolher entre três níveis de gasto com defesa pública, A, B e C, é possível
que a maioria prefira A a B, B a C e C a A. As preferências sociais não são transitivas.
Porém, se o consumidor 1 levar em conta sua utilidade líquida do bem público (entre o
gasto com o bem público G e a sua contribuição g1 ) e todos os outros consumidores também
considerarem suas utilidades líquidas, basta que o formato das preferências seja como na
Figura 2a: uma parábola de único pico. Isto significa que a utilidade líquida com o bem
público inicialmente aumenta por causa do benefício gerado pelo bem público, chega ao
ponto mais preferido e depois cai devido aos custos de se prover o bem público. Com
preferências individuais com esse formato, as preferências sociais não exibirão o paradoxo do
voto. Porém, o paradoxo continua se as preferências forem como as desenhadas na Figura 2b.
O gasto escolhido G * será aquele para o qual metade dos consumidores quer gastar
mais e a outra metade quer gastar menos. Mas isso não informa quão mais do bem eles
querem. Já que é isto o que a noção de eficiência captura, mesmo que a escolha de G* com
preferências sociais de único pico não sejam intransitivas, a escolha por votação continua
ineficiente. Além disso, mesmo que os consumidores tenham preferências de único pico, eles
ainda possuem o incentivo de não votar em suas preferências verdadeiras para manipular o
resultado em seu favor.
Imposto de Clarke
Os consumidores poderão revelar o valor verdadeiro que atribuem ao bem público através do
mecanismo de mercado se as preferências forem quase-lineares. Como vimos, com
preferências quase-lineares há um nível ótimo de bem público e a questão é encontrá-lo.
Vamos supor que o problema seja provê-lo ou não.
Uma associação de moradores pensa em iluminar uma rua de um condomínio. A
compra do material custa $100. Cada consumidor atribui um preço de reserva diferente ao
bem público: vi . Como vimos, vale a pena comprar o bem público se
n
∑v
i =1
i
≥ $100 .
(86)
Pedindo aos consumidores que informem seus vi , eles possuem incentivos para mentir, já que
podem pegar carona com os outros: se outros pagarem o suficiente, por que contribuir?
Um mecanismo capaz de evitar este problema é decidir que, uma vez que se decida
que a rua será iluminada, cada morador paga uma quantia predeterminada ci . Depois, cada
consumidor poderá informar seu vi , quando poderemos conhecer o valor líquido
ni = vi − ci .
(87)
Depois somamos todos os ni para ver se o total é positivo, o que teria justificado a escolha de
comprar o bem público.
Há ainda um problema, pois cada consumidor pode exagerar no valor informado de vi .
Os consumidores que quiserem que a compra do bem público seja feita podem aumentar em
muito seu valor verdadeiro de vi , já que isto não afeta seu pagamento ci , faz com que a soma
dos ni fique positiva e decida-se comprar o bem público.
Apenas os consumidores que conseguem alterar a soma total dos ni importam: os
pivôs. Precisamos, então, de um mecanismo para que os pivôs tenham incentivos para não
exagerar vi e revelem seu preço de reserva verdadeiro.
Supondo que o consumidor j seja o pivô, se a soma de todos os ni , com i ≠ j , for
positiva (decisão de iluminar a rua) e, por causa de n j decida-se não iluminar, ∑ ni + n j < 0 ,
então o consumidor j causa o dano social de
H j = ∑ ni > 0 .
(88)
i≠ j
A solução seria cobrar um imposto (de Clarke) do consumidor pivô. No exemplo em
que o pivô alterou a decisão de provisão de bem público (iluminar a rua) para não provisão
(não iluminar), o imposto de Clarke seria:
H j = ∑ si ,
(89)
i≠ j
onde si é o valor líquido informado por cada consumidor, que pode ou não ser o valor líquido
verdadeiro ni . Se o pivô tivesse alterado a decisão social de não provisão para provisão, o
imposto de Clarke seria:
H j = −∑ si .
(90)
i≠ j
O imposto não poderia ser distribuído para os outros moradores, já que isso alteraria
seu comportamento. Deveria ser pago ao síndico (governo) e não importa como o síndico
venha a usar o dinheiro.
Outro exemplo: três estudantes de uma república, 1, 2 e 3, precisam decidir se
compram uma TV para a sala, que custa $300. Cada um concorda em pagar antecipadamente
$100, que seria usado no caso de se decidir comprar o bem público. Os preços de reserva
verdadeiros dos consumidores 1 e 2 são $50 para cada e o do consumidor 3 é $250. Os dados
estão na tabela a seguir.
Consumidor
ci
vi
ni
Hj
1
2
3
100
100
100
50
50
250
−50
−50
150
0
0
100
A soma dos vi é 350, acima do custo de 300: comprar a TV gera uma melhoria de
Pareto. Mas, se votassem, ganharia a escolha de não comprá-la. Os consumidores 1 e 2
votariam em não comprar ( n1 e n2 são negativos). O imposto de Clarke possibilita que a
escolha ótima de Pareto seja feita, que é comprar a TV. O imposto é cobrado do pivô.
Considerando o consumidor 1, somando n2 e n3 (= −50 + 150) dá 100 e a escolha
seria comprar, diferente do que o consumidor 1 deseja. Sozinho, ele não pode influenciar a
escolha. Portanto, o consumidor 1 não é pivô, e seu imposto será zero. Exagerando seu preço
de reserva, ele teria que reportar s1 = −100 ou abaixo, para ultrapassar 100, ni ficar negativo e
a TV deixar de ser comprada. Mas, se ele fizer isso, torna-se pivô e o imposto de Clarke para
ele seria agora 100, ou seja, n2 + n3 (equação (88)). Ele estava querendo ganhar 50, ou seja,
s1 − n1 = 100 − 50, mas terá que pagar 100 de imposto. No final, ele acabaria perdendo 50.
Assim, não vale a pena exagerar. O mesmo raciocínio se aplica ao consumidor 2, já que os
dados são os mesmos.
Para o consumidor 3, somando n1 e n2 (= −50 − 50) dá −100. Como
(n3 = 150) > (n1 + n2 = 100) , o consumidor 3 é pivô, pois ni fica positivo por sua causa e a TV
seria comprada. Por (90), ele deve pagar o imposto de Clarke de 100. Como n3 = 150, menos
100 de imposto ele fica com 50 e não vale a pena exagerar v3 . Com o imposto de Clarke, a
TV seria comprada e ninguém teria incentivo para exagerar vi .
Porém, o imposto de Clarke somente funciona com preferências quase-lineares, para
as quais a riqueza de cada consumidor não influencia a demanda pelo bem público e há um
único nível ótimo do bem público. O imposto de Clarke garante que o nível de gasto com o
bem público seja ótimo, mas o consumo privado é reduzido quando do pagamento do
imposto. O resultado é, então, Pareto-ineficiente, já que o consumo privado poderia ser maior
caso não houvesse o imposto. O imposto de Clarke garante que, se todos puderem ter sua
situação melhorada com o fornecimento do bem público, então este será fornecido. Mas isto
não significa que todos terão sua situação melhorada. Alguns perdem (consumidores 1 e 2)
para que o bem público seja fornecido.
© Sergio Da Silva 2010
sergiodasilva.com
Informação Assimétrica
Hal R. Varian
Intermediate Microeconomics, 8th edition
Capítulo 37
Se consumidores e vendedores tiverem a mesma informação sobre a qualidade do bem, uma
melhor qualidade seria corretamente informada por um preço mais alto. Mas se um lado do
mercado for mais informado do que o outro, os preços não informarão corretamente a
qualidade. Assimetria de informação impede o funcionamento eficiente do mercado.
Mercado de carros usados
Os vendedores de carros usados conhecem melhor a qualidade do produto do que os
compradores. Supomos que existem 100 vendedores de 100 carros usados e 100 potenciais
compradores. Todos sabem que 50 carros estão em boas condições e 50 são ruins. Mas apenas
os vendedores sabem quais são exatamente os bons e quais são os ruins. Quem tem carro ruim
quer vender por $1000 e quem tem carro bom quer vender por $2000. Os preços de reserva
dos compradores são maiores: querem pagar até $1200 por um carro ruim e $2400 por um
carro bom.
Se não houvesse informação assimétrica, os carros ruins seriam vendidos por preços
entre $1000 e $1200 e os carros bons seriam vendidos por preços entre $2000 e $2400. Mas
se os consumidores precisarem adivinhar quais dos carros são bons ou ruins, resta a eles
pensar que as chances são iguais. Eles então pagariam por um carro de qualidade
desconhecida o valor esperado de $1800:
1
1
VE = 1200 + 2400 = 1800 .
2
2
(1)
Mas por $1800 nenhum vendedor de carro bom quer vender: o preço mínimo para eles é
$2000. Neste caso, há uma externalidade negativa: as vendas dos carros ruins reduzem o valor
médio que os consumidores querem pagar e reduzem as vendas dos carros bons.
Escolha da qualidade
Os consumidores querem comprar guarda-chuvas, mas não conhecem sua qualidade. O seu
preço de reserva é $14 para os de boa qualidade e $8 para os de má qualidade. Os vendedores
em concorrência pura têm um custo marginal de $11.50 para os dois tipos de guarda-chuva.
Como os consumidores não sabem que fração q de guarda-chuvas será de boa qualidade, o
preço médio que eles gostariam de pagar será:
p = 14q + 8(1 − q) .
(2)
Os vendedores produzem se esse preço for maior ou igual ao custo de $11.50:
p = 14q + 8(1 − q) ≥ 11.50 .
(3)
O menor valor de q que faz com que os consumidores queiram pagar exatamente $11.50 é:
p = 14q + 8(1 − q) = 11.50
14q + 8 − 8q = 11.50
6q = 11.50 − 8
6q = 3.50
3.50
q=
.
6
(3′)
(4)
Multiplicando o numerador e o denominador por 2:
q=
7
.
12
(4′)
Portanto, se a fração de guarda-chuvas de boa qualidade for 127 , os consumidores estariam
dispostos a pagar exatamente p = $11.50. Como $11.50 está abaixo do preço de reserva de
$14, eles aceitariam pagar qualquer valor entre $11.50 e $14 para adquirir guarda-chuvas de
qualidade igual ou superior a 127 . O equilíbrio ocorrerá no intervalo
q = 127 ,1 .
(5)
Como em concorrência pura os vendedores podem apenas vender por
p = CM = 11.50
(6)
se, por exemplo, apenas guarda-chuvas de boa qualidade forem produzidos ( q = 1 e p =
$11.50), o excedente do consumidor será máximo: $2.50 (=$14 − $11.50) (Figura 1).
Se os custos marginais forem diferentes, podemos supor que, para produzir guardachuva de boa qualidade,
CM q = 11.50
(7)
e, para produzir guarda-chuva de má qualidade,
CM 1− q = 11 .
(8)
Um pequeno produtor não consegue afetar nem o preço p nem a qualidade q . Ele assim
prefere produzir guarda-chuvas de má-qualidade de custo marginal menor. Se todos os outros
pequenos produtores raciocinarem da mesma forma, todos produzirão guarda-chuva de má
qualidade ao preço
p = CM 1− q = 11 .
(9)
Porém, como os consumidores pagam no máximo $8 por guarda-chuvas de má qualidade,
nenhum item seria vendido. Há seleção adversa porque, na presença de informação
assimétrica, o bem de má qualidade expulsa do mercado o bem de boa qualidade até destruir o
próprio mercado.
Seleção adversa
Uma companhia de seguros pensa em oferecer seguro contra roubo de bicicleta. Através de
uma pesquisa de mercado, ela descobre que a incidência de roubo é alta em uma área e baixa
em outra. Se oferecer o seguro com base na taxa de roubo média, a firma fica em situação
difícil porque quem vai acabar comprando são os consumidores da área de alta ocorrência de
roubo, e estes vão acabar fazendo os pedidos de pagamento do seguro. Baseando-se na taxa
média de furtos, a companhia não fará uma seleção imparcial de clientes, mas sim uma
seleção adversa.
Se a companhia oferecer o seguro com base na taxa de roubo da área de maior risco, a
situação piora: o preço será muito alto para os consumidores de menor risco, que não
comprarão a apólice e sairão do mercado.
Na seleção adversa há uma externalidade de consumo, pois as compras dos
consumidores de alto risco afetam as compras dos consumidores de menor risco, expulsando
estes últimos do mercado.
Para impedirmos a seleção adversa, todos os consumidores precisam inicialmente
voltar ao mercado. Obrigando a companhia a cobrar o seguro com base na taxa média, que é
menor do que o seguro baseado na taxa de maior risco, os consumidores de baixo risco
retornariam ao mercado e os consumidores de alto risco comprariam o seguro a uma taxa
menor. O governo então interferiria para garantir essa melhoria de Pareto e socorreria a
companhia em caso de inadimplência.
Perigo moral
Se todos tiverem a mesma probabilidade de roubo no mercado de seguros de bicicleta, não
surgirá o problema de seleção adversa. Mas a própria probabilidade de roubo pode ser afetada
pelas ações dos donos das bicicletas: fazendo o seguro, um consumidor toma menos cuidados
do que se não fizesse o seguro. Sem seguro, cada consumidor terá que enfrentar os custos de
suas atitudes e vai querer investir em “tomar cuidado” até que o benefício marginal de mais
cuidado se iguale ao custo marginal. Com seguro completo, a companhia reembolsa
completamente o valor da bicicleta e o consumidor, racionalmente, não terá nenhum incentivo
para investir em tomar cuidado: ocorrerá o perigo moral.
Em suma, com pouco seguro, os consumidores enfrentam demasiados riscos; com
muito seguro, tomam pouco cuidado. Por essa razão, sem conhecer a quantidade de cuidado
que cada consumidor toma, as companhias costumam não vender o seguro completo. De fato,
a maior parte dos seguros inclui uma franquia, que o segurado paga ao solicitar o pagamento
do seguro. Mas o consumidor desejaria comprar o seguro completo. Há ineficiência porque a
propensão marginal a pagar não se iguala à propensão marginal a vender, já que ocorre
racionamento da parte da empresa.
Enquanto a seleção adversa é um problema de informação escondida, em que um lado
do mercado não pode observar a qualidade dos bens do outro, o perigo moral é um problema
de ação escondida: um lado do mercado não pode observar as ações do outro.
No caso de perigo moral, se o governo não puder monitorar o quanto os consumidores
tomam cuidado, ele não poderá melhorar a situação, a não ser que uma determinada
quantidade de cuidado seja tornada obrigatória por lei.
Sinalização
No mercado de carros usados com informação assimétrica, os vendedores de carros bons
podem querer sinalizar que seus carros são os bons, e não os ruins, evitando problemas de
seleção adversa. Um sinal poderia ser a garantia de que eles se comprometem a pagar certa
quantia se o carro der defeito. Somente donos de carros bons podem se dar ao luxo de
oferecer garantias, e os compradores sabem disso.
No mercado de trabalho, o problema da seleção adversa também surge e os
trabalhadores mais produtivos podem querer demonstrar que são, de fato, mais produtivos. A
produtividade marginal dos trabalhadores produtivos é a2 e a dos menos produtivos é a1 .
Logo,
a1 < a2
(10)
ou
a2 − a1 > 0 .
(10′)
Uma fração b dos trabalhadores é mais produtiva e a fração 1 − b é menos produtiva. O
mercado de trabalho é competitivo e a função produção é linear:
y = a1 L1 + a2 L2 ,
(11)
onde y é a produção total e Li é a quantidade de trabalhadores do tipo i .
Se a qualidade dos trabalhadores pudesse ser observada, as empresas pagariam salários
iguais às produtividades marginais:
w1 = a1
(12)
w2 = a2
(13)
e
e não haveria seleção adversa. Porém, se as empresas não puderem observar as produtividades
marginais, o melhor que elas podem fazer é pagar o salário médio:
w = (1 − b)a1 + ba2 .
(14)
Se tanto os trabalhadores mais produtivos como os menos produtivos concordassem em
receber esse salário médio w não haveria problemas de seleção adversa. Mas como w < w2 ,
os trabalhadores mais produtivos podem não concordar com w . Neste caso, haveria seleção
adversa, pois eles sairiam do mercado de trabalho.
Os trabalhadores mais produtivos podem querer sinalizar que são, de fato, mais
produtivos (para receber w2 ) através do sinal de anos de escolaridade. O nível de escolaridade
atingido pelos trabalhadores menos produtivos é e1 e o dos mais produtivos é e2 . O custo de
se educar é c1e1 para os menos produtivos e c2 e2 para os mais produtivos. Este custo inclui
não apenas o custo de ir para a escola, mas também o custo do esforço e o custo de
oportunidade diante de escolhas alternativas.
Supomos que o custo marginal (igual ao custo médio) seja maior para os trabalhadores
menos produtivos:
c1 > c2 .
(15)
Por simplicidade, supomos também que o nível de escolaridade não afeta a produtividade e
que serve apenas para sinalizá-la. Assim, os trabalhadores precisam decidir que nível de
escolaridade e desejam e as empresas precisam resolver quanto pagar aos trabalhadores com
diferentes níveis de escolaridade e .
Multiplicando (15) por (10′):
c1 (a2 − a1 ) > c2 (a2 − a1 )
a2 − a1 a2 − a1
>
c2
c1
a2 − a1 a2 − a1
<
.
c1
c2
(16)
O nível de escolaridade e* que precisa satisfazer (16) deve estar no intervalo
a2 − a1
a −a
< e* < 2 1 .
c1
c2
(17)
Note que a2 − a1 fornece o benefício do aumento de salário para os dois tipos de
trabalhadores. Se o grupo menos produtivo estiver pensando em escolher e* , seu custo será
c1e* . O benefício dessa escolha será maior do que o custo se
a2 − a1 > c1e*
a2 − a1
> e* .
c1
(18)
Mas isto contradiz (17). Então, para o grupo menos produtivo, o custo de escolher e* supera o
benefício.
Por outro lado, para o grupo mais produtivo, escolher e* tem custo c2 e* . O benefício
supera o custo se
a2 − a1 > c2 e*
a2 − a1
> e* ,
c2
(19)
que é validado por (17). Assim, apenas os trabalhadores mais produtivos são capazes de
escolher e* . As empresas então pagam aos trabalhadores com nível de escolaridade e* o
salário w2 .
O equilíbrio em (17) permite, através da escolha diferente, a separação dos
trabalhadores dos dois tipos (separating equilibrium). Como os trabalhadores mais produtivos
pagam para sinalizar sua produtividade sem aumentá-la, o mesmo produto anterior é
produzido. A aquisição de sinal é um desperdício e, assim, o equilíbrio de sinalização
separating é socialmente ineficiente.
A origem dessa ineficiência é uma externalidade negativa. Se os trabalhadores mais
produtivos recebessem o salário médio w menor do que w2 , isto ocorreria devido à existência
de trabalhadores menos produtivos. O investimento em sinalização oferece aos mais
produtivos um benefício privado, mas nenhum benefício social.
Se fizéssemos a hipótese (menos realista) contrária a (15):
c1 < c2 ,
(20)
o grupo mais produtivo não escolheria e* , não ocorreria a sinalização e ele aceitaria o salário
médio w : os dois grupos fariam a mesma escolha (pooling equilibrium). Mas se (20) fosse
verdadeira, o grupo 1 é que seria mais produtivo.
Incentivos
A quantidade produzida da empresa y depende do esforço x feito pelo trabalhador:
y = f ( x) .
(21)
Sendo o preço
p = 1,
(22)
o valor p ⋅ y do produto se reduz a y . Se o trabalhador (agente) produzir um valor do produto
de y dólares, o dono da empresa (principal) paga a ele s ( y ) . O principal maximiza lucro
fazendo
max y − s ( y ) .
s
(23)
(21) em (23):
max f ( x) − s ( f ( x) ) .
x
(24)
Sendo c( x) o custo de se esforçar do trabalhador, onde tanto o custo total como o custo
marginal aumentam quando o esforço aumenta, a utilidade do trabalhador será
u = s( y ) − c( x) .
(25)
(21) em (25):
u = s ( f ( x) ) − c ( x ) .
(26)
O trabalhador também recebe utilidade ν de outras tarefas ou de lazer. Por hipótese,
v=u.
(27)
Para que o trabalhador aceite trabalhar em determinada empresa em vez de realizar outras
tarefas ou ter lazer:
s ( f ( x) ) − c ( x ) ≥ u .
(28)
Se ele apenas satisfizer a “restrição de participação” (28), então
s ( f ( x) ) − c ( x ) = u .
(29)
O problema agora para o principal é
max f ( x) − s ( f ( x) )
x
(24)
sujeito a
s ( f ( x) ) − c( x) = u .
(29)
(29) em (24):
max f ( x) − c( x) − u
(30)
f ′ − c′ = 0
f ′ = c′
PM ( x* ) = CM ( x* ) .
(31)
x
Para que o trabalhador se esforce em exatamente x* , a sua utilidade ao escolher o
esforço x* não pode ser menor do que qualquer outro nível de esforço x :
s ( f ( x* ) ) − c( x* ) ≥ s ( f ( x) ) − c( x) , ∀x .
(32)
Se o produto vier da terra, o proprietário (principal) poderia alugar a terra ao
trabalhador (agente) pelo aluguel R . Um esquema de incentivo útil seria deixar ao
trabalhador todo o produto acima do aluguel:
s ( f ( x) ) = f ( x) − R .
(33)
Por (26), o trabalhador maximiza
max s ( f ( x) ) − c( x) .
(34)
(33) em (34):
max f ( x) − R − c( x)
x
(35)
f ′ − c′ = 0
f ′ = c′
PM ( x* ) = CM ( x* ) .
(31)
Esta é exatamente a condição que o principal deseja.
O aluguel a ser cobrado pode ser encontrado substituindo (33) em (29):
f ( x) − R − c( x) = u .
(36)
Para x* ,
f ( x* ) − c ( x * ) − R * = u
R * = f ( x* ) − c* − u .
(37)
Outro esquema seria o proprietário da terra pagar ao trabalhador um salário w
dependendo do seu esforço x, juntamente com uma quantia fixa K :
s ( f ( x) ) = wx + K .
(38)
Na escolha ótima x* ,
w = PM ( x* ) .
(39)
Por (38) em (34), o trabalhador maximiza:
max wx + K − c( x)
(40)
w − c′ = 0
w = CM ( x* ) .
(41)
x
(39) em (41):
PM ( x* ) = CM ( x* ) .
(31)
Portanto, a escolha ótima do trabalhador coincide com a do proprietário.
Um terceiro esquema de incentivo seria o proprietário pagar ao trabalhador
 B*
s ( f ( x) ) = 
0
se x = x*
se x ≠ x*
(42)
Na escolha ótima x* , (29) em (42):
B* = u + c ( x* ) .
(43)
Fora da escolha ótima, a utilidade para o trabalhador seria negativa. De fato, (29) em (42):
u + c( x) = 0
u = −c ( x ) .
(44)
Um exemplo de esquema de incentivo não-ótimo seria a parceria, onde tanto
proprietário como trabalhador ficam com a mesma percentagem fixa do produto. A cota do
trabalhador seria, por exemplo,
s ( x) = α f ( x) + F ,
(45)
onde 0 < α < 1 e F é uma constante. Assim,
max α f ( x) + F − c( x)
x
α f ′ − c′ = 0
α PM ( xˆ ) = CM ( xˆ ) ,
(46)
Que não é a condição de eficiência (31). Logo, a parceria é um esquema de incentivos que não
é ótimo.
Nos três casos em que o esquema de incentivos é ótimo e o esforço é observado pelo
proprietário, o trabalhador iguala benefício marginal a custo marginal. O trabalhador escolhe
o esforço a fazer dada a produção. No caso do esquema do aluguel, o trabalhador fica com
toda a produção remanescente depois de pagar o aluguel ao proprietário.
Com informação assimétrica, o trabalhador pode escolher seu nível de esforço, mas o
proprietário não pode observá-lo de maneira perfeita. O proprietário precisa inferir que
esforço foi feito a partir da produção observada. Se a produção tiver um componente
aleatório, o proprietário irá repassar todo o risco para o trabalhador. Mas como o trabalhador
tem mais chance de ser mais avesso ao risco do que o proprietário, possivelmente ele irá abrir
mão de ganhos residuais a fim de obter um fluxo de renda menos arriscado. Assim, os três
esquemas de incentivos apresentados acima se tornam ineficientes, enquanto o esquema de
parceria poderia até mesmo vir a ser ótimo.
© Sergio Da Silva 2010
sergiodasilva.com