Universidade Federal de Santa Catarina From the SelectedWorks of Sergio Da Silva 2010 Micro 2: Varian Passo a Passo Sergio Da Silva, Federal University of Santa Catarina Available at: http://works.bepress.com/sergiodasilva/129/ Micro 2: Varian Passo a Passo Sergio Da Silva Universidade Federal de Santa Catarina www.sergiodasilva.com Monopólio Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 24 O monopólio é a estrutura de mercado em que há apenas uma empresa. O monopólio fica, portanto, no extremo oposto da concorrência perfeita, onde há um grande número de pequenas empresas que consideram os preços dados pelo mercado. É improvável que a empresa monopolista considere os preços dados: ela irá querer escolher o preço ou a quantidade para maximizar seu lucro. A escolha do monopólio é limitada pelo comportamento da demanda dos consumidores. Se escolher o preço, o monopólio deixa que os consumidores escolham a quantidade que desejam comprar a esse preço. Se, por exemplo, escolher um preço muito alto, somente conseguirá vender uma pequena quantidade. Se escolher a quantidade, o monopólio deixa que os consumidores escolham o preço que desejam pagar por essa quantidade. Maximização de lucro A função demanda inversa do mercado é p ( y ) . (A demanda é inversa porque é o preço p que é colocado como função da quantidade y , e não o contrário). A função custo é c( y ) . A função receita do monopolista é r ( y) = p( y) ⋅ y . (1) O monopolista maximiza lucro π fazendo max r ( y ) − c( y ) (2) π ( y ) = r ( y ) − c( y ) . (3) y onde Derivando e igualando a zero, encontramos a condição de primeira ordem r ′( y ) − c′( y ) = 0 r ′( y ) = c′( y ) . (4) Portanto, para maximizar lucro, o monopolista precisa igualar sua receita marginal RM ≡ r ′( y ) a seu custo marginal CM ≡ c′( y ) : RM = CM . (4′) Alternativamente, diferenciando (1): r ′( y ) = p′( y ) ⋅ y + p ( y ) . Substituindo (5) em (4): (5) p′( y ) ⋅ y + p ( y ) = c′( y ) . (4″) Para garantir que (4) seja um máximo (e não um mínimo), tomamos a segunda derivada para encontrar a condição de segunda ordem: r ′′( y ) − c′′( y ) ≤ 0 . (6) Ou seja, c′′( y ) ≥ r ′′( y ) . (7) Portanto, a inclinação da curva de custo marginal fica maior do que a inclinação da receita marginal depois do ponto de máximo, garantindo que este é, de fato, de maximização de lucro. Se, na escolha ótima, RM < CM , o monopólio teria incentivo para reduzir a quantidade produzida: isto reduziria sua receita, mas reduziria o custo ainda mais. Se RM > CM , a empresa monopolista teria incentivos para aumentar a quantidade produzida: isto aumentaria sua receita, mas o custo aumentaria ainda mais. Apenas quando RM = CM a empresa não tem incentivos para alterar a produção. Em tempo discreto, (4) pode ser reescrita como: ∆r ∆c = . ∆y ∆y (4″′) A condição RM = CM é válida para empresas em qualquer estrutura de mercado. Em particular, para uma pequena empresa competitiva “tomadora de preço”: RM = CM = p . (8) Para maximizar seu lucro, a empresa competitiva se preocupa apenas em igualar seu custo marginal ao preço do produto dado pelo mercado. Para o monopólio, a receita marginal não se iguala ao preço. Se a empresa monopolista resolver aumentar a quantidade produzida ∆y , isto alterará a receita ∆r por dois canais: a receita aumenta em p ⋅ ∆y , mas o preço diminui em ∆p para toda a quantidade vendida y , e não apenas para as novas unidades. O efeito total será, então, ∆ r = p ⋅ ∆y + y ⋅ ∆p . (9) Dividindo (9) por ∆y encontramos a receita marginal: ∆r ∆y ∆p = p⋅ + y⋅ ∆y ∆y ∆y ∆r ∆p = p+ ⋅y. ∆y ∆y (10) Comparando com (5), veja que (10) é a mesma definição de receita marginal, mas agora para o tempo discreto. A condição de lucro máximo (4′) pode ser escrita em termos da elasticidade da demanda (em geral negativa): ε= ∆y y ∆p p = p ∆y . y ∆p (11) Primeiro, consideramos a expressão da receita marginal em termos da elasticidade (Capítulo 15 do livro): 1 1 RM ( y ) = p ( y ) 1 + = p ( y ) 1 − ε ( y) ε ( y) . (12) Segundo, substituímos (12) em (4′): 1 p( y ) 1 − ε ( y) = CM ( y ) . (13) De novo, (13) é válida para qualquer estrutura de mercado. Como a empresa competitiva considera o preço determinado pelo mercado, a curva de demanda do mercado é horizontal na altura desse preço: é infinitamente elástica, ou seja, ε → ∞. (14) Isto significa que 1 1 = →0. ε ( y) ∞ (15) Substituindo (15) em (13): p ( y ) = CM ( y ) , (16) que é a condição de lucro máximo da empresa competitiva. Já a empresa monopolista nunca escolhe operar onde a curva de demanda é inelástica. Ela opera nas situações em que 1≤ ε < ∞ . (17) Ela não opera quando ε < 1 porque, neste caso, 1 ε >1. (18) Considerando (18) em (13) vemos que a receita marginal seria negativa, sem poder se igualar ao custo marginal. Monopólio com curva de demanda linear Supondo que a função demanda inversa do mercado seja p ( y ) = a − by , (19) que é linear, e onde a é o intercepto vertical da curva e −b é o coeficiente angular (inclinação), a função receita (1) fica sendo, considerando (19), r ( y ) = p ( y ) ⋅ y = (a − by ) y = ay − by 2 . (20) Diferenciando (20), encontramos a receita marginal: RM ( y ) = a − 2by . (21) Para traçar as curvas, comparando (19) com (21) vemos que a receita marginal e a demanda apresentam o mesmo intercepto vertical a , mas a receita marginal é duas vezes mais inclinada (inclinação da receita marginal = −2b e inclinação da demanda = −b ). Depois de desenhada a demanda (Figura 1), achamos um dado intercepto horizontal para ela. Logo, o intercepto horizontal da RM deverá ficar na metade do intercepto da demanda. Ligando o intercepto vertical com o horizontal encontramos a “curva” de RM . Desenhada uma dada curva de CM podemos também fazer a curva de custo médio ( CMe ), sabendo que a curva de CM passa sobre o ponto mínimo da curva de CMe (Capítulo 21). A quantidade produzida ótima y * ocorre no intercepto de RM e CM , mas não o preço. O monopólio cobra o preço mais alto que puder ao nível y * , p( y* ) , que é apenas limitado pela demanda do mercado. A receita será r ( y* ) = p( y* ) ⋅ y* , (22) que é a área do retângulo maior na Figura 1. O custo na produção de y * será c( y* ) = CMe( y* ) ⋅ y* , (23) que é a área do retângulo menor. Logo, considerando (22), (23) e (3), a área hachurada representa o lucro. Escolhendo o preço por markup Podemos reescrever a condição de lucro máximo em termos da elasticidade da demanda (13) como p( y) = 1 1− CM ( y ) . 1 (13′) ε ( y) O preço pode então ser escolhido considerando-se CM ( y* ) e adicionando-se um montante fixo (markup) que depende da elasticidade da demanda: markup = 1 1− 1 . (24) ε ( y) A empresa monopolista opera apenas quando ε ≥ 1 (equação (17)). Se ε = 1 , o markup será infinito em (24). Este caso não interessa ao monopólio. Mas, para ε > 1 , 1 ε < 1 e, por (24), markup > 1 . Se, além disso, ε for constante, por (24) o markup será constante. E, por (13′), o preço será escolhido como um markup constante do nível de custo marginal de máximo lucro, isto é, CM ( y* ) . Podemos desenhar uma curva de demanda de elasticidade constante juntamente com a curva de CM (Figura 2) (veja também a Figura 15.6 do Capítulo 15 do livro). A curva de custo marginal com markup constante, CM 1−1 ε , é mais alta do que CM por um montante fixo. Para atender toda a demanda do mercado a este onde as curvas de demanda e CM 1−1 ε CM 1−1 ε , a empresa produz y * , se cruzam. A este nível de custo marginal CM ( y* ) 1−1 ε , por (13′) a empresa cobra o preço p* para maximizar seu lucro. Efeito do imposto sobre o preço cobrado pelo monopolista No caso em que CM = c = constante , (25) a curva de CM é uma reta horizontal. Com uma demanda linear (equação (19)), podemos analisar o efeito que um imposto t sobre a quantidade tem sobre o preço cobrado pelo monopolista. Esse imposto aumenta o custo marginal: CM = c + t . (26) Para a demanda linear, a RM é dada por (21) e a condição de lucro máximo RM = CM fica sendo (considerando (26)): a − 2by = c + t . (27) Isolando y : 2by = a − c − t a −c−t y= 2b (27′) ou y=− 1 ( −a + c + t ) . 2b (27″) Diferenciando em relação a t : dy 1 1 = 1⋅ − = − dt 2b 2b (28) que, em tempo discreto, é o mesmo que ∆y 1 =− . ∆t 2b Diferenciando a curva de demanda (29) p ( y ) = a − by (19) em relação a t , temos: dp dy = −b . dt dt (30) (28) em (30): dp 1 1 = −b − = . dt 2b 2 (31) Então, se o imposto aumentar, o preço cobrado aumentará pela metade do aumento do imposto. Claro que se a demanda não for linear e o CM não for constante, o preço cobrado pode aumentar mais ou menos do que o aumento do imposto. Se a demanda inversa do mercado for de elasticidade constante, a condição de lucro máximo será dada por (13). Com custo marginal constante, sendo introduzido o imposto ((26) em (13)): 1 p( y ) 1 − = c + t ε ( y ) 1 p( y ) 1 − = c + t ε c+t p= 1 − ε1 ou (32) p= 1 (c + t ) . 1 − ε1 (32′) Diferenciando em relação a t : 1 dp = 1⋅ 1 − ε1 dt 1 = > 1, 1 − ε1 (33) que é igual ao markup (equação (24)) e, portanto, maior do que 1. Logo, o monopolista repassa ao preço mais do que o valor do imposto. Se o governo cobrar um imposto sobre o lucro, que é (considerando (1) e (3)), π ( y ) = p ( y ) ⋅ y − c( y ) , (34) o monopolista pagará uma fração τ de seu lucro ao governo, isto é, (1 − τ )π e maximizará (considerando (34)): max (1 − τ )( p( y ) ⋅ y − c( y )) y (1 − τ )( p′( y ) ⋅ y + p ( y ) − c′( y )) = 0 p′( y ) ⋅ y + p ( y ) − c′( y ) = 0 p′ ( y ) ⋅ y + p( y ) = c′( y ) , (35) (4″) que é a mesma condição de máximo lucro sem imposto dada por (4″). Assim, o imposto sobre o lucro é ineficaz. Ineficiência do monopólio Como o monopólio tende a cobrar um preço mais alto do que o custo marginal, os consumidores estariam em melhor situação na concorrência, onde o preço seria igual ao custo marginal e, portanto, mais baixo. Mas as empresas se beneficiariam na situação de monopólio pela mesma razão. Logo, apenas comparando o bem-estar relativo não dá para saber que estrutura de mercado seria melhor para os dois grupos ao mesmo tempo, consumidores e empresas. Mas pode-se argumentar que a concorrência é melhor para ambos em termos de eficiência. Um arranjo é eficiente no sentido de Pareto se não houver nenhuma forma de melhorar a situação de alguém sem, com isso, piorar a de outrem. Se o arranjo melhorar a situação de ambos, ele será ineficiente. A quantidade produzida ótima de monopólio é eficiente? O nível eficiente de produção é aquele em que a disposição dos consumidores de pagar por uma unidade extra do produto é exatamente igual ao custo de produzi-la para a empresa. Podemos imaginar que, se a empresa monopolista fosse obrigada a se comportar como uma empresa concorrencial, ela iria cobrar o preço pc onde o custo marginal é igual à demanda do mercado por seu produto. A quantidade produzida seria então yc , que é maior do que ym , que seria produzida na condição de máximo lucro do monopólio onde RM = CM . Na curva de demanda inversa, a cada quantidade y , o preço p mede quanto os consumidores estão dispostos a pagar por uma unidade adicional do produto (Capítulo 15 do livro). Para y = ym , pm > CM . (36) Como pm está sobre a demanda, os consumidores estão dispostos a pagar mais por uma unidade extra do produto do que custa para produzir esta unidade ( CM m ). (Isto ocorre para todas as unidades no intervalo ym ≤ y < yc ). A empresa monopolista está sempre pronta para produzir uma unidade adicional e vender por p se pm > p > CM m . (37) Os consumidores ficam em melhor situação porque estavam dispostos a pagar pm e acabam comprando por p < pm , e a empresa também fica em melhor situação porque vende a unidade adicional por p > CM m (e continua vendendo todas as outras unidades por pm ). Na venda da unidade extra, cada lado do mercado obtém um excedente. Logo, há uma melhoria de Pareto: a quantidade produzida que maximiza lucro no monopólio, ym , é ineficiente. O ônus do monopólio A variação do excedente do produtor (alteração do lucro da empresa) mede quanto o produtor está disposto a pagar para obter o preço mais alto de monopólio pm , enquanto a variação no excedente do consumidor mede quanto os consumidores teriam de receber para ser compensados pelo preço mais alto pm . A diferença entre os dois excedentes mede o ônus do monopólio. No equilíbrio de monopólio, a empresa vende ym unidades do produto ao preço pm cada. Se forçada a ir até o equilíbrio competitivo, as unidades ym seriam vendidas ao preço mais baixo pc : o lucro (excedente do produtor) se reduziria pela área A da Figura 5. Mas a empresa agora venderia mais unidades, yc − ym , ao preço mais baixo pc : o lucro (excedente do produtor) subiria pela área C . Já os consumidores passariam a comprar as unidades ym ao preço mais baixo pc e, portanto, “lucrariam” pela área A (o excedente do consumidor aumentaria). Na área A , a redução do excedente do produtor seria exatamente compensada pelo aumento do excedente do consumidor: o excedente total não variaria. Mas os consumidores também “lucrariam” com o aumento das unidades, yc − ym , postas à venda pelo preço mais baixo pc : a área B mediria o aumento do excedente do consumidor. Como o excedente do produtor aumentaria pela área C e o excedente do consumidor aumentaria pela área B , o excedente total aumentaria em B + C . B + C mediria o ônus do monopólio pois, ao preço pm , tanto a empresa como o consumidor deixariam de ganhar. Como exemplo, temos as patentes. Uma patente dá ao inventor o direito de beneficiarse de sua invenção por um período limitado de tempo: monopólio limitado. Acha-se que, sem patentes, uma descoberta seria copiada pelos concorrentes e isto desencorajaria novas descobertas. Mas o monopólio limitado tem ônus. Isto sugere um prazo de duração ótimo para as patentes. Nos Estados Unidos a patente é válida por 17 anos. Um estudo (Nordhaus, 1969) mostra que, com essa duração, o benefício da proteção de novas descobertas compensa em quase 90% o ônus do monopólio. Porém, não apenas o tempo de validade de uma patente importa: a abrangência da patente e o grau de novidade também devem ser considerados. Mas apenas o tempo de validade é quantificado facilmente. Monopólio natural O monopólio natural ocorre em situações em que a tecnologia impõe grandes custos fixos e baixos custos marginais e, assim, o intercepto das curvas de CM e de demanda ficam abaixo da curva de CMe (Figura 6). Se o regulador forçar o monopólio a operar onde o preço pc = CM , isto não cobre seus custos pela área chamada de “prejuízo” na Figura 6: o monopólio abandona o negócio. Se o regulador deixar o monopólio cobrar o preço que cobre o seu custo médio, pCMe , a quantidade produzida yCMe fica menor do que a eficiente yc . Exemplos de monopólio natural são os serviços de utilidade pública. Em empresas de gás, construir (e manter) gasodutos envolve custos fixos altos, enquanto bombear gás para dentro do gasoduto já pronto (custo marginal) custa muito pouco. Em empresas telefônicas, há um alto custo em instalar fios e redes de comutação, mas baixo custo por unidade extra de serviço telefônico. Os monopólios naturais costumam ser regulados ou operados pelo governo. Quando regulados, os monopólios são deixados operar no ponto ( pCMe , yCMe ) da Figura 6. Os custos são cobertos, mas a produção fica abaixo da eficiente. (Mas saber o preço que cobre o custo médio pCMe não é tarefa fácil.) Exemplos nos Estados Unidos são os serviços de gás, telefone, eletricidade e TV a cabo. Quando o governo opera o monopólio, ele cobra o preço igual a custo marginal pc e compensa o prejuízo com um subsídio fixo. Exemplos nos Estados Unidos são o transporte público de ônibus e metrô. Causa do monopólio Dependendo do custo médio e do tamanho da demanda podemos prever se um negócio será monopolizado. Podemos recorrer ao conceito de “escala mínima de eficiência” ( EME ) , que nos indica o nível de produção que minimiza o custo médio comparando-o com o tamanho da demanda. No caso a da Figura 7, há espaço para várias empresas operando em escala pequena: EME baixa. No caso b, como a EME é alta, será lucrativa a instalação de apenas uma única empresa. A primeira causa do monopólio é, então, a EME em relação ao tamanho do mercado. Como a tecnologia determina a EME, não há muito que fazer aqui para impedir que o monopólio apareça, mas o governo pode ainda tentar aumentar o tamanho do mercado. Outra causa é o cartel, quando empresas se unem para reduzir a produção, aumentar o preço e o lucro. Mas nos Estados Unidos os carteis são ilegais. Outra causa é a entrada pioneira de uma empresa numa indústria de custos altos. Depois de estabelecida, a empresa cria barreiras à entrada de outras reduzindo o preço. © Sergio Da Silva 2010 www.sergiodasilva.com Comportamento Monopolista Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 25 Na concorrência, muitas empresas vendem o mesmo produto: se uma aumentar o preço perde todos os clientes. No monopólio, uma única empresa vende determinado produto: se aumentar o preço perde alguns, mas nem todos os clientes. Se um posto de gasolina elevar o preço e perder a maioria dos clientes, podemos inferir que a estrutura de mercado é competitiva. Se um restaurante aumentar o preço e perder apenas alguns clientes, podemos inferir que ele possui algum grau de poder de mercado. Empresas com algum grau de poder de mercado praticam estratégias de fixação de preço e tentam diferenciar seus produtos para aumentar ainda mais seu poder de mercado. Discriminação de preços O monopolista não deseja produzir acima de ym porque a quantidade extra forçaria a queda do preço abaixo de pm , que ele consegue cobrar por todas as unidades ym . Mas, se for possível, uma empresa vende diferentes unidades do produto a preços diferentes, praticando a discriminação de preços. Na discriminação de preços de primeiro grau (perfeita), o monopolista vende diferentes unidades de produto a preços diferentes e os preços podem diferir de cliente para cliente. Na discriminação de preços de segundo grau, o monopolista vende diferentes unidades de produto a preços diferentes e os preços não podem diferir de cliente para cliente. Na discriminação de preços de terceiro grau (mais comum), o monopolista vende a produção a clientes diferentes a preços diferentes, mas cada unidade vendida a determinado cliente é vendida pelo mesmo preço. Discriminação de preços de primeiro grau Na discriminação de preços de primeiro grau, cada unidade do produto é vendida ao consumidor que lhe atribui maior valor e ao preço máximo que o consumidor esteja disposto a pagar pelo produto (preço de reserva). Como cada unidade é vendida ao preço de reserva de cada consumidor, não há excedente do consumidor, ou melhor, o monopolista apropria-se dele, que vira o excedente do produtor (áreas hachuradas A e B da Figura 1). O lucro da empresa (excedente do produtor) é máximo e qualquer aumento do excedente do consumidor terá que ocorrer em detrimento da redução do excedente do produtor: este arranjo é eficiente no sentido de Pareto, como na concorrência. Porém, utilizando a discriminação perfeita de preços, a empresa monopolista captura todo o excedente. Portanto, o monopólio também pode ser eficiente se praticar a discriminação perfeita de preços, que ocorre quando o monopolista vende a quantidade x10 ao consumidor 1 ao preço igual à área A e vende a quantidade x20 ao consumidor 2 ao preço B. Como exemplo, temos o médico de uma cidade pequena que cobra preços diferentes de cada paciente levando em conta a capacidade máxima de pagar de cada um. Outro exemplo próximo seria venda de carro ou de antiguidades por negociação. Discriminação de preços de segundo grau Na prática, é muito difícil para a empresa monopolista conhecer as curvas de demanda dos consumidores 1 e 2 da Figura 1. Além disso, o consumidor 1, que é propenso a pagar mais, pode querer se passar pelo consumidor 2 que é propenso a pagar menos. Isto dificulta a discriminação perfeita de preços. Porém, o monopolista pode conseguir distinguir os dois consumidores dando-lhes incentivos para que se auto-selecionem. Uma maneira seria oferecer dois pacotes diferentes de preço-quantidade: um visando o consumidor 1 e o outro visando o consumidor 2. Na Figura 2 juntamos os dois consumidores, os degraus das curvas de demanda foram esticados e o CM constante da empresa foi considerado zero por simplicidade. O monopolista sabe que deve vender a quantidade x10 ao preço A, como na Figura 1. Mas na Figura 2 ele troca, por engano, a demanda do consumidor 1 pela do consumidor 2. Na Figura 2, o monopolista também gostaria de vender a quantidade x20 ao preço A + B + C , porque assim ele captura todo o excedente do outro consumidor. O consumidor 1 então compra as unidades x10 , pagando A e tendo um excedente igual a B. Ele não compra x20 porque, neste caso, seu excedente seria zero. A empresa, então, não consegue capturar todo o excedente do consumidor 1. Apesar disto, a empresa pode ainda aumentar seu excedente baixando o preço da quantidade x20 para A + C , em vez de A + B + C . O consumidor 1 agora compra a quantidade maior x20 , em vez de x10 , ganha A + B + C , paga A + C ao monopolista, e continua com o excedente B. A empresa, por sua vez, aumenta seu excedente para A + C , em vez de A. Outra estratégia da empresa seria, em vez de oferecer x10 ao preço A , oferecer um pacote preço-quantidade, com quantidade um pouco menor do que x10 e preço um pouco menor do que A . O excedente do produtor seria reduzido pelo triângulo cheio da Figura 3, mas ele pode cobrar mais pela mesma quantidade x20 : a área C é acrescida (excedente do produtor aumenta) pela região hachurada. O monopolista, então, reduz ainda mais a quantidade x10 até que o lucro reduzido com um consumidor se iguale ao lucro aumentado com o outro consumidor. Com isto, a empresa reduz ainda mais o excedente B do consumidor de alta demanda, capturando-o e aumentando o seu excedente do produtor. Na prática, em vez de manipular as quantidades, o monopolista manipula a qualidade do produto vendido. A empresa vende ao consumidor com maior propensão a pagar a um preço mais alto e oferece o produto de menor qualidade ao consumidor com menor propensão a pagar. Isto evita que o consumidor de maior propensão a pagar queira comprar o produto de menor qualidade destinado ao outro consumidor. Como exemplo, na discriminação de preços em passagens aéreas há a “tarifa sem restrição” para quem viaja a negócios (preço mais alto) e há a “tarifa com restrição” para quem viaja a passeio. Discriminação de preços de terceiro grau O monopolista, neste caso, vende a grupos de consumidores diferentes cobrando preços diferentes, embora as unidades vendidas a determinado grupo sejam vendidas ao mesmo preço. Como exemplo, temos o preço da entrada de cinema para estudantes ou os preços de remédios para idosos. O preço cobrado a esses grupos é menor porque a sua elasticidadepreço da demanda é maior. Para provar isto, consideremos a função demanda inversa do grupo de consumidores 1 dada por p1 ( y1 ) e a do grupo 2 dada por p2 ( y2 ) . O custo de produção é c( y1 + y2 ) . Para maximizar lucro, o monopolista computa max p1 ( y1 ) ⋅ y1 + p2 ( y2 ) ⋅ y2 − c( y1 + y2 ) y1 , y2 (1) em duas partes. Primeira: max p1 ( y1 ) y1 + p2 ( y2 ) y2 − c( y1 + y2 ) y1 p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) − c′( y1 + y2 ) ⋅1 = 0 p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) = c′( y1 + y2 ) r ′( y1 ) Do Capítulo 24 (equação (5)) sabemos que r ′( y1 ) = p1′ ( y1 ) ⋅ y1 + p1 ( y1 ) . (1′) Então, r ′( y1 ) = c′( y1 + y2 ) (2) Segunda parte: max p1 ( y1 ) y1 + p2 ( y2 ) y2 − c( y1 + y2 ) y2 (1″) p2′ ( y2 ) ⋅ y2 + p2 ( y2 ) − c′( y1 + y2 ) ⋅1 = 0 p2′ ( y2 ) ⋅ y2 + p2 ( y2 ) = c′( y1 + y2 ) r ′ ( y2 ) r ′( y2 ) = c′( y1 + y2 ) . (3) A solução ótima é, então, RM1 ( y1 ) = CM ( y1 + y2 ) (2′) RM 2 ( y2 ) = CM ( y1 + y2 ) . (3′) e Combinando (2′) e (3′): RM1 = RM 2 . (4) Portanto, unidades adicionais do produto devem gerar a mesma receita marginal, quer sejam vendidas em um mercado ou no outro. Se RM1 > CM , valeria a pena aumentar a produção no mercado do grupo 1. Se RM 2 > CM , valeria a pena aumentar a produção no mercado do grupo 2. Do Capítulo 24 (equação (12)) inferimos que 1 RM 1 ( y1 ) = p1 ( y1 ) 1 − ε1 ( y1 ) . (5) e 1 RM 2 ( y2 ) = p2 ( y2 ) 1 − ε 2 ( y2 ) . (6) (5) em (2′): 1 p1 ( y1 ) 1 − ε1 ( y1 ) = CM ( y1 + y2 ) . (7) (6) em (3′): 1 p2 ( y2 ) 1 − ε 2 ( y2 ) = CM ( y1 + y2 ) . (8) (7) e (8): 1 p1 ( y1 ) 1 − ε1 ( y1 ) 1 = p2 ( y2 ) 1 − ε 2 ( y2 ) . (9) Para p1 < p2 , devemos ter, por (9), 1− 1 1 > 1− ε1 ( y1 ) ε 2 ( y2 ) 1−1+ 1 1 > ε 2 ( y2 ) ε1 ( y1 ) 1 1 < ε1 ( y1 ) ε 2 ( y2 ) ε1 > ε 2 . (10) Logo, o preço mais baixo deve ser cobrado no mercado de maior elasticidade-preço da demanda. Estudantes e idosos são mais sensíveis ao preço e, assim, possuem demandas mais elásticas. A empresa cobra deles, então, o preço mais baixo. Discriminação de preços de terceiro grau com demanda linear No caso especial de uma demanda linear, a quantidade produzida será a mesma, quer a empresa discrimine preços ou não. Para provar isto, consideramos as demandas (não as inversas): x1 = a − bp1 (11) x2 = c − dp2 (12) e (que são relacionadas às demandas inversas do Capítulo 24, Seção 2 do livro). Por simplicidade, CM = 0 e, no lucro máximo, RM1 = CM = 0 (13) RM 2 = CM = 0 RM1 = RM 2 = 0 . (14) Por definição, r1 = p1 x1 . (15) (11) em (15): r1 = p1 (a − bp1 ) r1 = ap1 − bp12 (16) RM1 = a − 2bp1 . (17) (14) em (17): 0 = a − 2bp1* a p1* = . 2b (18) (18) em (11): a 2b a 2a − a a x1* = a − = = . 2 2 2 x1* = a − b (19) Por definição, r2 = p2 x2 . (20) (12) em (20): r2 = p2 (c − dp2 ) r2 = cp2 − dp22 (21) RM 2 = c − 2dp2 . (22) (14) em (22): 0 = c − 2dp2* c . p2* = 2d (23) em (12): (23) x2* = c − d c c 2c − c c =c− = = . 2d 2 2 2 (24) Vendendo em ambos os mercados ao mesmo preço: x1 + x2 = x (25) p1 = p2 = p . (26) e (11), (12), (25) e (26): x = a − bp + (c − dp ) x = a + c − (b + d ) p . (27) Por definição, r = p⋅x. (28) (27) em (28): r = p [ a + c − (b + d ) p ] r = (a + c) p − (b + d ) p 2 (29) RM = a + c − 2(b + d ) p . (30) Por (14), RM = RM1 = RM 2 = 0 . (14′) (14′) em (30): 0 = a + c − 2(b + d ) p* a+c p* = . 2(b + d ) (31) (31) em (27): x* = a + c − (b + d ) x* = a+c . 2 Como, por (25), a+c a + c 2(a + c) − (a + c) = a+c− = (b + d ) 2 2 (32) x* = x1* + x2* , (25′) (19) e (24) em (25′): x* = a c a+c , + = 2 2 2 que é (32). Logo, para a demanda linear, a quantidade produzida é a mesma quer a empresa discrimine preços ou não. Por (11) e (17), a demanda do primeiro grupo tem intercepto vertical a igual ao da RM1 e a inclinação da RM1 é −2b , o dobro da inclinação da demanda −b . Isto significa que (Capítulo 24 do livro), a RM1 corta o eixo das abscissas na metade do trecho a partir do ponto em que D1 o corta. Na Figura 5, o equilíbrio ocorre em x1* e p1* . O preço p1* não permite a compra dos consumidores do grupo 2. Mas, se o monopolista puder discriminar preço ele, por maximização análoga, cobra p2* e vende menos quantidades para o grupo 2. A discriminação de preço permite, então, que ele aumente a produção mesmo que as demandas sejam lineares. Usando a expressão de máximo lucro em termos de elasticidade-preço (Capítulo 24): 1 p1* 1 − = CM . ε 1 Como, por (13), CM = 0 , (33) 1 p1* 1 − = 0 ε 1 1 1= ε1 ε1 = 1 (34) ε1 = −1 , (35) ou com RM1 = CM = 0 . Cálculo da discriminação ótima de preços O monopolista se defronta com o mercado segmentado em dois grupos. As demandas são D1 ( p1 ) = 100 − p1 (36) D2 ( p2 ) = 100 − 2 p2 . (37) Se o custo marginal for constante e igual a CM = 20 (38) dólares por unidade de produto, se ele puder discriminar preços, quanto cobraria em cada mercado para maximizar lucro? E quanto cobraria se não pudesse discriminar preço? As demandas inversas de (36) e (37) são y1 = 100 − p1 ( y1 ) p1 ( y1 ) = 100 − y1 (39) e y2 = 100 − 2 p2 ( y2 ) 2 p2 ( y2 ) = 100 − y2 y p2 ( y2 ) = 50 − 2 . 2 (40) Para o primeiro mercado, r1 = p1 ( y1 ) ⋅ y1 . (41) Considerando (39): r1 = (100 − y1 ) y1 r1 = 100 y1 − y12 (42) e RM1 = 100 − 2 y1 . (43) Por (43) e (38), a condição de lucro máximo, RM1 = CM , é 100 − 2 y1* = 20 (44) 2 y = 100 − 20 * 1 y1* = 40 . (45) (45) em (39): p1* = 100 − 40 p1* = 60 . (46) Para o segundo mercado, r2 = p2 ( y2 ) ⋅ y2 . (47) Considerando (40): y r2 = 50 − 2 ⋅ y2 2 1 r2 = 50 y2 − y22 2 (48) e RM 2 = 50 − y2 . (49) Por (49) e (38), a condição de lucro máximo, RM 2 = CM , é 50 − y2* = 20 y2* = 30 . (50) (50) em (40): p2* = 50 − 30 2 p2* = 35 . (51) Cobrando o mesmo preço nos dois mercados, p1 = p2 = p (52) e D( p) = D1 ( p1 ) + D2 ( p2 ) . (53) (36), (37) e (52) em (53): D ( p ) = 100 − p + (100 − 2 p ) D ( p ) = 200 − 3 p . (54) A curva de demanda inversa é y = 200 − 3 p ( y ) 3 p ( y ) = 200 − y 200 y p( y) = − 3 3 (55) e r = p( y ) ⋅ y . (56) (55) em (56): 200 y r = − y 3 3 200 1 r= y − y2 3 3 (57) e RM = 200 2 − y. 3 3 (58) Considerando (58) e (38), a condição de lucro máximo, RM = CM , é 200 2 * − y = 20 3 3 2 * 200 y = − 20 3 3 3 200 y* = − 20 = 2 3 y* = 70 . (59) em (55): p* = 200 70 130 − = 3 3 3 3 200 − 60 3 140 140 = = 2 2 3 2 3 (59) p* = 43,3 . (60) Venda casada As razões para a venda casada (bundling) são: (1) a redução de custos, (2) a complementaridade entre os produtos e (3) o comportamento do consumidor. Um exemplo seria dado pelos pacotes de software: no Office, a Microsoft reúne o Word, o Excel e o Power Point. Digamos que a disposição a pagar de dois grupos de consumidores por dois produtos seja como na Tabela 1. Tabela 1 Consumidor do grupo 1 Consumidor do grupo 2 Processador de texto, $ 120 100 Planilha eletrônica, $ 100 120 Supondo que CM ≈ 0 , a empresa maximiza lucro maximizando apenas a receita. Supomos ainda que a propensão a pagar por um pacote seja a soma da propensão a pagar de cada produto. Se vender os produtos em separado por $100 cada, a empresa apura $400 de receita, vendendo duas unidades de processador de texto e duas de planilha. O preço de venda para consumidores diferentes é determinado pelo comportamento do comprador com menor propensão a pagar. Cobrando $220 por cada pacote, a empresa apura $440, vendendo um pacote para cada tipo de consumidor. A venda casada vale a pena. Tarifa em duas partes Considere um parque de diversões em que se cobra um preço para entrar e outro para andar nos brinquedos. Como a empresa deve fixar os dois preços para maximizar lucro? Ocorre o “dilema da Disneylândia”. Para entendê-lo, supomos que (1) há apenas um brinquedo, (2) os consumidores vão à Disneylândia apenas por esse brinquedo, (3) todos têm o mesmo gosto em relação ao brinquedo e (4) o CM é constante. Fixando p* por cada volta nos brinquedos, o número de voltas vendidas será x* . Dado p* , quanto cobrar de entrada no parque? O máximo que pode ser cobrado é a área do excedente do consumidor. A área do triângulo da Figura 6 será desperdiçada. O monopolista deve então baixar o preço das voltas p* até igualá-lo ao CM : todo o triângulo acima da reta de CM passa a ser o excedente do consumidor. Isto significa que o monopolista deve cobrar na entrada o preço igual a todo o excedente do consumidor, abocanhando-o. Concorrência monopolista Costumamos chamar de indústria ao conjunto de todas as empresas que produzem determinado produto. Na indústria monopolista, uma única empresa grande produz determinado produto. Porém, apenas uma grande empresa produz Coca-Cola e não é monopolista. Precisamos então ampliar o conceito de indústria. Podemos dizer que é o conjunto de empresas que produzem produtos que são substitutos próximos (não necessariamente perfeitos). Ao fixar o preço e a quantidade, cada empresa leva em conta a decisão análoga das concorrentes. A curva de demanda da empresa depende da escolha de preço e quantidade das concorrentes. A inclinação da curva de demanda depende do grau de substituição do seu produto em relação ao das concorrentes. O grau de substituição influencia a elasticidade-preço da demanda. Se a empresa aumentar o preço, o número de consumidores que vai deixar de consumir o produto depende do grau de substituição. Quanto mais a empresa consiga diferenciar seu produto, mais poder de mercado terá para aumentar o preço: menos elástica fica a curva de demanda. A Coca-Cola tem poder de mercado, mas ainda enfrenta a concorrência das empresas que produzem substitutos imperfeitos. A indústria de refrigerantes é, então, de concorrência monopolista: há um grande número de empresas produzindo artigos semelhantes, mas não idênticos. Cada produto tem seus adeptos e a sua empresa desfruta de algum poder de mercado. A indústria é monopolista porque cada empresa se defronta com uma curva de demanda negativa (e não horizontal, como na concorrência perfeita). Cada empresa tem um grau de monopólio e pode fixar seu preço, em vez de aceitar passivamente o preço de mercado. Porém, a indústria também é competitiva, pois as empresas concorrem em preço e tipo de produto e não há barreiras à entrada de outras empresas. Quando novas empresas entram na indústria, a curva de demanda de cada empresa: (1) desloca-se para dentro: a cada preço a empresa venderá menos unidades do seu produto e (2) fica mais elástica, porque entram mais produtos similares. Com novas e novas entradas, surgem três fatos: (1) cada empresa precisa ainda vender uma combinação de preço e quantidade sobre a curva de demanda, (2) cada empresa precisa ainda maximizar lucro, dada a demanda e (3) as entradas forçam os lucros de cada empresa até zero (o ponto de máximo lucro é de lucro zero): a combinação de preço e quantidade tem que ficar sobre a curva de custo médio. Para que os fatos 1, 2 e 3 ocorram simultaneamente, a demanda de mercado de cada empresa em concorrência monopolista (sem barreiras à entrada) deve tangenciar a curva de CMe . Se a demanda cruzasse a curva de CMe , haveria pontos sobre a demanda acima da curva de CMe : isto não pode ocorrer porque aí o lucro não seria zero. O preço seria maior do que o custo médio CMe = c (yy ) , i.e. p > c (yy ) , o que significa lucro positivo: p ⋅ y − c( y ) > 0 . A concorrência monopolista é Pareto ineficiente, já que aí p > CM . Perceba que lucro zero é outra coisa: relaciona-se ao CMe . Na concorrência monopolista cada empresa opera à esquerda do nível de produção que minimiza o CMe . Diferenciação de produtos em concorrência monopolista Pode haver pouca ou muita diferenciação de produto na concorrência monopolista. No caso de pouca diferenciação, cada empresa vai querer tornar seu produto semelhante ao das concorrentes para tomar seus clientes. Um exemplo que ilustra isso é o do sorveteiro na praia. Suponha que os consumidores estejam distribuídos homogeneamente ao longo da praia. Um sorveteiro vai escolher se localizar no meio da praia e isto é bom tanto para ele como para os consumidores. No caso de dois sorveteiros vendendo o mesmo tipo de sorvete, o bom para os consumidores seria como na Figura 9. Porém, o bom para os vendedores é se dirigir para o centro. Mas se o sorveteiro 1 se mover para o centro, tira alguns clientes do sorveteiro 2 e não perde nenhum (Figura 10). O sorveteiro 2 então faz o mesmo. O que é bom para os vendedores (Figura 11) não é bom para os consumidores (Figura 9). Outro exemplo é o de duas emissoras de rádio (Figura 12). Em equilíbrio, as duas tocariam tanto música erudita como rock heavy metal, desagradando os consumidores de gostos extremos. No caso de excessiva diferenciação do produto, considerando o exemplo anterior, imagine que a praia seja muito grande (Figura 13). O bom para os vendedores seria ficar nos extremos da praia, embora isto não seja o bom para os consumidores (que é a situação da Figura 9). Neste caso, cada empresa tentaria convencer o consumidor de que seu produto não tem substituto, como no caso do sabão em pó, onde as empresas investem pesadamente para diferenciar o produto através de propaganda. © Sergio Da Silva 2010 www.sergiodasilva.com Comportamento Monopolista Hal R. Varian no Mercado de Fatores Intermediate Microeconomics, 8th edition Capítulo 26 A empresa monopolista no mercado competitivo de fatores A empresa maximizadora de lucro escolhe a quantidade de um fator de produção (como mãode-obra) de modo que a receita marginal recebida por empregar uma unidade a mais dele se iguale ao custo marginal de empregá-lo. Supomos que há apenas um fator de produção e que a função produção da empresa é y = f ( x) , (1) onde x representa as unidades empregadas de mão-de-obra. A receita é r ( y) = p( y) ⋅ y . (2) Por (1), se x aumentar em ∆x , então y aumentará em ∆y , ou seja, ∆y = f ( x + ∆x) − f ( x) . O produto marginal do fator é, então, PM x = ∆y f ( x + ∆x) − f ( x) = . ∆x ∆x (3) Com o aumento da quantidade produzida e vendida y , a receita r aumenta: a receita marginal é RM = ∆r r ( y + ∆y ) − r ( y ) = . ∆y ∆y Como o aumento da receita r por causa do aumento de y , (4) ∆r ∆y , se deveu ao aumento do insumo x , ∆∆yx , medimos diretamente o efeito de ∆x em ∆r e o chamamos de produto da receita marginal: PRM x = ∆r ∆r ∆y = ⋅ ∆x ∆y ∆x (5) ou, considerando (3) e (4), PRM x = RM ⋅ PM x . (5′) Derivando (2): RM = p′( y ) ⋅ y + p( y ) que, em termos discretos, é (6) RM = p( y ) + ∆p ⋅y. ∆y (6′) (6′) em (5′): ∆p PRM x = p( y ) + ⋅ y PM x . ∆y (7) Do Capítulo 15 do livro sabemos que 1 RM = p( y ) 1 − . ε (8) (8) em (5′): 1 PRM x = p( y ) 1 − PM x . ε (9) Na concorrência perfeita, temos que ε =∞ (10) porque a demanda é horizontal ao nível do preço dado pelo mercado. Substituindo (10) em (8): 1 RM = p 1 − = p (1 − 0) ∞ RM = p . (11) (11) em (5′): PRM x = p ⋅ PM x , (12) onde toda a expressão depois da igualdade fornece o valor do produto marginal do fator. No monopólio, a empresa opera quando ε ≥1, (13) já que sabemos do Capítulo 24 que ela não opera quando ε < 1 . Podemos comparar o PRM x nos dois casos, concorrência e monopólio, considerando (9) e (12). Note que 1 PRM x = p 1 − PM x ≤ p ⋅ PM x , ε (14) o que significa que o PRM x no monopólio é menor ou igual ao PRM x na concorrência. Para confirmar, calibremos com ε = 2 em (14), considerando (13): 1 p 1 − PM x < p ⋅ PM x 2 1 p ⋅ PM x <1 ⋅ p ⋅ PM x . 2 (15) (15′) O aumento marginal do emprego do fator vale menos para o monopolista do que para a empresa competitiva. O monopolista então emprega menos mão-de-obra do que a empresa competitiva para maximizar lucro: por isso, a quantidade produzida de máximo lucro é menor no monopólio ( ym < yc ). Se o mercado de trabalho for competitivo, o custo marginal para a empresa empregar uma unidade do fator x se iguala ao preço do fator, w : CM x = w . (16) Para saber quanto do fator empregar, a empresa iguala PRM x com o custo marginal do fator CM x : PRM x = CM x . (17) A empresa competitiva emprega xc unidades de mão-de-obra, fazendo ((12) e (16) em (17)): PRM x = p ⋅ PM x = w . (18) Já a empresa monopolista emprega xm trabalhadores fazendo ((9) e (16) em (17)): PRM x = w . (19) Como PRM x no monopólio é menor do que PRM x na concorrência (equação (14)): PRM x < p ⋅ PM x (20) e o ponto em que PRM x ( xm ) = w fica à esquerda do ponto em que p ⋅ PM x ( xc ) = w . O monopolista emprega menos trabalhadores do que a empresa competitiva. Monopsônio Enquanto no monopólio há um único vendedor, no monopsônio há um único comprador. A empresa monopsonista vende seu produto em um mercado competitivo, mas não é tomadora de preço (price taker) no mercado de fatores: é formadora de preço (price maker). A função produção é y = f ( x) (21) e a curva de oferta inversa do fator é w( x) > 0 . (22) Se a empresa monopsonista quiser empregar x unidades de mão-de-obra, terá que pagar o preço (salário) w( x) . Quanto mais de x desejar empregar, maior o preço que precisará pagar. A receita (em função de y ) é: r ( y) = p( y) ⋅ y , (23) onde p( y ) é a demanda inversa. A receita (em função de x ) é, considerando (21) em (23), r ( x) = p( f ( x)) ⋅ f ( x) . Usando a regra da cadeia, diferenciamos (24) em relação a x : (24) dr ( x) = p′( y ) ⋅ f ′( x) ⋅ f ( x) + f ′( x) ⋅ p( y ) dx dr ( x) = f ′( x)( p′( y ) ⋅ f ( x) + p( y )) dx (25) ou, considerando (21), dr ( x) = f ′( x)( p′( y ) ⋅ y + p( y )) . dx (26) (6) em (26): dr ( x) = f ′( x) ⋅ RM . dx A definição de PM x = ∆y ∆x (27) em tempo contínuo é PM x = f ′( x) . (28) (28) em (27): dr ( x) = PM x ⋅ RM . dx Enquanto RM captura o aumento em r devido ao aumento de y , o termo aumento em r devido ao aumento de x . Então, PRM x ≡ dr ( x) . dx (29) dr ( x ) dx captura o (30) (30) em (29): PRM x = RM ⋅ PM x . (5′) Mas como a empresa monoposonista é concorrencial no mercado do seu produto, (5′) se a reduz a (12), como vimos na seção anterior. O custo da empresa monopsonista é c = w⋅ x (31) ou c( x) = w( x) ⋅ x . (31′) O diferencial total de (31′) é dc = dw ⋅ x + dx ⋅ w (32) que, em tempo discreto, dá a alteração total dos custos pelo emprego de mais ∆x de mão-deobra: ∆c = w ⋅ ∆ x + x ⋅ ∆ w . (33) Derivando (31′): c′( x) = w′( x) ⋅ x + w( x) . (34) CM x ≡ c′( x) (35) Como temos ((35) em (34)): CM x = w( x) + w′( x) ⋅ x . (36) Em tempo discreto, (36) fica sendo CM x = w + ∆w x. ∆x (37) Portanto, ao aumentar o emprego da mão-de-obra em ∆x , a empresa paga mais por isto: w ⋅ ∆x . Além disso, o aumento de ∆x significa que a empresa vai pagar mais por todas as unidades de mão-de-obra: ∆w ⋅ x . A equação (37) pode ser reescrita como x ∆w CM x = w 1 + . w ∆x (37′) Podemos expressar (37′) em termos da elasticidade-preço da oferta do fator: η≡ ∆x x ∆w w = ∆x w w ∆x ⋅ = ⋅ . x ∆w x ∆w (38) Logo, 1 η = w x 1 x ∆w = ⋅ . ∆x ⋅ ∆w w ∆x (39) (39) em (37′): 1 CM x = w 1 + . η (40) Se a empresa fosse tomadora de preços no mercado de fatores (como na seção anterior), a curva de oferta de mão-de-obra seria perfeitamente elástica: η =∞. (41) (41) em (40): CM x = w . (16) Este é o caso anterior da empresa monopolista no mercado de fatores competitivo (equação (16)). Mas, para a empresa monopsonista, a curva de oferta de mão-de-obra é positivamente inclinada: η > 0, (42) de modo que (considerando (42) em (40)), para o monopsonista CM x > w , (43) ( ) Já que seu CM x se iguala a w vezes o termo positivo 1 + η1 > 0 . Supondo uma oferta de mão-de-obra inversa linear: w( x) = a + bx , (44) o custo é c( x) = w( x) ⋅ x = ax + bx 2 (45) e o custo marginal é CM x = a + 2bx . (46) A empresa monopsonista maximiza lucro fazendo: max r ( x) − c( x) x (47) ou, considerando (24) e (31′) em (47): max p ⋅ f ( x) − w( x) ⋅ x . x (48) Derivando e igualando a zero: f ′( x) ⋅ p − ( w′( x) ⋅ x + w( x)) = 0 p ⋅ f ′( x) = w( x) + w′( x) ⋅ x . (49) (28) e (36) em (49): p ⋅ PM x = CM x . (50) Como a empresa monopsonista é concorrencial no mercado de seu produto, então PRM x = p ⋅ PM x (12) pode ser substituída em (50): PRM x = CM x . (52) Portanto, o lucro máximo ocorre quando o aumento da receita marginal pelo emprego de uma unidade a mais do fator se iguala ao aumento do custo marginal com o emprego desta unidade. Em termos da elasticidade-preço da oferta do fator, (40) em (51): 1 PRM x = w 1 + . η (52) Comparando com (19), a empresa monopolista emprega mão-de-obra pela regra PRM x = w . (19) Este é o caso em (52) se η = ∞ (concorrência no mercado de fatores). Mas, no monopsônio, η > 0 (equação (42)) e CM x > w (equação (43)). Como o custo marginal do emprego do fator é maior do que seu preço, isto significa que o monopsonista emprega menos trabalhadores do que no caso do mercado de trabalho competitivo: há ineficiência de Pareto no mercado de trabalho. O regulador poderia então fixar um salário-mínimo wmín = CM x fazendo com que o monopsônio se movesse sobre a curva de oferta de mão-de-obra inversa e chegasse ao nível de contratação eficiente: o salário-mínimo então aumentaria o emprego, ao contrário do esperado no mercado de trabalho competitivo. Este é o caso na Figura 2, onde consideramos os casos das funções lineares (44) e (46). Venda de fator de produção por um monopolista a outro que vende produto Considere a situação da Figura 3. Para o monopolista 2 (downstream): p ( y ) = a − by (53) r ( y) = p( y) ⋅ y (54) c( y ) = ky (55) y=x (56) max p ( y ) ⋅ y − κ y . (57) y (53) em (57): max(a − by ) ⋅ y − ky y max ay − by 2 − ky y a − 2by* − k = 0 2by* = a − k a−k y2* = . 2b (58) (59) (56) e (59): x2* = a−k . 2b (60) O monopolista 1 (upstream) escolhe o x* do monopolista 2 para maximizar seu próprio lucro: x= a−k 2b (60) ou p = k = a − 2bx , (61) que é a demanda pelo fator x . A receita é r ( x) = p ⋅ x . (62) (61) em (62): r ( x) = (a − 2bx) ⋅ x r ( x) = ax − 2bx 2 . (63) A receita marginal é RM x = a − 4bx . (64) No lucro máximo: RM x = CM x = c . (65) (64) em (65): a − 4bx* = c 4bx* = a − c a−c x1* = . 4b (66) A função produção é y = x. (67) (66) em (67): y1* = a−c . 4b Se as duas empresas fizerem uma fusão, com a demanda inversa p = a − by , (68) (53) CM = c , (69) r = p⋅ y . (70) (53) em (70): r = (a − by ) y r = ay − by 2 . (71) A receita marginal é, então, RM = a − 2by (72) e o lucro máximo é atingindo quando ((69) e (72)): RM = CM = a − 2by* = c 2by* = a − c a−c y* = . 2b (73) (74) Comparando (68) com (74): a − c = 4by1* (68′) a − c = 2by* . (74′) e (68′) e (74′): 4by1* = 2by* 2 y1* antes da fusão = y* . (75) depois da fusão Portanto, a quantidade produzida será duas vezes maior depois da fusão para o monopólio upstream. A razão é que o monopolista upstream eleva seu preço acima do CM e o monopolista downstream eleva seu preço acima desse teto de CM : markup duplo. O preço não apenas é alto demais do ponto de vista da concorrência, mas também do ponto de vista da maximização de lucro total dos dois monopólios. Depois que fazem a fusão, o preço baixa e o lucro sobe. © Sergio Da Silva 2010 www.sergiodasilva.com Oligopólio Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 27 Comportamento estratégico O oligopólio é a estrutura de mercado com poucas empresas que são interdependentes. No duopólio, duas empresas fabricam o mesmo produto e as variáveis estratégicas são os dois preços e as duas quantidades produzidas. As interações estratégicas podem ocorrer em um jogo sequencial (modelo de Stackelberg). Neste caso, a empresa que escolhe seu preço antes é a líder de preço e, a outra, fica sendo a seguidora. A empresa que escolhe sua quantidade antes é a líder de quantidade; a outra é a seguidora. Em um jogo simultâneo, as empresas escolhem seus preços ou quantidades simultaneamente, sem que uma conheça a escolha da outra. Em vez de competir, as empresas podem também formar um conluio e o jogo fica cooperativo. Liderança de quantidade Quando há uma empresa líder em uma indústria, esta anuncia a quantidade do seu produto antes da outra. Por exemplo, a IBM. A empresa 1 (líder) escolhe produzir y1 . A empresa 2 (seguidora) responde com a escolha de y2 . A produção total da indústria é Y = y1 + y2 . (1) O preço de equilíbrio depende de Y (função demanda inversa): p = p (Y ) = p ( y1 + y2 ) . (2) Para saber que y1 escolher, a líder já considera antes o problema de maximização de lucro da seguidora. A seguidora maximiza max = p ( y1 + y2 ) ⋅ y2 − c2 ( y2 ) y2 (3) depois de conhecer a produção y1 da líder: y1 é constante para a empresa 2. Assim, p′( y1 + y2 ) ⋅ y2 + p( y1 + y2 ) − c2′ ( y2 ) = 0 p( y1 + y2 ) + p′( y1 + y2 ) ⋅ y2 = c2′ ( y2 ) . (4) Em tempo discreto: p ( y1 + y2 ) + ∆c ∆p y2 = 2 ∆y2 ∆y2 RM 2 ≡ p( y1 + y2 ) + ∆p y2 . ∆y2 (4′) (5) Como antes, quando a empresa 2 aumenta y : (1) a receita aumenta pois vende mais produtos ao preço de mercado e (2) o preço é empurrado para baixo em ∆p e os lucros caem para todas as unidades vendidas ao preço que agora baixou. Além disso, CM 2 ≡ ∆c2 = c2′ ( y2 ) ∆y2 (6) (5) e (6) em (4′): RM 2 = CM 2 . (4″) Para outra escolha de y1 , a seguidora maximiza lucro de novo, considerando o novo valor de y1 constante. Assim, a função de reação é y2 = f 2 ( y1 ) . (7) Para a função demanda inversa linear p ( y1 + y2 ) = a − b( y1 + y2 ) (8) c2 = 0 , (9) e custos a função lucro π 2 ( y1 , y2 ) = r2 − c2 (10) fica sendo ((8) e (9) em (10)): π 2 ( y1 , y2 ) = (a − b( y1 + y2 )) y2 π 2 ( y1 , y2 ) = ay2 − by1 y2 − by22 . (11) Podemos usar (11) para encontrar todas as combinações de y1 e y2 que deixam π 2 constante, encontrando a isolucro: π 2 = ay2 − by1 y2 − by22 . (12) Se a empresa líder escolher y1 = 0 , a empresa seguidora vira monopólio e aufere o lucro mais alto possível. Logo, na Figura 1, curvas isolucro mais à esquerda representam lucros maiores para a empresa 2. A curva de reação corta as curvas isolucro quando as inclinações das curvas forem verticais, porque, para cada y1 , ocorrem aí as escolhas ótimas de y2 . Para y1 em particular, a escolha ótima da seguidora será y2 . Algebricamente, considerando (11) e (9), r2 = ay2 − by1 y2 − by22 (13) RM 2 ( y1 , y2 ) = a − by1 − 2by2 . (14) (9) implica que: CM 2 = 0 (15) e o máximo lucro será ((14) e (15)): RM 2 = a − by1 − 2by2 = 0 = CM 2 2by2 = a − by1 a − by1 y2 = , 2b (16) que é a curva de reação da empresa seguidora. A empresa líder sabe que a sua escolha de y1 influencia a escolha da seguidora de y2 : ela conhece a função de reação da seguidora ((7) e (16)). A empresa 1 então maximiza max p ( y1 + y2 ) ⋅ y1 − c1 ( y1 ) y1 (17) de modo que y2 = f 2 ( y1 ) . (7) em (17): (7) max p ( y1 + f 2 ( y1 ) ) ⋅ y1 − c1 ( y1 ) . y1 (18) Supomos, como antes, que c1 = 0 (19) CM 1 = 0 . (20) A receita é r1 = p( y1 + y2 ) y1 . (21) Para a demanda inversa linear ((8) em (21)): r1 = ( a − b( y1 + y2 ) ) y1 r1 = ay1 − by12 − by1 y2 . (22) (16) em (22): a − by1 2b aby1 − b 2 y12 2 r1 = ay1 − by1 − 2b a b r1 = ay1 − by12 − y1 + y12 2 2 a b 2 r1 = y1 − y1 . 2 2 r1 = ay1 − by12 − by1 (23) Logo, RM 1 = a − by1 2 (24) e o máximo lucro será (considerando (20)): RM 1 = a − by1* = 0 = CM 1 2 a 2 a , y1* = 2b by1* = onde y1* é a quantidade produzida da líder. Substituindo (25) na função de reação (16) da seguidora: (25) y2* = a −b a 2b 2b a 2a − a a a− 2= 2 = 2 =a 1 y2* = 2b 2b 2b 2 2b a y2* = , 4b (26) onde y2* é a quantidade produzida da seguidora. A quantidade produzida total ((1), (25) e (26)) será, então, Y * = y1* + y2* = Y* = a a 2a + a + = 2b 4b 4b 3a . 4b (27) As curvas isolucro da empresa 1 têm a mesma forma que as da empresa 2: há apenas um deslocamento de 90°. A curva de reação da empresa 1 também corta as curvas isolucro quando a inclinação das curvas for horizontal, por causa da escolha ótima de y1 na condição de tangência zero. A curva de reação da empresa 2 (Figura 1) é também plotada na Figura 2. Na Figura 2, curvas isolucro mais baixas representam y1 maior e, portanto, π 1 mais alto, já que y2 → 0 e a empresa 1 se aproxima da situação de monopólio. Dada a curva de reação da empresa 2, a empresa 1 então seleciona o ponto de tangência com a curva isolucro mais baixa. Liderança de preço Como os produtos são idênticos, em equilíbrio a seguidora tem que adotar o mesmo preço que a líder. Se fosse menor, os consumidores não iriam comprar nada da líder e não haveria duopólio. Se a líder então escolher o preço p, a seguidora considerará este preço dado ao maximizar seu lucro, de maneira similar a uma empresa em concorrência pura. Então, max py2 − c2 ( y2 ) (28) p − c2′ ( y2 ) = 0 p = CM 2 . (29) y2 A função de oferta da seguidora depende então do preço escolhido pela líder: y2 = S ( p ) . (30) A líder percebe que, ao fixar p , a seguidora oferecerá a quantidade S ( p ) . De toda a demanda do mercado, D( p) , a líder terá que descontar a parte atendida pela seguidora, que é S ( p ) . A demanda residual será, então, R ( p) = D( p) − S ( p) = y1 . (31) A líder produz a quantidade y1 para atender a demanda residual e vende cada unidade ao preço p . A receita será r1 = p ⋅ y1 (32) r1 = p ⋅ ( D( p ) − S ( p ) ) . (32′) Para produzir as quantidades D( p ) − S ( p ) , a líder incorre em custos constantes por cada unidade: c1 = c ⋅ ( D( p ) − S ( p ) ) . (33) Logo, o lucro será ((32′) e (33)): π 1 ( p) = p ( D( p) − S ( p) ) − c ( D( p) − S ( p) ) π 1 ( p ) = ( p − c) ( D ( p ) − S ( p ) ) (34) ou, considerando (31), π 1 ( p ) = ( p − c) R ( p ) . (34′) Para a demanda inversa linear D( p ) = a − bp e custos (35) c2 ( y2 ) = y22 2 c1 ( y1 ) = cy1 , (36) (37) a seguidora opera onde p = CM 2 . (38) Seu custo marginal (considerando (36)) será: CM 2 = y2 . (39) (39) em (38): p = y2 . (40) (40) e (30): y2 = S ( p ) = p . (41) (35) e (41) em (31): R( p ) = a − bp − p R( p) = a − (b + 1) p . (42) (42) em (31): y1 = a − (b + 1) p (b + 1) p = a − y1 a 1 p= − y1 , b +1 b +1 (43) que é a demanda inversa (residual) da líder. A receita é ((43) em (32)): 1 a r1 = − y1 y1 b +1 b +1 r1 = a 1 2 y1 − y1 . b +1 b +1 (44) A receita marginal é: RM 1 = a 2 − y1 . b +1 b +1 (45) Comparando (43) e (45), vemos que a demanda inversa e a receita marginal têm o mesmo intercepto ( b+a 1 ) e a RM 1 é duas vezes mais inclinada ( b+2 1 ) . O custo marginal, considerando (37), é CM 1 = c (46) e o lucro máximo ocorrerá quando ((45) e (46)): RM 1 = CM 1 = a 2 * − y1 = c b +1 b +1 2 * a y1 = −c b +1 b +1 2 * a − c(b + 1) y1 = b +1 b +1 a − c ( b + 1) . y1* = 2 (47) Escolha simultânea da quantidade: modelo de Cournot Se as duas empresas decidirem simultaneamente a quantidade a ser produzida, cada uma precisará prever a quantidade da outra. No modelo de Cournot, a empresa 1 espera que a empresa 2 produza y2e . Ao produzir y1 , ela espera que o total produzido seja Y = y1 + y2e e que o preço de mercado seja (48) p (Y ) = p ( y1 + y2e ) . (49) A sua maximização de lucro será: max p( y1 + y2e ) y1 − c( y1 ) . y1 (50) Logo, para cada expectativa y2e haverá uma escolha ótima de y1 . A função de reação é a relação entre a produção esperada y2e e a escolha ótima de y1 : y1 = f1 ( y2e ) . (51) Analogamente, a função de reação da empresa 2 é y2 = f 2 ( y1e ) . (52) Se as expectativas das empresas se confirmarem em equilíbrio, o equilíbrio de Cournot será dado por: y1* = f1 ( y2* ) (53) y2* = f 2 ( y1* ) . (54) Este é o ponto onde as duas curvas de reação se encontram na Figura 4. Adaptando a função de reação linear da empresa 2 de antes (equação (16)): y2 = a − by1e . 2b (55) Como a empresa 1 age da mesma forma, sua função de reação é análoga: a − by2e y1 = . 2b (56) Se as expectativas se confirmarem: y1e = y1 (57) y2e = y2 , (58) (57) em (55): y2 = a − by1 . 2b (59) (58) em (56): y1 = a − by2 . 2b (60) (59) em (60): a − by1* a b 2a − a b * a b * a −b a − + y1* + y1 + y1 b 2 = 2 2 = 2 2 = 2 2 y1* = 2b 2b 2b 2b a b 2by1* = + y1* 2 2 b a 2by1* − y1* = 2 2 b * a 2b − y1 = 2 2 4b − b * a y1 = 2 2 3b * a y1 = 2 2 a y1* = . 3b (61) em (59): (61) a a 3a − a 2a a− 3b = 3= 3 = 3 y2* = 2b 2b 2b 2b 2a 1 y2* = ⋅ 3 2b a y2* = . 3b a −b (62) A produção total (48) será: a a a+a + = 3b 3b 3b 2 a Y* = . 3b Y* = (63) Se não houver equilíbrio na produção das empresas, haverá convergência desde que a quantidade produzida fique fixa de um período para outro: o equilíbrio de Cournot é estável. Para provar, considere que no período t as empresas produzam y1t e y2t , que não são as quantidades de equilíbrio. Se a empresa 1 esperar que a empresa 2 vai manter a quantidade em y2t , em t + 1 , y1t +1 = f1 ( y2t ) . (64) Se a empresa 2 pensar da mesma forma: y2t +1 = f 2 ( y1t ) . (65) Na Figura 5 isto é representado pelo movimento horizontal à esquerda do ponto ( y , y ) até a função de reação da empresa 1. Para os outros períodos, o processo se repete: subimos a escada em direção ao equilíbrio de Cournot. t 1 t 2 Escolha simultânea da quantidade por várias empresas Com n empresas, e não apenas duas, a quantidade produzida de toda a indústria fica sendo Y = y1 + ... + yn . (66) Como no duopólio, o preço de equilíbrio depende de Y (função demanda inversa): p = p (Y ) = p ( y1 + ... + yn ) . (67) A receita de uma empresa i qualquer é ri = p(Y ) ⋅ yi . (68) A receita marginal é RM i = p′(Y ) ⋅ yi + p(Y ) . (69) Em tempo discreto: RM i = p(Y ) + ∆p yi . ∆Y (70) ∆p yi = CM i ∆Y (71) No lucro máximo, RM i = p(Y ) + que pode ser reescrita como ∆p Y yi p(Y ) 1 + = CM i . ∆Y p(Y ) Y (71′) Note que a participação da empresa i no mercado total é dada por si = yi . Y (72) (72) em (71′): ∆p Y p(Y ) 1 + si = CM i . ∆Y p (Y ) Note também que a elasticidade-preço da demanda é (73) ε (Y ) ≡ ∆Y Y ∆p p = ∆Y p(Y ) ⋅ < 0. Y ∆p (74) Logo, 1 = ε (Y ) 1 ∆Y p (Y ) ⋅ Y ∆p = Y ∆p ∆p Y ⋅ = ⋅ < 0. ∆Y p(Y ) ∆Y p(Y ) (75) (75) em (73): 1 p(Y ) 1 − si = CM i ε (Y ) ou 1 p (Y ) 1 − ε (Y ) = CM i . si (76) Se si = 1 , por (72), yi = Y , o que significa que a participação da empresa i no mercado é total: ela é um monopólio. Fazendo si = 1 em (76) dá, portanto, a mesma condição de máximo lucro do monopólio puro (Capítulo 24, Seção 3 do livro). O equilíbrio de Cournot vira o de monopólio puro. Se si = 0 , por (76), 1 p (Y ) 1 − ε (Y ) = CM i 0 1 p(Y ) 1 − = CM i ∞ p (Y ) (1 − 0 ) = CM i p(Y ) = CM i . (77) Fazendo si = 0 em (76) dá, portanto, a mesma condição de máximo lucro da concorrência pura (Capítulo 22, Seção 3 do livro). O equilíbrio de Cournot vira o de concorrência pura. Portanto, ε (Y ) si (78) é a elasticidade da curva de demanda com a qual a empresa i se defronta. Quanto menor a participação da empresa i na indústria, mais elástica a curva de demanda, e vice-versa. Escolha simultânea do preço: modelo de Bertrand Neste caso, o equilíbrio de duopólio vira o equilíbrio competitivo. Se a empresa 1 escolher um preço acima do custo marginal, a empresa 2 fica com o preço igual ao custo marginal e toma todos os clientes da empresa 1. Assim, a empresa 1 acaba também escolhendo o preço igual ao custo marginal: equilíbrio de Bertrand. Cartel Se puderem, as empresas duopolistas formarão um cartel para virar monopolista e maximizar a soma dos lucros das duas empresas. O cartel maximiza max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 ) . y1 , y2 (79) Primeiro, max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 ) y1 p′( y1* + y2* ) ⋅ ( y1* + y2* ) + p ( y1* + y2* ) − c1′( y1* ) = 0 ∆p * p( y1* + y2* ) + ( y1 + y2* ) = CM 1 ( y1* ) . ∆Y (80) Segundo, max p ( y1 + y2 ) ⋅ ( y1 + y2 ) − c1 ( y1 ) − c2 ( y2 ) y2 p′( y1* + y2* ) ⋅ ( y1* + y2* ) + p( y1* + y2* ) − c2′ ( y2* ) = 0 ∆p * p( y1* + y2* ) + ( y1 + y2* ) = CM 2 ( y2* ) . ∆Y (81) (80) e (81): CM 1 = CM 2 . (82) (80) pode ser reescrita como: ∆p * ∆p * y1 + y2 − CM 1 = 0 ∆Y ∆Y ∆p * ∆p * p( y1* + y2* ) + y1 − CM 1 = − y2 , ∆Y ∆Y p( y1* + y2* ) + (80′) onde ∆∆Yp é a inclinação da curva de demanda inversa da indústria. Como a inclinação é negativa, ∆p < 0. ∆Y (83) (83) em (80′): p ( y1* + y2* ) + ∆p * ∆p * y1 − CM 1 = − y2 > 0 . ∆Y ∆Y (80″) Como o lucro marginal da empresa 1 é positivo em (80″), ou seja, ∆π 1 ∆p * ≡ p( y1* + y2* ) + y1 − CM 1 > 0 , ∆y1 ∆Y (80′′′) no equilíbrio do cartel a empresa 1 tem incentivos para aumentar unilateralmente a produção, desde que a outra não o faça. A receita do cartel é r ( y1 , y2 ) = p( y1 + y2 ) ⋅ ( y1 + y2 ) . (84) No caso linear ((8) em (84)), r ( y1 , y2 ) = ( a − b( y1 + y2 ) ) ( y1 + y2 ) r ( y1 , y2 ) = a( y1 + y2 ) − b( y1 + y2 ) 2 . (84′) A receita marginal é RM = a − 2bY RM = a − 2b( y1 + y2 ) . (85) Supondo CM = 0 , (86) o lucro máximo ((85) e (86)) será: RM = a − 2b( y1* + y2* ) = CM = 0 2b( y1* + y2* ) = a a y1* + y2* = . 2b (87) (88) Como o cartel maximiza o lucro total, o lucro marginal de uma empresa precisa ser igual ao da outra: se não for, vale a pena para a empresa mais lucrativa produzir mais. Logo, as inclinações das curvas isolucro (lucros marginais) das duas empresas têm que ser iguais e as curvas são tangentes ao nível de lucro máximo conjunto Y * . Na Figura 6, a solução em A, por exemplo, é instável, porque, se a empresa 1 achar que a empresa 2 vai manter a produção constante e ficar em A, a empresa 1 aumenta a sua produção para ir para a isolucro mais baixa em B, onde seu lucro aumenta. Punindo para estabilizar o cartel No cartel, cada empresa aufere o lucro de monopólio π m . Se uma delas burlar o cartel, aumenta seu lucro ainda mais para π d . Portanto, πd > πm . (89) A outra empresa pode ameaçar punir a empresa 1 por isso e produzir no nível de equilíbrio de Cournot, de antes do cartel. O lucro para as duas fica sendo menor, em π c . Portanto, πc < πm . (90) Para a empresa 1, não burlar o cartel gera o valor presente (VP) dos dois períodos de VPmanter = π m + cartel πm , γ (91) onde γ é a taxa de juros real. Para a mesma empresa, burlar o cartel gera VPburlar = π d + cartel πc . γ A punição funcionará para manter o cartel unido se (92) VPmanter > VPburlar . cartel (93) cartel (91) e (92) em (93): πm π > πd + c γ γ πm πc − > πd −πm γ γ πm −πc > πd −πm γ π −π γ< m c . πd −πm πm + (94) Por (89) e (90), tanto o numerador como o denominador são positivos. Quanto menor for a taxa de juros, mais chances de (94) ocorrer e de a punição funcionar. Mas a ameaça da empresa 2 de retornar ao equilíbrio de Cournot pode não ter credibilidade se o jogo se repetir por muitos períodos. © Sergio Da Silva 2010 sergiodasilva.com Teoria dos Jogos Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 28 Estratégias dominantes A teoria dos jogos fornece a análise geral da interação estratégica. Por exemplo, o jogador 1 possui dois cartões. Em um deles está escrito “Alto” e, no outro, “Baixo”. O jogador 2 tem dois cartões: um com a palavra “Esquerda” e outro com a palavra “Direita”. Cada jogador escolhe um dos cartões e coloca-o na mesa. A matriz de resultados (payoffs) é dada pela tabela a seguir. Jogador 2 Esquerda Direita Alto 1, 2 0, 1 Jogador 1 Baixo 2, 1 1, 0 Se o jogador 1 tiver escolhido “Alto” e o jogador 2 “Esquerda”, então o jogador 1 ganha 1 e o jogador 2 ganha 2. Conhecendo a matriz de resultados, o jogador 1 escolherá “Baixo” porque (1) se o jogador 2 escolher “Esquerda”, o jogador 1 ganha 2 (e não 1) e (2) se o jogador 2 escolher “Direita”, o jogador 1 ganha 1 (e não 0). Independentemente do que o jogador 2 faça, é vantagem para o jogador 1 escolher “Baixo”: esta é sua estratégia dominante. Do ponto de vista do jogador 2, é vantagem escolher “Esquerda” independentemente do que o jogador 1 escolha: (1) se o jogador 1 escolher “Alto”, o jogador 2 ganha 2 (e não 1) e (2) se o jogador 1 escolher “Baixo”, o jogador 2 ganha 1 (e não 0). Escolher “Esquerda” é a estratégia dominante do jogador 2, enquanto escolher “Baixo” é a estratégia dominante do jogador 1. Portanto, sendo conhecida a matriz de resultados, o equilíbrio será (“Baixo”, “Esquerda”) com o jogador 1 ganhando 2 e o jogador 2 ganhando 1. Equilíbrio de Nash Se a matriz de resultados for modificada, como na tabela abaixo, pode ser que não haja estratégia dominante. Jogador 2 Esquerda Direita Alto 2, 1 0, 0 Jogador 1 Baixo 0, 0 1, 2 Se o jogador 2 escolher “Esquerda”, o jogador 1 escolherá “Alto”, porque ganha 2 (e não 0). Mas se o jogador 2 escolher “Direita”, o jogador 1 agora escolherá “Baixo”, porque ganha 1 (e não 0). Do ponto de vista do jogador 2, se o jogador 1 escolher “Alto”, o jogador 2 escolherá “Esquerda”, porque ganha 1 (e não 0). Mas se o jogador 1 escolher “Baixo”, o jogador 2 escolherá “Direita”, porque ganha 2 (e não 0). Há dois equilíbrios de Nash: (“Alto”, “Esquerda”) = (2, 1) e (“Baixo”, “Direita”) = (1, 2). No equilíbrio de (Cournot-)Nash, a escolha de um jogador é ótima dada a escolha do outro e a escolha do outro é ótima dada a escolha do primeiro. Isto significa que quando as escolhas forem reveladas, ninguém vai querer alterar a escolha feita. Quando cada jogador faz uma escolha e a mantém, isto é uma “estratégia pura”. Se modificarmos a matriz dos resultados mais uma vez, como na tabela a seguir, pode ser que não haja mais equilíbrio de Nash com estratégias puras. Jogador 2 Esquerda Direita Alto 0, 0 0, −1 Jogador 1 Baixo 1, 0 −1, 3 Estratégias mistas Se cada jogador escolher de acordo com uma probabilidade, eles adotarão “estratégias mistas” e poderá existir equilíbrio de Nash no jogo anterior. O jogador 1 agora escolherá “Alto” com probabilidade π A e “Baixo” com probabilidade 1 − π A . O jogador 2 escolherá “Esquerda” com probabilidade π E e “Direita” com probabilidade 1 − π E (tabela a seguir). Jogador 2 Esquerda, π E Direita, 1 − π E Jogador 1 Alto, π A 0, 0 0, −1 Baixo, 1 − π A 1, 0 −1, 3 Como achar as probabilidades? Se o jogador 2 escolher “Esquerda”, ele ganhará 0 se o jogador 1 escolher “Alto” e ganhará 0 se o jogador 1 escolher “Baixo”. Mas o jogador 1 escolherá “Alto” com probabilidade π A e “Baixo” com probabilidade 1 − π A . Assim, o valor esperado de escolher “Esquerda” para o jogador 2 é VE ( E ) = 0 × π A + 0 × (1 − π A ) = 0 . (1) Analogamente, o valor esperado de escolher “Direita” para o jogador 2 é VE ( D) = −1× π A + 3 × (1 − π A ) VE ( D) = −π A + 3(1 − π A ) . (2) No equilíbrio de Nash, VE ( E ) = VE ( D ) . (1) e (2) em (3): 0 = −π A + 3(1 − π A ) π A = 3 − 3π A (3) 4π A = 3 3 πA = 4 (4) e 1− π A = 1 . 4 (5) O valor esperado de escolher “Alto” para o jogador 1 é VE ( A) = 0 × π E + 0 × (1 − π E ) = 0 . (6) O valor esperado de escolher “Baixo” para o jogador 1 é VE ( B) = 1× π E + (−1) × (1 − π E ) VE ( B) = π E − (1 − π E ) . (7) No equilíbrio de Nash, VE ( A) = VE ( B ) . (8) (6) e (7) em (8): 0 = π E − (1 − π E ) 0 = π E −1+ π E 1 = 2π E 1 πE = 2 (9) e 1− π E = 1 . 2 (10) Então, o jogador 1 adota a estratégia mista ("Alto", "Baixo") = ( 34 , 14 ) e o jogador 2 adota a estratégia mista ("Esquerda", "Direita") = ( 12 , 12 ) , como na tabela abaixo. Jogador 2 Esquerda, 12 Direita, Jogador 1 Alto, Baixo, 3 4 1 4 0, 0 0, −1 1, 0 −1, 3 1 2 Assim, ocorre o equilíbrio em (0, 0) com probabilidade equilíbrio em (0, −1) com probabilidade 83 probabilidade 1 8 ( = 34 × 12 ) . 3 8 ( = 34 × 12 ) . Ocorre o Ocorre o equilíbrio em (1, 0) com ( = 14 × 12 ) . E ocorre o equilíbrio em (−1,3) com probabilidade 18 ( = 14 × 12 ) . O valor médio esperado do jogador 1 é, então, 3 3 1 1 VE (1) = 0 × + 0 × + 1× + (−1) × 8 8 8 8 1 1 VE (1) = − = 0 . 8 8 (11) E o valor médio esperado do jogador 2 é 3 3 1 1 VE (2) = 0 × + (−1) × + 0 × + 3 × 8 8 8 8 3 3 VE (2) = 0 − + 0 + = 0 . 8 8 (12) Dilema dos prisioneiros Um equilíbrio de Nash não é necessariamente Pareto-eficiente. Um exemplo disso é o dilema dos prisioneiros da tabela a seguir. Prisioneiro 2 Confessar Negar Confessar −3, −3 0, −6 Prisioneiro 1 Negar −6, 0 −1, −1 Se o prisioneiro 2 confessar o crime, é melhor para o prisioneiro 1 confessar, pois pega três meses de prisão ( −3) em vez de seis (−6) . Se o prisioneiro 2 negar, para o prisioneiro 1 é melhor confessar, pois seria libertado (0) em vez de pegar um mês de prisão ( −1) . Logo, confessar é a estratégia dominante para o jogador 1 e esta será sua escolha. Se o prisioneiro 1 confessar, é melhor para o prisioneiro 2 confessar e pegar três meses (−3) em vez de seis (−6) . Se o prisioneiro 1 negar, é melhor para o prisioneiro 2 também confessar (0 é melhor do que −1). Logo, confessar também é a estratégia dominante para o jogador 2 e esta será sua escolha. Assim, o único equilíbrio de Nash (também em estratégias dominantes) é ambos confessarem e cada um pegar três meses de prisão. Mas este equilíbrio é ineficiente no sentido de Pareto, pois há outra situação em que a situação de ambos melhora: a situação em que ambos negam (um mês para cada) seria eficiente. Jogos repetidos Se o jogo do dilema dos prisioneiros for repetido digamos, dez vezes, na décima rodada, mesmo que os prisioneiros estivessem adotando a estratégia cooperativa “negar”, cada um iria confessar. Jogar pela última vez é o mesmo que jogar apenas uma vez. Sabendo disso, cada prisioneiro vai confessar na nona rodada, na oitava rodada e assim por diante. Com um número fixo de rodadas, cada prisioneiro confessa em todas as rodadas e o único equilíbrio é “confessar”, que é não-cooperativo e Pareto-ineficiente. Se o jogo for indefinido, há a possibilidade de surgir uma solução cooperativa (Robert Axelrod, 1984), através da estratégia “olho por olho”: o prisioneiro 1 coopera negando na primeira rodada, esperando que o prisioneiro 2 faça o mesmo. Se este não cooperar, o prisioneiro 1 deixa de cooperar. Se ele cooperar, o prisioneiro 1 continua cooperando e a situação Pareto-eficiente pode ser atingida. Um exemplo de dilema dos prisioneiros é um duopólio na estratégia de fixar o preço. As duas empresas cobrando um preço alto alcançam conjuntamente o maior lucro: situação cooperativa. Mas se uma cobrar o preço alto valerá a pena para a outra diminuir seu preço e aumentar seu lucro ainda mais. Portanto, a estratégia dominante de cada empresa é reduzir o seu preço. O equilíbrio de Nash será a situação com lucros menores. Se o jogo for repetido, adotando a estratégia “olho por olho” pode ser que ambas as empresas alcancem o equilíbrio cooperativo. Jogos sequenciais Se o jogo da tabela a seguir Jogador 2 Esquerda Direita Alto 1, 9 1, 9 Jogador 1 Baixo 0, 0 2, 1 deixar de ser simultâneo e passar a ser sequencial, a sua forma extensiva será como na Figura 1, onde o jogador 1 é o líder. Para o seguidor (jogador 2), se o jogador 1 já escolheu “Alto”, então é indiferente escolher entre “Esquerda” e “Direita”: resultados iguais a 9. Mas se o jogador 1 escolheu “Baixo”, então o jogador 2 escolherá “Direita” (para ganhar 1 em vez de 0). Para o líder (jogador 1), escolher “Alto” leva a um ganho de 1 sempre. Se escolher “Baixo” ganha 2, porque o jogador 2 terá que escolher “Direita”. O equilíbrio será (Baixo, Direita) = (2,1) . Como o jogador 2 não gosta deste resultado de equilíbrio (ele ganhou 1 mas poderia ter ganho 9, caso o jogador 1 tivesse escolhido “Alto”), o jogador 2 pode ameaçar escolher “Esquerda” para que o jogador 1 fique com 0 em vez de 2. Mas a ameaça do jogador 2 não tem credibilidade: se o jogador 1 escolher “Baixo”, o jogador 2 terá que escolher “Direita”, ganhando 1 em vez de 0. Porém, o jogador 2 pode “comprar” credibilidade limitando sua própria capacidade de escolher. Por exemplo, ele pode passar sua decisão para um advogado que deverá, por contrato em cartório (ou por um programa de computador), escolher sempre “Esquerda”. Sabendo disso, o jogador 1 irá escolher “Alto” e o equilíbrio se modifica em favor do seguidor para: (Alto, Esquerda) = (1, 9) . Um exemplo com estrutura de jogo similar é o de uma empresa que escolhe entrar ou não em uma indústria (líder) e a empresa já estabelecida (seguidora) resolve ou não reduzir seu preço em resposta. Em um jogo sequencial, uma vez que uma escolha seja feita, os jogadores ficam em um subjogo contendo as estratégias e resultados daquele ponto em diante, como descrito na Figura 2. © Sergio Da Silva 2010 sergiodasilva.com Teoria dos Jogos II Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 29 Função de melhor resposta No jogo abaixo, se o jogador 2 escolher “Esquerda”, a melhor resposta do jogador 1 é escolher “Alto”. Se o jogador 2 escolher “Direita”, a melhor resposta do jogador 1 é escolher “Baixo”. Por sua vez, se o jogador 1 escolher “Alto”, a melhor resposta do jogador 2 é escolher “Esquerda”. Se o jogador 1 escolher “Baixo”, a melhor resposta do jogador 2 é escolher “Direita”. Jogador 2 Esquerda Direita Alto 2, 1 0, 0 Jogador 1 Baixo 0, 0 1, 2 Resumo Escolha do jogador 2 Melhor resposta do jogador 1 Esquerda Alto Direita Baixo Escolha do jogador 1 Melhor resposta do jogador 2 Alto Esquerda Baixo Direita As escolhas (Alto, Esquerda), por exemplo, são mutuamente consistentes: equilíbrio de Nash, onde as crenças e as ações dos jogadores coincidem. As funções de melhor resposta são, então, J1* = f1 ( J 2* ) (1) J 2* = f 2 ( J1* ) . (2) e O equilíbrio de Nash é ( J1* , J 2* ) . O par J1* e J 2* é apenas uma das possíveis melhores respostas mutuamente consistentes, no caso (Alto, Esquerda). Note que (Baixo, Direita) também seria uma melhor resposta. Se houver apenas uma melhor resposta, a função de reação torna-se a função de melhor resposta. Então, o equilíbrio de Nash nas funções de melhor resposta é um caso particular do equilíbrio de Cournot nas funções de reação. Encontrando o equilíbrio de Nash Podemos generalizar o jogo anterior para considerar a possibilidade de equilíbrios de Nash em estratégias puras e em estratégias mistas. Considere o jogo a seguir. Jogador 2 Esquerda, π E Direita, 1 − π E Jogador 1 Alto, π A 2,1 0, 0 Baixo, 1 − π A 0, 0 1, 2 A probabilidade de se escolher “Alto” é π A e a probabilidade de se escolher “Esquerda” é π E . Se π A = 0 , o jogador 1 escolhe “Baixo” com certeza. Se π A = 1 , o jogador 1 escolhe “Alto” com certeza. Se π E = 0 , o jogador 2 escolhe “Direita” com certeza. Se π E = 1 , o jogador 2 escolhe “Esquerda” com certeza. Então, as estratégias puras ocorrem quando: 0 1 (3) 0 1 (4) πA = e πE = Se o jogador 1 escolher “Alto” com probabilidade π A e o jogador 2 escolher “Esquerda” com probabilidade π E , a probabilidade de esses eventos independentes ocorrerem ao mesmo tempo é dada por π A × π E e o ganho seria 2 para o jogador 1, e 1 para o jogador 2. Dessa forma, podemos calcular o valor esperado para cada jogador de cada combinação possível de escolhas. Para o jogador 1, o ganho esperado é: VE ( J1 ) = π A × π E × 2 + π A × (1 − π E ) × 0 + (1 − π A ) × π E × 0 + (1 − π A )(1 − π E ) × 1 VE ( J1 ) = 2π Aπ E + (1 − π A )(1 − π E ) . (5) Para o jogador 2, o ganho esperado é: VE ( J 2 ) = π A × π E × 1 + π A × (1 − π E ) × 0 + (1 − π A ) × π E × 0 + (1 − π A )(1 − π E ) × 2 VE ( J 2 ) = π Aπ E + 2(1 − π A )(1 − π E ) . (6) A expressão (5) pode ser reescrita como: VE ( J1 ) = 2π Aπ E + 1 − π E − π A + π Aπ E VE ( J1 ) = 3π Aπ E − π A − π E + 1 . (5′) Diferenciando em relação a π A : dVE ( J1 ) = 3π E − 1 . dπ A (7) Se a probabilidade de jogar “Alto” for aumentada e o jogador 1 aumentar seu ganho esperado, ou seja, dVE ( J1 ) >0 dπ A (8) então, (8) e (7): 3π E − 1 > 0 3π E > 1 1 πE > . 3 (9) Se não aumentar, ou seja, dVE ( J1 ) =0 dπ A (10) então, (10) e (7): 3π E − 1 = 0 3π E = 1 1 πE = . 3 (11) Se a probabilidade de jogar “Alto” for aumentada e o jogador 1 reduzir seu ganho esperado: dVE ( J1 ) <0 dπ A (12) então, (11) e (7): 3π E − 1 < 0 1 πE < . 3 (13) Em resumo, se o jogador 2 escolher jogar “Esquerda” com probabilidade 13 , então a melhor resposta para o jogador 1 é não alterar sua probabilidade de jogar “Alto” (trecho horizontal da curva de reação da Figura 1). Se o jogador 2 escolher π E em qualquer valor acima de 13 , a melhor resposta para o jogador 1 é aumentar sua probabilidade de jogar “Alto” (trecho vertical da curva de reação, acima de π E = 13 ). Se o jogador 2 escolher π E em qualquer valor abaixo de 13 , a melhor resposta para o jogador 1 é reduzir π A (trecho vertical da curva de reação, abaixo de π E = 13 ). Analogamente, (6) pode ser reescrita como: VE ( J 2 ) = π Aπ E + 2 − 2π E − 2π A + 2π Aπ E VE ( J 2 ) = 3π Aπ E − 2π E − 2π A + 2 . (6′) Diferenciando em relação a π E : dVE ( J 2 ) = 3π A − 2 . dπ E (14) dVE ( J 2 ) =0 dπ E (15) 2 . 3 (16) dVE ( J 2 ) >0 dπ E (17) 2 . 3 (18) dVE ( J 2 ) <0 dπ E (19) 2 . 3 (20) Se → πA = Se → πA > Se → πA < Portanto, se o jogador 1 escolher jogar “Alto” com probabilidade 23 , a melhor resposta para o jogador 2 é não alterar π E (trecho vertical da curva de reação). Se o jogador 1 escolher π A acima de 23 , a melhor resposta para o jogador 2 é aumentar π E , pois isto aumenta seu ganho esperado VE ( J 2 ) (trecho horizontal acima de 23 ). Se o jogador 1 escolher π A abaixo de 23 , a melhor resposta para o jogador 2 é diminuir π E (trecho horizontal abaixo de 23 ). Na Figura 1 há três equilíbrios de Nash: dois com estratégias puras (que já conhecíamos) e um com estratégia mista. Note que as curvas da Figura 1 são curvas de reação, já que, como vimos, escolhemos para a curva de melhor resposta apenas um equilíbrio: (Alto, Esquerda). No equilíbrio de Nash com estratégias mistas ocorre VE ( J1* ) = VE ( J 2* ) (21) π A = 1− π E . (22) e Para provar (22), substituímos (5) e (6) em (21): 2π Aπ E + (1 − π A )(1 − π E ) = π Aπ E + 2(1 − π A )(1 − π E ) π Aπ E = (1 − π A )(1 − π E ) π Aπ E = 1 − π E − π A + π Aπ E 0 = 1− π E − π A π A = 1− π E (22) ou 2 1 = 1− . 3 3 (22′) Jogos de coordenação Jogos de coordenação são aqueles onde os ganhos dos jogadores seriam maiores se eles pudessem coordenar suas estratégias. Exemplos: batalha dos sexos, dilema dos prisioneiros, corrida armamentista, jogo do amarelão. 1. Batalha dos sexos: mesmo jogo que acabamos de analisar (Alto, Baixo, Esquerda, Direita). Moça Filme de ação Filme de arte Filme de ação 2, 1 0, 0 Rapaz Filme de arte 0, 0 1, 2 Há três equilíbrios de Nash: (1) (Ação, Ação) = (2, 1); (2) (Arte, Arte) = (1, 2) e Rapaz escolhe Ação com probabilidade 23 e Moça escolhe Arte com probabilidade 23 . Se, por considerações externas, um dos equilíbrios for mais esperado, este será o ponto focal do jogo. Por exemplo, se o cinema ficar perto da casa do rapaz, talvez ocorra o equilíbrio no ponto focal (2, 1). 2. Dilema dos prisioneiros. Prisioneiro 2 Confessar Negar Confessar −3, −3 0, −6 Prisioneiro 1 Negar −6, 0 −1, −1 A solução não-cooperativa (Confessar, Confessar) = (−3, −3) pode ser evitada se o jogo for repetido indefinidamente com cada jogador adotando a estratégia “olho por olho”. Os jogadores também podem assinar um contrato para que a escolha seja (Negar, Negar) = (−1, −1). 3. Corrida armamentista. Ex-URSS Não construir Construir Não construir mísseis 4, 4 1, 3 EUA Construir 3, 1 2, 2 Há dois equilíbrios de Nash com estratégias puras: (1) (Não construir, Não construir) = (4, 4) e (2) (Construir, Construir) = (2, 2). Para se chegar ao melhor equilíbrio em (4, 4) um jogador pode permitir unilateralmente a inspeção. 4. Jogo do amarelão. John Nash Desviar Ir em frente Desviar o carro 0, 0 −1, 1 James Dean Ir em frente 1, −1 −2, −2 Há dois equilíbrios de Nash com estratégias puras: (1) (Desviar, Ir em frente) = (−1, 1) e (2) (Ir em frente, Desviar) = (1, −1). James Dean pode botar uma tranca antes de acelerar e garantir o equilíbrio (1, −1). Jogos de competição Jogos de competição são jogos de soma zero, onde os ganhos de um jogador se igualam às perdas do outro. Exemplo: maioria dos esportes. Pênalti do futebol. Goleiro Pular à esquerda Pular à direita Chutar à esquerda 50, −50 80, −80 Atacante Chutar à direita 90, −90 20, −20 Os resultados podem ser interpretados da seguinte maneira: por exemplo, na célula superior esquerda, o atacante faz gol em 50% das vezes. Comecemos com o ponto de vista do atacante. É vantagem para ele adotar uma estratégia mista: chutar à esquerda com probabilidade π E e à direita com probabilidade 1 − π E . Se o goleiro pular à esquerda, VE (atacante) = 50π E + 90(1 − π E ) . (23) Se o goleiro pular à direita, VE (atacante) = 80π E + 20(1 − π E ) . (24) (23) e (24): 50π E + 90(1 − π E ) = 80π E + 20(1 − π E ) 30π E = 90 − 90π E − 20 + 20π E 30π E = 70 − 70π E 100π E = 70 π E = 0.70 . (25) Se o atacante chutar à esquerda 70% das vezes e o goleiro responder de forma ótima, ele marcará gol em 62% das vezes. De fato, (25) em (23) (ou em (24)): VE (atacante) = 50 × 0.7 + 90 × 0.3 = 35 + 27 VE (atacante) = 62 . (26) Vejamos agora o ponto de vista do goleiro, que pula à esquerda com probabilidade κ E e à direita com probabilidade 1 − κ E . Se o atacante chutar à esquerda: VE (goleiro) = −50κ E + (−80)(1 − κ E ) VE (goleiro) = −50κ E − 80(1 − κ E ) . (27) Se o atacante chutar à direita: VE (goleiro) = −90κ E + (−20)(1 − κ E ) VE (goleiro) = −90κ E − 20(1 − κ E ) . (28) (27) e (28): −50κ E − 80(1 − κ E ) = −90κ E − 20(1 − κ E ) −50κ E + 90κ E = −20(1 − κ E ) + 80(1 − κ E ) 40κ E = −20 + 20κ E + 80 − 80κ E 40κ E = 60 − 60κ E 100κ E = 60 κ E = 0.60 . (29) Se o goleiro pular à esquerda 60% das vezes e o atacante responder de forma ótima, o atacante marcará gol em 62% das vezes. De fato, (29) em (27) (ou em (28)): VE (goleiro) = −50 × 0.6 − 80 × 0.4 = −30 − 32 VE (goleiro) = −62 . (30) Compare (26) com (30). As curvas de reação (de melhor resposta) estão na Figura 2. No equilíbrio de Nash, (23) = (27) ou (24) = (28). Para (23) = (27), VE (atacante* ) = VE (goleiro* ) 50π E + 90 − 90π E = −50κ E − 80 + 80κ E −40π E + 90 = 30κ E − 80 30κ E + 40π E − 170 = 0 . (31) Fora do equilíbrio, para o atacante, diferenciamos (31) em relação a π E : dVE (atacante) = 40 > 0 dπ E (32) → π E ↑ → VE (atacante) ↑ e π E ↓ → VE (atacante) ↓. Para o goleiro, diferenciando (31) em relação a κ E : dVE (goleiro) = 30 > 0 dκ E (33) → κ E ↑ → VE (goleiro) ↑ e κ E ↓ → VE (goleiro) ↓. As curvas de reação estão representadas na Figura 3. Jogos de coexistência Jogo de falcões e pombos. Chupacabra 2 Comportamento de Comportamento de falcão pombo Chupacabra 1 Comportamento de falcão Comportamento de pombo −2, −2 4, 0 0, 4 2, 2 Há dois equilíbrios de Nash em estratégias puras (este é o jogo do amarelão de antes), mas há outro em estratégias mistas. Se os dois cachorros selvagens adotarem um comportamento de falcão com probabilidade π H , e de pombo com probabilidade 1 − π H , para o chupacabra 1, seu ganho esperado de se comportar como falcão será: VE ( H ) = −2π H + 4(1 − π H ) . (34) O seu ganho esperado de se comportar como pombo será: VE ( D) = 0 ⋅ π H + 2(1 − π H ) VE ( D) = 2(1 − π H ) . (35) Cálculo similar vale para o chupacabra 2. Se VE ( H ) > VE ( D) , (36) valerá a pena para o chupacabra 1 se comportar como falcão: ele se reproduzirá mais e os seus descendentes herdarão a tendência de jogar falcão. Se VE ( H ) < VE ( D) , (37) a população de chupacabras que se comportam como pombos aumentará. Em equilíbrio: VE ( H ) = VE ( D) . (38) (34) e (35) em (38): −2π H + 4 − 4π H = 2 − 2π H 2 = 4π H π H = 0.5 . Chupacabras com comportamento de falcão em igual proporção a outros com comportamento de pombo é o equilíbrio de Nash, que também é evolucionariamente estável (John Maynard Smith, 1982). Se VE ( H ) > VE ( D) , então, (34) e (35) em (36): −2π H + 4 − 4π H > 2 − 2π H 2 > 4π H π H < 0.5 . (36) Quando π H < 0.5 , o ganho esperado de se comportar como falcão é maior, levando à maior proporção de comportamento de falcão. Se VE ( H ) < VE ( D) , (37) então, (34) e (35) em (37): −2π H + 4 − 4π H < 2 − 2π H 2 < 4π H π H > 0.5 . Quando π H > 0.5 , vale a pena ser pombo e a população com esse comportamento aumentará. Note em VE ( H ) = −2π H + 4(1 − π H ) (34) que quando π H = 0 → VE ( H ) = 4 (intercepto da Figura 4). Veja também que em VE ( D) = 2(1 − π H ) , quando π H = 0 → VE ( D) = 2 (intercepto). (35) Jogos de compromisso Para alterar o resultado de um jogo sequencial em seu favor, um jogador pode comprar credibilidade através de uma escolha que envolva compromisso. Esta escolha precisa ser observada pelo outro jogador para que este se convença de alterar o comportamento. Exemplo: o sapo e o escorpião. Como o jogo é sequencial, se o sapo escolher carregar o escorpião, o escorpião escolherá ferroar o sapo, pois o ganho do escorpião de 5 superará o de 3. Equilíbrio: (Sapo, Escorpião) = (−10, 5). O sapo poderia ter feito um acordo para que, antes, o escorpião amarrasse sua cauda. Equilíbrio: (Sapo, Escorpião) = (5, 3) Outro exemplo é o jogo “sequestrador e refém”. O refém pede para ser libertado e em troca promete não identificar o sequestrador. Porém, se o sequestrador libertar o refém, este vai identificá-lo depois, já que o ganho de 5 supera o de 3. Equilíbrio: (Sequestrador, Refém) = (−5, 5). Mas o refém pode comprar credibilidade impondo a si mesmo um custo. Equilíbrio: (Sequestrador, Refém) = (5, 3). Ainda outro exemplo é o jogo do porco subordinado e do porco dominador (Figura 7). Porco dominador Não pressiona a alavanca Pressiona Não pressiona a alavanca 9, 0 5, 1 Porco subordinado Pressiona −1, 6 1, 5 Não pressionar a alavanca é a estratégia dominante do porco subordinado. Equilíbrio de Nash: (5, 1). Se o porco fosse racional, ele talvez resolvesse comprar pela ACME uma alavanca que desse choque: não pressionar viraria a estratégia dominante para ele, mas aí ninguém comeria. Alguma outra sugestão? Um exemplo final seria o jogo da extorsão (Figura 8), onde um vendedor de uma loja acha melhor extorquir o cliente, que escolhe ceder: equilíbrio em (1300, 0). Porém, a resultante má reputação da loja dificultaria a manutenção desse equilíbrio no futuro. Jogo do ultimato Os jogadores 1 e 2 precisam dividir $1 (digamos, em moedas de um cent (penny): ¢1) entre si em três dias de negociação. Se um jogador for indiferente entre duas propostas, por hipótese ele aceita a preferida pelo oponente. Jogo sequencial: no primeiro dia, o jogador 1 faz uma oferta. O jogador 2 a aceita ou não. Recusando-a, ele faz uma contra-oferta no segundo dia. O jogador 1 a aceita ou não. Recusando-a, ele faz a última oferta no terceiro dia. Se não chegarem a um acordo no terceiro dia, os dois jogadores nada ganham. O valor futuro de $1 é dado por VF ($1) = $1(1 + r ) , onde r é a taxa de juros real. A utilidade diária da taxa de desconto para o jogador 1 é u (1 + r ) = α e, para o jogador 2, é u (1 + r ) = β . Assim, VFpróximo ($1) = $1× α = α para o jogador 1 dia e VFpróximo ($1) = $1× β = β para o jogador 2. dia Comecemos a análise pelo final do jogo. No terceiro dia, o jogador oferece ¢1 e fica com ¢99. O jogador 2 prefere ¢1 a ¢0 e o subjogo acaba. Se o jogador 2 for indiferente entre ¢1 e nada, o equilíbrio fica sendo: ( Ganho do jogador 1, Ganho do jogador 2 ) = ($1, 0) . Por causa disso, no segundo dia o jogador 2 sabe que o jogador 1 vai rejeitar sua oferta para, no terceiro dia, ficar com $1. VFpróximo ($1) = α para o jogador 1. dia Logo, qualquer oferta do jogador 2 menor do que α será rejeitada pelo jogador 1. Sobra 1 − α para o jogador 2 no segundo dia, que é melhor do que zero no terceiro dia. O jogador 2 oferece α e o jogador 1 aceita. O equilíbrio do subjogo (terceiro dia e segundo dia) fica sendo: ( Ganho do jogador 1, Ganho do jogador 2 ) = (α , 1 − α ) . No primeiro dia, o jogador 1 sabe que o jogador 2 garante 1 − α no segundo dia se ele recusar sua oferta. O jogador 1 então oferece VFpróximo (1 − α ) = β (1 − α ) para o jogador 2 dia e fica com 1 − β (1 − α ) . O equilíbrio deste subjogo (terceiro dia, segundo dia e primeiro dia) fica sendo: ( Ganho do jogador 1, Ganho do jogador 2 ) = (1 − β (1 − α ), β (1 − α )) . O jogo então se resolve no primeiro dia e, assim, existe o único equilíbrio perfeito de subjogo acima. Ariel Rubinstein (1982) mostrou que, para uma negociação sem tempo definido, o equilíbrio perfeito de subjogo fica sendo: 1 − β β (1 − α ) , . 1 − αβ 1 − αβ ( Ganho do jogador 1, Ganho do jogador 2 ) = Note que a soma dos ganhos dos dois jogadores em todos os subjogos é igual a 1. © Sergio Da Silva 2010 sergiodasilva.com Economia Comportamental Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 30 Apresentação das escolhas O modelo da escolha do consumidor é o melhor ponto de partida de análise, mas incompleto. Precisamos adicionalmente levar em conta as descobertas da economia comportamental, que recorre à psicologia. O modo como as escolhas são apresentadas (framed) ao consumidor pode afetar sua escolha. Uma calça rasgada sendo vendida em uma loja exclusiva vende mais do que a mesma calça em uma loja comum. Comprar uma ação vendendo outra deixa o portfólio inalterado, mas o consumidor quando compra se comporta de forma diferente da situação em que vende. Se um livro for etiquetado em $29.95 vende mais do que se for em $29.00. Os efeitos da apresentação da escolha são bem capitalizados pelas técnicas de marketing. O dilema da doença Apresentando um tratamento para uma doença de modo positivo pode fazer com que o consumidor o escolha. Mas ele não o escolheria se fosse apresentado de modo negativo. Exemplo: uma doença séria ameaça 600 pessoas. Uma apresentação positiva seria: Tratamento A salva 200 vidas com certeza Tratamento B salva 600 vidas com 1 3 de chance e nenhuma vida com 2 3 de chance Uma apresentação negativa seria: Tratamento C 400 pessoas morrem com certeza Tratamento D 600 pessoas morrem com 2 3 de chance e ninguém morre com 1 3 de chance O consumidor tende a escolher o tratamento A em vez do B, mas incorre em inconsistência ao escolher o tratamento D em vez do C. Note que tudo é uma questão de apresentação porque os tratamentos A e C geram o mesmo resultado. O tratamento A salva 200 vidas com certeza e, portanto, 400 pessoas morrem com certeza, que é como o tratamento C é apresentado. Os tratamentos B e D são similares também. No tratamento B, o valor esperado de vidas salvas é: 1 2 VE = 600 + 0 = 200 . 3 3 Portanto, espera-se que 400 pessoas morram. Isto é o valor esperado no tratamento D: VE = 2 1 1200 600 + 0 = = 400 . 3 3 3 Se o consumidor for avesso ao risco e escolher salvar 200 vidas com certeza (tratamento A) em vez de apostar em 200 vidas salvas (tratamento B), espera-se que ele também escolha o tratamento C em vez da aposta (tratamento D). Porém, quando perdas estão envolvidas, parece que o consumidor busca o risco. Mesmo médicos incorrem nesse viés cognitivo: em um experimento, 72% escolheram o tratamento A, mas apenas 22% escolheram também o equivalente tratamento C. Efeito-disposição Um consumidor que recebe de presente ações de uma empresa que ele jamais compraria tende a demorar muito para vendê-las em caso de baixa contínua. Além disso, tende a vender apressadamente ações em alta. Efeito-âncora A escolha do consumidor pode ser influenciada por informação irrelevante. Em um experimento, os participantes giravam uma roda da fortuna e depois eram perguntados se o número de países africanos nas Nações Unidas era maior ou menor do que o número que saiu. Em seguida, os participantes diziam quais eram suas estimativas do número de países africanos nas Nações Unidas. O número que saiu na roda da fortuna, apesar de inteiramente aleatório, influenciava a estimativa do número de países. Em outro experimento, uma garrafa de vinho cara era mostrada a alunos de MBA. Depois estes eram perguntados se pagariam pela garrafa o equivalente aos dois últimos dígitos do seu número de Seguridade Social. Em seguida, os alunos informavam o valor máximo que estariam dispostos a pagar pela garrafa. O número de Seguridade Social influenciava as respostas. Aqueles com dígitos 50 ou abaixo queriam pagar $11.62 em média; os com dígitos acima de 50 queriam pagar $19.95 em média. Fora do laboratório há outros exemplos. Três empregadores ofereciam entrada automática em determinado fundo de pensão. Os empregados poderiam optar por sair depois. Mais de 85% dos trabalhadores aceitaram a entrada automática. O problema é que os trabalhadores também escolhiam ao mesmo tempo o associado investimento: um fundo de baixa contribuição e baixo retorno. Os empregadores escolhiam um investimento conservador para evitar risco e ação judicial. Escolha de uma só vez Um professor oferecia a seus alunos a escolha de seis diferentes tipos de lanche. Em uma escolha, os alunos tinham que escolher logo o lanche das três semanas seguintes. Em outra escolha, os alunos escolhiam o lanche a ser consumido a cada dia. Na escolha de uma só vez para o futuro, os alunos escolhiam lanches mais diversificados. Excesso de variedade Mais escolha é melhor. Mas isto ignora o custo de se escolher. Em um experimento, dois estandes de geleia foram expostos em um supermercado. No primeiro, havia 24 sabores e, no segundo, apenas 6. Embora mais pessoas parassem em frente ao estande com mais variedade, acabavam comprando mais no estande de menos sabores. Excesso variedade dificulta a escolha do consumidor. Em decisões de investimento também ocorre o problema da escolha excessiva. Descobriu-se que pessoas montando portfólios para a aposentadoria tendiam a ficar satisfeitas em copiar o portfólio de colegas. Ter autonomia para escolher tem custo. Preferências construídas Na microeconomia, as preferências preexistentes explicam o comportamento. Mas os economistas comportamentais acham que o consumidor cria preferências no ato de escolher: as preferências são construídas. Exemplo: uma consumidora pega um tomate em uma banca. Coloca-o de volta. Pega-o de novo. Ela o quer ou não? Talvez ela esteja descobrindo sua preferência. Contudo, uma vez descobertas, as preferências ficam embutidas em qualquer escolha. Uma vez que a escolha seja feita, ela tende a ancorar futuras decisões. Se você tentar comprar o tomate da consumidora que finalmente resolveu comprá-lo, provavelmente irá pagar mais. Lei dos pequenos números Pela lei dos grandes números, a média de uma amostra grande de uma população tende a se aproximar da média da população. Psicologicamente, porém, os consumidores tendem a ser influenciados por pequenas amostras. Eles esperam que as amostras sejam iguais à distribuição de onde elas são extraídas. Exemplo: uma cidadezinha possui dois hospitais. Em média, nascem por dia 45 bebês no hospital grande e 15 no pequeno. Em 50% das vezes nascem meninos. Mas isto pode variar de dia para dia. Cada hospital registra os dias em que nascem mais meninos (> 60%). Que hospital registra mais essas saídas da média em, digamos, um ano? Em um questionário para estudantes, 56% responderam que os dois hospitais registrariam aproximadamente o mesmo número de dias nascendo mais meninos, 22% responderam que o hospital grande registraria mais dias e apenas 22% responderam corretamente que o hospital menor registraria mais dias. Para entender, suponha agora que ocorram em média, por dia, 2 nascimentos no hospital pequeno e 100 no grande. No hospital pequeno, a probabilidade de que os dois nascimentos sejam de meninos é 1 1 1 2 × 2 = 4 = 0.25 = 25% . Seria bem mais difícil esperar que 25% de todos os 100 nascimentos do hospital grande fossem de meninos. O consumidor também não reconhece bem a aleatoridade. Jogando uma moeda, a chance de sair “cara” três vezes seguidas é 12 × 12 × 12 = 18 = 0.125 . A de sair “coroa” três vezes seguidas é 0.125. Como os dois eventos “cara três vezes seguidas” ou “coroa três vezes seguidas” são mutuamente excludentes, a probabilidade é dada por 0.125 + 0.125 = 0.25. Em um experimento onde pessoas escreviam uma sequência de 150 lances de moeda, somente em 15% das vezes escreveram cara, cara, cara ou coroa, coroa, coroa. Mas deveria ser em 25% das vezes para ser aleatório. Analogamente, a probabilidade de aparecer cara, cara, cara, cara ou coroa, coroa, coroa, coroa é ( 12 × 12 × 12 × 12 ) + ( 12 × 12 × 12 × 12 ) = 161 + 161 = 0.0625 + 0.0625 = 0.125 . No experimento, apenas em 3% das vezes as pessoas escreveram quatro caras ou quatro coroas em seguida. Já que o correto é 12.5%, as pessoas parecem não entender a teoria de probabilidade. Talvez as pessoas, então, não consigam aleatorizar suas decisões nas estratégias mistas da teoria dos jogos. Em um estudo com jogadores de tênis em Wimbledon, percebeu-se que eles não conseguiam aleatorizar os serviços de saque, tendendo a mudar de saques à esquerda e à direita em excesso com relação ao aleatoriamente correto. Excesso de aversão ao risco Se sair cara, ganha-se $14; se sair coroa, perde-se $10. Vale a pena para alguém com renda de $100 mil por ano entrar nessa aposta? Sim, porque VE = (14 × 12 ) + ( −10 × 12 ) = 7 − 5 = 2 . Além de o valor esperado ser positivo, a aposta é muito pequena em relação à renda. Surpreendentemente, poucas pessoas entram em apostas desse tipo, demonstrando um excesso de aversão ao risco. Os consumidores também tendem a fazer seguro de pequenos eventos. Exemplo: seguro de perda de telefone celular. Se o seguro custar $36 por ano e o aparelho novo custar 36 $180, o correto é observar a house odds de 180 = 0.2 . O seguro valerá a pena apenas se a chance de se perder o celular durante o ano ficar acima de 20%. Efeito-dotação Em um experimento, metade dos participantes ganhou canecos de café. Depois, eles reportaram o preço mais baixo que venderiam os canecos. O preço mediano foi $5.79. Para aqueles da outra metade do grupo que não ganhou caneco foi pedido que fosse reportado o preço máximo que eles comprariam caneco. O preço mediano foi $2.25. Como os grupos foram formados aleatoriamente, esperava-se que os preços medianos de venda e compra fossem próximos. Parece que quem possui um item atribui um valor a mais para ele do que quem não o possui. Falácia dos custos irrecuperáveis Ao se comprar um item, o montante pago é irrecuperável (sunk cost). Por esta razão, o comportamento futuro não deve depender do valor pago. Mas, na prática, um estudo em Boston mostrou que os preços de apartamentos em condomínios cobrados por proprietários eram fortemente correlacionados aos preços de compra. Porém, para donos que compraram para investir, e não para morar, os preços eram menos correlacionados. Desconto semi-hiperbólico A teoria convencional estabelece que os consumidores descontam o futuro a uma fração constante δ t . Se u (c) for a utilidade do consumo de hoje, a utilidade do consumo em t anos no futuro será δ t u (c) , onde 0 < δ < 1 . Este desconto exponencial é o único em que o comportamento é consistente ao longo do tempo. Para um consumidor com horizonte de planejamento de três períodos, a função utilidade será u (c1 ) + δ u (c2 ) + δ 2u (c3 ) , a taxa marginal de substituição entre os períodos 1 e 2 será TMS1,2 = δ UM (c2 ) UM (c1 ) e a taxa marginal de substituição entre os períodos 2 e 3 será TMS2,3 = δ 2UM (c3 ) δ UM (c3 ) = . δ UM (c2 ) UM (c2 ) Portanto, a taxa à qual o consumidor deseja substituir o consumo no período 2 pelo consumo no período 3 é a mesma que a taxa que ele deseja substituir o consumo no período 1 pelo consumo no período 2. Na prática, porém, parece ocorrer o desconto semi-hiperbólico ( 1+1kt ). Isto significa que o consumidor desconta mais o futuro de longo prazo do que o futuro de curto prazo. Pode, então, ocorrer inconsistência temporal na escolha. Um consumidor que resolve gastar $5000 em uma viagem à Europa pensa em começar a poupar no próximo verão. Quando o verão chega, ele decide que vai poupar no próximo, e assim por diante: ele protela sempre com o desconto semi-hiperbólico. Autocontrole Protelar pode significar falta de autocontrole. Uma consumidora decide fazer uma dieta, mas não para hoje e sim para a próxima semana. Também ocorre a tendência para excesso de comprometimento. Como há a tendência a protelar, o certo seria não deixar para amanhã o que se pode fazer hoje. Para evitar excesso de comprometimento o certo seria dizer “não” com mais freqüência. A maneira mais eficaz de lidar com problemas de autocontrole, porém, é adotar esquemas de comprometimento para ações futuras. Exemplos: pronunciamento público de comportamento futuro e contratos consigo mesmo e com os outros. Pode-se comprar autocontrole como no caso de se consumir o serviço de spas, personal trainers e professores particulares. Excesso de confiança Investidores do sexo masculino tendem a transacionar com ativos de modo excessivo. Isto leva a menores retornos. Em um estudo com 66465 investidores, os que fizeram mais transações receberam um retorno médio de 11.3% no período contra 18% de retorno para os que fizeram menos transações. Homens transacionaram 45% a mais do que mulheres na amostra e, portanto, ficaram com menores retornos. Isto ocorre porque os homens costumam apresentar mais excesso de confiança em suas próprias habilidades do que as mulheres. Teoria comportamental dos jogos Em jogos de ultimato, como vimos, onde o jogador proponente divide $10 entre ele e o outro jogador, a estratégia dominante para este último é aceitar qualquer oferta maior do que zero. Sabendo disso, o proponente oferece o mínimo para o outro jogador. O resultado do jogo será uma divisão em que o proponente fica com quase tudo. Em experimentos práticos, porém, ofertas abaixo de 30% tendem a ser rejeitadas em mais da metade das vezes. Porém, quando o proponente sabe que o respondente vai rejeitar propostas consideradas “injustas”, tende a oferecer 45% do valor e a rejeição cai para cerca de 16%. Mulheres oferecem divisões mais iguais para homens. Algumas culturas valorizam mais divisões iguais do que outras. Com valores mais altos, divisões mais desiguais costumam ser aceitas: com $10 sendo dividido pode-se não querer $1; mas com $1000 dificilmente se rejeita $100. As divisões ficam mais iguais também quando os respondentes anunciam antecipadamente o mínimo valor que irão aceitar. As pessoas então possuem um viés para distribuições não desiguais (fairness). Jogos de punição generalizam jogos de ultimato introduzindo uma terceira parte que observa as escolhas do proponente e pode resolver reduzir seu ganho. Em experimentos, 60% dos observadores costumam punir os proponentes que fazem distribuições desiguais. O desejo de punir também varia de cultura para cultura. © Sergio Da Silva 2010 sergiodasilva.com Equilíbrio Geral: Troca Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 31 Na análise de equilíbrio parcial, a demanda e a oferta são afetadas apenas pelo preço do bem. Mas os preços dos bens substitutos e complementares também afetam a demanda pelo bem e os preços dos bens vendidos aumentam ou diminuem a renda, que, por sua vez, afeta a quantidade demandada de outros bens. Assim, no equilíbrio geral consideramos as demandas e ofertas de vários mercados interagindo para determinar os preços de muitos bens. Para simplificar, consideramos apenas: (1) mercados competitivos, (2) dois bens e dois consumidores e (3) duas etapas de análise: troca pura (onde as pessoas não produzem e possuem dotações de bens fixas) e produção. Caixa de Edgeworth Na caixa de Edgeworth representamos as dotações e preferências de dois consumidores, A e B , em relação a dois bens, 1 e 2 , em um único diagrama. A cesta de consumo do consumidor A é X A = ( x1A , x A2 ) , (1) onde x1A é a quantidade consumida por A do bem 1 e xA2 é a quantidade consumida por A do bem 2 . Analogamente, a cesta de consumo do consumidor B é X B = ( x1B , xB2 ) . (2) O par de cestas X A e X B é uma alocação. A alocação será factível se a quantidade total de cada bem for igual ao total disponível. Para a alocação da dotação inicial de cada consumidor (que cada um traz ao mercado), ω A = (ω1A , ω A2 ) (3) ω B = (ω1B , ωB2 ) . (4) e A alocação factível será x1A + x1B = ω1A + ω1B (5) para o bem 1 , e xA2 + xB2 = ω A2 + ωB2 (6) para o bem 2 . Os consumidores A e B trocarão quantidades dos bens até chegarem às suas alocações finais. Por exemplo (Figura 1), se houver, inicialmente, 10 unidades do bem 1 e 20 unidades do bem 2 (não há produção), então a alocação na dotação inicial será ω1A + ω1B = 10 (7) ω A2 + ωB2 = 20 . (8) e Se a dotação do consumidor A for ω A = (ω1A , ω A2 ) = (7, 12) , (9) então a dotação do consumidor B será ω B = (ω1B , ωB2 ) = (3, 8) . (10) Qualquer alocação depois da troca não pode ultrapassar a alocação factível ((7) em (5) e (8) em (6)): x1A + x1B = 10 (11) xA2 + xB2 = 20 . (12) e A caixa de Edgeworth não passa de eixos convencionais que são encaixados, depois de se rotar os eixos do consumidor B . Qualquer alocação resultante de trocas X A e X B precisa ser representada dentro da caixa de Edgeworth, já que aquela não pode ultrapassar a alocação factível. Para cada consumidor, na alocação de dotação inicial passa uma curva de indiferença, uma vez que à dotação está associado um número de utilidade. A caixa de Edgeworth representa as dotações e as preferências dos dois consumidores e, assim, captura as características essenciais que tornam possível a troca. Troca Do ponto de vista do consumidor A , todas as combinações de bens situadas acima da curva de indiferença que passa pelo seu ponto de dotação são preferíveis. O mesmo ocorre com o consumidor B . Na caixa de Edgeworth, as combinações que são preferíveis para ambos ao mesmo tempo situam-se na área hachurada da Figura 2. Quando ocorrer a interseção das curvas de indiferença, não será possível melhorar a situação de um consumidor sem, com isto, piorar a do outro: ocorre a eficiência de Pareto na troca. Na Figura 2, esta situação acontece no ponto M , onde o consumidor A abre mão de 2 unidades do bem 1 para adquirir 1 ω unidade adicional do bem 2 , enquanto o consumidor B abre mão de 1 unidade do bem 2 para adquirir 2 unidades do bem 1 . No ponto M , TMS A = TMS B . (13) Alocações eficientes de Pareto Em uma alocação eficiente de Pareto: (1) não há como melhorar a situação dos dois consumidores conjuntamente, ou (2) não há como melhorar a situação de um consumidor sem, com isto, piorar a do outro, ou (3) todos os ganhos advindos das trocas se esgotaram, ou ainda (4) não há mais trocas mutuamente vantajosas. Há muitas situações em que as curvas de indiferença dos dois consumidores se tangenciam dentro da caixa de Edgeworth. Todos os pontos eficientes perfazem o conjunto de Pareto. Ligando os pontos encontramos a curva de contrato (Figura 3). A origem para cada consumidor também é um ponto eficiente, apesar de não haver tangência: caso de fronteira. Na origem do consumidor A , por exemplo, este não possui nada dos dois bens e o consumidor B possui tudo: esta situação é eficiente porque a situação de A somente poderá ser melhorada tirando-se de B . Portanto, a curva de contrato passa pelas origens. Trocas com leiloeiro Podemos imaginar muitos consumidores e que um deles se torne um leiloeiro que escolhe um preço para o bem 1, um preço para o bem 2 , e os anuncia aos consumidores do tipo A e do tipo B . Cada grupo calcula quanto vale sua dotação aos preços ( p1 , p2 ) e decide quanto de cada bem comprar. A esses preços, a demanda do grupo A não necessariamente se iguala à oferta do grupo B para cada um dos bens. A demanda bruta do grupo A pelo bem 1 , x1A , é a quantidade desejada ao preço anunciado. Para o consumidor A , a demanda líquida (ou demanda excedente), e1A , é o que fica depois de retirarmos da demanda bruta a dotação inicial do bem 1 : e1A = x1A − ω1A . Para o bem 2 : (14) eA2 = x A2 − ω A2 . (15) Para o consumidor B : e1B = x1B − ω1B (16) eB2 = xB2 − ωB2 . (17) e A demanda excedente é, portanto, a diferença entre o que um consumidor deseja consumir de um bem e o que inicialmente possui do bem. Na Figura 4, para a relação de preços p1 p2 , as TMS dos dois grupos são diferentes. Os preços anunciados p1 e p2 não levam, portanto, os mercados ao equilíbrio. O leiloeiro então aumenta o preço do bem com demanda excedente (e a reta orçamentária rota em torno da dotação ) até que a demanda excedente desapareça. No equilíbrio de mercado competitivo resultante (Figura 5), o conjunto de preços ( p1* , p2* ) permite que cada grupo escolha a cesta mais preferida pela qual pode pagar e as escolhas dos dois grupos se compatibilizam, já que a demanda se iguala à oferta nos dois mercados e ω TMS A = TMS B = p1 . p2 (18) Monopólio na caixa de Edgeworth Sem leiloeiro, o consumidor A (monopolista) fixa o preço para B , que resolve quanto trocar ao preço fixado. O consumidor A conhece o comportamento da demanda de B através da sua curva de preço-consumo, que representa todas as escolhas ótimas de B a diferentes preços (Capítulo 6). O consumidor A escolhe a sua curva de indiferença mais alta sobre a curva de preço-consumo de B : a curva de indiferença de A tangencia a curva de preço- consumo de B . Escolher o preço no ponto de tangência equivale a escolher a reta orçamentária passando por ele até o ponto de dotação (Figura 6). Como a curva de indiferença de A não tangencia a curva de indiferença de B , o equilíbrio geral de monopólio é ineficiente. Porém, o consumidor A pode também ser um monopolista discriminador perfeito de preço se conseguir vender cada unidade do bem 1 pelo preço de reserva de B . Na curva de indiferença de B que passa pelo ponto de dotação, o consumidor A vende a primeira unidade do bem 1 à esquerda de a certo preço (Figura 7). Depois vende outra unidade a outro preço no ponto mais à esquerda da curva de indiferença de B . A consegue ficar sobre a curva de indiferença de B , pois cada preço é escolhido de modo a deixar B exatamente indiferente entre comprar ou não a unidade do bem 1 . A deixa de vender quando as curvas de indiferença se tangenciarem. A consegue extrair todo o excedente do consumidor de B , enquanto este continua no equilíbrio na mesma situação em que começou no ponto de dotação. O equilíbrio é eficiente no sentido de Pareto. ω A álgebra do equilíbrio A função demanda do consumidor A pelo bem 1 é x1A = x1A ( p1 , p2 ) (19) e a função demanda do consumidor B pelo bem 1 é x1B = x1B ( p1 , p2 ) . (20) As funções demanda de A e B pelo bem 2 são xA2 = x A2 ( p1 , p2 ) e (21) xB2 = xB2 ( p1 , p2 ) . (22) No equilíbrio geral, a demanda total de cada bem 1 e 2 deve se igualar à oferta total: x1A ( p1* , p2* ) + x1B ( p1* , p2* ) = ω1A + ω1B (23) xA2 ( p1* , p2* ) + xB2 ( p1* , p2* ) = ω A2 + ωB2 (24) x1A ( p1* , p2* ) − ω1A + x1B ( p1* , p2* ) − ω1B = 0 (23′) xA2 ( p1* , p2* ) − ω A2 + xB2 ( p1* , p2* ) − ωB2 = 0 . (24′) e ou e Considerando (14), (15), (16) e (17) em (23′) e (24′): e1A ( p1* , p2* ) + e1B ( p1* , p2* ) = 0 (25) eA2 ( p1* , p2* ) + eB2 ( p1* , p2* ) = 0 . (26) e A soma das demandas excedentes é igual a zero ou o excesso de demanda (oferta) do consumidor A se iguala ao excesso de oferta (demanda) do consumidor B. Em geral (mesmo fora do equilíbrio), a demanda excedente agregada pelo bem 1 é dada por: z1 ( p1 , p2 ) = e1A ( p1 , p2 ) + e1B ( p1 , p2 ) (27) ou, considerando (14) e (15), z1 ( p1 , p2 ) = x1A ( p1 , p2 ) + x1B ( p1 , p2 ) − ω1A − ω1B . (28) Similarmente, para o bem 2 , a demanda excedente agregada é z2 ( p1 , p2 ) = eA2 ( p1 , p2 ) + eB2 ( p1 , p2 ) (29) z2 ( p1 , p2 ) = x A2 ( p1 , p2 ) + xB2 ( p1 , p2 ) − ω A2 − ωB2 . (30) ou No equilíbrio, a demanda agregada excedente de cada bem é zero, ou seja, (25) e (26) em (29) e (30): z1 ( p1* , p2* ) = 0 (31) z2 ( p1* , p2* ) = 0 . (32) e Lei de Walras Pela lei de Walras, o valor da demanda agregada excedente dos dois bens em conjunto é idêntico a zero. Isto vale para quaisquer preços p1 e p2 , e não apenas para os de equilíbrio: p1 z1 ( p1 , p2 ) + p2 z2 ( p1 , p2 ) ≡ 0 . (33) Para provar, somamos as restrições orçamentárias dos dois consumidores. Quando o conjunto orçamentário do consumidor A se reduz à reta orçamentária, temos p1 x1A ( p1 , p2 ) + p2 x A2 ( p1 , p2 ) ≡ p1 ω1A + p2ω A2 (34) p1 ( x1A ( p1 , p2 ) − ω1A ) + p2 ( x A2 ( p1 , p2 ) − ω A2 ) ≡ 0 . (35) ou (14) e (15) em (35): p1e1A ( p1 , p2 ) + p2 eA2 ( p1 , p2 ) ≡ 0 . (36) Logo, o valor da demanda excedente do consumidor A é zero: o valor da quantidade excedente que ele deseja comprar do bem 1 (bem 2 ) tem que ser igual ao valor da quantidade excedente que ele deseja vender do bem 2 (bem 1 ). Para o consumidor B , temos equações semelhantes: p1 ( x1B ( p1 , p2 ) − ω1B ) + p2 ( xB2 ( p1 , p2 ) − ωB2 ) ≡ 0 (37) p1e1B ( p1 , p2 ) + p2 eB2 ( p1 , p2 ) ≡ 0 . (38) e Somando (35) e (37): ( p (x ) ( ( p , p ) −ω ) ≡ 0 ) ( ) p1 x1A ( p1 , p2 ) − ω1A + p1 x1B ( p1 , p2 ) − ω1B + p2 x A2 ( p1 , p2 ) − ω A2 + 2 2 B 1 2 2 B (39) (14), (15), (16) e (17) em (39): p1e1A ( p1 , p2 ) + p1e1B ( p1 , p2 ) + p2eA2 ( p1 , p2 ) + p2 eB2 ( p1 , p2 ) ≡ 0 ( ) ( ) p1 e1A ( p1 , p2 ) + e1B ( p1 , p2 ) + p2 eA2 ( p1 , p2 ) + eB2 ( p1 , p2 ) ≡ 0 . (40) (27) e (29) em (40): p1 z1 ( p1 , p2 ) + p2 z2 ( p1 , p2 ) ≡ 0 , (33) que é a lei de Walras. Como o valor da demanda excedente de cada consumidor é zero, o valor da soma das demandas excedentes dos dois consumidores é zero (lei de Walras). A lei de Walras vale para todos os preços porque a restrição orçamentária de cada consumidor se aplica a qualquer preço. Em particular, a lei de Walras vale para os preços de equilíbrio onde z1 ( p1* , p2* ) = 0 (31) z2 ( p1* , p2* ) = 0 . (32) e Mas (32) fica redundante pela lei de Walras para os preços de equilíbrio: p1 z1 ( p1* , p2* ) + p2 z2 ( p1* , p2* ) = 0 (41) (31) em (41): p2 z2 ( p1* , p2* ) = 0 . (43) Para p2 > 0 , (44) (44) em (43): z2 ( p1* , p2* ) = 0 . (32) Logo, usando a lei de Walras, a descrição do equilíbrio geral por (31) é suficiente. Se a demanda pelo bem 1 for igual à oferta do bem 1 ao preço p1* , logo a demanda pelo bem 2 precisa ser igual à oferta do bem 2 . Ou, se o mercado do bem 2 estiver em equilíbrio, então o mercado do bem 1 precisa também estar em equilíbrio. Em geral, se k − 1 mercados estiverem em equilíbrio, o mercado do bem k também estará com demanda igual à oferta. Preços relativos Em um modelo de equilíbrio geral de k bens, a lei de Walras implica que há apenas k − 1 equações independentes. Surge o problema de encontrar os k preços do modelo com apenas k − 1 equações. Sabemos que multiplicando os preços e a renda por um número positivo t , o conjunto orçamentário (e a reta orçamentária) não varia e, portanto, a cesta ótima também não (Capítulo 2). Aqui, a renda m corresponde ao valor da dotação. Por exemplo, para o consumidor A : p1 ω1A + p2ω A2 . Se ( p1* , p2* ,...) for equilíbrio, então (tp1* , tp2* ,...) também será. Podemos escolher t= 1 >0 p1 ( (45) ) e ficar com 1, pp12 , pp13 ,... , onde o primeiro bem é o numerário e os preços restantes ficam sendo os preços relativos. Ficamos então com apenas k − 1 preços relativos e o modelo de equilíbrio geral permite encontrá-los com as k − 1 equações independentes. Como exemplo, tomemos a utilidade Cobb-Douglas. As funções utilidade CobbDouglas para os dois consumidores A e B são dadas por (Capítulo 6): u A = ( x1A , x A2 ) = ( x1A ) a ( x A2 )1−a (46) uB = ( x1B , xB2 ) = ( x1B )b ( xB2 )1−b , (47) e onde a e b são parâmetros. As correspondentes funções demanda são (Capítulo 6), para o consumidor A , x1A ( p1 , p2 , mA ) = a mA p1 (48) x A2 ( p1 , p2 , mA ) = (1 − a) mA p2 (49) e, para o consumidor B , x1B ( p1 , p2 , mB ) = b mB p1 xB2 ( p1 , p2 , mB ) = (1 − b) (50) mB . p2 (51) Cada consumidor começa com as retas orçamentárias: mA = p1ω1A + p2ω A2 (52) mB = p1ω1B + p2ωB2 . (53) Considerando (48), (49), (50) e (51) em (28) e (30), encontramos as demandas agregadas excedentes: z1 ( p1 , p2 ) = a mA m + b B − ω1A − ωB1 p1 p1 (54) e z2 ( p1 , p2 ) = (1 − a) mA m + (1 − b) B − ω A2 − ωB2 . p2 p2 (55) (52) e (53) em (54) e (55): p1ω1A + p2ω A2 p1ω1B + p2ωB2 z1 ( p1 , p2 ) = a +b − ω1A − ω1B p1 p1 z2 ( p1 , p2 ) = (1 − a) p1ω1A + p2ω A2 p ω1 + p2ωB2 + (1 − b) 1 B − ω A2 − ωB2 . p2 p2 (56) (57) As funções demandas agregadas excedentes, z1 e z2 , satisfazem a lei de Walras: p1 z1 + p2 z2 ≡ 0 . (33) Para provar, substituímos (48), (50), (52) e (53) em (56): z1 = x1A + x1B − ω1A − ω1B . (56′) (49), (51), (52) e (53) em (57): z2 = x A2 + xB2 − ω A2 − ωB2 . (57′) (56′) e (57′) em (33): p1 ( x1A + x1B − ω1A − ω1B ) + p2 ( x A2 + xB2 − ω A2 − ωB2 ) ≡ 0 . (58) (14), (15), (16), (17) em (58): p1 (e1A + e1B ) + p2 (eA2 + eB2 ) ≡ 0 . (59) Substituindo (25) e (26) em (59), confirmamos que a lei de Walras se aplica. Achando o preço relativo de equilíbrio geral Se fizermos o bem 2 o numerário, então, p2 = 1 (60) e p1 torna-se o preço relativo do bem 1 , ou seja, p1 = p1 p1 = . p2 1 (61) Assim, as duas equações de demanda agregada excedentes ficam apenas em função de p1 . (60) em (56) e (57): p1ω1A + ω A2 p ω1 + ωB2 +b 1 B − ω1A − ωB1 p1 p1 (62) z2 ( p1 ,1) = (1 − a)( p1ω1A + ω A2 ) + (1 − b)( p1ω1B + ωB2 ) − ω A2 − ωB2 . (63) z1 ( p1 ,1) = a e Quando o preço for de equilíbrio, a demanda excedente de cada bem será zero, como vimos (equações (31) e (32)). Escolhendo a equação para o bem 1, (31) e (62): p1*ω1A + ω A2 p1*ω1B + ωB2 z1 ( p ,1) = a +b − ω1A − ω1B = 0 * * p1 p1 a b aω1A + * ω A2 + bω1B + * ωB2 − ω1A − ω1B = 0 p1 p1 1 (aω A2 + bωB2 ) = ω1A + ω1B − aω1A − bω1B * p1 * 1 (64) 1 (aω A2 + bωB2 ) = (1 − a)ω1A + (1 − b)ω1B * p1 aω A2 + bωB2 p = . (1 − a)ω1A + (1 − b)ωB1 * 1 (65) Este é o preço de equilíbrio geral com preferências Cobb-Douglas. (Note que ele também poderia ter sido encontrado usando (32) e (63)). Existência do equilíbrio Contar k − 1 preços relativos em número igual a k − 1 equações garante encontrar formalmente os preços de equilíbrio, mas isto não significa que de fato o equilíbrio exista. Para isso, as funções demandas excedentes agregadas precisam ser contínuas. Isto significa que pequenas alterações nos preços não levam a grandes alterações na demanda agregada. Isto, por sua vez, exige que cada função demanda individual seja contínua, o que é garantido se as preferências forem convexas. Ou, então, se os consumidores fizerem pequenas compras em relação ao tamanho dos mercados, o que é garantido se houver concorrência pura. Equilíbrio e eficiência Na Figura 5, a alocação de equilíbrio é eficiente no sentido de Pareto, pois o conjunto das cestas preferidas por A não intercepta o conjunto das cestas preferidas por B . Como as curvas de indiferença se tangenciam, não há alocações que os dois consumidores prefiram à alocação de equilíbrio. A alocação eficiente deixa cada consumidor tão bem quanto possível, dada a utilidade do outro. Sendo o nível de utilidade de B igual a u , o consumidor A maximiza max u A ( x1A , x A2 ) x1A , x 2A , x1B , xB2 (66) sujeito a uB ( x1B , xB2 ) = u (67) x1A + x1B = ω1 (68) x A2 + xB2 = ω 2 , (69) onde ω1 é a quantidade total disponível do bem 1 : ω1 = ω1A + ω1B (70) e ω 2 é a quantidade total disponível do bem 2 : ω 2 = ω A2 + ωB2 . (71) O que encontraremos é a alocação ( x1A , x A2 , x1B , xB2 ) que torna a utilidade do consumidor A máxima para um número fixo de utilidade de B e toda a quantidade disponível dos bens seja utilizada. Montando o lagrangeano: ( ) L = u A ( x1A , x A2 ) − λ uB ( x1B , xB2 ) − u − µ1 ( x1A + x1B − ω1 ) − µ2 ( x A2 + xB2 − ω 2 ) , (72) onde λ é o multiplicador de Lagrange na restrição de utilidade e µ1 e µ2 são os multiplicadores de Lagrange na restrição dos recursos. Diferenciando parcialmente e igualando a zero: ∂L ∂u A = − µ1 = 0 ∂x1A ∂x1A (73) ∂L ∂u A = − µ2 = 0 ∂x A2 ∂x A2 (74) ∂u ∂L = −λ 1B − µ1 = 0 1 ∂xB ∂xB (75) ∂u ∂L = −λ B2 − µ2 = 0 . 2 ∂xB ∂xB (76) A TMS A do consumidor A é encontrada dividindo (73) por (74): ∂u A TMS A = ∂x1A ∂u A = ∂x A2 µ1 . µ2 (77) A TMS B de B é encontrada dividindo (75) por (76): ∂u B TMS B = ∂x1B ∂u B ∂xB2 = µ1 . µ2 (78) (77) e (78): TMS A = TMS B . (79) Portanto, na alocação eficiente de Pareto, as taxas marginais de substituição dos dois consumidores coincidem: mesma inclinação das curvas de indiferença. Se não fosse assim, haveria alguma troca que melhoraria a situação de ambos. Além disso, se os dois consumidores se defrontarem com os mesmos preços para os dois bens, ou seja, ∂u A ∂x1A ∂u A = p1 p2 (80) = p1 p2 (81) ∂x 2A e ∂u B ∂x1B ∂u B ∂xB2 que vigora no equilíbrio geral competitivo, então, (77), (78), (80) e (81): p1 µ1 = . p2 µ2 (82) Por isso, os multiplicadores de Lagrange µ1 e µ2 são chamados de preços de eficiência ou preços-sombra. Primeiro teorema do bem-estar Se fizermos a suposição de que o equilíbrio competitivo não é eficiente no sentido de Pareto, isto nos levará a uma contradição. Se o equilíbrio não for eficiente, então haverá outra alocação factível ( y1A , y A2 , y1B , yB2 ) tal que y1A + y1B = ω1A + ω1B (83) y A2 + yB2 = ω A2 + ωB2 (84) ( y1A , y A2 ) A ( x1A , x A2 ) (85) ( y1B , yB2 ) B ( x1B , xB2 ) , (86) e onde o símbolo A se refere às preferências de A e B se refere às preferências de B . No equilíbrio, cada consumidor precisa comprar a melhor cesta pela qual pode pagar, que é ( x1A , x A2 , x1B , xB2 ) . Se ( y1A , y A2 , y1B , yB2 ) for melhor do que a cesta de equilíbrio competitivo ( x1A , x A2 , x1B , xB2 ) , então os consumidores não poderão pagar por ela; ou, o que é a mesma coisa, a cesta ( y1A , y A2 , y1B , yB2 ) custa mais do que os consumidores podem pagar: p1 y1A + p2 y A2 > p1 ω1A + p2ω A2 (87) p1 y1B + p2 yB2 > p1 ω1B + p2ωB2 . (88) Somando (87) e (88): p1 y1A + p2 y A2 + p1 y1B + p2 yB2 > p1 ω1A + p2ω A2 + p1 ω1B + p2ωB2 (89) p1 ( y1A + y1B ) + p2 ( y A2 + yB2 ) > p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) . (90) (83) e (84) em (90): p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) > p1 (ω1A + ω1B ) + p2 (ω A2 + ωB2 ) . (91) A equação (91) não pode ser verdadeira, já que os termos à esquerda e à direita da desigualdade são iguais. Pelo primeiro teorema do bem-estar, uma alocação alcançada por um conjunto de mercados competitivos será necessariamente eficiente no sentido de Pareto. Não há referência à distribuição dos recursos: se o consumidor A tiver quase tudo na sua dotação inicial, ele acabará tendo quase tudo após as trocas. Limites do primeiro teorema do bem-estar O primeiro teorema do bem-estar afirma que qualquer equilíbrio competitivo é Paretoeficiente. Se estivermos lidando com um problema de escassez que envolva muitos consumidores, a instituição do mercado competitivo faz com que se economize na informação que cada consumidor teria que ter em caso contrário. Os consumidores não precisam saber como os bens são produzidos, quem é o dono dos bens ou de onde vêm os bens. Eles precisam apenas conhecer os preços dos bens. Com eles, os consumidores determinam suas demandas e, se os mercados forem competitivos, o resultado será eficiente. Porém, há três hipóteses implícitas na análise de equilíbrio geral para que o primeiro teorema funcione: (1) os consumidores não se preocupam com o consumo dos outros. Se B estiver consumindo cigarro, mesmo no equilíbrio, A poderia melhorar sua situação pagando a B para fumar menos. Quando houver externalidade no consumo, o equilíbrio competitivo não será Pareto-eficiente (Capítulo 34). (2) Há muitos consumidores que agem competitivamente. Se forem apenas dois (como na caixa de Edgeworth), os consumidores adotariam comportamento estratégico com possíveis equilíbrios de Nash Pareto-ineficientes. (3) As compras dos consumidores são pequenas em relação ao tamanho do mercado. Não sendo assim, o equilíbrio competitivo não existirá. Segundo teorema do bem-estar Na tangência das curvas de indiferença, o equilíbrio é Pareto-eficiente. A inclinação da reta orçamentária nesse ponto dá os preços relativos de equilíbrio. Isto é sempre verdade para curvas de indiferença convexas (Figura 8). Qualquer dotação, como , que coloque os dois consumidores sobre a reta orçamentária, levará ao equilíbrio eficiente no ponto de tangência das curvas de indiferença. Se as preferências não forem convexas, isto não acontece (Figura 9). Portanto, pelo segundo teorema do bem-estar, se os consumidores tiverem preferências convexas, então haverá sempre um conjunto de preços tal que cada alocação eficiente de Pareto será um equilíbrio de mercado competitivo para uma apropriada dotação. ω Implicações do segundo teorema do bem-estar Os preços têm dois papeis: alocativo e distributivo. O papel alocativo indica a escassez relativa e o papel distributivo determina quanto de diferentes bens os consumidores podem comprar. O segundo teorema do bem-estar implica que esses dois papeis se encontram separados. Pode-se redistribuir as dotações de bens para se determinar quanto de riqueza cada consumidor fica e, depois, usar os preços para indicar a escassez relativa. Em um mercado competitivo, a decisão marginal de se consumir mais ou menos de um bem depende do preço, que mede como os outros consumidores valorizam o bem na margem (considerações de eficiência). Se o governo taxar o valor das dotações, ele redistribuirá poder de compra entre os consumidores sem alterar a eficiência. Pelo segundo teorema, a troca a partir de qualquer dotação resultará em uma alocação Pareto-eficiente. O governo deverá, no caso, recorrer a impostos sobre o montante global da dotação (lump-sum taxes) e evitar impostos que afetem a escolha dos consumidores: impostos distorcionários. © Sergio Da Silva 2010 sergiodasilva.com Equilíbrio Geral: Produção Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 32 A economia de Robinson Crusoe Crusoe é ao mesmo tempo consumidor e produtor. Consome lazer quando fica na praia sem fazer nada. Produz quando resolve coletar cocos. Produzindo, mais terá para comer, mas também terá menos tempo para lazer. A Figura 1 é semelhante à de consumo e lazer (Capítulo 9). Mas como “lazer” é substituído por “trabalho”, o formato convexo em relação à origem das curvas de indiferença é invertido. Enquanto lazer é um bem, trabalho é um “mal”, possuindo, portanto, curvas de indiferença de inclinação positiva. A função produção mostra a relação entre quanto Crusoe trabalha e quantos cocos coleta. Mais trabalho, mais cocos. À medida que as horas de trabalho são aumentadas, ele coleta menos cocos: há retornos decrescentes. Dada a tecnologia para coletar cocos, a curva de indiferença mais alta que tangencia a função produção determina o consumo ótimo de cocos e as horas de trabalho escolhidas. Como a inclinação da curva de indiferença se iguala à inclinação da função produção, a taxa marginal de substituição entre consumo de cocos e lazer (inclinação da curva de indiferença) é igual ao produto marginal de uma hora extra de trabalho (inclinação da função produção). Crusoe resolve se comportar inteiramente como consumidor em um dia e, no seguinte, inteiramente como produtor. Como consumidor, ele se comporta como trabalhador e recebe renda. Como produtor, se comporta como gerente da empresa Crusoe S.A. e realiza lucro, que manda para o único acionista (ele mesmo ☺), que é o consumidor. No dia de consumir, ele escolhe quanto comprar da empresa usando seus dividendos. Crusoe inventa uma moeda e fixa o preço de uma unidade de coco em uma unidade monetária: o preço do coco (numerário) é, portanto, igual a um, restando saber qual é o salário w. No dia de produzir, seu lucro π é dado pela produção de cocos vendida C (o preço do coco é um) menos o custo da mão-de-obra wL . Dado π , a reta isolucro é: π = C − wL (1) C = π + wL , (1′) ou onde a inclinação é w e o intercepto vertical é π . O lucro é maximizado quando a reta isolucro tangencia a função produção (Figura 2). Logo, o produto marginal do trabalho (inclinação da função produção) se iguala ao salário (inclinação da reta isolucro) no lucro máximo. Conhecendo o salário ótimo w* , a empresa escolhe quantas horas de mão-de-obra contratar L* para produzir C * cocos. O lucro de π * unidades monetárias pode comprar π * cocos, já que o preço do coco é igual a um. No dia de consumir, a reta isolucro vira a reta orçamentária. Crusoe pode consumir sua dotação (consumir π * cocos e sua dotação de lazer) ou pode trabalhar algumas horas até a quantidade máxima de L horas. Dado o salário w* , ele escolhe consumir C * cocos (mais do que os π * cocos da dotação) e trabalhar L* horas. Sua utilidade é máxima onde uma curva de indiferença tangenciar a reta orçamentária: a TMS entre consumo e trabalho (inclinação da curva de indiferença) se iguala ao salário (inclinação da reta orçamentária). Superpondo as Figuras 2 e 3 (Figura 4), vemos que o comportamento de simular um mercado de Crusoe (consumidor e produtor separados) gera o mesmo resultado de não separar consumo e produção, dado pela Figura 1. No equilíbrio, TMS = PML = w . (2) Se houvesse retornos constantes no emprego de mão-de-obra, usando duas vezes mais horas de trabalho seria produzido o dobro. A função produção seria uma reta que passa pela origem (Figura 5). Com retornos constantes, a empresa competitiva opera com lucro zero (Capítulo 19, seção 10): a reta orçamentária passa pela origem também, coincidindo com a função produção. Se houvesse retornos crescentes no emprego de horas de trabalho, a função produção seria côncava (Figura 6). Com retornos crescentes, os custos médios são maiores do que os custos marginais, o que leva a lucros negativos no caso competitivo (veja o conceito de EME do Capítulo 24). Se as empresas tiverem retornos crescentes de escala, no nível de equilíbrio da produção elas iriam querer produzir mais aos preços do equilíbrio competitivo. Esta nãoconvexidade da função produção cria problemas para o funcionamento do mercado competitivo: os preços não fornecem toda a informação necessária para a escolha da alocação eficiente. Precisa-se de informação adicional com relação às inclinações das funções produção e às curvas de indiferença em pontos afastados da escala atual de operações. Porém, se houver apenas regiões pequenas de retornos crescentes em relação ao tamanho do mercado, a nãoconvexidade não cria problemas. Primeiro teorema do bem-estar Um equilíbrio competitivo é Pareto-eficiente em uma economia de pura troca. Este que é o primeiro teorema do bem-estar também se aplica a uma economia com produção. Se todas as empresas forem maximizadoras de lucro, o equilíbrio competitivo será Pareto-eficiente. Como no caso da economia de troca pura, (1) o primeiro teorema diz que a maximização de lucro assegura apenas eficiência, não justiça distributiva. (2) O primeiro teorema faz sentido apenas se o equilíbrio competitivo realmente existir, ou seja, se não houver muitos casos de retornos crescentes de escala. (3) O primeiro teorema é válido apenas se as escolhas de uma firma não afetarem as possibilidades de produção das outras, o que significa que não podem ocorrer externalidades na produção. As decisões das firmas também não podem afetar as escolhas dos consumidores, ou seja, não podem ocorrer externalidades no consumo. Segundo teorema do bem-estar Para uma economia de pura troca, cada alocação eficiente de Pareto pode ser um equilíbrio competitivo se as preferências forem convexas. Se os conjuntos de produção das empresas forem também convexos, o segundo teorema se aplica para a economia com produção. Porém, com retornos crescentes de escala, o segundo teorema não se aplica. Possibilidades de produção Supomos agora que Crusoe coleta não apenas cocos, mas também pesca. O conjunto de possibilidades de produção mostra os conjuntos dos dois bens produzidos que são factíveis dadas a tecnologia e as funções produção (Figura 7). Para tecnologias com retornos constantes de escala, a fronteira de possibilidades de produção fica linear. Exemplo (Figura 8): se Crusoe produzir 10 peixes por hora e 20 cocos por hora, em 10 horas ele poderá dedicar LF horas na produção de 10 LF peixes e LC horas na produção de 20 LC cocos. O conjunto de possibilidades de produção é dado por todas as combinações de cocos C e peixes F tal que C = 20 LC F = 10 LF (3) (4) LC + LF = 10 , (5) onde (3) e (4) são as relações de produção e (5) é a restrição dos recursos. A equação (3) pode ser reescrita como LC = C 20 (3′) F . 10 (4′) e a (4) como LF = (3′) e (4′) em (5): C F + = 10 , 20 10 (6) que é a fronteira de possibilidade de produção. Para achar os interceptos, fazemos F = 0 em (6): C = 10 20 C = 200 (6′) e fazemos C = 0 em (6): F = 10 10 F = 100 . (6″) Para encontrar a inclinação, tomamos o diferencial total de (6): 1 1 dC + dF = 0 20 10 dC 20 =− = −2 , dF 10 (7) que, em tempo discreto, é o mesmo que TMTRC = ∆C = −2 . ∆F (7′) Vantagem comparativa Sexta-feira aparece na ilha, com habilidades diferentes. Seu conjunto de possibilidades de produção é dado por: C = 10 LC (8) F = 20 LF (9) LC + LF = 10 . (10) (8) e (9) em (10): C F + = 10 , 10 20 (11) que é sua fronteira de possiblidades de produção (Figura 9). Os interceptos são obtidos fazendo F = 0 em (11): C = 10 10 C = 100 e C = 0 em (11): F = 10 20 (11′) F = 200 . (11″) Para achar a inclinação, tomamos o diferencial total de (11): 1 1 dC + dF = 0 10 20 1 1 dC = − dF 10 20 dC 10 1 =− =− dF 20 2 (12) que, em tempo discreto, é o mesmo que TMTSF = ∆C 1 =− . ∆F 2 (12′) Comparando as habilidades relativas, em uma hora de trabalho Crusoe produz 10 peixes e Sexta produz 20 peixes ou Crusoe produz 20 cocos e Sexta produz 10 cocos. Logo, Crusoe tem vantagem comparativa na produção de cocos e Sexta, na produção de peixes. Se Crusoe e Sexta produzirem apenas cocos ((6′) e (11′)), ambos produzirão 300 cocos (Figura 10). Se produzirem apenas peixes ((6″) e (11″)), ambos produzirão 300 peixes. Porém, a produção pode ser aumentada se aquele com vantagem comparativa em determinado bem se especializar. Por exemplo, mais peixes seriam pescados se Sexta não produzisse cocos e dedicasse as 10 horas na produção de peixes. Produção total = 200 + 200 = 400, em vez de 300. Mais cocos seriam coletados se Crusoe não produzisse peixes e dedicasse as 10 horas na produção de cocos. Produção total = 200 + 200 = 400, em vez de 300. Equilíbrio geral na produção e na troca O conjunto de possibilidades de produção fornece as cestas de consumo factíveis para toda a economia. Na cesta agregada ( X F , X C ) existem X F unidades de peixe e X C unidades de coco disponíveis para consumo. A caixa de Edgeworth pode ser, então, desenhada dentro da fronteira de possibilidade de produção (Figura 11). Na curva de contrato, as cestas eficientes são encontradas dados os montantes de coco e peixes disponíveis. Na economia com produção, esses montantes são escolhidos dentro do conjunto de possibilidades de produção. Na curva de contrato, as TMS de Crusoe e Sexta são iguais. Se a TMS não for igual à TMT , a taxa à qual Crusoe (ou Sexta) está querendo trocar peixe por coco é diferente da taxa à qual peixe pode ser “transformado” em coco, redirecionando-se trabalho para produzir menos peixe e mais coco. Nesse caso, a situação de Crusoe (ou Sexta) poderia ser melhorada rearranjando-se a produção. Por exemplo, se a TMS = 1 , Crusoe (ou Sexta) quer trocar um peixe por um coco. Mas se TMT = 2 , Crusoe (ou Sexta) quer reduzir a produção de uma unidade de peixe para produzir 2 unidades de coco. Como a troca é de um peixe por apenas um coco, faz sentido então reduzir a produção da unidade extra de coco, fazendo TMT = 1 . A alocação Pareto-eficiente é, então, TMS RC = TMS SF = TMT . (13) Para provar isto, consideramos X F , a quantidade total de peixes produzida e consumida, F F X F = xRC + xSF (14) e X C , a quantidade total de cocos produzida e consumida, C C . X C = xRC + xSF (15) Para descrever a fronteira de possibilidades de produção, que se refere a todas as combinações de X F e X C que são tecnologicamente factíveis, recorremos à função transformação T ( X F , X C ) . Uma dada combinação ( X F , X C ) fica sobre a fronteira de possibilidades de produção se T(X F , X C ) = 0 . (16) A taxa à qual os recursos são retirados da produção de coco para se produzir mais peixe é a taxa marginal de transformação. Isto faz com que se saia de um ponto para outro da fronteira de possibilidades de produção: a TMT é, então, a inclinação da fronteira de possibilidades de produção: TMT ≡ dX C . dX F (17) Tomando o diferencial total de (16): ∂T ∂T dX F + dX C = 0 F C ∂X ∂X ∂T ∂T dX F = − C dX C F ∂X ∂X ∂T C F dX = − ∂∂XT . F dX ∂X C (17) e (18): (18) TMT ≡ ∂T dX C ∂X F = − . ∂T dX F ∂X C (18′) Como no caso da economia de pura troca, uma alocação é eficiente de Pareto quando maximiza a utilidade de um consumidor dada a utilidade do outro: F xRC max C F C , xRC , xSF , xSF F C uRC ( xRC , xRC ) (19) sujeita a F C uSF ( xSF , xSF )=u (20) T(X F , X C ) = 0 . (21) e Montando o lagrangeano: F C F C L = uRC ( xRC , xRC ) − λ ( uSF ( xSF , xSF ) − u ) − µ (T ( X F , X C ) − 0 ) . (22) As condições de primeira ordem são: ∂u ∂L ∂T = RC −µ =0 F F ∂xRC ∂xRC ∂X F (23) ∂u ∂L ∂T = CRC − µ =0 C ∂xRC ∂xRC ∂X C (24) ∂u ∂L ∂T = −λ SF −µ =0 F F ∂xSF ∂xSF ∂X F (25) ∂u ∂L ∂T = −λ CSF − µ = 0. C ∂xSF ∂xSF ∂X C (26) Dividindo (23) por (24): ∂u RC F ∂xRC ∂u RC = ∂T ∂X F ∂T (27) ∂X C C ∂xRC e dividindo (25) por (26): ∂uSF F ∂xSF ∂uSF C ∂xSF = ∂T ∂X F ∂T ∂X C (28) . Do Capítulo 4 sabemos que a razão das utilidades marginais é a TMS . Considerando (18) em (27) e (28): TMS RC = TMT (29) TMS SF = TMT (30) (29) e (30): TMS RC = TMS SF = TMT . (31) Logo, a taxa à qual cada consumidor quer substituir um bem pelo outro se iguala à taxa pela qual é tecnologicamente factível transformar um bem no outro. Se não fossem iguais, haveria uma maneira de aumentar a utilidade de um consumidor sem afetar a utilidade do outro. Agora Crusoe e Sexta montam a empresa Náufragos S.A. Nesta economia de dois indivíduos, há dois fatores de produção (mão-de-obra de Crusoe, LRC , e mão-de-obra de Sexta, LSF ) e dois bens (cocos, C , e peixes, F ). Crusoe e Sexta são os acionistas da empresa também, além de produtores, empregados e consumidores. Como produtores, eles maximizam lucro fazendo max C , F , LRC , LSF pC C + pF F − wRC LRC − wSF LSF (32) onde pC é o preço da unidade de coco, pF é o preço da unidade de peixe, wRC é o salário de Crusoe e wSF é o salário de Sexta. O lucro é maximizado sujeito às restrições tecnológicas dadas pelo conjunto de possibilidades de produção. Fazendo a maximização suponha que a empresa encontra que é ótimo contratar L*RC unidades de mão-de-obra de Crusoe e L*SF unidades de trabalho de Sexta. O custo da mão-de-obra em equilíbrio é, então, L* = wRC L*RC + wSF L*SF (33) e o lucro é dado por π = pC C + pF F − L* , (34) que é a linha isolucro. A equação (34) pode ser reescrita como pC C = π − pF F + L* pC C = π + L* − pF F C= π + L* pC − pF F . pC Logo, o intercepto vertical da linha isolucro é (34′) π + L* pC e sua inclinação é − pF pC (Figura 12). A isolucro mais alta tem que tangenciar a fronteira de possibilidades de produção e a sua inclinação precisa se igualar à inclinação da fronteira de possibilidades de produção: TMT = − pF . pC (35) Se a empresa desejar produzir mais cocos, ela terá que reduzir a produção de peixes. Em quanto? Pelo preço relativo do peixe em relação ao preço do coco. * * e wSF e dividendos da Como consumidores, Crusoe e Sexta recebem salários wRC empresa Náufragos S.A. Como a empresa paga suas receitas na forma de salários e dividendos a seus trabalhadores e acionistas, estes necessariamente possuem renda para comprar os produtos da firma. Crusoe e Sexta usam seu dinheiro para comprar as melhores cestas que podem pagar aos preços pF e pC . O ótimo, como vimos, é, então TMS RC = TMS SF = − pF . pC (36) (35) e (36): TMS RC = TMS SF = TMT = − pF . pC (37) Por (13), esta alocação é eficiente de Pareto. Os preços dos bens dão o sinal de escassez relativa de duas formas: (1) escassez tecnológica: quanto reduzir da produção de um bem a fim de se produzir mais do outro e (2) escassez de consumo: quanto cada consumidor deseja reduzir de consumo de um bem para ter mais do outro. © Sergio Da Silva 2010 sergiodasilva.com Bem-Estar Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 33 É possível agregar as preferências dos consumidores individuais para construir preferências “sociais”? Não. Não existe função de bem-estar social. Apesar disto, há maneiras menos rigorosas de ordenar as diferentes distribuições de utilidade dos consumidores. Agregação de preferências Definimos as preferências dos consumidores em relação à sua própria cesta de bens e fizemos a suposição de que elas eram transitivas (Capítulo 3). Isto significa que cada consumidor é individualista: não se preocupa com o que os outros possuem. Podemos expandir esse conceito e supor que cada consumidor possui preferências em relação a todas as cestas de bens. Cada consumidor pode continuar sendo individualista, mas pode também invejar o que os outros possuem. Sendo x uma alocação do que todos os consumidores possuem de todos os bens, dada outra alocação y , supomos que cada consumidor i é capaz de dizer se prefere ou não x a y . Se soubermos como todos os consumidores fazem o ordenamento das várias alocações, poderemos procurar o seu ordenamento social. Uma forma de agregar preferências individuais para obter as preferências sociais é utilizar um sistema de votação. Embora pareça simples dizer que x é “socialmente preferida” a y se a maioria dos indivíduos prefere x a y , este método pode não gerar um ordenamento social que seja transitivo. Veja o exemplo da tabela abaixo. Consumidor A Consumidor B Consumidor C y x z y z x y z x Note que a maioria prefere x a y , y a z , mas também z a x ! As preferências sociais não são transitivas e, por isso, não se pode falar da “melhor” alternativa do conjunto (x, y, z ) . O resultado escolhido pela sociedade depende da ordem da votação. Se os consumidores escolherem primeiro entre x e y , e, depois, escolherem entre o vencedor e z , como a maioria prefere x a y , o segundo turno será entre x e z , com z vencendo. Porém, decidindo primeiro entre z e x , z ganha; mas, no segundo turno entre y e z , y vence. Outro mecanismo de votação é o ordenamento pelo rank. Cada consumidor atribui um número a cada alternativa e depois somamos os números para encontrar os pontos agregados. Se o número escolhido for 1 para a melhor alternativa, 2 para a segunda melhor e assim por diante, o resultado socialmente preferido será aquele da alternativa com menos pontos. No exemplo da tabela a seguir, se apenas as alternativas x e y forem consideradas, o consumidor A daria 1 para x e o consumidor B daria 2 para x . Somando: 3. O consumidor A daria 2 para y e o consumidor B daria 1 para y . Somando: 3. O resultado seria empate. Se agora z também for considerada, o consumidor A daria 1 para x , 2 para y e 3 para z . O consumidor B daria 1 para y , 2 para z e 3 para x . Agregando, x ficaria com 4 e y com 3. Logo, y seria vencedora. A escolha social entre x e y depende de z . Assim, esse mecanismo de votação pode também ser manipulado através da introdução de novas alternativas. Consumidor A Consumidor B y x y z z x Mecanismos de decisão social, que são maneiras de agregar preferências, são todos sujeitos à manipulação. Para um mecanismo de decisão social ser consistente, ele precisaria satisfazer a, pelo menos, três exigências: 1. Dados quaisquer conjuntos de preferências individuais completas, reflexivas e transitivas, o mecanismo de decisão social deve gerar preferências sociais que satisfaçam as mesmas propriedades. 2. Se todo mundo preferir a alternativa x à alternativa y , então a preferência social deverá classificar x na frente de y . 3. As preferências entre x e y devem depender apenas de como os consumidores ordenam x em relação a y , e não de como eles ordenam outras alternativas. Contudo, não existe nenhum mecanismo de decisão social que satisfaça as três exigências acima. Pelo teorema da impossibilidade de Arrow, se um mecanismo de decisão social satisfizer as propriedades 1, 2, e 3, então ele deverá ser uma ditadura, o que significa que todos os ordenamentos sociais coincidem com os ordenamentos de um indivíduo. É impossível agregar preferências individuais para se chegar à preferência social. Não existe forma perfeita de se tomar decisões sociais: a democracia é inconsistente. Funções bem-estar social Se descartarmos a exigência 3, podemos pensar em um second best para substituir a função bem-estar social. Supomos que o consumidor i prefere x a y se e somente se ui (x) > ui (y ) . Apesar de a representação das preferências pela função utilidade não ser única, consideramos apenas uma delas. Assim, somamos as utilidades individuais de n consumidores e chamamos o número resultante de utilidade social: x será socialmente preferível a y se n n i =1 i =1 ∑ ui (x) >∑ ui (y) . (1) Para que a exigência 2 seja mantida, supomos que (1) seja crescente em cada utilidade individual. Então, (1) é uma função agregadora que pode ser considerada uma função bemestar social: W = W ( u1 (x),..., un (x) ) . (2) No caso clássico (de Bentham), as somas são consideradas: n W ( u1 ,..., un ) = ∑ ui . (3) i =1 Uma generalização possível é considerar a soma ponderada: n W ( u1 ,..., un ) = ∑ ai ui , i =1 (4) onde os pesos a1 , ..., an indicam a importância da utilidade de cada consumidor para o bemestar geral. Geralmente, pensa-se que ai > 0 . (5) Outra função é a minimax (de Rawls): W (u1 ,..., un ) = min {u1 ,..., un } , (6) onde o bem-estar social depende apenas do bem-estar do indivíduo de menor utilidade. A diametralmente oposta é a de Nietzsche: W (u1 ,..., un ) = max {u1 ,..., un } , (7) onde o bem-estar social depende apenas do bem-estar do indivíduo de maior utilidade. Maximização de bem-estar Supondo n consumidores e j bens, indicamos por xij quanto o consumidor i possui do bem j . Portanto, a alocação x é formada da lista de quanto cada consumidor tem de cada bem. A quantidade total do bem 1 é X 1 , a do bem 2 é X 2 ,... e a do bem j é X j . Cada quantidade total é distribuída entre os consumidores. O problema de maximização de bem-estar é, então, max W ( u1 (x),..., un (x) ) (8) tal que n ∑x i =1 1 i n ∑x i =1 i j = X1 (9) =Xj A alocação factível que maximiza o bem-estar social deve ser Pareto-eficiente. Se não fosse, teríamos que pensar em outra alocação que, pelo menos para um dos consumidores, teria utilidade maior do que a do máximo. Como a função bem-estar social é crescente em cada utilidade individual, esta nova alocação teria que ter um bem-estar maior. Mas isto contradiz o fato de termos inicialmente o bem-estar máximo. Na Figura 1, mostramos o conjunto de possibilidades de utilidade de dois consumidores e a fronteira de possibilidades de utilidade, onde as alocações são Paretoeficientes. Se uma curva iso-bem-estar tangenciar a fronteira de possibilidades de utilidade, o bem-estar será máximo e não existe outra alocação que gere utilidade mais alta e que seja também factível. Além disso, uma vez que se escolha a função de bem-estar social, pode-se encontrar a correspondente alocação eficiente de Pareto. Assim, não apenas todo máximo de bem-estar é uma alocação Pareto-eficiente, mas também toda alocação Pareto-eficiente é um máximo de bem-estar. Escolhendo a função soma ponderada (4), se o conjunto de possibilidades de utilidades for convexo, pode-se escolher uma das alocações ótimas de Pareto que fique sobre a fronteira de possibilidades de utilidade (Figura 2). Funções bem-estar social individualistas No nosso modelo inicial em que cada consumidor não tem preferências sobre todas as alocações, mas apenas sobre sua cesta, a cesta de consumo do consumidor i é xi e uma dada representação das preferências pela utilidade é ui ( xi ) . Neste caso, a função bem-estar social individualista (de Bergson-Samuelson) W = W ( u1 ( x1 ),..., un ( xn ) ) (10) é função direta das utilidades individuais e função indireta das cestas dos consumidores. Como a utilidade de cada consumidor depende apenas do seu próprio consumo, não há externalidade de consumo. Todo equilíbrio competitivo é Pareto-eficiente e, desde que as preferências e a tecnologia sejam convexas, toda alocação eficiente de Pareto é um equilíbrio competitivo. Além disso, todo bem-estar máximo é um equilíbrio competitivo e todo equilíbrio competitivo é um máximo de bem-estar para uma certa função bem-estar. Para provar isto, tomemos os consumidores A e B e os bens 1 e 2. Queremos ( max W u A ( x1A , x A2 ), u B ( x1B , xB2 ) x1A , x 2A , x1B , xB2 ) (11) sujeita à fronteira de possibilidades de produção: T ( X 1, X 2 ) = 0 , (12) onde X 1 = x1A + x1B é a quantidade total do bem 1 produzido e consumido e X 2 = x A2 + xB2 é a quantidade total do bem 2. Formando o lagrangeano: ( ) ( ) L = W u A ( x1A , x A2 ), uB ( x1B , xB2 ) − λ T ( X 1 , X 2 ) − 0 , (13) as condições de primeira ordem são: ∂L ∂W ∂u A ∂T = −λ 1 = 0 1 1 ∂x A ∂u A ∂x A ∂X (14) ∂L ∂W ∂u A ∂T = −λ =0 2 2 ∂x A ∂u A ∂x A ∂X 2 (15) ∂L ∂W ∂uB ∂T = −λ 1 = 0 1 1 ∂xB ∂uB ∂xB ∂X (16) ∂L ∂W ∂uB ∂T = −λ =0. 2 2 ∂xB ∂uB ∂xB ∂X 2 (17) Dividindo (14) por (15): ∂u A ∂x1A ∂u A ∂x 2A = ∂T ∂X 1 ∂T ∂X 2 e dividindo (16) por (17): (18) ∂u B ∂x1B ∂u B ∂xB2 = ∂T ∂X 1 ∂T ∂X 2 . (19) Considerando (18) e (19): TMS A = TMS B = TMT . (20) Logo, a maximização do bem-estar na função individualista leva ao mesmo resultado da eficiência de Pareto em uma economia com produção (Capítulo 32). Alocações justas Como dividir bens justamente entre n consumidores que, por hipótese, os merecem igualmente? Igualmente. Cada consumidor fica com as mesmas cestas de bens e ninguém prefere a cesta de outrem à sua. Mas a divisão igualitária não é necessariamente Paretoeficiente. Se os consumidores tiverem gostos diferentes farão trocas e a economia sairá da divisão igualitária. Ocorrendo troca, chega-se a uma alocação eficiente de Pareto (Capítulo 31). Esta nova alocação Pareto-eficiente continua sendo “justa”? Não necessariamente. Por exemplo, os consumidores A e B têm os mesmos gostos e o consumidor C tem gosto diferente. Inicialmente, os três possuem as mesmas cestas. A e C se encontram e trocam. No final, ambos melhoram sua situação. Como B encontrou C, B agora inveja A, o que significa que B prefere a cesta de A à sua: ( x1B , xB2 ) ≺ B ( x1A , x A2 ) . (21) Voltando à situação de igualdade inicial, se os consumidores estiverem transacionando em mercados competitivos, eles escolherão as melhores cestas que puderem aos preços de equilíbrio p1 e p2 . A alocação final deve ser Pareto-eficiente (Capítulo 31). Se A e B tiverem a mesma cesta, B não pode invejar A. Se B preferir a cesta de A à sua, e se sua cesta fosse a melhor que pudesse conseguir aos preços p1 e p2 , a cesta de A deveria custar mais do que B poderia pagar: p1ω1B + p2ωB2 < p1 x1A + p2 x A2 . (22) Mas isto é impossível porque se B não puder pagar pela cesta, A também não poderá, já que possuem a mesma cesta. Se uma alocação for igualitária, não pode haver inveja. Uma alocação é justa se for igualitária e eficiente. Então, o equilíbrio competitivo em uma divisão igualitária é justo. © Sergio Da Silva 2010. sergiodasilva.com Externalidades Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 34 Há externalidade de consumo se um consumidor for afetado pelo consumo de outro ou pela produção de uma empresa. Exemplos de externalidade de consumo negativa são o vizinho tocando música alta às três horas da manhã, o consumidor na mesa ao lado de um restaurante fumando charuto ou a poluição produzida pelos carros. Um exemplo de externalidade de consumo positiva é ter prazer em observar as flores do vizinho. Ocorre externalidade de produção quando as possibilidades de produção de uma empresa são afetadas pelas escolhas de outra empresa ou consumidor. Um exemplo de externalidade de produção negativa é a situação em que uma empresa de pesca é afetada por poluentes jogados na área de pesca. Um exemplo de externalidade de produção positiva é um pomar de maçãs localizado próximo a uma colmeia. O aspecto mais importante das externalidades é a existência de bens que não são vendidos em mercados. Por exemplo, não há mercado para fumaça. É esta falta de mercados para externalidades que causa problema. No nosso modelo básico, conhecendo suas próprias possibilidades de consumo ou produção, cada consumidor ou produtor toma decisões sem se preocupar com que os outros estão fazendo. Eles interagem apenas no mercado e toda a informação necessária é dada pelos preços. O mecanismo de mercado leva a alocações eficientes de Pareto, já que não ocorrem externalidades. Porém, se cada consumidor ou produtor se importar com o consumo ou a produção dos outros, ocorrem externalidades e não se chega a alocações eficientes de Pareto. Aqui, o governo ou o sistema legal contribui para atingir a eficiência. Externalidades de consumo negativas na caixa de Edgeworth Dois consumidores A e B começam com $100 , sendo que A é fumante e B não. “Fumaça” é um bem para A, mas um mal para B. As possibilidades de consumo dos dois consumidores A e B de “dinheiro” e “fumaça” podem ser representadas na caixa de Edgeworth da Figura 1. Enquanto o dinheiro está dividido entre os dois consumidores, há apenas uma quantia de fumaça a ser consumida conjuntamente. Se estiverem na sala de não-fumantes de um restaurante, na dotação inicial ambos A e B possuem (dinheiro, fumaça) = (100, 0). Isto significa que B possui o direito de propriedade ao ar puro. A situação na dotação não é eficiente de Pareto porque, sendo as TMS diferentes, A e B podem transacionar para melhorar suas situações. B se deixa subornar e troca um pouco de fumaça (digamos, 0.4 ) por dinheiro (digamos, $30 ). Em outras palavras, o consumidor A paga para fumar. O equilíbrio ao final da troca em X é Pareto-eficiente, já que as TMS são iguais. Se, por outro lado, estiverem na sala de fumantes, na dotação inicial ambos A e B possuem (100, 1). Como as TMS são diferentes, há possibilidades de ganho mútuo com a troca. Agora B suborna A, pagando para ele reduzir o número de cigarros que vai fumar. Em X′ , há eficiência de Pareto. O consumidor A preferiria o equilíbrio em X′ , enquanto o consumidor B preferiria o equilíbrio em X. A teve que pagar para fumar a partir da dotação (100, 0) porque o direito ao ar puro foi alocado para B. Observe que, se os consumidores criarem um mercado para a fumaça, chegarão à eficiência, não importando de quem seja o direito ao ar puro. Ocorre que, nessa barganha, eles fizeram transações ilegais. Em vez da barganha, eles poderiam ter usado o mecanismo de preços. O leiloeiro anunciaria um preço para o ar puro e cada consumidor escolheria o quanto comprar a esse preço. O equilíbrio competitivo seria o mesmo da Figura 1. Se o direito ao ar puro não estivesse bem definido nas dotações iniciais, o mercado de fumaça não seria viabilizado e a alocação eficiente da externalidade não seria atingida. Preferências quase-lineares e o teorema de Coase Em X e X′ na Figura 1, a quantidade de fumaça (externalidade) na situação eficiente depende da alocação inicial do direito de propriedade do ar puro. No caso especial de preferências quase-lineares, o montante da externalidade torna-se independente da alocação inicial do direito de propriedade: teorema de Coase (Figura 2). Realocar as dotações iniciais não afeta a quantidade eficiente de fumaça. Externalidade de produção Uma siderúrgica S produz aço na quantidade s e poluentes na quantidade x , que joga no rio. O seu custo é c s = cs ( s , x ) . (1) Uma empresa de pesca F dos arredores produz a quantidade f de peixes e sua função custo é c f = c f ( f , x) . (2) Há externalidade de produção porque o custo da empresa F depende também da quantidade de poluentes lançados pela empresa S . Supomos que ∆cs ≤0 ∆x (3) CM s ( x) ≤ 0 . (3′) ou Se a empresa S reduzir seus poluentes em ∆x o seu custo ∆cs seria aumentado. Para a empresa F , ∆c f >0 (4) CM f ( x) > 0 . (4′) ∆x ou O aumento dos poluentes lançados pela empresa S , ∆x , aumenta o custo da empresa F em ∆c f . Este é o custo externo que é ignorado pela siderúrgica. Não custa nada para a siderúrgica poluir. Então o preço do poluente é zero para ela: px = 0 . (5) A maximização de lucro da empresa S é: max ps s − cs ( s, x) , s,x (6) onde ps é o preço da unidade de aço laminado. A maximização de lucro da empresa F é: max p f f − c f ( f , x) , (7) f onde p f é o preço do peixe. Para a empresa de pesca, x não é variável de escolha. Para a siderúrgica, as condições de primeira ordem são encontradas derivando (6) em relação a s e igualando a zero: ps − c′s = 0 ps = c′s ou ps = CM S ( s* ) . (8) Depois, derivando (6) em relação a x e igualando a zero: 0 − c′s = 0 0 = CM s ( x* ) . (9) Por (9), a siderúrgica polui até que o custo de uma unidade extra do poluente seja zero. Para a segunda empresa, a condição de primeira ordem é encontrada derivando (7) em relação a f e igualando a zero: p f − c′f = 0 p f = CM f ( f * ) . (10) Como o custo externo não está sendo levado em conta pela siderúrgica, é de se esperar que as quantidades do poluente que ela emite no lucro máximo sejam excessivas do ponto de vista das duas empresas tomadas em conjunto. Fusões Se as duas empresas fizessem uma fusão, a nova empresa resultante internalizaria o custo externo, pois maximizaria: max ps s + p f f − cs ( s, x) − c f ( f , x) . s, f ,x (11) As condições de primeira ordem podem ser encontradas derivando (11) em relação a s e igualando o resultado a zero: ps − c′s = 0 ps = CM s ( s** ) . (12) Depois, derivando (11) em relação a f e igualando a zero: p f − c′f = 0 p f = CM f ( f ** ) . (13) E finalmente derivando (11) em relação a x e igualando a zero: 0 + 0 − c′s − c′f = 0 0 = c′s + c′f 0 = CM s ( x** ) + CM f ( x** ) . (14) Assim, a empresa surgida da fusão polui até que a soma dos custos (custo social) das unidades extras de poluição vinda dos dois departamentos (aço e pesca) seja zero. Isto é Paretoeficiente, pois agora não é possível reduzir um custo marginal sem, com isso, aumentar o outro. A equação (14) pode ser reescrita como: −CM s ( x** ) = CM f ( x** ) . (14′) Isto é plotado na Figura 3. Veja que a quantidade socialmente ótima de poluente é menor do que a quantidade privada ótima (equação (9)). O próprio mercado cria incentivos para internalização da externalidade de produção através de fusões. Ao perceberem que o lucro é maior na fusão, as empresas se engajam nela. O exemplo do pomar de maçãs e da colmeia é raro de se encontrar porque a externalidade de produção somente ocorreria caso as empresas ignorassem sua interação. Por isso, o mais comum é encontrar empresas com pomares e colmeias ao mesmo tempo. Imposto de Pigou Como a siderúrgica se defronta com o preço errado da poluição ( px = 0) , ela não se importa com o custo que a poluição traz para a empresa de pesca. Para corrigir esta situação deve-se fazer com que a siderúrgica encare o custo social correto. Uma solução seria um imposto t por unidade de poluição gerada. A siderúrgica maximizaria lucro fazendo max ps s − cs ( s, x) − tx . s,x Derivando (15) primeiramente em relação a s e igualando a zero: ps − c′s = 0 (15) ps = c′s ps = CM s ( s*** ) . (16) Derivando (15) em relação a x e igualando a zero: −c′s − t = 0 t = −CM s ( x*** ) . (17) Levando em conta (14′) em (17): t = CM f ( x*** ) . (18) Por (17) e (18), o imposto obriga a siderúrgica a internalizar o custo marginal da poluição da empresa de pesca. Este é chamado de imposto de Pigou. Para sabermos qual é o imposto correto, temos antes que conhecer o nível ótimo de poluição. Mas conhecendo o nível ótimo de poluição basta obrigar a firma a produzi-lo, sem necessidade do imposto. Criação de mercado para a poluição A siderúrgica se depara com o preço zero para o poluente ( px = 0) e a empresa de pesca está disposta a pagar para reduzir a poluição. Portanto, o preço social correto da poluição deveria ser negativo. Atribuindo-se direitos de propriedade de água limpa a qualquer uma das empresas seria suficiente para se criar o mercado do poluente que está faltando e se remover a externalidade. A situação eficiente irá ocorrer independentemente de a quem seja atribuído o direito de água limpa. Se à empresa de pesca for concedido o direito, ela poderá vender o direito gerando o mercado do poluente. A maximização de lucro da siderúrgica será agora max ps s − px x − cs ( s, x) s,x (19) e a da empresa de pesca será max p f f + px x − c f ( f , x) . f ,x (20) O valor da poluição px x é negativo para a siderúrgica porque ela compra o direito de água limpa (para poluir), mas px x é positivo para a empresa de pesca porque ela arrecada receita vendendo o direito. Maximizando (19) em relação a s : ps − c′s = 0 ps = c′s ps = CM s ( s**** ) . Maximizando (19) em relação a x : (21) − px − c′s = 0 px = −CM s ( x**** ) . (22) Maximizando (20) em relação a f : p f − c′f = 0 p f = CM f ( f **** ) . (23) Maximizando (20) em relação a x : px − c′f = 0 px = CM f ( x**** ) . (24) Logo, cada empresa leva em conta o custo marginal de suas ações quando compra ou vende poluição. Quando a oferta se iguala à demanda ao preço de equilíbrio px , por (22) e (24), −CM s ( x**** ) = CM f ( x**** ) . (25) Esta é a mesma condição de ótimo de Pareto de antes (equação (14′)). Ela diz que o custo marginal para a siderúrgica reduzir a poluição, CM s , deve se igualar ao benefício marginal da empresa de pesca dessa redução, −CM f . Se o direito a água limpa fosse concedido à siderúrgica, a empresa de pesca teria agora que pagar à siderúrgica para esta poluir menos. Isto leva ao mesmo resultado anterior. Supomos que poluir seja permitido até o limite x . A maximização de lucro da siderúrgica é: max ps s + px ( x − x) − cs ( s, x) . s,x (26) Derivando (26) em relação a s e igualando a zero: ps − c′s = 0 ps = CM s ( s***** ) . (27) Derivando (26) em relação a x e igualando a zero: − px − c′s = 0 px = −CM s ( x***** ) . (28) A maximização de lucro da empresa de pesca é: max p f f − px ( x − x) − c f ( s, x) . f ,x Derivando (29) em relação a f e igualando a zero: (29) p f − c′f = 0 p f = CM f ( s***** ) . (30) Derivando (29) em relação a x e igualando a zero: px − c′f = 0 px = CM f ( x***** ) . (31) As equações (27), (28), (30) e (31) são as mesmas que (21), (22), (23) e (24). Logo, a produção ótima dos bens e do mal (poluição) independe de a quem seja atribuído o direito de propriedade sobre a poluição e o lucro maior será daquela empresa que recebeu o direito. A tragédia dos recursos comuns Se os direitos de propriedade forem bem definidos, as externalidades de produção serão internalizadas. Se um recurso de uso comum for propriedade de alguém, este pode evitar que outros o utilizem em excesso. Ineficiências resultam apenas de situações em que não se consegue excluir outros de usar o recurso. Um exemplo é a “tragédia” dos recursos comuns. Vacas leiteiras pastam em um campo de uso coletivo. Nenhum proprietário possui muitas vacas. O preço de cada vaca comprada c é $a : o custo é então ac . A receita com a venda de leite é f (c) . A produção de leite de cada vaca dependerá de quantas outras vacas pastam no campo coletivo. Assim, a receita por vaca é f (cc ) . Se a pastagem tivesse dono, o lucro seria maximizado fazendo max f (c) − ac (32) f ′(c* ) − a = 0 RM (c* ) = a . (33) c Logo, o lucro seria máximo quando a receita marginal da venda de leite fosse igual ao preço da vaca. Como a pastagem não tem dono, existem c vacas no campo comum e a receita por vaca é f (cc ) . Comprar uma vaca a mais significa aumentar a receita em f (c + 1) , mas o número total de vacas também aumenta em c + 1 . A receita média que esta vaca a mais dará será f (cc++11) . Se esta receita for maior do que o preço da vaca, a , valerá a pena comprá-la. Vacas a mais serão compradas até que a receita média em leite proporcionada pela última vaca se iguale a seu preço de compra: f (c + 1) =a. c +1 (34) O número total de vacas compradas c** será dado então por: f (c** ) =a c** (35) ou f (c** ) − ac** = 0 . (35′) Portanto, quando o lucro for zero não se compra mais vaca. (35) é o equilíbrio quando o recurso for de uso coletivo. Em (34), (35) e (35′) cada consumidor ignora o fato de que uma vaca a mais comprada reduzirá a receita de leite dos outros: cada um ignora o custo social de sua compra. O resultado será que as vacas compradas superarão o número ótimo do ponto de vista social. ** A receita média f (cc** ) diminuirá à medida que mais vacas forem compradas (curva decrescente): f (c** ) < 0. c** (36) Derivando (36) em relação a c** : f ′c** − f (c** ) <0 (c** ) 2 f ′c** − f < 0 . Dividindo por c** : f <0 c** f f ′ < ** c RM < RMe . f ′− (37) Logo, o equilíbrio no caso em que o recurso é de uso coletivo, (35), é ineficiente, enquanto o equilíbrio no caso de um único dono, (33), é eficiente. © Sergio Da Silva 2010 sergiodasilva.com Tecnologia de Informação Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 35 A revolução industrial transformou a maneira de produzir, distribuir e consumir bens. Agora, a revolução da informação está transformando a maneira de produzir, distribuir e consumir informação. A tecnologia de informação é usada em sistemas de diversos componentes, que podem ser bens complementares fornecidos por diferentes empresas. Esses bens possuem valor apenas se usados em conjunto. Por exemplo, hardware não possui valor sem os correspondentes softwares. Uma CPU (central processing unit) da Intel precisa de um sistema operacional, como o Windows. Quanto maior for o número de softwares escritos para um hardware, maior será seu valor. As estratégias competitivas nas indústrias de tecnologia de informação precisam, portanto, levar em conta que os componentes dos sistemas são bens complementares. Apreçamento dos complementos Os vendedores dos bens complementares (Intel e Microsoft, por exemplo) sabem que a demanda isolada por CPU ou Windows depende do preço de ambos os produtos. Sendo p1 o preço da CPU e p2 o preço do Windows, a demanda por, digamos, CPU depende do preço desses dois componentes: D( p1 + p2 ) . Sendo CM 1 o custo marginal de uma CPU e F1 seu custo fixo, o problema de maximização da Intel é: max( p1 − CM 1 ) D( p1 + p2 ) − F1 . p1 (1) Analogamente, o problema de maximização da Microsoft é: max( p2 − CM 2 ) D( p1 + p2 ) − F2 . p2 (2) Supondo, por simplicidade, que os custos marginais sejam irrelevantes: CM 1 = CM 2 = 0 , (3) ficamos com ( (3) em (1) e (2) ): max p1 D( p1 + p2 ) − F1 p1 (1′) e max p2 D( p1 + p2 ) − F2 . p2 (2′) Para o caso da função demanda linear D( p1 + p2 ) = a − b( p1 + p2 ) , temos, para a Intel ( (4) em (1′) ): (4) max p1 (a − b( p1 + p2 )) − F1 p1 max ap1 − bp12 − bp1 p2 − F1 . p1 (1″) Derivando em relação a p1 e igualando a zero: a − 2bp1 − bp2 = 0 2bp1 = a − bp2 p1 = a − bp2 . 2b (5) Logo, o preço da CPU ( p1 ) depende do preço do Windows ( p2 ). Para a Microsoft, cálculos análogos se aplicam e ficamos com p2 = a − bp1 . 2b (6) Logo, o preço do Windows também depende do preço da CPU. Se cada empresa acertar o preço que espera da outra, p1e = p1 e p2e = p2 , e poderemos calcular o equilíbrio de Nash substituindo (6) em (5): a − bp1 a −b 2b p1 = 2b p1 = a− ab − b 2 p1 2b 2b 2ab − ab + b 2 p1 2b p1 = 2b 2ab − ab + b 2 p1 2bp1 = 2b 4b 2 p1 = ab + b 2 p1 3b 2 p1 = ab p1 = ab 3b 2 p1 = a . 3b (7) (7) em (6): p2 = a 3b a −b 2b 3ab − ab 3b p2 = 2b 2ab p2 = 3b 2b p2 = 2a 1 3 2b p2 = 2a 6b p2 = a . 3b (8) Portanto, no equilíbrio de Nash ( (7) e (8) ): p1 = p2 = a . 3b (9) A soma dos preços dos dois produtos é: p1 + p2 = a a a+a + = 3b 3b 3b p1 + p2 = 2a . 3b (10) Se houvesse uma fusão entre Intel e Microsoft, o preço seria menor. De fato, a nova empresa maximizaria max p (a − bp ) − F . p Derivando em relação a p e igualando a zero: a − 2bp = 0 (11) 2bp = a p= a . 2b (12) Comparando (10) e (12) vemos que p < p1 + p2 , pois a 2a . < 2b 3b (13) Com o preço mais baixo depois da fusão, os consumidores comprariam mais e a empresa aumentaria as vendas e os lucros (melhoramento de Pareto). Este é o mesmo resultado geral (de Cournot) de que a fusão de dois monopólios que produzem bens complementares baixa os preços e aumenta os lucros. Exemplo 1: Motorola e Apple. Mesmo sem precisar fazer uma fusão, a Apple compra a CPU da Motorola, combina-a com seu sistema operacional (Macintosh) e vende o computador pronto para o consumidor final. Exemplo 2: Boeing e GE. A Boeing faz o corpo do avião e a GE faz o motor. A Boeing compra o motor, monta o avião completo e reverte uma fração da receita para a GE. Exemplo 3: Sony e Philips. Essas empresas possuem as patentes básicas da tecnologia do DVD e licenciam a tecnologia para muitas outras empresas a preços baixos para viabilizar o mercado. Lock-in Há grandes custos de mudança (switching costs) nas indústrias de tecnologia de informação. Mudar de um computador baseado no Windows para outro baseado no Macintosh traz custos não apenas de hardware, mas também de toda uma inteira gama de software. Se os custos de mudança forem muito altos, os consumidores podem não conseguir mudar de produto: ocorre o lock-in. O lock-in é a situação na qual o custo de mudar para um diferente sistema é tão alto que o consumidor fica preso ao atual. Isto significa uma demanda menos elástica e uma vantagem para o vendedor, que pode extrair um excedente do consumidor maior. Em um ambiente competitivo, o custo (= custo marginal) de um serviço de acesso à internet se iguala ao preço do serviço p : p =c. (14) Se o consumidor desejar mudar de servidor, há o custo de mudança s . Porém, o novo servidor pode oferecer o desconto d para o primeiro período. Se o consumidor mudar de servidor, paga p − d e o custo s no primeiro período e rp no período seguinte, onde r é a taxa de juros real por período sendo usada como fator de desconto. Se ele continuar com o servidor atual, paga p no primeiro período e rp no período seguinte. Assim, o consumidor muda de servidor se ( p − d) + p p +s< p+ . r r O consumidor será indiferente entre mudar ou não de servidor se ( p − d) + p p +s = p+ r r (15) p−d +s = p d = s. (16) Isto significa que ele será indiferente se o desconto fornecido pelo novo servidor exatamente compensar o custo de mudança. Caso o consumidor opte pelo novo servidor, este receberá o pagamento pelo serviço p menos o desconto d que concede. O lucro será a receita p − d menos o custo c . No outro período, o lucro será apenas pr−c . Para o novo servidor, a concorrência força seu lucro até zero. Ou melhor, os lucros dos dois períodos se igualarão a zero: ( p − d) − c + p−c = 0. r (17) Como o desconto mínimo será d = s (por (16) ), substituindo (16) em (17): ( p − s) − c + p−c+ p−c =0 r p−c = s. r (18) Portanto, o valor presente dos lucros do novo servidor se igualará ao custo de mudança do consumidor. Vendo de outra forma, p =c− p= p−c +s r cr − ( p − c) + sr r pr = cr − p + c + sr pr + p = (1 + r )c + sr (1 + r ) p = (1 + r )c + sr p =c+ r s. 1+ r (19) Isto significa que o preço do serviço será um mark up do custo c proporcional ao custo de mudança s . Se o novo servidor também tiver receita de propaganda a , a condição de lucro zero (17) deve ser modificada para: ( p − d) + a − c + p+a−c = 0. r (20) p+a−c = 0. r (21) (16) em (20): ( p − s) + a − c + Neste caso, se comparado a (19), o preço do serviço será reduzido da receita de propaganda a . De fato, p−s+a−c+ p+a−c =0 r p+a−c p = s−a +c− r p= rs − ra + rc − p − a + c r rp = rs − (1 + r )a + (1 + r )c − p rp + p = (1 + r )c − (1 + r )a + rs (1 + r ) p = (1 + r )a − (1 + r )a + rs p =c−a+ r s. 1+ r (22) Externalidade de rede Uma externalidade de rede (network) ocorre quando a utilidade de um bem para um consumidor depende do número de outros consumidores do bem. Se o número de usuários de aparelhos de fax começar a diminuir, isto reduzirá a utilidade do seu próprio aparelho. Afinal, haverá cada vez menos pessoas capazes de receber seus faxes. Suponha que há 1000 consumidores de um bem: v = 1,...,1000 . O preço de reserva para o bem do consumidor v é o próprio v . Ao preço p , o número de consumidores que acham que o bem vale pelo menos p é 1000 − p . Se p = $200 , haverá 800 consumidores querendo pagar pelo menos $200 e o número de unidades compradas será 800. Isto gerará uma curva de demanda negativamente inclinada (como vimos no Capítulo 1). Se o bem for um aparelho de fax, haverá externalidade de rede e o valor do bem para a pessoa v será vn , sendo n o número de possíveis consumidores do bem. Quanto maior for n , maior será o valor do bem: ( v n ↑ ) ↑ . Ao preço p , haverá o consumidor marginal v̂ exatamente indiferente entre comprar ou não o bem. Neste caso, p se iguala à sua vontade de pagar: ˆ . p = vn (23) Logo, todos os outros consumidores v > vˆ preferirão comprar. O número de consumidores querendo comprar o bem será: n = 1000 − vˆ . (24) (24) em (23): p = n(1000 − n) . (25) A equação (25) está plotada na Figura 1. Supondo que os aparelhos de fax sejam produzidos com retornos constantes de escala, a sua curva de oferta será a linha horizontal ao preço que se iguala ao custo médio ( CMe ), como na Figura 2. Reunindo demanda e oferta (Figura 3), há dois possíveis equilíbrios: com poucos consumidores e com muitos. Se a curva de demanda estiver acima da de oferta, a quantidade n aumentará, e viceversa. As setas próximas aos equilíbrios na Figura 4 mostram esse processo de ajustamento. Apenas o equilíbrio com n maior é estável. Esse modelo pode ser adaptado para incluir externalidade de rede indireta. A utilidade de um consumidor de aparelho de DVD simples não se altera diretamente se outros estiverem comprando aparelhos de DVD Blu-Ray. Porém, há ainda externalidade de rede de forma indireta: quanto mais Blu-Rays forem vendidos, mais discos Blu-Ray vão aparecer, tornando os aparelhos de Blu-Ray ainda mais populares, fato que, indiretamente, reduz o uso de aparelhos de DVD simples. Suponha, então, que o preço de reserva do bem 1 seja v1 e que v1 = 1,...,1000 . O preço de reserva do bem 2 é v2 = 1,...,1000 . O valor do bem 1 depende de quantos consumidores consomem o bem 2 e o valor do bem 2 depende de quantos consumidores consomem o bem 1. As utilidades serão: U1 = v1n2 (26) U 2 = v2 n1 . (27) e Ao preço p , para os consumidores marginais indiferentes entre comprar ou não os respectivos bens, teremos: p1 = vˆ1n2 (28) p2 = vˆ2 n1 . (29) e Todos com valores acima de v̂1 compram o bem 1 e, assim, n1 = 1000 − vˆ1 . (30) Todos com valores acima de v̂2 compram o bem 2 e, assim, n2 = 1000 − vˆ2 . (31) (30) em (28): p1 = n2 (1000 − n1 ) . (32) (31) em (29): p2 = n1 (1000 − n2 ) . (33) As equações (32) e (33) generalizam (25), que é válida quando não há externalidade de rede indireta. Modelos alternativos de negócios Suponha que o lucro de um jornal online de custo irrelevante seja maximizado: (34) max p ( y ) y y e se encontre o par ótimo ( p*, y*) . O jornal fornece um período grátis de uma semana. Porém, se o período for aumentado para um mês e, além disso, esse novo modelo de negócio funcionar, a nova curva de demanda inversa será: P(Y ) = ap(Y ), a >1. (35) As vendas agora aumentariam e Y = by, b > 1. (36) A firma agora maximizará max P (Y ) y . Y (37) (35) e (36) em (37): max ap(Y ) Y max Y Y b a p(Y )Y . b (38) Já que a constante ba > 0 , esta não modifica a escolha ótima de Y em relação ao problema (34). Podemos então concluir que Y * = y * . Portanto, 1. A quantidade consumida Y * independe da mudança do prazo gratuito. 2. A quantidade produzida, que é y = Yb , fica menor, já que b > 1 e y* = Y * . 3. Os lucros podem subir ou cair dependendo de se ba > 1 ou ba < 1 . Quando permitir o aluguel de bens de informação? Um produtor de vídeo produz y cópias para maximizar lucro: max p ( y ) y − cy − F . y (39) Isto leva a determinada quantidade ótima de cópias. Se houver a possibilidade de aluguel de qualquer cópia, a quantidade de vídeos que podem ser assistidos x pode superar a quantidade produzida: x = ky, k >1. (40) onde k é o número de consumidores que assistem ao vídeo. Para o consumidor marginal que é indiferente entre alugar e comprar, p( x) = p(ky ) . (41) Porém, há um custo de inconveniência t ao se alugar o vídeo quando se pode comprá-lo e, portanto, possuí-lo. Por isso, a disposição a pagar do consumidor marginal deve ser p ( x) − t e (41) deve ser reformulada para p ( x) − t = p(ky ) − t . (42) A disposição a pagar da locadora (demanda inversa do ponto de vista do produtor) será k (que é o número de usuários) vezes a disposição a pagar do consumidor marginal (equação (42) ): p( y ) = k ( p(ky ) − t ) . (43) Agora, o problema para o produtor do vídeo será: max p ( y ) y − cy − F . y (44) (43) em (44): max k ( p (ky ) − t ) y − cy − F y max p (ky ) ky − kty − cy − F y c max p (ky )ky − + k ky − F . y k (45) (40) em (45): c max p ( x) x − + t x − F . x k (46) Comparando o problema de maximização sem a possibilidade de alugar o vídeo (39) com o que permite o aluguel (46), podemos notar que muda apenas o termo de custo: c em (39) e c k + t em (46). Por (46), o lucro será maior na situação em que o aluguel é possível se c +t < c k ou t <c− c k t< ck − c k t< c(k − 1) k tk < c(k − 1) (47) tk <c k −1 k t <c. k −1 (48) Se o número de consumidores for grande k ≈ k − 1 , o que faz com que kk−1 → 1 . Neste casto, (48) informa que se o custo de produzir o vídeo for mais alto do que o custo de inconveniência ( c > t ), o lucro do produtor será maior se este permitir o aluguel do vídeo produzido. Se c < t , o produtor terá mais lucro proibindo o aluguel. © Sergio Da Silva 2010 sergiodasilva.com Bens Públicos Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 36 Direitos de propriedade bem definidos para fumaça, por exemplo, são capazes de eliminar externalidades de consumo entre dois consumidores que transacionam o direito. No caso da externalidade de produção, os sinais dados pelos lucros podem arranjar os direitos de propriedade da maneira mais eficiente. Quando houver propriedade comum, basta atribuir-se direito de propriedade para uma das partes envolvidas para se remover a externalidade. Porém, essas soluções não funcionam para mais de dois indivíduos. Com um fumante e dois não fumantes, imagine que o direito de propriedade seja bem definido: o direito ao ar puro é dos não fumantes, que podem transacioná-lo em troca de apropriada compensação. Mas apenas definir o direito não resolve porque os não fumantes precisam chegar a um acordo em relação à quantidade de fumaça que será permitida e sobre qual deverá ser a compensação. O acordo é improvável se os não fumantes tiverem preferências muitos diferentes e dotações distintas (um deles ser mais rico). Esta externalidade de consumo de fumaça com três ou mais pessoas é um exemplo de bem-público: o bem (ou o mal, no caso da fumaça para os não-fumantes) tem que ser consumido por todos na mesma quantidade, mas cada consumidor atribui valor diferente para ele. Outros exemplos de bens públicos são a defesa nacional, ruas e calçadas. Bens públicos não podem ser alocados pelo mercado. Compra de bens públicos Um aparelho de TV na sala de dois colegas de república é um bem público. Vale a pena comprá-lo? Cada consumidor 1 e 2 contribui com g1 e g 2 em dinheiro para comprar a TV (bem público) e x1 e x2 é o dinheiro restante para ser gasto em bens privados. A riqueza inicial de cada é w1 e w2 . As restrições orçamentárias são: x1 + g1 = w1 (1) x2 + g 2 = w2 . (2) A TV custa c em dinheiro. Para comprá-la, é preciso que g1 + g 2 ≥ c . (3) A função utilidade do consumidor 1 é: u1 = u1 ( x1 , G ) , (4) G=0 (5) onde sem TV, ou G =1 (6) com TV. Não há subíndice, o que significa que o bem público é consumido ao mesmo tempo pelos dois consumidores. A função utilidade do consumidor 2 é: u2 = u2 ( x2 , G ) . (7) Cada consumidor valoriza os serviços da TV (programação) diferentemente. Perguntando até quanto cada consumidor gostaria de pagar pela TV, poderíamos conhecer seu preço de reserva r1 e r2 . Estamos, então, supondo que ambos não iriam mentir. Ao preço de reserva r1 , o consumidor 1 seria indiferente entre pagar r1 para ter o bem público ou não pagar e ficar sem ele. Supomos que o preço de reserva depende da riqueza: o valor máximo que se quer pagar depende de quanto se é capaz de pagar: r1 ≤ w1 (8) r2 ≤ w2 . (9) e Se o consumidor 1 pagar o preço de reserva (menor do que a sua riqueza) sobra x1 em dinheiro para ser gasto em bens privados: x1 = w1 − r1 . (10) Se não pagar, ele terá toda a sua riqueza disponível para ser gasta nos bens privados: x1 = w1 . (11) Se ele for indiferente entre pagar e não pagar, sua utilidade será ((4), (10) e (11)): u1 = u1 ( x1 , G ) = u1 ( w1 − r1 ,1) = u1 ( w1 , 0 ) . (12) Similarmente, para o consumidor 2 temos: x2 = w2 − r2 (13) x2 = w2 (14) u2 = u2 ( x2 , G ) = u2 ( w2 − r2 ,1) = u2 ( w2 , 0 ) . (15) Duas alocações são possíveis. Sem TV ((5), (11) e (14)): ( x1 , x2 , G ) = ( w1 , w2 , 0) (16) e com TV ((6)): ( x1 , x2 , G ) = ( x1 , x2 ,1) . (17) Substituindo (1) e (2) em (17): ( x1 , x2 , G ) = ( w1 − g1 , w2 − g 2 ,1) . (17′) Em (17′), o consumo privado de cada consumidor depende da riqueza que fica depois de se gastar com o bem público. Quando gastar com o bem público ( g1 , g 2 ) será uma melhoria de Pareto? (Sendo possível melhoria, teremos ineficiência). Quando ((12)) u1 ( w1 , 0 ) < u1 ( x1 ,1) (18) u2 ( w2 , 0 ) < u2 ( x2 ,1) . (19) e ((15)) Se fossem indiferentes entre pagar ou não ((12) em (18)): u1 ( w1 − r1 ,1) < u1 ( x1 ,1) (20) e ((15) em (19)): u2 ( w2 − r2 ,1) < u2 ( x2 ,1) . (21) Pagando ((1) em (20)): u1 ( w1 − r1 ,1) < u1 ( w1 − g1 ,1) e ((2) em (21)) u2 ( w2 − r2 ,1) < u2 ( w2 − g 2 ,1) . (22) (23) Supondo monotonicidade em (22) e (23), mais quantidades consumidas do bem privado aumentam a utilidade dos consumidores: w1 − r1 < w1 − g1 (24) w2 − r2 < w2 − g 2 (25) e ou r1 > g1 + w1 − w1 r1 > g1 (26) r2 > g 2 + w2 − w2 r2 > g 2 . (27) e Portanto, por (26) e (27), a contribuição de cada consumidor ( g1 e g 2 ) é menor do que o preço máximo que cada um estaria disposto a pagar ( r1 e r2 ). Neste caso, há ineficiência e ambos melhorariam sua situação comprando a TV. Considerando (3), para a TV ser de fato adquirida e ambos melhorarem, r1 + r2 > g1 + g 2 = c . (28) Portanto, se a soma dos preços de reserva for maior do que o preço da TV é vantajoso para ambos comprarem o bem público. A soma das vontades de pagar deve ser pelo menos igual ao custo. Como os preços de reserva, r1 e r2 , dependem da riqueza, w1 e w2 , dependendo de como a riqueza esteja distribuída pode ocorrer tanto r1 + r2 > c ou r1 + r2 < c . A compra ou não do bem público dependerá da distribuição da riqueza. Por exemplo, se o consumidor 1 tiver toda a riqueza e gostar muito de TV e se o consumidor 2 for indiferente a TV, o consumidor 1 comprará sozinho e ocorrerá uma melhoria de Pareto. Mas se o consumidor 2 tiver toda a riqueza, como ele não se importa com TV, poderia não comprá-la. Descartando as hipóteses (8) e (9) e considerando preferências quase-lineares, a compra do bem público independerá da distribuição da riqueza: u1 ( x1 , G ) = x1 + v1 ( G ) (29) u2 ( x2 , G ) = x2 + v2 ( G ) . (30) Sem TV, G = 0 e a utilidade do bem público seria zero: v1 ( 0 ) = v2 ( 0 ) = 0 . (31) Sendo o consumidor 1 indiferente entre pagar ou não ((12) em (29)): u1 ( x1 , G ) = w1 − r1 + v1 (1) = w1 + v1 ( 0 ) . (32) (31) em (32): w1 − r1 + v1 (1) = w1 r1 = v1 (1) + w1 − w1 r1 = v1 (1) . (33) Sendo o consumidor 2 indiferente entre pagar ou não ((15) em (30)): u2 ( x2 , G ) = w2 − r2 + v2 (1) = w2 + v2 ( 0 ) . (34) (31) em (34): w2 − r2 + v2 (1) = w2 r2 = v2 (1) + w2 − w2 r2 = v2 (1) . (35) (33) e (35) não dependem de g1 e g 2 e, por (1) e (2), não dependem de w1 e w2 . Apesar disto, r1 e r2 ainda dependem indiretamente de w1 e w2 por (8) e (9). Comprar ou não o bem público Os consumidores 1 e 2 podem não revelar seus preços de reserva verdadeiros r1 e r2 . Mesmo que r1 > c (36) r2 > c , (37) e se a riqueza dos dois consumidores for suficiente para comprar a TV, o consumidor 1 pode mentir e dizer que r1 = 0 (38) e o consumidor 2 compraria a TV sozinho. Mas o consumidor 2 pode agir da mesma forma. Há incentivos para que um consumidor tente se aproveitar do outro. Supondo que w1 = w2 = 500 (39) r1 = r2 = 100 (40) c = g1 + g 2 = 150 . (41) e Neste caso, r1 + r2 > c (42) e vale a pena comprar a TV. Comprando sozinho, o consumidor 1 terá o benefício r1 = 100 e o custo g1 = c = 150 e, portanto, um prejuízo líquido igual a −50. Neste caso, o consumidor 2 terá o benefício r2 = 100 e o custo g 2 = 0 e, portanto, um benefício líquido de 100. O mesmo raciocínio se aplica se o consumidor 2 comprar sozinho. Se ninguém comprar, não haverá benefício. A matriz de resultados é dada a seguir. Em (0, 0) ocorre o equilíbrio de Nash com estratégias dominantes. Ninguém compra. Consumidor 2 Compra sozinho Não compra Compra sozinho −50, −50 −50, 100 Consumidor 1 Não compra 100, −50 0, 0 Compra do bem público Em vez de simplesmente pensarmos na decisão de comprar ou não ( G = 1 ou G = 0), podemos supor que ambos contribuam para comprar uma TV de qualidade G , tendo que gastar c ( G ) . Quanto maior a qualidade G , maior o custo c . A restrição orçamentária fica: x1 + x2 + c ( G ) = w1 + w2 . (43) Uma vez comprada a TV, chega-se à eficiência onde a utilidade de um consumidor não pode ser mais aumentada sem, com isso, reduzir a do outro. Maximizamos a utilidade do consumidor 1 sujeita ao fato de que a utilidade de 2 fique fixa em u2 e de que a restrição orçamentária seja obedecida: max u1 ( x1 , G ) (44) u2 ( x2 , G ) = u2 (45) x1 + x2 + c ( G ) = w1 + w2 . (43) x1 , x2 ,G tal que e O lagrangeano é L = u1 ( x1 , G ) − λ ( u2 ( x2 , G ) − u2 ) − µ ( x1 + x2 + c(G ) − w1 − w2 ) . Condições de primeira ordem: ∂L ∂u1 = −µ =0 ∂x1 ∂x1 (46) ∂L ∂u = −λ 2 − µ = 0 ∂x2 ∂x2 (47) ∂u ∂L ∂u1 ∂c = −λ 2 −µ = 0. ∂G ∂G ∂G ∂G (48) (48) pode ser reescrita como ∂u ∂c ∂u1 = −λ 2 ∂G ∂G ∂G ∂c 1 ∂u1 λ ∂u2 = − . ∂G µ ∂G µ ∂G µ (48′) (46) pode ser reescrita como µ= ∂u1 ∂x1 (46′) e (47) pode ser reescrita como ∂u2 ∂x2 ∂u µ =− 2 ∂x2 λ µ = −λ 1 (47′) 1 µ ∂u2 λ ∂x2 λ 1 =− . ∂ u2 µ ∂x2 =− (47″) (46′) e (47″) em (48′): ∂c 1 ∂u 1 = ∂u ⋅ 1 − − ∂u ∂G ∂x1 ∂G ∂x2 1 2 ∂c = ∂G ∂u1 ∂G ∂u1 ∂x1 + ∂u2 ∂G ∂u2 ∂G ∂u2 ∂x2 CM (G ) = TMS1 + TMS 2 . Como CM (G ) > 0 , (49) CM (G ) = TMS1 + TMS 2 . (49′) Logo, a soma dos valores absolutos das taxas marginais de substituição entre o bem privado e o bem público para os dois consumidores deve se igualar, no ótimo, ao custo marginal de se comprar uma unidade a mais do bem público. Isto é eficiente, já que as TMS medem a vontade marginal de se pagar por uma unidade extra do bem público e a soma das vontades marginais de pagar se iguala ao custo de se produzir a unidade a mais. Por exemplo, para CM (G ) = 1 TMS1 = 14 TMS 2 = 12 , a soma TMS1 + TMS 2 = 1 1 1+ 2 3 + = = 4 2 4 4 é diferente de CM (G ) = 44 . Isto deve ser ineficiente de acordo com (49′), o que significa que se pode melhorar a situação dos dois consumidores. Se o preço do bem privado for igualado ao preço do bem público em $1 por unidade, TMS1 = 14 significa que o consumidor 1 aceitaria $ 14 a mais do bem privado por $1 de redução do bem público. E TMS 2 = 1 2 significa que o consumidor 2 aceitaria $ 12 a mais do bem privado por $1 de redução do bem público. Suponha que o bem público seja reduzido de uma unidade e que, portanto, economizamos um dólar. Para compensar, oferecemos os 34 de dólar que os consumidores desejam e sobra 14 de dólar. Se este 14 de dólar for repartido entre os consumidores, ambos melhorariam sua situação, o que demonstra ineficiência. Portanto, se a soma das vontades marginais de se pagar pelo bem público for maior do que o custo marginal de produzi-lo, será apropriado fornecer mais do bem público. A condição de eficiência para os bens privados é que a TMS de cada consumidor se iguale ao custo marginal, enquanto que para o bem público a condição de eficiência é que a soma das TMS de cada consumidor se iguale ao custo marginal. Embora cada consumidor possa consumir diferentes quantidades do bem privado, cada consumidor atribui ao bem o mesmo valor na margem; caso contrário, eles se engajariam na troca. Porém, cada consumidor deve consumir a mesma quantidade do bem público, embora cada um atribua um valor diferente para ele na margem. Compra de bens públicos com preferências quase-lineares No caso especial em que os consumidores têm preferências quase-lineares: ui ( xi , G ) = xi + vi ( G ) . O problema agora é (50) max x1 + v1 ( G ) (51) x2 + v2 ( G ) = u2 (52) x1 , x2 ,G tal que e x1 + x2 + c ( G ) = w1 + w2 . (43) Lagrangeano: L = x1 + v1 (G ) − λ ( x2 + v2 (G ) − u2 ) − µ ( x1 + x2 + c(G ) − w1 − w2 ) . (53) Condições de primeira ordem: ∂L = 1− µ = 0 ∂x1 µ =1 (54) ∂L = −λ − µ = 0 ∂x2 λ = −µ . (55) (54) e (55): λ = −1 (55′) ∂L ∂v1 ∂v ∂c = −λ 2 −µ =0 ∂G ∂G ∂G ∂G ∂v ∂c ∂v1 µ = −λ 2 . ∂G ∂G ∂G (56) (54) e (55′) em (56): ∂c ∂v1 ∂v2 = + ∂G ∂G ∂G (57) ou, no caso discreto, CM (G ) = ∆v1 (G ) ∆v2 (G ) + . ∆G ∆G (58) Portanto, G* pode ser encontrado independentemente de x1 e x2 , que não entram na expressão (58). Em geral, a quantidade ótima do bem público G * é diferente para diferentes alocações do bem privado x1 e x2 (equação (49)). Com preferências quase-lineares, há um único nível eficiente do bem público G * , já que este independe de x1 e x2 (equação (58)). Neste caso, todas as alocações ( x1* , x2* , G * ) eficientes de Pareto são encontradas apenas redistribuindo x1* e x2* , já que G * é único. Poluição como mal público Como no caso do bem público de consumo, podemos encontrar a provisão eficiente de um bem público de produção. Retomemos o exemplo da produção de aço, peixe e poluição. Poluição será um mal público se houver duas empresas de pesca, além da siderúrgica que produz aço e poluição. Podemos então achar a quantidade de poluição eficiente de Pareto. A quantidade eficiente é aquela em que o custo externo da poluição é internalizado. Para que isso seja possível, temos que considerar a maximização da soma dos lucros das três empresas (como se houvesse uma fusão). Isto significa também que estamos minimizando o custo social total da poluição. O custo cs da siderúrgica é cs ( s , x ) , (59) onde s é a quantidade de aço produzida e x é a quantidade de poluição gerada. O custo da primeira empresa de pesca c1f é c1f ( f1 , x) , (60) onde f1 é a quantidade de peixes pescada pela primeira empresa, e o custo da segunda empresa de pesca é c 2f ( f 2 , x) . (61) A soma dos lucros das três empresas é maximizada fazendo max ps s + p f f1 + p f f 2 − cs ( s, x) − c1f ( f1 , x) − c 2f ( f 2 , x) . s , f1 , f 2 , x (62) Derivando e igualando a zero em relação a cada variável de escolha, temos, em relação a s , ps − cs′ = 0 ps = CM ( s ) . (63) Em relação a f1 : p f − c1f ′ = 0 p f = CM 1 ( f ) . (64) Em relação a f 2 : p f − c 2f ′ = 0 p f = CM 2 ( f ) . (65) As condições (63), (64) e (65) são as mesmas que aquelas do Capítulo 34. A novidade está na última condição de primeira ordem. Derivando-se em relação a x : −cs′ − c1f ′ − c 2f ′ = 0 cs′ + c1f ′ + c 2f ′ = 0 ou CM s ( x* ) + CM f1 ( x* ) + CM f2 ( x* ) = 0 (66) CM f1 ( x* ) + CM f2 ( x* ) = −CM s ( x* ) . (66′) A quantidade eficiente de poluição x* é aquela para a qual a soma dos custos marginais da poluição para as empresas de pesca se iguala ao benefício marginal para a empresa siderúrgica. Free riding na compra do bem público O consumidor 1 possui w1 , fica com a fração x1 para consumo do bem privado e tira a fração g1 para contribuir com a compra do bem público. O consumidor 2 tem w2 e usa x2 para comprar o bem privado e g 2 para contribuir com a compra do bem público. O provimento do bem público custa, por hipótese, c(G ) = G . (67) Logo, o custo marginal de prover uma unidade a mais do bem público é, derivando (67) em relação a G : c′(G ) = 1 CM (G ) = 1 . (68) Portanto, o custo marginal é constante e igual a 1. A quantidade total do bem público a ser provida precisa ser G = g1 + g 2 . A função utilidade do consumidor 1 é (69) u1 = u1 ( x1 , G ) . (70) (69) em (70): u1 = u1 ( x1 , g1 + g 2 ) . (70′) Analogamente, a função utilidade do consumidor 2 é u2 = u2 ( x2 , G ) = u2 ( x2 , g1 + g 2 ) . (71) O consumidor 1 maximiza sua utilidade fazendo a previsão de que a contribuição do consumidor 2 para a compra do bem público será g 2 : max u1 ( x1 , g1 + g 2 ) x1 , g1 (72) tal que x1 + g1 = w1 . (1) Lagrangeano: L = u1 ( x1 , g1 + g 2 ) − λ ( x1 + g1 − w1 ) . (73) Condições de primeira ordem: ∂L ∂u1 = −λ = 0 ∂x1 ∂x1 ∂u1 =λ ∂x1 ∂L ∂u1 = −λ = 0 ∂g1 ∂g1 ∂u1 =λ ∂g1 (74) (75) Dividindo (76) por (75): ∂u1 ∂g1 ∂u1 ∂x1 λ =1 λ (76) TMS1 = 1 . (77) = ou Analogamente, inferimos que TMS 2 = 1 . (78) (77) e (78): TMS1 = TMS 2 = 1 . (79) Supomos agora que g1 ≥ 0 (80) g2 ≥ 0 , (81) e o que significa que nenhum consumidor pode reduzir a quantidade do bem público a ser comprada: pode apenas aumentá-la ou deixá-la inalterada. Dado que cada consumidor maximiza sua utilidade supondo conhecer a contribuição do outro ( g1 e g 2 ), temos um equilíbrio de Nash. Cada consumidor pode não contribuir se a contribuição do outro for suficiente para comprar o bem público. Free riding ocorre no equilíbrio de Nash, que é ineficiente de Pareto. Por exemplo, se a contribuição do consumidor 1 for suficiente, g1 = G (82) e, por (69), g2 = 0 . (83) Por (1) e (82), a riqueza do consumidor 1 fica sendo x1 + g1 = x1 + G = w1 (84) e, analogamente, a riqueza do consumidor 2 fica sendo x2 + g 2 = x2 + 0 = w2 x2 = w2 . (85) O consumidor 2 pega carona com a contribuição do consumidor 1 para a compra do bem público (Figura 1). Se o consumidor 1 contribui e o consumidor 2 não contribui, mas poderia ter contribuído, a quantidade do bem público no equilíbrio de Nash é ineficiente, abaixo da que seria socialmente eficiente. Free riding gera ineficiência. Votação Vimos que, para que haja eficiência de Pareto, não podem existir externalidades de consumo: a utilidade de um consumidor não pode ser afetada pelo consumo de outro. Como todos consomem a mesma quantidade do bem público, as utilidades dos consumidores são mutuamente dependentes. Podem, então, ocorrer externalidades de consumo e o mercado competitivo não necessariamente provê a quantidade eficiente do bem público. Descartando-se o mecanismo de comando, resta apelar para o sistema de votação para a escolha das quantidades do bem público. Infelizmente, o mecanismo de votação também não garante a escolha da quantidade eficiente, já que está sujeito ao paradoxo do voto (Capítulo 33). Ao escolher entre três níveis de gasto com defesa pública, A, B e C, é possível que a maioria prefira A a B, B a C e C a A. As preferências sociais não são transitivas. Porém, se o consumidor 1 levar em conta sua utilidade líquida do bem público (entre o gasto com o bem público G e a sua contribuição g1 ) e todos os outros consumidores também considerarem suas utilidades líquidas, basta que o formato das preferências seja como na Figura 2a: uma parábola de único pico. Isto significa que a utilidade líquida com o bem público inicialmente aumenta por causa do benefício gerado pelo bem público, chega ao ponto mais preferido e depois cai devido aos custos de se prover o bem público. Com preferências individuais com esse formato, as preferências sociais não exibirão o paradoxo do voto. Porém, o paradoxo continua se as preferências forem como as desenhadas na Figura 2b. O gasto escolhido G * será aquele para o qual metade dos consumidores quer gastar mais e a outra metade quer gastar menos. Mas isso não informa quão mais do bem eles querem. Já que é isto o que a noção de eficiência captura, mesmo que a escolha de G* com preferências sociais de único pico não sejam intransitivas, a escolha por votação continua ineficiente. Além disso, mesmo que os consumidores tenham preferências de único pico, eles ainda possuem o incentivo de não votar em suas preferências verdadeiras para manipular o resultado em seu favor. Imposto de Clarke Os consumidores poderão revelar o valor verdadeiro que atribuem ao bem público através do mecanismo de mercado se as preferências forem quase-lineares. Como vimos, com preferências quase-lineares há um nível ótimo de bem público e a questão é encontrá-lo. Vamos supor que o problema seja provê-lo ou não. Uma associação de moradores pensa em iluminar uma rua de um condomínio. A compra do material custa $100. Cada consumidor atribui um preço de reserva diferente ao bem público: vi . Como vimos, vale a pena comprar o bem público se n ∑v i =1 i ≥ $100 . (86) Pedindo aos consumidores que informem seus vi , eles possuem incentivos para mentir, já que podem pegar carona com os outros: se outros pagarem o suficiente, por que contribuir? Um mecanismo capaz de evitar este problema é decidir que, uma vez que se decida que a rua será iluminada, cada morador paga uma quantia predeterminada ci . Depois, cada consumidor poderá informar seu vi , quando poderemos conhecer o valor líquido ni = vi − ci . (87) Depois somamos todos os ni para ver se o total é positivo, o que teria justificado a escolha de comprar o bem público. Há ainda um problema, pois cada consumidor pode exagerar no valor informado de vi . Os consumidores que quiserem que a compra do bem público seja feita podem aumentar em muito seu valor verdadeiro de vi , já que isto não afeta seu pagamento ci , faz com que a soma dos ni fique positiva e decida-se comprar o bem público. Apenas os consumidores que conseguem alterar a soma total dos ni importam: os pivôs. Precisamos, então, de um mecanismo para que os pivôs tenham incentivos para não exagerar vi e revelem seu preço de reserva verdadeiro. Supondo que o consumidor j seja o pivô, se a soma de todos os ni , com i ≠ j , for positiva (decisão de iluminar a rua) e, por causa de n j decida-se não iluminar, ∑ ni + n j < 0 , então o consumidor j causa o dano social de H j = ∑ ni > 0 . (88) i≠ j A solução seria cobrar um imposto (de Clarke) do consumidor pivô. No exemplo em que o pivô alterou a decisão de provisão de bem público (iluminar a rua) para não provisão (não iluminar), o imposto de Clarke seria: H j = ∑ si , (89) i≠ j onde si é o valor líquido informado por cada consumidor, que pode ou não ser o valor líquido verdadeiro ni . Se o pivô tivesse alterado a decisão social de não provisão para provisão, o imposto de Clarke seria: H j = −∑ si . (90) i≠ j O imposto não poderia ser distribuído para os outros moradores, já que isso alteraria seu comportamento. Deveria ser pago ao síndico (governo) e não importa como o síndico venha a usar o dinheiro. Outro exemplo: três estudantes de uma república, 1, 2 e 3, precisam decidir se compram uma TV para a sala, que custa $300. Cada um concorda em pagar antecipadamente $100, que seria usado no caso de se decidir comprar o bem público. Os preços de reserva verdadeiros dos consumidores 1 e 2 são $50 para cada e o do consumidor 3 é $250. Os dados estão na tabela a seguir. Consumidor ci vi ni Hj 1 2 3 100 100 100 50 50 250 −50 −50 150 0 0 100 A soma dos vi é 350, acima do custo de 300: comprar a TV gera uma melhoria de Pareto. Mas, se votassem, ganharia a escolha de não comprá-la. Os consumidores 1 e 2 votariam em não comprar ( n1 e n2 são negativos). O imposto de Clarke possibilita que a escolha ótima de Pareto seja feita, que é comprar a TV. O imposto é cobrado do pivô. Considerando o consumidor 1, somando n2 e n3 (= −50 + 150) dá 100 e a escolha seria comprar, diferente do que o consumidor 1 deseja. Sozinho, ele não pode influenciar a escolha. Portanto, o consumidor 1 não é pivô, e seu imposto será zero. Exagerando seu preço de reserva, ele teria que reportar s1 = −100 ou abaixo, para ultrapassar 100, ni ficar negativo e a TV deixar de ser comprada. Mas, se ele fizer isso, torna-se pivô e o imposto de Clarke para ele seria agora 100, ou seja, n2 + n3 (equação (88)). Ele estava querendo ganhar 50, ou seja, s1 − n1 = 100 − 50, mas terá que pagar 100 de imposto. No final, ele acabaria perdendo 50. Assim, não vale a pena exagerar. O mesmo raciocínio se aplica ao consumidor 2, já que os dados são os mesmos. Para o consumidor 3, somando n1 e n2 (= −50 − 50) dá −100. Como (n3 = 150) > (n1 + n2 = 100) , o consumidor 3 é pivô, pois ni fica positivo por sua causa e a TV seria comprada. Por (90), ele deve pagar o imposto de Clarke de 100. Como n3 = 150, menos 100 de imposto ele fica com 50 e não vale a pena exagerar v3 . Com o imposto de Clarke, a TV seria comprada e ninguém teria incentivo para exagerar vi . Porém, o imposto de Clarke somente funciona com preferências quase-lineares, para as quais a riqueza de cada consumidor não influencia a demanda pelo bem público e há um único nível ótimo do bem público. O imposto de Clarke garante que o nível de gasto com o bem público seja ótimo, mas o consumo privado é reduzido quando do pagamento do imposto. O resultado é, então, Pareto-ineficiente, já que o consumo privado poderia ser maior caso não houvesse o imposto. O imposto de Clarke garante que, se todos puderem ter sua situação melhorada com o fornecimento do bem público, então este será fornecido. Mas isto não significa que todos terão sua situação melhorada. Alguns perdem (consumidores 1 e 2) para que o bem público seja fornecido. © Sergio Da Silva 2010 sergiodasilva.com Informação Assimétrica Hal R. Varian Intermediate Microeconomics, 8th edition Capítulo 37 Se consumidores e vendedores tiverem a mesma informação sobre a qualidade do bem, uma melhor qualidade seria corretamente informada por um preço mais alto. Mas se um lado do mercado for mais informado do que o outro, os preços não informarão corretamente a qualidade. Assimetria de informação impede o funcionamento eficiente do mercado. Mercado de carros usados Os vendedores de carros usados conhecem melhor a qualidade do produto do que os compradores. Supomos que existem 100 vendedores de 100 carros usados e 100 potenciais compradores. Todos sabem que 50 carros estão em boas condições e 50 são ruins. Mas apenas os vendedores sabem quais são exatamente os bons e quais são os ruins. Quem tem carro ruim quer vender por $1000 e quem tem carro bom quer vender por $2000. Os preços de reserva dos compradores são maiores: querem pagar até $1200 por um carro ruim e $2400 por um carro bom. Se não houvesse informação assimétrica, os carros ruins seriam vendidos por preços entre $1000 e $1200 e os carros bons seriam vendidos por preços entre $2000 e $2400. Mas se os consumidores precisarem adivinhar quais dos carros são bons ou ruins, resta a eles pensar que as chances são iguais. Eles então pagariam por um carro de qualidade desconhecida o valor esperado de $1800: 1 1 VE = 1200 + 2400 = 1800 . 2 2 (1) Mas por $1800 nenhum vendedor de carro bom quer vender: o preço mínimo para eles é $2000. Neste caso, há uma externalidade negativa: as vendas dos carros ruins reduzem o valor médio que os consumidores querem pagar e reduzem as vendas dos carros bons. Escolha da qualidade Os consumidores querem comprar guarda-chuvas, mas não conhecem sua qualidade. O seu preço de reserva é $14 para os de boa qualidade e $8 para os de má qualidade. Os vendedores em concorrência pura têm um custo marginal de $11.50 para os dois tipos de guarda-chuva. Como os consumidores não sabem que fração q de guarda-chuvas será de boa qualidade, o preço médio que eles gostariam de pagar será: p = 14q + 8(1 − q) . (2) Os vendedores produzem se esse preço for maior ou igual ao custo de $11.50: p = 14q + 8(1 − q) ≥ 11.50 . (3) O menor valor de q que faz com que os consumidores queiram pagar exatamente $11.50 é: p = 14q + 8(1 − q) = 11.50 14q + 8 − 8q = 11.50 6q = 11.50 − 8 6q = 3.50 3.50 q= . 6 (3′) (4) Multiplicando o numerador e o denominador por 2: q= 7 . 12 (4′) Portanto, se a fração de guarda-chuvas de boa qualidade for 127 , os consumidores estariam dispostos a pagar exatamente p = $11.50. Como $11.50 está abaixo do preço de reserva de $14, eles aceitariam pagar qualquer valor entre $11.50 e $14 para adquirir guarda-chuvas de qualidade igual ou superior a 127 . O equilíbrio ocorrerá no intervalo q = 127 ,1 . (5) Como em concorrência pura os vendedores podem apenas vender por p = CM = 11.50 (6) se, por exemplo, apenas guarda-chuvas de boa qualidade forem produzidos ( q = 1 e p = $11.50), o excedente do consumidor será máximo: $2.50 (=$14 − $11.50) (Figura 1). Se os custos marginais forem diferentes, podemos supor que, para produzir guardachuva de boa qualidade, CM q = 11.50 (7) e, para produzir guarda-chuva de má qualidade, CM 1− q = 11 . (8) Um pequeno produtor não consegue afetar nem o preço p nem a qualidade q . Ele assim prefere produzir guarda-chuvas de má-qualidade de custo marginal menor. Se todos os outros pequenos produtores raciocinarem da mesma forma, todos produzirão guarda-chuva de má qualidade ao preço p = CM 1− q = 11 . (9) Porém, como os consumidores pagam no máximo $8 por guarda-chuvas de má qualidade, nenhum item seria vendido. Há seleção adversa porque, na presença de informação assimétrica, o bem de má qualidade expulsa do mercado o bem de boa qualidade até destruir o próprio mercado. Seleção adversa Uma companhia de seguros pensa em oferecer seguro contra roubo de bicicleta. Através de uma pesquisa de mercado, ela descobre que a incidência de roubo é alta em uma área e baixa em outra. Se oferecer o seguro com base na taxa de roubo média, a firma fica em situação difícil porque quem vai acabar comprando são os consumidores da área de alta ocorrência de roubo, e estes vão acabar fazendo os pedidos de pagamento do seguro. Baseando-se na taxa média de furtos, a companhia não fará uma seleção imparcial de clientes, mas sim uma seleção adversa. Se a companhia oferecer o seguro com base na taxa de roubo da área de maior risco, a situação piora: o preço será muito alto para os consumidores de menor risco, que não comprarão a apólice e sairão do mercado. Na seleção adversa há uma externalidade de consumo, pois as compras dos consumidores de alto risco afetam as compras dos consumidores de menor risco, expulsando estes últimos do mercado. Para impedirmos a seleção adversa, todos os consumidores precisam inicialmente voltar ao mercado. Obrigando a companhia a cobrar o seguro com base na taxa média, que é menor do que o seguro baseado na taxa de maior risco, os consumidores de baixo risco retornariam ao mercado e os consumidores de alto risco comprariam o seguro a uma taxa menor. O governo então interferiria para garantir essa melhoria de Pareto e socorreria a companhia em caso de inadimplência. Perigo moral Se todos tiverem a mesma probabilidade de roubo no mercado de seguros de bicicleta, não surgirá o problema de seleção adversa. Mas a própria probabilidade de roubo pode ser afetada pelas ações dos donos das bicicletas: fazendo o seguro, um consumidor toma menos cuidados do que se não fizesse o seguro. Sem seguro, cada consumidor terá que enfrentar os custos de suas atitudes e vai querer investir em “tomar cuidado” até que o benefício marginal de mais cuidado se iguale ao custo marginal. Com seguro completo, a companhia reembolsa completamente o valor da bicicleta e o consumidor, racionalmente, não terá nenhum incentivo para investir em tomar cuidado: ocorrerá o perigo moral. Em suma, com pouco seguro, os consumidores enfrentam demasiados riscos; com muito seguro, tomam pouco cuidado. Por essa razão, sem conhecer a quantidade de cuidado que cada consumidor toma, as companhias costumam não vender o seguro completo. De fato, a maior parte dos seguros inclui uma franquia, que o segurado paga ao solicitar o pagamento do seguro. Mas o consumidor desejaria comprar o seguro completo. Há ineficiência porque a propensão marginal a pagar não se iguala à propensão marginal a vender, já que ocorre racionamento da parte da empresa. Enquanto a seleção adversa é um problema de informação escondida, em que um lado do mercado não pode observar a qualidade dos bens do outro, o perigo moral é um problema de ação escondida: um lado do mercado não pode observar as ações do outro. No caso de perigo moral, se o governo não puder monitorar o quanto os consumidores tomam cuidado, ele não poderá melhorar a situação, a não ser que uma determinada quantidade de cuidado seja tornada obrigatória por lei. Sinalização No mercado de carros usados com informação assimétrica, os vendedores de carros bons podem querer sinalizar que seus carros são os bons, e não os ruins, evitando problemas de seleção adversa. Um sinal poderia ser a garantia de que eles se comprometem a pagar certa quantia se o carro der defeito. Somente donos de carros bons podem se dar ao luxo de oferecer garantias, e os compradores sabem disso. No mercado de trabalho, o problema da seleção adversa também surge e os trabalhadores mais produtivos podem querer demonstrar que são, de fato, mais produtivos. A produtividade marginal dos trabalhadores produtivos é a2 e a dos menos produtivos é a1 . Logo, a1 < a2 (10) ou a2 − a1 > 0 . (10′) Uma fração b dos trabalhadores é mais produtiva e a fração 1 − b é menos produtiva. O mercado de trabalho é competitivo e a função produção é linear: y = a1 L1 + a2 L2 , (11) onde y é a produção total e Li é a quantidade de trabalhadores do tipo i . Se a qualidade dos trabalhadores pudesse ser observada, as empresas pagariam salários iguais às produtividades marginais: w1 = a1 (12) w2 = a2 (13) e e não haveria seleção adversa. Porém, se as empresas não puderem observar as produtividades marginais, o melhor que elas podem fazer é pagar o salário médio: w = (1 − b)a1 + ba2 . (14) Se tanto os trabalhadores mais produtivos como os menos produtivos concordassem em receber esse salário médio w não haveria problemas de seleção adversa. Mas como w < w2 , os trabalhadores mais produtivos podem não concordar com w . Neste caso, haveria seleção adversa, pois eles sairiam do mercado de trabalho. Os trabalhadores mais produtivos podem querer sinalizar que são, de fato, mais produtivos (para receber w2 ) através do sinal de anos de escolaridade. O nível de escolaridade atingido pelos trabalhadores menos produtivos é e1 e o dos mais produtivos é e2 . O custo de se educar é c1e1 para os menos produtivos e c2 e2 para os mais produtivos. Este custo inclui não apenas o custo de ir para a escola, mas também o custo do esforço e o custo de oportunidade diante de escolhas alternativas. Supomos que o custo marginal (igual ao custo médio) seja maior para os trabalhadores menos produtivos: c1 > c2 . (15) Por simplicidade, supomos também que o nível de escolaridade não afeta a produtividade e que serve apenas para sinalizá-la. Assim, os trabalhadores precisam decidir que nível de escolaridade e desejam e as empresas precisam resolver quanto pagar aos trabalhadores com diferentes níveis de escolaridade e . Multiplicando (15) por (10′): c1 (a2 − a1 ) > c2 (a2 − a1 ) a2 − a1 a2 − a1 > c2 c1 a2 − a1 a2 − a1 < . c1 c2 (16) O nível de escolaridade e* que precisa satisfazer (16) deve estar no intervalo a2 − a1 a −a < e* < 2 1 . c1 c2 (17) Note que a2 − a1 fornece o benefício do aumento de salário para os dois tipos de trabalhadores. Se o grupo menos produtivo estiver pensando em escolher e* , seu custo será c1e* . O benefício dessa escolha será maior do que o custo se a2 − a1 > c1e* a2 − a1 > e* . c1 (18) Mas isto contradiz (17). Então, para o grupo menos produtivo, o custo de escolher e* supera o benefício. Por outro lado, para o grupo mais produtivo, escolher e* tem custo c2 e* . O benefício supera o custo se a2 − a1 > c2 e* a2 − a1 > e* , c2 (19) que é validado por (17). Assim, apenas os trabalhadores mais produtivos são capazes de escolher e* . As empresas então pagam aos trabalhadores com nível de escolaridade e* o salário w2 . O equilíbrio em (17) permite, através da escolha diferente, a separação dos trabalhadores dos dois tipos (separating equilibrium). Como os trabalhadores mais produtivos pagam para sinalizar sua produtividade sem aumentá-la, o mesmo produto anterior é produzido. A aquisição de sinal é um desperdício e, assim, o equilíbrio de sinalização separating é socialmente ineficiente. A origem dessa ineficiência é uma externalidade negativa. Se os trabalhadores mais produtivos recebessem o salário médio w menor do que w2 , isto ocorreria devido à existência de trabalhadores menos produtivos. O investimento em sinalização oferece aos mais produtivos um benefício privado, mas nenhum benefício social. Se fizéssemos a hipótese (menos realista) contrária a (15): c1 < c2 , (20) o grupo mais produtivo não escolheria e* , não ocorreria a sinalização e ele aceitaria o salário médio w : os dois grupos fariam a mesma escolha (pooling equilibrium). Mas se (20) fosse verdadeira, o grupo 1 é que seria mais produtivo. Incentivos A quantidade produzida da empresa y depende do esforço x feito pelo trabalhador: y = f ( x) . (21) Sendo o preço p = 1, (22) o valor p ⋅ y do produto se reduz a y . Se o trabalhador (agente) produzir um valor do produto de y dólares, o dono da empresa (principal) paga a ele s ( y ) . O principal maximiza lucro fazendo max y − s ( y ) . s (23) (21) em (23): max f ( x) − s ( f ( x) ) . x (24) Sendo c( x) o custo de se esforçar do trabalhador, onde tanto o custo total como o custo marginal aumentam quando o esforço aumenta, a utilidade do trabalhador será u = s( y ) − c( x) . (25) (21) em (25): u = s ( f ( x) ) − c ( x ) . (26) O trabalhador também recebe utilidade ν de outras tarefas ou de lazer. Por hipótese, v=u. (27) Para que o trabalhador aceite trabalhar em determinada empresa em vez de realizar outras tarefas ou ter lazer: s ( f ( x) ) − c ( x ) ≥ u . (28) Se ele apenas satisfizer a “restrição de participação” (28), então s ( f ( x) ) − c ( x ) = u . (29) O problema agora para o principal é max f ( x) − s ( f ( x) ) x (24) sujeito a s ( f ( x) ) − c( x) = u . (29) (29) em (24): max f ( x) − c( x) − u (30) f ′ − c′ = 0 f ′ = c′ PM ( x* ) = CM ( x* ) . (31) x Para que o trabalhador se esforce em exatamente x* , a sua utilidade ao escolher o esforço x* não pode ser menor do que qualquer outro nível de esforço x : s ( f ( x* ) ) − c( x* ) ≥ s ( f ( x) ) − c( x) , ∀x . (32) Se o produto vier da terra, o proprietário (principal) poderia alugar a terra ao trabalhador (agente) pelo aluguel R . Um esquema de incentivo útil seria deixar ao trabalhador todo o produto acima do aluguel: s ( f ( x) ) = f ( x) − R . (33) Por (26), o trabalhador maximiza max s ( f ( x) ) − c( x) . (34) (33) em (34): max f ( x) − R − c( x) x (35) f ′ − c′ = 0 f ′ = c′ PM ( x* ) = CM ( x* ) . (31) Esta é exatamente a condição que o principal deseja. O aluguel a ser cobrado pode ser encontrado substituindo (33) em (29): f ( x) − R − c( x) = u . (36) Para x* , f ( x* ) − c ( x * ) − R * = u R * = f ( x* ) − c* − u . (37) Outro esquema seria o proprietário da terra pagar ao trabalhador um salário w dependendo do seu esforço x, juntamente com uma quantia fixa K : s ( f ( x) ) = wx + K . (38) Na escolha ótima x* , w = PM ( x* ) . (39) Por (38) em (34), o trabalhador maximiza: max wx + K − c( x) (40) w − c′ = 0 w = CM ( x* ) . (41) x (39) em (41): PM ( x* ) = CM ( x* ) . (31) Portanto, a escolha ótima do trabalhador coincide com a do proprietário. Um terceiro esquema de incentivo seria o proprietário pagar ao trabalhador B* s ( f ( x) ) = 0 se x = x* se x ≠ x* (42) Na escolha ótima x* , (29) em (42): B* = u + c ( x* ) . (43) Fora da escolha ótima, a utilidade para o trabalhador seria negativa. De fato, (29) em (42): u + c( x) = 0 u = −c ( x ) . (44) Um exemplo de esquema de incentivo não-ótimo seria a parceria, onde tanto proprietário como trabalhador ficam com a mesma percentagem fixa do produto. A cota do trabalhador seria, por exemplo, s ( x) = α f ( x) + F , (45) onde 0 < α < 1 e F é uma constante. Assim, max α f ( x) + F − c( x) x α f ′ − c′ = 0 α PM ( xˆ ) = CM ( xˆ ) , (46) Que não é a condição de eficiência (31). Logo, a parceria é um esquema de incentivos que não é ótimo. Nos três casos em que o esquema de incentivos é ótimo e o esforço é observado pelo proprietário, o trabalhador iguala benefício marginal a custo marginal. O trabalhador escolhe o esforço a fazer dada a produção. No caso do esquema do aluguel, o trabalhador fica com toda a produção remanescente depois de pagar o aluguel ao proprietário. Com informação assimétrica, o trabalhador pode escolher seu nível de esforço, mas o proprietário não pode observá-lo de maneira perfeita. O proprietário precisa inferir que esforço foi feito a partir da produção observada. Se a produção tiver um componente aleatório, o proprietário irá repassar todo o risco para o trabalhador. Mas como o trabalhador tem mais chance de ser mais avesso ao risco do que o proprietário, possivelmente ele irá abrir mão de ganhos residuais a fim de obter um fluxo de renda menos arriscado. Assim, os três esquemas de incentivos apresentados acima se tornam ineficientes, enquanto o esquema de parceria poderia até mesmo vir a ser ótimo. © Sergio Da Silva 2010 sergiodasilva.com