Aula 14 Introdução ao Stata 05 de julho de 2013 Modelos com dados ordenados • A variável dependente pode cair em múltiplas categorias exclusivas mas com uma natureza ordenada. • A distância entre as categorias é desconhecida. • Exemplos: pesquisas de opinião. • Modelos probit ou logit ordenados. Modelos com dados ordenados • Resultado de yi é uma das m alternativas. yi j • • • • J = 1.... m alternativas que são ordenadas. Modelo de variável latente: Para uma única observação i: Irei escolher m se: Exemplo • Você considera que uma mãe trabalhar garante uma relação segura entre mãe e filho? – (SD) discorda totalmente – (D) discorda – (A) Concorda – (SA) Concorda totalmente • Variável latente: propensão das mães em concordar que mães que trabalham são boas mães. Exemplo Exemplo • Probabilidade de y ser igual a m: Exemplo: estado de saúde • Y=1 ruim • Y=2 bom • Y=3 excelente Comando ologit Number of obs LR chi2(3) Prob > chi2 Pseudo R2 Ordered logistic regression Log likelihood = -4769.8525 Std. Err. hlthstat Coef. age linc ndisease -.0292944 .2836537 -.0549905 .001681 .0231098 .0040692 /cut1 /cut2 -1.39598 .9513097 .2061301 .2054301 z -17.43 12.27 -13.51 P>|z| 0.000 0.000 0.000 = = = = 5574 740.39 0.0000 0.0720 [95% Conf. Interval] -.0325891 .2383593 -.0629661 -.0259996 .3289481 -.047015 -1.799987 .5486741 -.9919722 1.353945 Significativos, categorias não podem ser colapsadas. Efeito marginal • Qual efeito de mudar a variável xr sobre a probabilidade de escolher a alternativa j: Marginal effects after ologit y = Pr(hlthstat==3) (predict, outcome(3)) = .53747616 variable dy/dx age linc ndisease -.0072824 .070515 -.0136704 Std. Err. .00042 .00575 .00101 z -17.43 12.26 -13.50 P>|z| [ 95% C.I. ] 0.000 0.000 0.000 -.008101 -.006463 .05924 .08179 -.015655 -.011686 X 25.5761 8.69693 11.2053 . margeff , predict Average partial effects after ologit y = Pr(hlthstat) variable Coef. Std. Err. z P>|z| [95% Conf. Interval] poor_or_fair age linc ndisease .002303 -.0222998 .0043232 .0001506 .0018975 .0003376 15.29 -11.75 12.81 0.000 0.000 0.000 .0020078 -.0260188 .0036615 .0025982 -.0185808 .0049848 .0041851 -.0405234 .0078561 .0002214 .0032951 .0005773 18.90 -12.30 13.61 0.000 0.000 0.000 .0037511 -.0469816 .0067246 .004619 -.0340651 .0089875 -.0064881 .0628232 -.0121792 .0003379 .0049561 .0008643 -19.20 12.68 -14.09 0.000 0.000 0.000 -.0071503 .0531094 -.0138732 -.0058258 .072537 -.0104852 good age linc ndisease excellent age linc ndisease Modelo de regressão censurada • A variável y é censurada, somente observamos seus valores acima ou abaixo de um determinado limite. • Gastos iguais a zero, o dado é censurado à esquerda abaixo de um determinado limite L. Exemplos Soluções de canto 1. Quantidade de dinheiro doado para caridade: muitas pessoas não fazem este tipo de doação. Uma parcela expressiva dos dados será igual a zero. 2. Horas trabalhadas pelas mulheres: muitas mulheres não trabalham. Uma fração significativa tem horas de trabalho igual a zero. Modelo Tobit é usado para modelar estas situações 12 Exemplo: oferta de trabalho feminina • Suponha que queremos estimar o efeito da educação x nas horas trabalhadas de mulheres casadas y. • O modelo tobit é escrito a partir de uma variável latente y*, que é parcialmente observada pelo pesquisador: y*=β0+β1x+u e u~N(0,σ2) 13 Exemplo: oferta de trabalho feminina • Se y* é positiva, y* é igual ao total de horas trabalhadas : y. • Se y* é negativo, as horas trabalhadas, y, se igualam a zero. • Por hipótese, u é normalmente distribuído. 14 Exemplo: oferta de trabalho feminina O modelo pode ser escrito como: Horas trabalhadas yi*=β0+β1xi+ui …………………..(1) tal que yi=yi* if yi*>0 yi=0 if yi*≤0 O subscrito i denota a i-ésima observação. A equação (1) e satisfaz as hipóteses do modelo 2 ui~N(0,σ ) linear clássico. 15 y*, y Ilustração gráfica Quando y* é negativo, horas trabalhadas são iguais a zero. Educ 16 Exemplo: oferta de trabalho feminina • A variável, y*, pode ser negativa, mas se negativa, horas trabalhadas são iguais a zero. • O modelo Tobit considera o fato de que muitas mulheres não trabalham, logo, horas trabalhadas são iguais a zero para muitas. 17 Modelo Tobit • Censura à esquerda • Censura à direita MQO e Tobit • As estimativas dos coeficientes Tobit tem o mesmo sinal dos estimados por MQO. • As estimativas Tobit são maiores que MQO contudo isto não é o efeito marginal direto pois dependerá do valor de x. • Temos que considerar as estimativas dos efeitos marginais. • Com relação à significância, os resultados são bem parecidos. 19 Efeitos parciais(efeitos marginais) • Os parâmetros estimados βj medem o efeito de xj em y*. • Contudo, na solução de canto, estamos interessados no efeito de xj sobre y. • Devemos estimar o efeito sobre o valor esperado de y. 20 Efeitos parciais(efeitos marginais) • A esperança de y dado x é dada por: zero E(y|x)=P(y>0)E(y|y>0,x) +P(y=0)E(0|y=0,x) =P(y>0)E(y|y>0,x) …………..(1) 21 Efeito marginal • Logo, existem duas formas de computar o efeito parcial de x sobre a esperança condicional de y: 1. 2. 0 1 x 0 1 x 0 1 x E ( y | y 0, x) 1 1 ( ) ( ) x O efeito de x sobre as horas de trabalho daqueles que estão trabalhando. 1 x E ( y | x) 1 ( 0 ) x O efeito total de x nas horas trabalhadas. 22 Efeito marginal • Ambos efeitos parciais dependem de x. Logo, eles diferem para as observações diferentes dos dados. • Contudo, precisamos saber o efeito total ao invés do efeito específico para uma observação do dado. • Da mesma forma que nos modelos Probit e logit models, existem duas formas de computar o efeito parcial total: 23 Efeito marginal total • Efeito parcial na média: coloca a média das variáveis explicativas (PEA). • Média do efeito parcial (APE): computa o efeito parcial para cada indivíduo no banco de dados e depois tira a média destes efeitos individuais. 24