Econometria 1. 2. 3. Econometria Multicolinearidade Observações missing Propriedades assintóticas dos estimadores MQO 1. 2. 3. Multicolinearidade Testes de hipóteses no modelo de regressão linear Propriedades assintóticas dos estimadores MQO Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Multicolinearidade Multicolinearidade Quando existem relação linear exata entre as variáveis independentes será impossível calcular os estimadores de MQO. O procedimento MQO utilizado para estimação não será efetivado. Mensagem: “matriz quase singular” (uma matriz quase singular X´X não pode ser invertida) ou “a variável xk dropped”. Relacionamento linear exato: só quando os dados foram construídos pelo pesquisador, pe., no caso de inclusão de dummies. Relacionamento linear aproximado entre as variáveis independentes: comuns em economia. O procedimento de estimação não é rompido quando as variáveis são bastante correlacionadas, contudo, surgem problemas de estimação. Multicolinearidade Característica do banco de dados que afeta a matriz de covariância do Estimador de MQO. Considere um estimador de um dos parâmetros β k: E[bk] = β k (não viesado) Var[b] = σ2(X’X)-1 . A variância de bk é o k-ésimo elemento da diagonal da matriz σ2(X’X)-1 Escreva [X,z] sendo [outros xs, xk] = [X1,x2] M1 matriz que gera os resíduos da projeção de um vetor no subespaço formado pelas colunas de X1. O elemento da diagonal será: [x2′M1x2]-1 que corresponde ao recíproco da soma do quadrado dos resíduos da regressão de x2 em X1. Multicolinearidade: nome dado ao fenômeno de presença de relação linear aproximada entre os regressores. Problema de estimação causado por uma amostra particular. Não é um problema teórico. Multicolinearidade nos dados pode existir por diferentes motivos: Regressores possuem a mesma tendência temporal. Algumas variáveis caminham na mesma direção porque os dados não foram coletados de uma base grande. Pode existir realmente algum tipo de relacionamento aproximado entre os regressores. Variância do estimador de MQO A variância estimada de bk é Var[b2/X] = s2 n 2 2 (1 − R2. ) ( xi 2 − x 2 ) i =1 ∑ = s2 . (1 − R22. ) S 22 Quanto maior o fit da regressão de x2 em X1, maior a variância. No limite, um ajuste perfeito produz uma variância infinita. 1 Variância do estimador de MQO Forma mais geral Defina a matriz X que contém uma constante e K-1 variáveis explicativas Consequências da Multicolinearidade A variância estimada de bk é Var[bk/X] = s2 (1 − R )∑ (x n 2 k. ik − xk )2 i =1 Ingrediente para existência de multicolinearidade: - Quanto maior a correlação entre xk e as outras variáveis (R2k). O estimador de MQO permanece não viesado e BLUE. O grau de ajuste não é afetado. Problemas práticos: Pequenas mudanças nos dados produzem grandes variações nas estimativas dos parâmetros. Os coeficientes estimados apresentam erros padrão muito elevados e baixos níveis de significância, mesmo que sejam conjuntamente significativos e com o grau de ajuste da regressão elevado (R2). Os coeficientes podem ter o sinal “errado” e magnitudes irreais. Consequências da Multicolinearidade Na presença de multicolinearidade, o procedimento de estimação MQO não recebe variação independente suficiente de uma variável para realizar o cálculo com confiança do efeito que esta tem sobre a variável dependente. Quando os regressores são altamente correlacionados, a maior parte da sua variação é comum às duas variáveis, deixando pouca variação exclusiva a cada variável. MQO tem pouca informação para usar ao fazer as estimativas do coeficiente (similar a um problema de amostra pequena ou que a variável não mudasse muito). Consequências da Multicolinearidade As variâncias dos estimadores MQO dos parâmetros são muito grandes – Imprecisão dos estimadores dos parâmetros. Erros de especificação : não sabemos qual variável é mais ou menos importante para explicar a variação da variável dependente. Como detectar? Controvérsia: muitos métodos inadequados. Sinais hipotéticos não são encontrados. Variáveis consideradas a priori importantes não são significativas individualmente, mas estatística F (significância coletiva) é alta. Resultados alterados quando uma variável independente é excluída ou quando uma observação é retirada. Matriz de correlação (0,8 a 0,9 são valores absolutos altos): detecta colinearidade de duas variáveis, mas não de mais de duas. Como detectar? Índice de condição dos dados (IC): Raiz quadrada da razão da maior para a menor raiz característica de X´X 1/ 2 raizmáxima γ = raizmínima Medida de sensibilidade das estimativas a pequenas pertubações dos dados. Medida de proximidade de X´X da singularidade (multicolinearidade perfeita): quanto maior o IC maior dificuldade em inverter a matriz. Índice maior que 20 indica colinearidade forte: mudança de 1% nos dados faz surgir uma mudança de IC% nos estimadores. 2 Como detectar? Inverso da matriz de correlação: . reg ln_sal_hora Elementos na diagonal: Fatores de inflação da variância (VIF). VIF = 1 (1 − Rk2. ) No stata: R2 da regressão da k-ésima variável independente em todas demais variáveis independentes. Quanto maior VIF, mais o R2k está perto da unidade. Medida da quantidade pela qual a variância da k-ésima estimativa do coeficiente é aumentada devido a associação linear com as outras variáveis explicativas. Se VIF > 10: presença de colinearidade Number of obs F( 5, 14531) Prob > F R-squared Adj R-squared Root MSE = 14537 = 1939.23 = 0.0000 = 0.4002 = 0.4000 = .74862 -----------------------------------------------------------------------------ln_sal_hora | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------filho | -.209508 .0202922 -10.32 0.000 -.2492833 -.1697328 idade | .0604502 .0028366 21.31 0.000 .05489 .0660103 idade2 | -.0005105 .0000332 -15.37 0.000 -.0005756 -.0004454 sexo | -.346604 .0129488 -26.77 0.000 -.3719854 -.3212227 educa | .1304724 .0014665 88.97 0.000 .1275979 .1333469 _cons | -.4814204 .061482 -7.83 0.000 -.601933 -.3609078 -----------------------------------------------------------------------------. vif Variable | VIF 1/VIF -------------+---------------------idade | 33.37 0.029969 idade2 | 30.63 0.032650 filho | 1.63 0.611927 educa | 1.11 0.901243 sexo | 1.04 0.961969 -------------+---------------------Mean VIF | 13.56 No stata: . collin filho idade idade2 sexo educa Source | SS df MS -------------+-----------------------------Model | 5434.065 5 1086.813 Residual | 8143.68463 14531 .560435251 -------------+-----------------------------Total | 13577.7496 14536 .934077438 No stata: graph matrix fam peer school idade idade2 sexo educa filho Collinearity Diagnostics SQRT RVariable VIF VIF Tolerance Squared ---------------------------------------------------idade 27.65 5.26 0.0362 0.9638 idade2 19.99 4.47 0.0500 0.9500 sexo 1.02 1.01 0.9843 0.0157 educa 1.55 1.25 0.6449 0.3551 filho 3.11 1.76 0.3218 0.6782 ---------------------------------------------------Mean VIF 10.66 Cond Eigenval Index --------------------------------1 4.3513 1.0000 2 1.0883 1.9996 3 0.3723 3.4187 4 0.1424 5.5283 5 0.0395 10.4905 6 0.0063 26.3514 --------------------------------Condition Number 26.3514 Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept) Det(correlation matrix) 0.0194 Multicolinearidade Não existe “cura” para a colinearidade. 1. Exclusão de variáveis: eliminar as variáveis que causam o problema – impor na regressão a hipótese de que a variável problemática não deve aparecer no modelo. Possível problema de especificação. 2. Obtenção de mais dados: dados adicionais e tamanho da amostra. 3. Formalizar os relacionamentos entre os regressores: equações simultâneas. 2. 4. Especificar o relacionamento entre alguns parâmetros: dois parâmetros iguais ou que a soma das elasticidades deve ser igual a um, etc. 3. 5. Análise componente principal: as variáveis colineares poderiam ser agrupadas para formar um índice composto capaz de representar este conjunto de variáveis. Variável só pode ser criada se tiver uma interpretação econômica. Econometria 4. Observações missing Testes de hipóteses no modelo de regressão linear Propriedades assintóticas dos estimadores MQO Danielle Carusi Machado - UFF - Econometria 2/2010 3 Observações missing Observações missing Existem gaps no banco de dados. Em surveys, entrevistados não respondem as perguntas. Série temporal: dado não existe na frequência desejada. Painel: atrito – as unidades observacionais deixam de ser investigadas. Informações missing de forma aleatória: As informações não são perdidas de forma aleatória (estão sistematicamente relacionadas com fenômeno que está sendo modelado) – problema de seleção amostral. Imputação de dados Regressores: Imputação de dados Método de ordem zero: substitui os valores missing pelas médias das informações completas – melhora no ajuste. Predições com base nas outras variáveis disponíveis. Nos dois casos acima, a variável verdadeira é substituída por uma proxy: (erro de medida) - viés xˆ ik = xik + uik a informação não está disponível por razões desconhecidas e; não há relação com os valores presentes para outras variáveis existentes na amostra. Variável dependente: Informações dos regressores está completa. Estimar os coeficientes e gerar uma predição para os valores faltantes. bc é calculado com base nas informações completas de yc e Xc. yˆ = X b m m c No segundo passo, o estimador da variância será menor pois está incluindo observações exatas de y. A imputação só vale a pena se a % imputada é muito pequena. Propriedades assintóticas Econometria 3. Propriedades assintóticas dos estimadores MQO Danielle Carusi Machado - UFF - Econometria 2/2010 O número de resultados estatísticos exatos, tais como o valor esperado ou a distribuição verdadeira, em muitos modelos é baixo. Usualmente, utilizamos resultados aproximados com base no que se sabe do comportamento de determinadas estatísticas de grandes amostras. Danielle Carusi Machado - UFF - Econometria 2/2010 4 Convergência Definições, tipos de convergência quando n cresce: 1. Para uma constante; exemplo, a média amostral, x Convergência para uma constante Convergência de uma variável aleatória O que significa uma variável aleatória convergir para uma constante? Convergência da variância para zero. 2. Para uma variável aleatória; exemplo, uma estatística t com n -1 graus de liberdade. A variável aleatória converge para algo que não é aleatório. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Resultados de convergência Convergência em probabilidade Convergência de uma sequência de variáveis aleatórias para uma constante A média converge para uma constante e a variância converge para zero. xn = n1 Σin=1 xi , E[ xn ] = µ → µ, Var[xn ]=σ2 / n → 0 Teorema de convergência para momentos amostrais. Momentos amostrais convergem em probabilidade para seus análogos populacionais. (1/n)Σig(zi) converge para E[g(zi)]. A variável aleatória x n converge em probabilidade para uma constante c sss ( ) limn →∞ Pr ob x n − c > ε = 0 para qualquer valor positivo ε . A probabilidade que a diferença entre xn e c seja maior do que ε para qualquer ε vai para zero. Ou seja, xn fica perto de c. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Convergência em probabilidade Convergência em Média Quadrática Convergência em probabilidade significa que os valores das variáveis que não estão próximos de c ficam cada vez mais improváveis à medida que o n cresce. Se xn tem média µn e variância σ2 tal que os limites ordinários de µn e σ2 são c e 0, respectivamente, xn converge em “mean square “ para c, e p lim x n = c Exemplo: Suponha uma variável aleatória xn que assume dois valores, zero e n, com probabilidades (1-1/n) e (1/n), respectivamente. Quando n aumenta , o segundo valor é menos provável. Xn converge em probabilidade para zero. Toda a massa da distribuição de probabilidade fica concentrada em pontos próximos de c. p lim x n = c Danielle Carusi Machado - UFF - Econometria 2/2010 5 Convergência em Média Quadrática Convergência em probabilidade não implica convergência em média quadrática!!! Exemplo dado: calcular o valor esperado: o valor esperado é igual a 1 para qualquer n. As condições para a convergência em média são mais fáceis de verificar do que a forma geral de convergência em probabilidade. Consistência de um estimador Se a variável aleatória, xn é um estimador (por exemplo, a média), e se: plim xn = θ xn é um estimador consistente de θ. Utilizaremos quase sempre convergência em média. Danielle Carusi Machado - UFF - Econometria 2/2010 Teorema de Slutsky Se xn é uma variável aleatória tal que plim xn = θ. Onde θ é uma constante. g(.) é uma função contínua. g(.) não é função de n. Conclusão: plim[g(xn)] = g[plim(xn)] e g[plim(xn)] existe. Limite de probabilidade não necessariamente funciona para esperanças. Danielle Carusi Machado - UFF - Econometria 2/2010 Corolários Slutsky x n and y n are two sequences of random variables with probability limits θ and µ. Plim (x n ± y n ) = θ ± µ (sum) Plim (x n × y n ) = θ × µ (product) Plim (x n / y n ) = θ / µ (product, if µ ≠ 0) Plim[g(x n ,y n )] = g(θ , µ) assuming it exists and g(.) is continuous with continuous partials, etc. E[x n ]=µ; plim(x n ) = µ, E[1/x n ]=?; plim(1/x n )=1/µ Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Resultados de Slutsky para Matrizes Distribuições limites Funções de matrizes são funções contínuas de elementos das matrizes. Se plimAn = A e plimBn = B (elemento a elemento), Plim(An-1) = [plim An]-1 = A-1 e plim(AnBn) = plimAnplim Bn = AB Danielle Carusi Machado - UFF - Econometria 2/2010 Convergência para um tipo de VA e não para uma constante xn é uma sequência de Va com Fn(xn). Se plim xn = θ (constante), Fn(xn) será um ponto. Mas, Fn pode convergir para uma variável aleatória específica. A distribuição desta VA será a distribuição limite de x n. d x n → x ⇔ Fn (x n ) → F(x) n →∞ Danielle Carusi Machado - UFF - Econometria 2/2010 6 Teorema de Slutsky para Variáveis Aleatórias Se d X n → X , e se g(Xn) é uma função continua com derivadas Uma extensão do Teorema de Slutsky Se que contínuas e que não depende de n, temos que : d x n → x (Xn tem uma distribuição limite) e θ é uma constante tal d g (x n , θ ) → g (gn tem uma distribuição limite que é função de θ), d → g e p lim y n = θ temos que: g (x n , y n ) d g ( X n ) → g (X ) Exemplo: Ou seja, substituir o θ por um estimador consistente leva a mesma t-student converge para uma normal padrão. Quadrado de uma t-student converge para uma qui-quadrada. distribuição limite. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Aplicação do Teorema de Slutsky Teorema do Limite Central Comportamento da estatística F para testar restrições em grandes amostras: (e *´e * − e´e ) F = e´e (e *´e * − e´e ) J = e´e (n − k ) Descreve o comportamento de uma variável aleatória que envolve soma de variáveis “Tendência para a normalidade.” 2 d χJ → σ 2J J p 1 → σ (n − k ) 2 d JF → χJ 2 A média de uma amostra aleatória de qualquer população (com variância finita), quando padronizada, tem uma distribuição normal padrão assintótica. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Teorema do Limite Central Teorema do Limite Central Teorema Lindeberg-Levy (versão simples do TLC): Teorema Lindeberg-Feller : Se x1, x2, … , xn é uma amostra aleatória de uma população cuja Suponha que {x i }, i distribuição de probabilidade tem média µ e variância finita igual a σ2 e xn = 1 n n xi ∑ i temos que: =1 n Danielle Carusi Machado - UFF - Econometria 2/2010 xn − µ d → N (0,1) σ Se p lims n= σ : x −µ d n n → N (0,1) sn = 1,..., n é uma sequência de variáveis aleatórias independentes com média µi e variâncias positivas finitas σ2i µn = 2 σn = 1 n 1 n (µ1 + µ2 + µ3 + ... + µn ) (σ 1 + σ 2 + σ 3 + ... + σ n ) d n (x n − µn ) → N (0, σ 2 ) Danielle Carusi Machado - UFF - Econometria 2/2010 7 Lindberg-Levy vs. Lindeberg-Feller Lindeberg-Levy assume amostra aleatória – observações Distribuição assintótica possuem as mesmas média e variância. Lindeberg-Feller – a variância pode ser diferente entre as observações, apenas com hipóteses de como elas variam. Soma de variáveis aleatórias, independente da sua distribuição, tenderão a ser normalmente distribuídas. E, mais, Lindeberg-Feller não requere que as variáveis na soma venham da mesma distribuição de probabilidade. Uma distribuição assintótica é uma distribuição usada para a aproximar a verdadeira distribuição de amostra finita de uma variável aleatória. Construída a partir da distribuição limite da função de uma variável aleatória. Se x −µ d n n N (0,1) → σ 2 ) x n ~ N (µ ,σ n é assintoticamente normalmente distribuído com média µ e variância σ2/n. Estimadores em econometria – uso da versão Lindeberg-Feller do TLC. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Eficiência assintótica Eficiência assintótica Comparação de variâncias assintóticas Como comparamos estimadores consistentes? Se convergem para constante, ambas variâncias vão para zero. Exemplo: Amostra aleatória de uma distribuição normal, d n (θˆn − θ ) → N (0,V ) Eficiência assintótica: Um estimador θˆn é assintoticamente normal, este estimador é eficiente assintoticamente se a A média amostral é assintoticamente normal com [µ,σ2/n] Mediana é assintoticamente normal com [µ,(π/2)σ2/n] Média é assintoticamente mais eficiente. matriz de covariância de qq outro estimador consistente e assintoticamente normal exceder (1/n)V por uma matriz definida não negativa. Danielle Carusi Machado - UFF - Econometria 2/2010 Propriedades assintóticas do EMQ A hipótese de normalidade não é necessária para derivarmos as propriedades assintóticas. Hipóteses: Convergência de X′′X/n para uma matriz Q positiva definida. Convergência de X’εε/n para 0. Suficiente para a consistência. Hipóteses: Convergência de (1/√n)X’εε para um vetor com distribuição normal – normalidade assintótica. Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 EMQ EMQ pode ser escrito da seguinte forma: (X′′X)-1X′′y = (X′′X)-1Σixiyi = β + (X′′X)-1Σixiεi Um vetor de constantes mais um vetor de variáveis aleatórias. Os resultados para a amostra finita são estabelecidos conforme regras estatísticas para esta soma. Como esta soma de variáveis se comporta em grandes amostras? Danielle Carusi Machado - UFF - Econometria 2/2010 8 We use 'convergence in mean square. Adequate for almost all problems, not adequate for some time Limite de probabilidade Convergência em média quadrática series problems. −1 1 1 n b = β + X'X × ∑ i=1 x iεi n n −1 1 1 n 1 n 1 (b - β)( b - β) ' = X'X × ∑ i=1 x iεi × ∑ i=1 x i ' εi X'X n n n n −1 −1 E[b|X]=β para qualquer X. Var[b|X]0 para um X específico b converge para β b é consistente −1 n n 1 1 1 = X'X 2 ∑ i=1 ∑ j=1 x iεi x j ' ε j X'X n n n In E[(b - β)( b - β) ' | X] in the double sum, terms with unequal subscripts have expectation zero. −1 1 1 E[(b - β)( b - β) ' | X ] = X'X 2 n n ∑ n i=1 −1 = σ2 1 1 1 X'X X'X X'X n n n n 1 x i x j 'E[ε2i | X] X'X n −1 = σ2 1 X'X n n −1 −1 Danielle Carusi Machado - UFF - Econometria 2/2009 Danielle Carusi Machado - UFF - Econometria 2/2010 Limite de probabilidade Resultados Assintóticos −1 1 1 n b = β + X'X × ∑ i=1 x iεi n n −1 1 n β + Q−1 × ∑ i=1 x iεi n Qual a média variável What is thedesta mean of thisaleatória? random vector? −1 1 1 n 1 1 b - β = X'X × ∑ i=1 x iεi = X'X X'ε n n n n −1 1 1 P lim(b - β) = p lim X'X X'ε n n −1 1 1 = p lim X'X plim X'ε = n n What is its variance? Do they 'converge' to something? We use Qual sua variância? −1 1 1 plim n X'X plim n X'ε Estathis soma converge Podemos achar method to para find algo? the probability limit.o limite de probabilidade. What is the asymptotic distribution? Qual a distribuição assintótica? 1 = Q−1p lim X'ε assuming well behaved regressors. A inversa é uma n função contínua 1 Este plim X'εdeverá What must be assumed to get p lim = 0 ?ser zero da matriz original. n Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Limite de probabilidade Hipótese crucial do modelo O que devemos assumir para que plim(1/nX’ε)=0? Devemos encontrar o plim do último termo: 1) X 'ε n p lim 1 X 'ε = n n n 2) n x i ε i = ∑w i = w ∑ n i i 1 =1 =1 p lim b = β + Q −1p limw Para isto, devemos formular algumas hipóteses. Danielle Carusi Machado - UFF - Econometria 2/2010 3) xi = vetor aleatório com média e variâncias finitas e com distribuições idênticas. εi = variável aleatória com uma distribuição constante com média e variância finitas e E(εi)=0 xi e εi são estatisticamente independentes. wi = xiεi = uma observação em uma amostra aleatória, com matriz de covariância constante e o vetor de média igual a zero. 1 w i converge para sua esperança. n ∑ Danielle Carusi Machado - UFF - Econometria 2/2010 9 Limite de probabilidade Pela hipótese de exogeneidade e pela lei das expectativas iteradas: E (w i ) = E x E w i = E E x i ε i x x i x i = 0 = E x x i E ε i x i Desta forma a expectativa exata E (w ) = 0 1 1 1 E (w ) = E ( wi ) = E ( wi ) = n ∑ i n =1 ∑ i n =1 Limite de probabilidade Pela decomposição da variância: [ ( X )]+ var[E (w X )] [ ( X )]+ 0 var( w ) = E var w = E var w Para calcular o primeiro termo usamos E [εε ' | X ] = σ 2 I 1 1 σ 2 X´X var w = E ( w w ´/ X ) = X ´E [εε ' | X ]X = X n n n n σ 2 X´X E var w = E X n n ( ) E (w i ) = 0 ∑ i =1 [ ( )] Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2010 Limite de probabilidade Distribuição assintótica Substituindo (2) em (1) : [ ( var(w ) = E var w )] = E σn Xn' X = σn E Xn' X 2 X 2 A variância irá para zero se a esperança entre parênteses convergir para uma matriz constante. A hipótese de que plim (X' X/n) converge para Q será suficiente . lim var(w ) = 0.Q = 0 n →∞ Como a média w é zero e sua variância converge para zero, w converge em média quadrática para zero, desta forma : X 'ε =0 n p lim b = β + Q −1.0 = β plim EMQ é consistente!! −1 1 1 n b = β + X'X × ∑ i=1 x iεi n n O comportamento limite de da as The limiting behavior ofbbé iso mesmo the same estatística resultante substituição da matriz that of the statisticda that results when the de momentos pelo seu limite. moment matrix is replaced by its limit. We Examinamos o comportamento da seguinte soma modificada: examine the behavior of the modified sum 1 n β + Q −1 × ∑ i=1 x iεi n Danielle Carusi Machado - UFF - Econometria 2/2010 Danielle Carusi Machado - UFF - Econometria 2/2009 Distribuição assintótica b β em probabilidade. Como descrever esta distribuição? Não tem uma distribuição limite Variância b 0 Como estabilizar a variância? Var[√n b] ~ σ2Q-1 is O(1) Mas, E[√n b]= √n β que diverge √n (b - β) é uma variável aleatória com média e variância finitas (transformação que estabiliza) b aproximadamente β +1/ √n vezes a variável aleatória. Danielle Carusi Machado - UFF - Econometria 2/2010 Distribuição limite √n (b - β) = √n (X’X)-1X’ε = √ n (X’X/n)-1(X’ε/n) No limite, isto é igual a (plim): √ n Q-1(X’ε/n) Q é uma matriz positiva definida fixa. Comportamento depende da variável aleatória √ n (X’ε/n) Danielle Carusi Machado - UFF - Econometria 2/2010 10 Distribuição no limite: Normal ( 1 n ) X ' ε = n (w − E (w ) ) Distribuição no limite: Normal Se var( x i ε i ) = σ 2E ( x i x i ' ) = σ 2Q i Podemos usar a versão Lindeberg - Feller do TLC para obter a distribuição limite da variável aleatória acima. w é a média de n vetores aleatórios independentes : w i = x i εi Estes vetores têm média zero e variância igual a : var( x i ε i ) = σ 2E ( x i x i ' ) = σ 2Q i var( n w ) = n var(w ) = n var( 1 n ∑ x i εi ) = n ∑ var(x i ε i ) 1 σ2 Q i = σ 2Qn n lim σ 2Q n = σ 2Q = ∑ Danielle Carusi Machado - UFF - Econometria 2/2009 Danielle Carusi Machado - UFF - Econometria 2/2009 Distribuição no limite: Normal Distribuição assintótica Temos todos elementos para aplicarmos o TLC para o vetor n (w ) : − {x i ε i } são vetores independentes distribuídos com média zero e variância igual a σ 2Q i . ( 1 d N 0, σ 2Q n X ' ε → ) ( ( n (b − β ) → N 0,Q −1σ 2 d s2 = ) Teorema : Distribuição assintótica de b com observações independentes Se {ε i } são independentemente distribuídos com média zero e variância finita σ 2 temos que : 1 d X ' ε → N Q −1 0,Q −1σ 2QQ −1 n Q −1 ( d N 0,Q −1σ 2 n (b − β ) → ) ) b ~ N β ,Q −1 σ 2 n Resultado importante : normalidade assintótica do EMQ não depende da normalidade dos distúrbios com consequênc ia do TLC. Danielle Carusi Machado - UFF - Econometria 2/2009 Danielle Carusi Machado - UFF - Econometria 2/2009 Consistência de s2 Consistência de s2 1 1 n 1 e'e = ε'Mε = ε'Mε n −K n−K n−K n n →1 n −K 1 1 1 p lim s2 = plim ε'Mε = plim ε'ε − ε'X (X'X )-1 X'ε n n n 1 1 1 1 = plim ε'ε − plim ε'X plim (X'X )-1 p lim X'ε n n n n 1 = plim ε'ε − 0'Q-1 0 n 1 What must be assumed to claim plim ε'ε= E[ε2 ] = σ2 ? n Danielle Carusi Machado - UFF - Econometria 2/2009 X ' X −1 ) = σ 2Q −1 n σ 2 −1 Q var b = n est var b = s 2 ( X ' X ) −1 p lim s 2 ( Danielle Carusi Machado - UFF - Econometria 2/2009 11 Eficiência assintótica Um estimador é assintoticamente eficiente se é consistente, assintoticamente normalmente distribuído, e tem uma matriz de covariância que não é maior que uma matriz de covariância de qualquer outro estimador consistente e com distribuição assintótica normal. Danielle Carusi Machado - UFF - Econometria 2/2009 12