1 Econometria Econometria

Propaganda
Econometria
1.
2.
3.
Econometria
Multicolinearidade
Observações missing
Propriedades assintóticas dos estimadores MQO
1.
2.
3.
Multicolinearidade
Testes de hipóteses no modelo de regressão linear
Propriedades assintóticas dos estimadores MQO
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Multicolinearidade
Multicolinearidade
Quando existem relação linear exata entre as variáveis
independentes será impossível calcular os estimadores de MQO.
O procedimento MQO utilizado para estimação não será efetivado.
Mensagem: “matriz quase singular” (uma matriz quase singular
X´X não pode ser invertida) ou “a variável xk dropped”.
Relacionamento linear exato: só quando os dados foram
construídos pelo pesquisador, pe., no caso de inclusão de
dummies.
Relacionamento linear aproximado entre as variáveis
independentes: comuns em economia.
O procedimento de estimação não é rompido quando as variáveis
são bastante correlacionadas, contudo, surgem problemas de
estimação.
Multicolinearidade
Característica do banco de dados que afeta a matriz de covariância do
Estimador de MQO.
Considere um estimador de um dos parâmetros β k: E[bk] = β k (não viesado)
Var[b] = σ2(X’X)-1 .
A variância de bk é o k-ésimo elemento da diagonal da matriz σ2(X’X)-1
Escreva [X,z] sendo [outros xs, xk] = [X1,x2]
M1 matriz que gera os resíduos da projeção de um vetor no subespaço
formado pelas colunas de X1.
O elemento da diagonal será: [x2′M1x2]-1 que corresponde ao recíproco da
soma do quadrado dos resíduos da regressão de x2 em X1.
Multicolinearidade: nome dado ao fenômeno de presença de
relação linear aproximada entre os regressores.
Problema de estimação causado por uma amostra particular.
Não é um problema teórico.
Multicolinearidade nos dados pode existir por diferentes
motivos:
Regressores possuem a mesma tendência temporal.
Algumas variáveis caminham na mesma direção porque
os dados não foram coletados de uma base grande.
Pode existir realmente algum tipo de relacionamento
aproximado entre os regressores.
Variância do estimador de MQO
A variância estimada de bk é
Var[b2/X] =
s2
n


2
2
(1 − R2. ) ( xi 2 − x 2 ) 


i =1
∑
=
s2
.
(1 − R22. ) S 22
Quanto maior o fit da regressão de x2 em X1, maior a variância. No
limite, um ajuste perfeito produz uma variância infinita.
1
Variância do estimador de MQO
Forma mais geral
Defina a matriz X que contém uma constante e K-1 variáveis explicativas
Consequências da
Multicolinearidade
A variância estimada de bk é
Var[bk/X] =
s2
(1 − R )∑ (x
n
2
k.
ik
− xk )2
i =1
Ingrediente para existência
de multicolinearidade:
- Quanto maior a correlação entre
xk e as outras variáveis (R2k).
O estimador de MQO permanece não viesado e BLUE.
O grau de ajuste não é afetado.
Problemas práticos:
Pequenas mudanças nos dados produzem grandes
variações nas estimativas dos parâmetros.
Os coeficientes estimados apresentam erros padrão
muito elevados e baixos níveis de significância, mesmo
que sejam conjuntamente significativos e com o grau
de ajuste da regressão elevado (R2).
Os coeficientes podem ter o sinal “errado” e
magnitudes irreais.
Consequências da
Multicolinearidade
Na presença de multicolinearidade, o procedimento de
estimação MQO não recebe variação independente suficiente
de uma variável para realizar o cálculo com confiança do
efeito que esta tem sobre a variável dependente.
Quando os regressores são altamente correlacionados, a
maior parte da sua variação é comum às duas variáveis,
deixando pouca variação exclusiva a cada variável.
MQO tem pouca informação para usar ao fazer as
estimativas do coeficiente (similar a um problema de
amostra pequena ou que a variável não mudasse muito).
Consequências da
Multicolinearidade
As variâncias dos estimadores MQO dos parâmetros são
muito grandes – Imprecisão dos estimadores dos
parâmetros.
Erros de especificação : não sabemos qual variável é
mais ou menos importante para explicar a variação da
variável dependente.
Como detectar?
Controvérsia: muitos métodos inadequados.
Sinais hipotéticos não são encontrados.
Variáveis consideradas a priori importantes não são
significativas individualmente, mas estatística F
(significância coletiva) é alta.
Resultados alterados quando uma variável independente
é excluída ou quando uma observação é retirada.
Matriz de correlação (0,8 a 0,9 são valores absolutos
altos): detecta colinearidade de duas variáveis, mas não
de mais de duas.
Como detectar?
Índice de condição dos dados (IC):
Raiz quadrada da razão da maior para a menor raiz
característica de X´X
1/ 2
 raizmáxima 
γ =
raizmínima 


Medida de sensibilidade das estimativas a pequenas
pertubações dos dados.
Medida de proximidade de X´X da singularidade
(multicolinearidade perfeita): quanto maior o IC maior
dificuldade em inverter a matriz.
Índice maior que 20 indica colinearidade forte: mudança de 1%
nos dados faz surgir uma mudança de IC% nos estimadores.
2
Como detectar?
Inverso da matriz de correlação:
. reg ln_sal_hora
Elementos na diagonal: Fatores de inflação da variância (VIF).
VIF =
1
(1 − Rk2. )
No stata:
R2 da regressão da k-ésima
variável independente em todas
demais variáveis independentes.
Quanto maior VIF, mais o R2k está perto da unidade.
Medida da quantidade pela qual a variância da k-ésima
estimativa do coeficiente é aumentada devido a associação
linear com as outras variáveis explicativas.
Se VIF > 10: presença de colinearidade
Number of obs
F( 5, 14531)
Prob > F
R-squared
Adj R-squared
Root MSE
=
14537
= 1939.23
= 0.0000
= 0.4002
= 0.4000
= .74862
-----------------------------------------------------------------------------ln_sal_hora |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------filho |
-.209508
.0202922
-10.32
0.000
-.2492833
-.1697328
idade |
.0604502
.0028366
21.31
0.000
.05489
.0660103
idade2 | -.0005105
.0000332
-15.37
0.000
-.0005756
-.0004454
sexo |
-.346604
.0129488
-26.77
0.000
-.3719854
-.3212227
educa |
.1304724
.0014665
88.97
0.000
.1275979
.1333469
_cons | -.4814204
.061482
-7.83
0.000
-.601933
-.3609078
-----------------------------------------------------------------------------. vif
Variable |
VIF
1/VIF
-------------+---------------------idade |
33.37
0.029969
idade2 |
30.63
0.032650
filho |
1.63
0.611927
educa |
1.11
0.901243
sexo |
1.04
0.961969
-------------+---------------------Mean VIF |
13.56
No stata:
. collin
filho idade idade2 sexo educa
Source |
SS
df
MS
-------------+-----------------------------Model |
5434.065
5
1086.813
Residual | 8143.68463 14531 .560435251
-------------+-----------------------------Total | 13577.7496 14536 .934077438
No stata:
graph matrix fam peer school
idade idade2 sexo educa filho
Collinearity Diagnostics
SQRT
RVariable
VIF
VIF
Tolerance
Squared
---------------------------------------------------idade
27.65
5.26
0.0362
0.9638
idade2
19.99
4.47
0.0500
0.9500
sexo
1.02
1.01
0.9843
0.0157
educa
1.55
1.25
0.6449
0.3551
filho
3.11
1.76
0.3218
0.6782
---------------------------------------------------Mean VIF
10.66
Cond
Eigenval
Index
--------------------------------1
4.3513
1.0000
2
1.0883
1.9996
3
0.3723
3.4187
4
0.1424
5.5283
5
0.0395
10.4905
6
0.0063
26.3514
--------------------------------Condition Number
26.3514
Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)
Det(correlation matrix)
0.0194
Multicolinearidade
Não existe “cura” para a colinearidade.
1.
Exclusão de variáveis: eliminar as variáveis que causam o problema – impor
na regressão a hipótese de que a variável problemática não deve aparecer
no modelo. Possível problema de especificação.
2.
Obtenção de mais dados: dados adicionais e tamanho da amostra.
3.
Formalizar os relacionamentos entre os regressores: equações simultâneas.
2.
4.
Especificar o relacionamento entre alguns parâmetros: dois parâmetros
iguais ou que a soma das elasticidades deve ser igual a um, etc.
3.
5.
Análise componente principal: as variáveis colineares poderiam ser
agrupadas para formar um índice composto capaz de representar este
conjunto de variáveis. Variável só pode ser criada se tiver uma
interpretação econômica.
Econometria
4.
Observações missing
Testes de hipóteses no modelo de regressão linear
Propriedades assintóticas dos estimadores MQO
Danielle Carusi Machado - UFF - Econometria
2/2010
3
Observações missing
Observações missing
Existem gaps no banco de dados.
Em surveys, entrevistados não respondem as
perguntas.
Série temporal: dado não existe na frequência
desejada.
Painel: atrito – as unidades observacionais
deixam de ser investigadas.
Informações missing de forma aleatória:
As informações não são perdidas de forma
aleatória (estão sistematicamente relacionadas
com fenômeno que está sendo modelado) –
problema de seleção amostral.
Imputação de dados
Regressores:
Imputação de dados
Método de ordem zero: substitui os valores missing
pelas médias das informações completas – melhora
no ajuste.
Predições com base nas outras variáveis disponíveis.
Nos dois casos acima, a variável verdadeira é
substituída por uma proxy: (erro de medida) - viés
xˆ ik = xik + uik
a informação não está disponível por razões
desconhecidas e;
não há relação com os valores presentes para outras
variáveis existentes na amostra.
Variável dependente:
Informações dos regressores está completa.
Estimar os coeficientes e gerar uma predição para
os valores faltantes.
bc é calculado com base nas informações completas
de yc e Xc. yˆ = X b
m
m c
No segundo passo, o estimador da variância será
menor pois está incluindo observações exatas de y.
A imputação só vale a pena se a % imputada é
muito pequena.
Propriedades assintóticas
Econometria
3.
Propriedades assintóticas dos estimadores MQO
Danielle Carusi Machado - UFF - Econometria
2/2010
O número de resultados estatísticos exatos, tais como o
valor esperado ou a distribuição verdadeira, em
muitos modelos é baixo.
Usualmente, utilizamos resultados aproximados com base
no que se sabe do comportamento de determinadas
estatísticas de grandes amostras.
Danielle Carusi Machado - UFF - Econometria
2/2010
4
Convergência
Definições, tipos de convergência quando n
cresce:
1. Para uma constante; exemplo, a média
amostral, x
Convergência para uma constante
Convergência de uma variável aleatória
O que significa uma variável aleatória convergir para uma
constante?
Convergência da variância para zero.
2. Para uma variável aleatória; exemplo, uma
estatística t com n -1 graus de liberdade.
A variável aleatória converge para algo que não é aleatório.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Resultados de convergência
Convergência em probabilidade
Convergência de uma sequência de variáveis aleatórias para uma
constante
A média converge para uma constante e a variância converge
para zero.
xn = n1 Σin=1 xi , E[ xn ] = µ → µ, Var[xn ]=σ2 / n → 0
Teorema de convergência para momentos amostrais. Momentos
amostrais convergem em probabilidade para seus
análogos populacionais.
(1/n)Σig(zi) converge para E[g(zi)].
A variável aleatória x n converge em probabilidade
para uma constante c sss
(
)
limn →∞ Pr ob x n − c > ε = 0 para qualquer valor positivo ε .
A probabilidade que a diferença entre xn e c seja maior do
que ε para qualquer ε vai para zero.
Ou seja, xn fica perto de c.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Convergência em probabilidade
Convergência em Média Quadrática
Convergência em probabilidade significa que os valores das
variáveis que não estão próximos de c ficam cada vez mais
improváveis à medida que o n cresce.
Se xn tem média µn e variância σ2 tal que os limites ordinários de
µn e σ2 são c e 0, respectivamente, xn converge em “mean
square “ para c, e
p lim x n = c
Exemplo:
Suponha uma variável aleatória xn que assume dois valores,
zero e n, com probabilidades (1-1/n) e (1/n), respectivamente.
Quando n aumenta , o segundo valor é menos provável.
Xn converge em probabilidade para zero.
Toda a massa da distribuição de probabilidade fica concentrada
em pontos próximos de c.
p lim x n = c
Danielle Carusi Machado - UFF - Econometria
2/2010
5
Convergência em Média Quadrática
Convergência em probabilidade não implica
convergência em média quadrática!!!
Exemplo dado: calcular o valor esperado: o valor esperado
é igual a 1 para qualquer n.
As condições para a convergência em média são mais
fáceis de verificar do que a forma geral de
convergência em probabilidade.
Consistência de um estimador
Se a variável aleatória, xn é um estimador (por exemplo, a
média), e se:
plim xn = θ
xn é um estimador consistente de θ.
Utilizaremos quase sempre convergência em média.
Danielle Carusi Machado - UFF - Econometria
2/2010
Teorema de Slutsky
Se xn é uma variável aleatória tal que plim xn = θ.
Onde θ é uma constante.
g(.) é uma função contínua. g(.) não é função de
n.
Conclusão: plim[g(xn)] = g[plim(xn)] e g[plim(xn)]
existe.
Limite de probabilidade não necessariamente
funciona para esperanças.
Danielle Carusi Machado - UFF - Econometria
2/2010
Corolários Slutsky
x n and y n are two sequences of random variables with
probability limits θ and µ.
Plim (x n ± y n ) = θ ± µ (sum)
Plim (x n × y n ) = θ × µ (product)
Plim (x n / y n ) = θ / µ (product, if µ ≠ 0)
Plim[g(x n ,y n )] = g(θ , µ) assuming it exists and g(.) is
continuous with continuous partials, etc.
E[x n ]=µ; plim(x n ) = µ, E[1/x n ]=?; plim(1/x n )=1/µ
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Resultados de Slutsky para
Matrizes
Distribuições limites
Funções de matrizes são funções contínuas de
elementos das matrizes.
Se plimAn = A e plimBn = B (elemento a
elemento),
Plim(An-1) = [plim An]-1 = A-1
e
plim(AnBn) = plimAnplim Bn = AB
Danielle Carusi Machado - UFF - Econometria
2/2010
Convergência para um tipo de VA e não para uma
constante
xn é uma sequência de Va com Fn(xn).
Se plim xn = θ (constante), Fn(xn) será um ponto.
Mas, Fn pode convergir para uma variável
aleatória específica.
A distribuição desta VA será a distribuição limite de
x n.
d
x n 
→ x ⇔ Fn (x n ) 
→ F(x)
n →∞
Danielle Carusi Machado - UFF - Econometria
2/2010
6
Teorema de Slutsky para Variáveis
Aleatórias
Se
d
X n →
 X
, e se g(Xn) é uma função continua com derivadas
Uma extensão do Teorema de
Slutsky
Se
que
contínuas e que não depende de n, temos que :
d
x n →
 x (Xn tem uma distribuição limite) e θ é uma constante tal
d
g (x n , θ ) →
 g (gn tem uma distribuição limite que é função de θ),
d
→ g
e p lim y n = θ temos que: g (x n , y n ) 
d
g ( X n ) →
 g (X )
Exemplo:
Ou seja, substituir o θ por um estimador consistente leva a mesma
t-student converge para uma normal padrão.
Quadrado de uma t-student converge para uma qui-quadrada.
distribuição limite.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Aplicação do Teorema de Slutsky
Teorema do Limite Central
Comportamento da estatística F para testar restrições em grandes amostras:
(e *´e * − e´e )
F =
e´e
(e *´e * − e´e )
J =
e´e
(n − k )
Descreve o comportamento de uma variável
aleatória que envolve soma de variáveis
“Tendência para a normalidade.”
2
 d
χJ

 →
σ 2J 
J
 p
 1
 →
σ (n − k )
2
d
JF →
 χJ 2
A média de uma amostra aleatória de qualquer
população (com variância finita), quando
padronizada, tem uma distribuição normal
padrão assintótica.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Teorema do Limite Central
Teorema do Limite Central
Teorema Lindeberg-Levy (versão simples do TLC):
Teorema Lindeberg-Feller :
Se x1, x2, … , xn é uma amostra aleatória de uma população cuja
Suponha que {x i }, i
distribuição de probabilidade tem média µ e variância finita
igual a σ2 e
xn =
1
n
n
xi
∑
i
temos que:
=1
n
Danielle Carusi Machado - UFF - Econometria
2/2010
xn − µ d

→ N (0,1)
σ
Se p lims n= σ :
x −µ d
n n

→ N (0,1)
sn
= 1,..., n
é uma sequência de variáveis aleatórias
independentes com média µi e variâncias positivas finitas σ2i
µn =
2
σn =
1
n
1
n
(µ1 + µ2 + µ3 + ... + µn )
(σ 1 + σ 2 + σ 3 + ... + σ n )
d
n (x n − µn ) →
 N (0, σ 2 )
Danielle Carusi Machado - UFF - Econometria
2/2010
7
Lindberg-Levy vs. Lindeberg-Feller
Lindeberg-Levy assume amostra aleatória – observações
Distribuição assintótica
possuem as mesmas média e variância.
Lindeberg-Feller – a variância pode ser diferente entre as
observações, apenas com hipóteses de como elas variam.
Soma de variáveis aleatórias, independente da sua
distribuição, tenderão a ser normalmente distribuídas. E,
mais, Lindeberg-Feller não requere que as variáveis na soma
venham da mesma distribuição de probabilidade.
Uma distribuição assintótica é uma distribuição usada para a
aproximar a verdadeira distribuição de amostra finita de uma variável
aleatória.
Construída a partir da distribuição limite da função de uma variável
aleatória.
Se
x −µ d
n  n
 N (0,1)
 →
 σ

2
)
x n ~ N (µ ,σ
n
é assintoticamente normalmente distribuído
com média µ e variância σ2/n.
Estimadores em econometria – uso da versão Lindeberg-Feller
do TLC.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Eficiência assintótica
Eficiência assintótica
Comparação de variâncias assintóticas
Como
comparamos
estimadores
consistentes?
Se
convergem para constante, ambas variâncias vão para zero.
Exemplo: Amostra aleatória de uma distribuição
normal,
d
n (θˆn − θ ) →
 N (0,V )
Eficiência assintótica: Um estimador θˆn é assintoticamente
normal, este estimador é eficiente assintoticamente se a
A média amostral é assintoticamente normal com
[µ,σ2/n]
Mediana é assintoticamente normal com
[µ,(π/2)σ2/n]
Média é assintoticamente mais eficiente.
matriz de covariância de qq outro estimador consistente e
assintoticamente normal exceder (1/n)V por uma matriz
definida não negativa.
Danielle Carusi Machado - UFF - Econometria
2/2010
Propriedades assintóticas do EMQ
A hipótese de normalidade não é necessária para
derivarmos as propriedades assintóticas.
Hipóteses: Convergência de X′′X/n para uma
matriz Q positiva definida.
Convergência de X’εε/n para 0. Suficiente para a
consistência.
Hipóteses: Convergência de (1/√n)X’εε para um
vetor com distribuição normal – normalidade
assintótica.
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
EMQ
EMQ pode ser escrito da seguinte forma:
(X′′X)-1X′′y = (X′′X)-1Σixiyi
= β + (X′′X)-1Σixiεi
Um vetor de constantes mais um vetor de variáveis
aleatórias.
Os resultados para a amostra finita são estabelecidos
conforme regras estatísticas para esta soma.
Como esta soma de variáveis se comporta em grandes
amostras?
Danielle Carusi Machado - UFF - Econometria
2/2010
8
We use 'convergence in mean square. Adequate for
almost all problems, not adequate for some time
Limite de probabilidade
Convergência em média quadrática
series problems.
−1
1

1 n

b = β +  X'X  ×  ∑ i=1 x iεi 
n

n

−1
1

1 n
 1 n
1

(b - β)( b - β) ' =  X'X  ×  ∑ i=1 x iεi  ×  ∑ i=1 x i ' εi   X'X 
n

n
 n
 n

−1
−1
E[b|X]=β para qualquer X.
Var[b|X]0 para um X específico
b converge para β
b é consistente
−1
n
n
1
 1
1

=  X'X   2 ∑ i=1 ∑ j=1 x iεi x j ' ε j   X'X 
n
 n
n

In E[(b - β)( b - β) ' | X] in the double sum, terms with unequal
subscripts have expectation zero.
−1
1
 1
E[(b - β)( b - β) ' | X ] =  X'X   2
n
 n
∑
n
i=1
−1
=
σ2  1
 1
1

X'X   X'X   X'X 
n  n
 n
n

1

x i x j 'E[ε2i | X]   X'X 
n

−1
=
σ2  1

X'X 
n  n

−1
−1
Danielle Carusi Machado - UFF - Econometria
2/2009
Danielle Carusi Machado - UFF - Econometria
2/2010
Limite de probabilidade
Resultados Assintóticos
−1
1

1 n

b = β +  X'X  ×  ∑ i=1 x iεi 
n

n

−1
1 n

β + Q−1 ×  ∑ i=1 x iεi 
n

Qual
a média
variável
What
is thedesta
mean
of thisaleatória?
random vector?
−1
1

1 n
 1
 1

b - β =  X'X  ×  ∑ i=1 x iεi  =  X'X   X'ε 
n

n
 n
 n

−1
 1
 1

P lim(b - β) = p lim  X'X   X'ε  
 n
 
 n
−1
1

1

= p lim  X'X  plim  X'ε  =
n

n

What is its variance?
Do they 'converge' to something? We use
Qual sua variância?
−1


1

1
plim  n X'X   plim  n X'ε 





Estathis
soma
converge
Podemos achar
method
to para
find algo?
the probability
limit.o
limite de probabilidade.
What
is the asymptotic
distribution?
Qual
a distribuição
assintótica?
1

= Q−1p lim  X'ε  assuming well behaved regressors.
A inversa é uma
n

função contínua
1

Este plim
X'εdeverá
What must be assumed to get p lim
= 0 ?ser zero da matriz

original.
n

Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Limite de probabilidade
Hipótese crucial do modelo
O que devemos assumir para que plim(1/nX’ε)=0?
Devemos encontrar o plim do último termo:
1)
 X 'ε 

 n 
p lim
1
X 'ε
=
n
n
n
2)
n
x i ε i = ∑w i = w
∑
n
i
i
1
=1
=1
p lim b = β + Q −1p limw
Para isto, devemos formular algumas hipóteses.
Danielle Carusi Machado - UFF - Econometria
2/2010
3)
xi = vetor aleatório com média e variâncias finitas e com
distribuições idênticas.
εi = variável aleatória com uma distribuição constante com
média e variância finitas e E(εi)=0
xi e εi são estatisticamente independentes. wi = xiεi = uma
observação em uma amostra aleatória, com matriz de
covariância constante e o vetor de média igual a zero.
1
w i converge para sua esperança.
n
∑
Danielle Carusi Machado - UFF - Econometria
2/2010
9
Limite de probabilidade
Pela hipótese de exogeneidade e pela lei das
expectativas iteradas:

E (w i ) = E x E w i
 
 = E E  x i ε i

x 
x i 
x i 
 

 = 0
= E x x i E  ε i

 x i 

Desta forma a expectativa exata E (w ) = 0
1
1
1
E (w ) = E (
wi ) = E ( wi ) =
n
∑
i
n
=1
∑
i
n
=1
Limite de probabilidade
Pela decomposição da variância:
[ ( X )]+ var[E (w X )]
[ ( X )]+ 0
var( w ) = E var w
= E var w
Para calcular o primeiro termo usamos E [εε ' | X ] = σ 2 I
1
1 σ 2  X´X 
var w
= E ( w w ´/ X ) = X ´E [εε ' | X ]X =


X
n
n
n  n 
σ 2  X´X 
E var w
=
E

X
n
 n 
( )
E (w i ) = 0
∑
i
=1
[ ( )]
Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2010
Limite de probabilidade
Distribuição assintótica
Substituindo (2) em (1) :
[ (
var(w ) = E var w
)] = E  σn  Xn' X  =  σn E  Xn' X 
2
X
2


 

 
A variância irá para zero se a esperança entre parênteses convergir para
uma matriz constante. A hipótese de que plim (X' X/n) converge para Q será
suficiente .
lim var(w ) = 0.Q = 0
n →∞
Como a média w é zero e sua variância converge para zero, w converge em média
quadrática para zero, desta forma :
X 'ε
=0
n
p lim b = β + Q −1.0 = β
plim
EMQ é consistente!!
−1
1

1 n

b = β +  X'X  ×  ∑ i=1 x iεi 
n
n




O comportamento
limite de
da as
The limiting behavior
ofbbé iso mesmo
the same
estatística
resultante
substituição
da matriz
that of the
statisticda
that
results when
the de
momentos pelo seu limite.
moment
matrix
is
replaced
by
its
limit.
We
Examinamos o comportamento da seguinte soma
modificada:
examine the behavior of the modified sum
1 n

β + Q −1 ×  ∑ i=1 x iεi 
n

Danielle Carusi Machado - UFF - Econometria
2/2010
Danielle Carusi Machado - UFF - Econometria
2/2009
Distribuição assintótica
b β em probabilidade. Como descrever esta
distribuição?
Não tem uma distribuição limite
Variância b 0
Como estabilizar a variância? Var[√n b] ~ σ2Q-1 is O(1)
Mas, E[√n b]= √n β que diverge
√n (b - β) é uma variável aleatória com média e
variância finitas (transformação que estabiliza)
b aproximadamente β +1/ √n vezes a variável
aleatória.
Danielle Carusi Machado - UFF - Econometria
2/2010
Distribuição limite
√n (b - β)
= √n (X’X)-1X’ε
= √ n (X’X/n)-1(X’ε/n)
No limite, isto é igual a (plim):
√ n Q-1(X’ε/n)
Q é uma matriz positiva definida fixa.
Comportamento depende da variável aleatória
√ n (X’ε/n)
Danielle Carusi Machado - UFF - Econometria
2/2010
10
Distribuição no limite: Normal
(
1
n
) X ' ε = n (w − E (w ) )
Distribuição no limite: Normal
Se var( x i ε i ) = σ 2E ( x i x i ' ) = σ 2Q i
Podemos usar a versão Lindeberg - Feller do TLC para obter
a distribuição limite da variável aleatória acima.
w é a média de n vetores aleatórios independentes :
w i = x i εi
Estes vetores têm média zero e variância igual a :
var( x i ε i ) = σ 2E ( x i x i ' ) = σ 2Q i
var( n w ) = n var(w ) = n var(
1
n
∑ x i εi ) = n ∑ var(x i ε i )
1
σ2
Q i = σ 2Qn
n
lim σ 2Q n = σ 2Q
=
∑
Danielle Carusi Machado - UFF - Econometria
2/2009
Danielle Carusi Machado - UFF - Econometria
2/2009
Distribuição no limite: Normal
Distribuição assintótica
Temos todos elementos para aplicarmos o TLC para o vetor n (w ) :
− {x i ε i } são vetores independentes distribuídos com média zero e
variância igual a σ 2Q i .
(
 1 
d


 N 0, σ 2Q
 n  X ' ε →


)
(
(
n (b − β ) →
 N 0,Q −1σ 2
d
s2 =
)
Teorema : Distribuição assintótica de b com observações independentes
Se {ε i } são independentemente distribuídos com média zero e variância
finita σ 2 temos que :
 1 
d
 X ' ε →
 N Q −1 0,Q −1σ 2QQ −1

 n 
Q −1 
(
d
 N 0,Q −1σ 2
n (b − β ) →
)
)



b ~ N  β ,Q −1
σ 2 
n 
Resultado importante : normalidade assintótica do EMQ não depende
da normalidade dos distúrbios com consequênc ia do TLC.
Danielle Carusi Machado - UFF - Econometria
2/2009
Danielle Carusi Machado - UFF - Econometria
2/2009
Consistência de s2
Consistência de s2
1
1
n 1
e'e =
ε'Mε =
ε'Mε
n −K
n−K
n−K n
n
→1
n −K
1
1
1

p lim s2 = plim ε'Mε = plim  ε'ε − ε'X (X'X )-1 X'ε 
n
n
n

1
1

1

1

= plim ε'ε − plim  ε'X  plim  (X'X )-1  p lim  X'ε 
n
n

n

n

1
= plim ε'ε − 0'Q-1 0
n
1
What must be assumed to claim plim ε'ε= E[ε2 ] = σ2 ?
n
Danielle Carusi Machado - UFF - Econometria
2/2009
X ' X −1
) = σ 2Q −1
n
σ 2 −1
Q
var b =
n
est var b = s 2 ( X ' X ) −1
p lim s 2 (
Danielle Carusi Machado - UFF - Econometria
2/2009
11
Eficiência assintótica
Um
estimador
é
assintoticamente
eficiente
se
é
consistente, assintoticamente normalmente distribuído, e
tem uma matriz de covariância que não é maior que uma
matriz de covariância de qualquer outro estimador
consistente e com distribuição assintótica normal.
Danielle Carusi Machado - UFF - Econometria
2/2009
12
Download