Slide 1 - OoCities

Propaganda
Revisão Geral
Econometria Avançada
Prof. Alexandre Gori Maia
Econometria 2 – Princípio da Normalidade
A. G. Maia
Métodos de Mínimos Quadrados
Mínimos Quadrados
Y
e6
e4
e2
e1
en
e5
e3
X
O método de mínimos quadrados irá
obter os ’s de tal forma que as
distâncias entre os valores observados
e a reta (ei) sejam mínimas.
2
Econometria 2 – Regressão Linear
A. G. Maia
Análise de Variância
Verificando a Signficância da Variável Independente
Quando X não explica Y
Quando X explica Y
Y
Y
Maior Soma dos
Quadrados da
Regressão
Menor Soma dos
Quadrados da
Regressão
Y
Y
^
Y
^
Y
X
n
STQ   (Yi  Y )
i 1
2
X
n
ˆ i  Y )2
SQReq   (Y
i 1
n
ˆ )2
SQRes   (Yi  Y
i
i 1
3
Econometria 2 – Regressão Linear
A. G. Maia
Análise de Variância
Tabela ANOVA
H0: O modelo não contribui para explicar Y
H1: O modelo contribui para explicar Y
Fonte
GL
Soma dos
Quadrados
n
Regressão
Resíduos
Total
v
ˆ  Y )2
SQReg   (Y
i
i 1
n
ˆ )2
n - v -1 SQRes   (Yi - Y
i
i 1
Quadr
Médios
SQReg
v
SQRes
n - v -1
F
F
SQReg
SQRes/(n - v - 1)
valor p
prob
erro
tipo I
n
2
n - 1 STQ   (Yi  Y )
i 1
Decisão
Irei afirmar que o modelo contribui para explicar a variável dependente Y
quando o nível de significância (valor p) for suficientemente baixo
(usualmente < 0,05). Ou seja, afirmo que o modelo é bom somente se a
chance de de erro ao fazer tal afirmação for baixa.
4
Econometria 2 – Princípio da Normalidade
A. G. Maia
Regressão Linear
Distribuição dos Resíduos
Y
Yi ~ N (  0  1 Xi , σ 2 )
^
Yj
Ŷi
Como os resíduos (ei) representam a
distância de cada Yi à reta (0+1Xi),
então é a mesma coisa afirmar que:
Xj
e i ~ N (0, σ 2 )
X
0
5
Econometria 2 – Princípio da Normalidade
A. G. Maia
Normalidade dos Resíduos
Como verificar o princípio?
As técnicas mais utilizadas para verificar se os resíduos estão
normalmente distribuídos são:
n
1) Análise gráfica:
8
7
6
5
4
3
2
Construir um histograma (valores dos resíduos no
eixo horizontal e as respectivas freqüências no
eixo vertical) e analisar visualmente se a forma de
distribuição assemelha-se a uma normal;
1
0
-2
-1,2
-0,4
0,4
1,2
2
Mais
ei
2) Estatística
O teste Jarque-Bera de normalidade é baseado nas
Jarque-Bera (JB): medidas de assimetria e curtose dos resíduos. Com a
 S 2 ( K  3) 2  estatística de JB é possível estimarmos a
JB  n  
 probabilidade de erro ao afirmar que o pressuposto da
6
24


normalidade é violado, ou seja, que os resíduos não
estão normalmente distribuídos;
6
Econometria 2 – Heterocedasticidade
A. G. Maia
Detectando Heterocedasticidade
Análise Gráfica
Homocedasticia
ep
Heterocedasticia
σ 2  constante
0
ep
σ i2  σ 2 Xi
0
X
X
A dispersão dos resíduos
é a mesma ao longo de X
A dispersão dos resíduos aumenta
para valores altos de X
Heterocedasticia
ep
Heterocedasticia
σ i2  α1 Xi  α 2 Xi2
ep
σi2  σ 2 Xi2
0
0
X
Há uma relação quadrática entre
os resíduos e os valores de X
X
Há uma relação quadrática entre
os resíduos e os valores de X
7
Econometria 2 – Heterocedasticidade
A. G. Maia
Heterocedasticidade
Como detectar a heterocedasticidade?
Dois teste para se detectar a heterocedasticidade:
1) Análise gráfica:
Construir um gráfico de dispersão entre os resíduos (ou resíduos
padronizados) e cada uma das variáveis independentes do modelo,
para verificar se há entre elas alguma relação sistemática.
2) Teste de Goldfeld-Quandt:
Divide-se a amostra em duas partições
iguais, para verificar se as variâncias
diferem entre elas. Ajusta-se então um
modelo para cada partição e verifica-se
as dispersões dentro de cada partição
(erro padrão ou SQRes) são iguais
(homocedasticidade)
ou
diferentes
(heterocedasticidade).
Y
X
8
Econometria 2 – Heterocedasticidade
A. G. Maia
Corrigindo Heterocedasticidade
Método de Mínimos Quadrados Ponderados
Mínimos Quadrados Ponderados:
O método de mínimos quadrados ponderados é um caso especial de uma
técnica econométrica mais geral denominada mínimos quadrados generalizados.
Na presença de heterocedasticidade, os parâmetros ’s do modelo Y = 0+1X
não são eficientes pois são influenciados pelos valores de X com maiores variâncias.
Uma opção para corrigir este problema é o chamado método de mínimos
quadrados ponderados, que consiste em ponderar as variáveis do modelo pela variância de
cada observação, ou seja, ajustar um novo modelo dado por:
os parâmetros ’s deste modelo serão
Yi
1
Xi
melhores (mais eficientes) que os do modelo
 β0 ( )  β1
σi
σi
σi
acima (mínimos quadrados ordinários)
Perceba que neste novo modelo há uma variável adicional (1/i) e não há
intercepto.
Quando os valores de i são desconhecidos, podem ser estimados pelos desvios
padrões (erros padrões) das sub-amostras do teste QG.
9
Econometria 2 – Multicolinearidade
A. G. Maia
MultiColinearidade
Conceito
Ausência de colinearidade
Variabilidade
de Y
explicada
por X1
Variabilidade
total de Y
Variabilidade
total de X1
Variabilidade
de Y
explicada
por X2
Variabilidade
total de X2
Presença de colinearidade
Efeito
isolado de
X1 em Y
X1
Variabilidade
total de Y
X2
Efeito
isolado de
X2 em Y
Efeito
conjunto de
X1 e X2
sobre Y
10
Econometria 2 – Multicolinearidade
A. G. Maia
Multicolinearidade
Como detectar a multicolinearidade?
Alguns sinais de multicolinearidade:
1) Estatísticas Conflitantes:
Um R2 elevado em um modelo com poucas estatísticas t
significativas. É até possível até que a estatística F indique que o
modela seja signficativo em explicar a variável dependente, mas
nenhuma estatística individual t seja significativa.
2) Relacionamento das variáveis independentes :
Um ajuste linear significativo entre as variáveis independentes pode
ser um forte indício de multicolinearidade.
3) Fator Inflacionário da Variância :
Uma estatística que mensura o Fator Inflacionário da Variância (FIV)
pode dar uma idéia de quão inflacionada esta sendo a variância dos
parâmetros ’s em virtude da multicolinearidade.
11
Econometria 2 – Multicolinearidade
A. G. Maia
Multicolinearidade
O que fazer?
Na presença de multicolinearidade, o pesquisador pode tomar as seguintes
atitudes:
- Aumentar o tamanho da amostra: se aumentarmos o tamanho da amostra,
a tendência é que os estimadores do parâmetros ´s fiquem mais precisos (diminua sua
variância). Ou seja, o aumento do tamanho da amostra irá aliviar a falta de significância dos
parâmetros estimados e melhorar a precisão das estimativas.
- Omitir a variável que apresentar alta colinearidade com as demais:
desde que esta omissão não comprometa as especificações do modelo, ou seja, ausência de
variáveis importantes na compreensão do problema.
- Tranformar as variáveis: a multicolinearidade pode ser eliminada
transformando-se as variáveis independentes. Por exemplo, se estamos estimando o preço
de venda da soja com base na área e quantidade produzida, teremos obviamente um
colinearidade entre área e quantidade produzida. Mas se substituirmos ambas as variáveis
independentes pela variável produtividade=produção/área, este problema será eliminado.
12
Econometria 2 – Autocorrelação
A. G. Maia
Detectando Autocorrelação
Análise Gráfica
Ausência de Autocorrelação
e
Autocorrelação
e
0
0
tempo
tempo
Não há nenhuma relação evidente
entre os resíduos ao longo do tempo
Há um padrão cíclico de dispersão
dos resíduos ao longo do tempo
Autocorrelação
Autocorrelação
e
e
0
0
tempo
Há uma tendência quadrática de
dispersão dos resíduos ao longo do tempo
tempo
Há uma tendência linear na distribuição
dos resíduos ao longo do tempo 13
Econometria 2 – Autocorrelação
A. G. Maia
Autocorrelação
Como detectar a autocorrelação?
Dois teste para se detectar a autocorrelação:
ep
1) Análise gráfica:
3
2
1
0
0
10
20
30
40
-1
Construir um gráfico de dispersão entre os
resíduos e o tempo de coleta das informações
amostrais, para verificar a existência de alguma
relação serial.
-2
-3
tempo
2) Teste de
A estatística de Durbin-Watson envolve o cálculo de
Durbin-Watson: um teste baseado nos resíduos do método de mínimos
n
quadrados, para se testar a hipótese nula da ausência
2
 (et  et 1 )
de autocorrelação.
DW  t  2
n
 et
2
t 1
14
Econometria 2 – Autocorrelação
A. G. Maia
Teste de Durbin-Watson
Conceito
Sabemos que:
DW  2(1   ) e
  corr (et , et 1)
e que...  1    1
Então, quando:
  -1
0
 1
DW  4
DW  2
DW  0
A estatística DW varia entre 0 e 4. Na ausência de
autocorrelação, o valor de DW será próximo de 2.
Quão mais afastado de 2, mais evidências para se
rejeitar a hipótese nula da ausência de correlação,
seja pela existência de correlação serial positiva
(DW≈0) ou negativa (DW≈4).
Mas quão distante de 2 deve estar DW para se rejeitar H0?
Dado o número de observações da amostra (n) e o número de variáveis independentes (k), devese consultar a tabela de Durbin-Watson para obter o limite inferior (dI) e superior (dS) tais que:
Rejeita H0, ou seja,
há autocorrelação
positiva
0
Zona de
indecisão
dI
Não se rejeita H0, ou
seja, não há
autocorrelação
dS
2
Zona de
indecisão
4-dS
Rejeita H0, ou seja,
há autocorrelação
negativa
4-dI
A novidade aqui é a zona de indecisão, limites onde o teste é inconclusivo!
4
15
Econometria 2 – Autocorrelação
A. G. Maia
Correção para Autocorrelação
Como corrigir a autocorrelação?
Quando a existência de autocorrelação não for devida à falhas na
especificação do modelo, uma medida corretiva para o modelo:
Yt   0  1 X t  et
Que apresenta correlação serial nos resíduos dada por:
são os resíduos não
et  et 1  vt onde... vt  (et  et 1) autocorrelacionados que devem
ser obtidos no modelo original.
Será dada por:
(Yt  Yt 1 )  (0  0 )  1 ( X t  X t 1 )  (et  et 1 )
ou, resumidamente...
Yt*   0*  1 X t*  vt
onde Y*t=(Yt-Yt-1), *0=(0-0), X*t=(Xt-Xt-1), e vt são os resíduos não
autocorrelacionados.
Este modelo corrige o problema da autocorrelação nos resíduos originais (et), e
apresenta o mesmo coeficiente 1 do modelo original.
16
Econometria 2 – Defasagens Distribuídas
A. G. Maia
Defasagem Temporal
Conceito
Supondo o exemplo da variação no consumo:
Dada uma variação de 1.000 reais na renda Em nosso exemplo para a variação no
Consumo $
consumo final
$200
Ao final, teremos
$900
$300
uma variação de
900 reais no
$400
consumo.
consumo anterior
t0
t1
t2
Tempo
Variação total:
Enquanto cada coeficiente i de um
modelo com defasagem distribuída é
chamado de impacto no tempo i, a variação
total, ou impacto total de uma variação
unitária de X em Y será dada por:
k
 i   0  ...   k  
i 0
consumo (C) dada uma variação na renda
(R), tínhamos:
Ct  cte   0Rt  1Rt 1   2Rt  2
Dados por:
Ct  cte  0,4Rt  0,3Rt 1  0,2Rt  2
Em outras palavras, significa que dada uma
variação da renda no período t, uma
proporção (0=0,4) terá efeito imediato (t0)
na variação do consumo. Outra menor
proporção (1=0,3) terá efeito no próximo
período (t1), e assim sucessivamente.
Ao final, teremos uma variação total no
consumo dada por:
2
 i   0  1   2  0,4  0,3  0,2  0,9
i 0
17
Econometria 2 – Defasagens Distribuídas
A. G. Maia
Transformação de Koyck
Conceito
0 k
Estabelecendo uma relação entre o impacto i e o tempo:
onde 0<<1
3 2 1
βk  β 0 λ
k
0
1
2
3
Vamos supor que a variação para o período 0 seja
dada por 0.
Supondo que os parâmetros i, que definem o
impacto de X em cada tempo i, sejam todos do
mesmo sinal, Koyck (1954) definiu uma técnica para
estimá-los, pressupondo que eles decaiam
geometricamente ao longo do tempo.
Tempo
Cada valor de 0 irá, portanto, depender do impacto inicial no período t (0) e da taxa de
declínio .
Por exemplo, supondo que o variação unitária de X cause um impacto imediato igual a 0,8
unidades de Y, com uma taxa de declínio de 0,5, teremos:
O impacto irá reduzir-se
taxa de
geometricamente ao longo do
…
0
1
2
 10
tempo, de tal forma que no
declínio


período 10 o impacto será
0
0
…

0
0
praticamente nulo
…
0,8*0,510
0,5
0,8
0,8*0,5 0,8*0,51
18
(010=0,001)
A. G. Maia
Econometria 2 – Séries Temporais
Séries Estacionárias
Yt
Exemplos
4
Processo estacionário
A série varia aleatoriamente em torno de uma
média constante, com variância também
constante. Choques são amortecidos com o
tempo (0<<1).
Exemplo: Inflação mensal.
3
2
1
0
-1
-2
-3
-4
0
10
20
30
40
50
60
70
80
90
100
Yt
Tempo
14
12
10
8
6
4
2
0
-2
0
10
20
30
40
50
60
70
80
90
100
Tempo
Processo não estacionário
A série varia aleatoriamente com um tendência
ao longo do tempo. Um choque que produz um
crescimento no período t, será assimilado
integralmente na série (=1).
Séries deste tipo são também chamadas de
passeio aleatório (random walk).
Exemplo: PIB real.
19
Econometria 2 – Séries Temporais
A. G. Maia
Séries Temporais
O que fazer quando há variáveis não estacionárias
Algumas alternativas quando temos variáveis não estacionárias no
modelo de série temporal:
1) Modelo de
tendência
estacionárias:
Uma solução simples para evitar o problema de
relação espúrias em variáveis temporais não
estacionárias é a inclusão da variável explanatória
tempo t.
2) Modelo de
diferença
estacionária:
Quando tempos uma variável não estacionária Yt, é
possível que sua diferença Yt=Yt-Yt-1 seja não
estacionária, de tal forma que o ajuste possa ser feito
com Yt no lugar de Yt;
3) Variáveis
cointegradas:
Embora não estacionárias, duas variáveis podem
compartilhar tendências temporais semelhantes,
exibindo uma relação de equilíbrio a longo prazo,
podendo desta forma serem relacionadas diretamente
num ajuste econométrico.
20
Econometria 2 – Regressão Logística
A. G. Maia
Variáveis Dummy
Problemas de Estimação
Quando ajustamos um modelo linear do tipo:
Y   0  1 X  e
onde Y é uma variável dummy, ou seja, estamos interessados em prever a
probabilidade de sucesso de Y em função da variável independente X, deparamo-nos com
uma série de dificuldades.
O fato de estarmos forçando um ajuste linear a uma relação curvilínea, irá
ocasionar problemas do tipo:
Y
1) Ausência de normalidade na distribuição dos resíduos: a
distribuição dos resíduos em torno da reta de regressão não
1
seguirá uma distribuição normal, comprometendo a análise
das estatísticas de teste.
2) Heterocedasticidade: Valores de X com probabilidade de Y
0
X próximos a 0 ou 1 terão menor variabilidade que valores
próximos a 0,5. Como conseqüência, os parâmetros estimados
serão ineficientes.
3) Escolha funcional: A relação linear não é a escolha apropriada para este tipo de relação.
Probabilidades negativas e maiores que 1 estarão sendo previstas, o que é irreal.
21
Econometria 2 – Regressão Logística
A. G. Maia
Regressão Logística
Definição
Modelo Logit
O modelo logit é o mais tradicional ajuste de regressão quando temos uma
dummy como variável dependente. Ajusta uma curva logística à probabilidade de sucesso
P
(P), segundo o modelo não linear:
P
1
1  e ( 0  1X )
(1)
Para linearizar a expressão:
Se Y é uma dummy, então temos que:
X
P  Y  P (Y  1)
A chance de sucesso (odds ratio, ou seja, taxa de sucesso em relação ao fracasso)
será dada por:
P
1 P
representa qual a chance de sucesso em relação aos fracassos.
Temos então o seguinte ajuste linear para a relação entre a chance de sucesso e as
variáveis independentes:
este ajuste linear é equivalente à curva logística (1) para a
ln(
P
)   0  1 X probabilidade de sucesso. Uma vez obtido este ajuste, é
1 P
possível estimar a probabilidade de sucesso dados os
valores de X.
22
Download