Revisão Geral Econometria Avançada Prof. Alexandre Gori Maia Econometria 2 – Princípio da Normalidade A. G. Maia Métodos de Mínimos Quadrados Mínimos Quadrados Y e6 e4 e2 e1 en e5 e3 X O método de mínimos quadrados irá obter os ’s de tal forma que as distâncias entre os valores observados e a reta (ei) sejam mínimas. 2 Econometria 2 – Regressão Linear A. G. Maia Análise de Variância Verificando a Signficância da Variável Independente Quando X não explica Y Quando X explica Y Y Y Maior Soma dos Quadrados da Regressão Menor Soma dos Quadrados da Regressão Y Y ^ Y ^ Y X n STQ (Yi Y ) i 1 2 X n ˆ i Y )2 SQReq (Y i 1 n ˆ )2 SQRes (Yi Y i i 1 3 Econometria 2 – Regressão Linear A. G. Maia Análise de Variância Tabela ANOVA H0: O modelo não contribui para explicar Y H1: O modelo contribui para explicar Y Fonte GL Soma dos Quadrados n Regressão Resíduos Total v ˆ Y )2 SQReg (Y i i 1 n ˆ )2 n - v -1 SQRes (Yi - Y i i 1 Quadr Médios SQReg v SQRes n - v -1 F F SQReg SQRes/(n - v - 1) valor p prob erro tipo I n 2 n - 1 STQ (Yi Y ) i 1 Decisão Irei afirmar que o modelo contribui para explicar a variável dependente Y quando o nível de significância (valor p) for suficientemente baixo (usualmente < 0,05). Ou seja, afirmo que o modelo é bom somente se a chance de de erro ao fazer tal afirmação for baixa. 4 Econometria 2 – Princípio da Normalidade A. G. Maia Regressão Linear Distribuição dos Resíduos Y Yi ~ N ( 0 1 Xi , σ 2 ) ^ Yj Ŷi Como os resíduos (ei) representam a distância de cada Yi à reta (0+1Xi), então é a mesma coisa afirmar que: Xj e i ~ N (0, σ 2 ) X 0 5 Econometria 2 – Princípio da Normalidade A. G. Maia Normalidade dos Resíduos Como verificar o princípio? As técnicas mais utilizadas para verificar se os resíduos estão normalmente distribuídos são: n 1) Análise gráfica: 8 7 6 5 4 3 2 Construir um histograma (valores dos resíduos no eixo horizontal e as respectivas freqüências no eixo vertical) e analisar visualmente se a forma de distribuição assemelha-se a uma normal; 1 0 -2 -1,2 -0,4 0,4 1,2 2 Mais ei 2) Estatística O teste Jarque-Bera de normalidade é baseado nas Jarque-Bera (JB): medidas de assimetria e curtose dos resíduos. Com a S 2 ( K 3) 2 estatística de JB é possível estimarmos a JB n probabilidade de erro ao afirmar que o pressuposto da 6 24 normalidade é violado, ou seja, que os resíduos não estão normalmente distribuídos; 6 Econometria 2 – Heterocedasticidade A. G. Maia Detectando Heterocedasticidade Análise Gráfica Homocedasticia ep Heterocedasticia σ 2 constante 0 ep σ i2 σ 2 Xi 0 X X A dispersão dos resíduos é a mesma ao longo de X A dispersão dos resíduos aumenta para valores altos de X Heterocedasticia ep Heterocedasticia σ i2 α1 Xi α 2 Xi2 ep σi2 σ 2 Xi2 0 0 X Há uma relação quadrática entre os resíduos e os valores de X X Há uma relação quadrática entre os resíduos e os valores de X 7 Econometria 2 – Heterocedasticidade A. G. Maia Heterocedasticidade Como detectar a heterocedasticidade? Dois teste para se detectar a heterocedasticidade: 1) Análise gráfica: Construir um gráfico de dispersão entre os resíduos (ou resíduos padronizados) e cada uma das variáveis independentes do modelo, para verificar se há entre elas alguma relação sistemática. 2) Teste de Goldfeld-Quandt: Divide-se a amostra em duas partições iguais, para verificar se as variâncias diferem entre elas. Ajusta-se então um modelo para cada partição e verifica-se as dispersões dentro de cada partição (erro padrão ou SQRes) são iguais (homocedasticidade) ou diferentes (heterocedasticidade). Y X 8 Econometria 2 – Heterocedasticidade A. G. Maia Corrigindo Heterocedasticidade Método de Mínimos Quadrados Ponderados Mínimos Quadrados Ponderados: O método de mínimos quadrados ponderados é um caso especial de uma técnica econométrica mais geral denominada mínimos quadrados generalizados. Na presença de heterocedasticidade, os parâmetros ’s do modelo Y = 0+1X não são eficientes pois são influenciados pelos valores de X com maiores variâncias. Uma opção para corrigir este problema é o chamado método de mínimos quadrados ponderados, que consiste em ponderar as variáveis do modelo pela variância de cada observação, ou seja, ajustar um novo modelo dado por: os parâmetros ’s deste modelo serão Yi 1 Xi melhores (mais eficientes) que os do modelo β0 ( ) β1 σi σi σi acima (mínimos quadrados ordinários) Perceba que neste novo modelo há uma variável adicional (1/i) e não há intercepto. Quando os valores de i são desconhecidos, podem ser estimados pelos desvios padrões (erros padrões) das sub-amostras do teste QG. 9 Econometria 2 – Multicolinearidade A. G. Maia MultiColinearidade Conceito Ausência de colinearidade Variabilidade de Y explicada por X1 Variabilidade total de Y Variabilidade total de X1 Variabilidade de Y explicada por X2 Variabilidade total de X2 Presença de colinearidade Efeito isolado de X1 em Y X1 Variabilidade total de Y X2 Efeito isolado de X2 em Y Efeito conjunto de X1 e X2 sobre Y 10 Econometria 2 – Multicolinearidade A. G. Maia Multicolinearidade Como detectar a multicolinearidade? Alguns sinais de multicolinearidade: 1) Estatísticas Conflitantes: Um R2 elevado em um modelo com poucas estatísticas t significativas. É até possível até que a estatística F indique que o modela seja signficativo em explicar a variável dependente, mas nenhuma estatística individual t seja significativa. 2) Relacionamento das variáveis independentes : Um ajuste linear significativo entre as variáveis independentes pode ser um forte indício de multicolinearidade. 3) Fator Inflacionário da Variância : Uma estatística que mensura o Fator Inflacionário da Variância (FIV) pode dar uma idéia de quão inflacionada esta sendo a variância dos parâmetros ’s em virtude da multicolinearidade. 11 Econometria 2 – Multicolinearidade A. G. Maia Multicolinearidade O que fazer? Na presença de multicolinearidade, o pesquisador pode tomar as seguintes atitudes: - Aumentar o tamanho da amostra: se aumentarmos o tamanho da amostra, a tendência é que os estimadores do parâmetros ´s fiquem mais precisos (diminua sua variância). Ou seja, o aumento do tamanho da amostra irá aliviar a falta de significância dos parâmetros estimados e melhorar a precisão das estimativas. - Omitir a variável que apresentar alta colinearidade com as demais: desde que esta omissão não comprometa as especificações do modelo, ou seja, ausência de variáveis importantes na compreensão do problema. - Tranformar as variáveis: a multicolinearidade pode ser eliminada transformando-se as variáveis independentes. Por exemplo, se estamos estimando o preço de venda da soja com base na área e quantidade produzida, teremos obviamente um colinearidade entre área e quantidade produzida. Mas se substituirmos ambas as variáveis independentes pela variável produtividade=produção/área, este problema será eliminado. 12 Econometria 2 – Autocorrelação A. G. Maia Detectando Autocorrelação Análise Gráfica Ausência de Autocorrelação e Autocorrelação e 0 0 tempo tempo Não há nenhuma relação evidente entre os resíduos ao longo do tempo Há um padrão cíclico de dispersão dos resíduos ao longo do tempo Autocorrelação Autocorrelação e e 0 0 tempo Há uma tendência quadrática de dispersão dos resíduos ao longo do tempo tempo Há uma tendência linear na distribuição dos resíduos ao longo do tempo 13 Econometria 2 – Autocorrelação A. G. Maia Autocorrelação Como detectar a autocorrelação? Dois teste para se detectar a autocorrelação: ep 1) Análise gráfica: 3 2 1 0 0 10 20 30 40 -1 Construir um gráfico de dispersão entre os resíduos e o tempo de coleta das informações amostrais, para verificar a existência de alguma relação serial. -2 -3 tempo 2) Teste de A estatística de Durbin-Watson envolve o cálculo de Durbin-Watson: um teste baseado nos resíduos do método de mínimos n quadrados, para se testar a hipótese nula da ausência 2 (et et 1 ) de autocorrelação. DW t 2 n et 2 t 1 14 Econometria 2 – Autocorrelação A. G. Maia Teste de Durbin-Watson Conceito Sabemos que: DW 2(1 ) e corr (et , et 1) e que... 1 1 Então, quando: -1 0 1 DW 4 DW 2 DW 0 A estatística DW varia entre 0 e 4. Na ausência de autocorrelação, o valor de DW será próximo de 2. Quão mais afastado de 2, mais evidências para se rejeitar a hipótese nula da ausência de correlação, seja pela existência de correlação serial positiva (DW≈0) ou negativa (DW≈4). Mas quão distante de 2 deve estar DW para se rejeitar H0? Dado o número de observações da amostra (n) e o número de variáveis independentes (k), devese consultar a tabela de Durbin-Watson para obter o limite inferior (dI) e superior (dS) tais que: Rejeita H0, ou seja, há autocorrelação positiva 0 Zona de indecisão dI Não se rejeita H0, ou seja, não há autocorrelação dS 2 Zona de indecisão 4-dS Rejeita H0, ou seja, há autocorrelação negativa 4-dI A novidade aqui é a zona de indecisão, limites onde o teste é inconclusivo! 4 15 Econometria 2 – Autocorrelação A. G. Maia Correção para Autocorrelação Como corrigir a autocorrelação? Quando a existência de autocorrelação não for devida à falhas na especificação do modelo, uma medida corretiva para o modelo: Yt 0 1 X t et Que apresenta correlação serial nos resíduos dada por: são os resíduos não et et 1 vt onde... vt (et et 1) autocorrelacionados que devem ser obtidos no modelo original. Será dada por: (Yt Yt 1 ) (0 0 ) 1 ( X t X t 1 ) (et et 1 ) ou, resumidamente... Yt* 0* 1 X t* vt onde Y*t=(Yt-Yt-1), *0=(0-0), X*t=(Xt-Xt-1), e vt são os resíduos não autocorrelacionados. Este modelo corrige o problema da autocorrelação nos resíduos originais (et), e apresenta o mesmo coeficiente 1 do modelo original. 16 Econometria 2 – Defasagens Distribuídas A. G. Maia Defasagem Temporal Conceito Supondo o exemplo da variação no consumo: Dada uma variação de 1.000 reais na renda Em nosso exemplo para a variação no Consumo $ consumo final $200 Ao final, teremos $900 $300 uma variação de 900 reais no $400 consumo. consumo anterior t0 t1 t2 Tempo Variação total: Enquanto cada coeficiente i de um modelo com defasagem distribuída é chamado de impacto no tempo i, a variação total, ou impacto total de uma variação unitária de X em Y será dada por: k i 0 ... k i 0 consumo (C) dada uma variação na renda (R), tínhamos: Ct cte 0Rt 1Rt 1 2Rt 2 Dados por: Ct cte 0,4Rt 0,3Rt 1 0,2Rt 2 Em outras palavras, significa que dada uma variação da renda no período t, uma proporção (0=0,4) terá efeito imediato (t0) na variação do consumo. Outra menor proporção (1=0,3) terá efeito no próximo período (t1), e assim sucessivamente. Ao final, teremos uma variação total no consumo dada por: 2 i 0 1 2 0,4 0,3 0,2 0,9 i 0 17 Econometria 2 – Defasagens Distribuídas A. G. Maia Transformação de Koyck Conceito 0 k Estabelecendo uma relação entre o impacto i e o tempo: onde 0<<1 3 2 1 βk β 0 λ k 0 1 2 3 Vamos supor que a variação para o período 0 seja dada por 0. Supondo que os parâmetros i, que definem o impacto de X em cada tempo i, sejam todos do mesmo sinal, Koyck (1954) definiu uma técnica para estimá-los, pressupondo que eles decaiam geometricamente ao longo do tempo. Tempo Cada valor de 0 irá, portanto, depender do impacto inicial no período t (0) e da taxa de declínio . Por exemplo, supondo que o variação unitária de X cause um impacto imediato igual a 0,8 unidades de Y, com uma taxa de declínio de 0,5, teremos: O impacto irá reduzir-se taxa de geometricamente ao longo do … 0 1 2 10 tempo, de tal forma que no declínio período 10 o impacto será 0 0 … 0 0 praticamente nulo … 0,8*0,510 0,5 0,8 0,8*0,5 0,8*0,51 18 (010=0,001) A. G. Maia Econometria 2 – Séries Temporais Séries Estacionárias Yt Exemplos 4 Processo estacionário A série varia aleatoriamente em torno de uma média constante, com variância também constante. Choques são amortecidos com o tempo (0<<1). Exemplo: Inflação mensal. 3 2 1 0 -1 -2 -3 -4 0 10 20 30 40 50 60 70 80 90 100 Yt Tempo 14 12 10 8 6 4 2 0 -2 0 10 20 30 40 50 60 70 80 90 100 Tempo Processo não estacionário A série varia aleatoriamente com um tendência ao longo do tempo. Um choque que produz um crescimento no período t, será assimilado integralmente na série (=1). Séries deste tipo são também chamadas de passeio aleatório (random walk). Exemplo: PIB real. 19 Econometria 2 – Séries Temporais A. G. Maia Séries Temporais O que fazer quando há variáveis não estacionárias Algumas alternativas quando temos variáveis não estacionárias no modelo de série temporal: 1) Modelo de tendência estacionárias: Uma solução simples para evitar o problema de relação espúrias em variáveis temporais não estacionárias é a inclusão da variável explanatória tempo t. 2) Modelo de diferença estacionária: Quando tempos uma variável não estacionária Yt, é possível que sua diferença Yt=Yt-Yt-1 seja não estacionária, de tal forma que o ajuste possa ser feito com Yt no lugar de Yt; 3) Variáveis cointegradas: Embora não estacionárias, duas variáveis podem compartilhar tendências temporais semelhantes, exibindo uma relação de equilíbrio a longo prazo, podendo desta forma serem relacionadas diretamente num ajuste econométrico. 20 Econometria 2 – Regressão Logística A. G. Maia Variáveis Dummy Problemas de Estimação Quando ajustamos um modelo linear do tipo: Y 0 1 X e onde Y é uma variável dummy, ou seja, estamos interessados em prever a probabilidade de sucesso de Y em função da variável independente X, deparamo-nos com uma série de dificuldades. O fato de estarmos forçando um ajuste linear a uma relação curvilínea, irá ocasionar problemas do tipo: Y 1) Ausência de normalidade na distribuição dos resíduos: a distribuição dos resíduos em torno da reta de regressão não 1 seguirá uma distribuição normal, comprometendo a análise das estatísticas de teste. 2) Heterocedasticidade: Valores de X com probabilidade de Y 0 X próximos a 0 ou 1 terão menor variabilidade que valores próximos a 0,5. Como conseqüência, os parâmetros estimados serão ineficientes. 3) Escolha funcional: A relação linear não é a escolha apropriada para este tipo de relação. Probabilidades negativas e maiores que 1 estarão sendo previstas, o que é irreal. 21 Econometria 2 – Regressão Logística A. G. Maia Regressão Logística Definição Modelo Logit O modelo logit é o mais tradicional ajuste de regressão quando temos uma dummy como variável dependente. Ajusta uma curva logística à probabilidade de sucesso P (P), segundo o modelo não linear: P 1 1 e ( 0 1X ) (1) Para linearizar a expressão: Se Y é uma dummy, então temos que: X P Y P (Y 1) A chance de sucesso (odds ratio, ou seja, taxa de sucesso em relação ao fracasso) será dada por: P 1 P representa qual a chance de sucesso em relação aos fracassos. Temos então o seguinte ajuste linear para a relação entre a chance de sucesso e as variáveis independentes: este ajuste linear é equivalente à curva logística (1) para a ln( P ) 0 1 X probabilidade de sucesso. Uma vez obtido este ajuste, é 1 P possível estimar a probabilidade de sucesso dados os valores de X. 22