DISCIPLINA: Econometria PROFESSOR: Bruno Moreira CURSO: Tecnólogo em Gestão Financeira Aula 13 – Modelagem Econométrica Referências GUJARATI, Damodar N. Econometria básica. 3. ed. São Paulo: Makron Books, 2005. Cap. 13 Econometria: Visão tradicional HIPÓTESE 9 MCRL – O modelo de regressão escolhido está corretamente especificado. Até agora! Econometria: Visão tradicional Considerando a Hipótese 9 nosso problema até o momento era: Estimar os parâmetros; Testar as hipóteses. Mas e se encontrarmos problemas? Econometria: Visão tradicional Métodos de correção: White; MQP Etc. E se os problemas persistirem? Econometria: Visão tradicional Encontramos, então, uma nova gama de problemas que uma regressão pode conter: Os chamados erros ou vieses de especificação: Variáveis omitidas do modelo; Variáveis supérfluas inseridas no modelo; Forma funcional incorreta; Má especificação do erro estocástico. Tipos de erro de especificação O caso de Variáveis omitidas do modelo Suponha que um modelo “correto” para definirmos o custo total de produção Y em função do produto X seja: Mas que por omissão tenhamos modelado da seguinte forma: Variáveis omitidas do modelo Neste caso estaremos cometendo um erro de omitir uma variável relevante. E nosso novo termo de erro: 𝑣𝑖 = 𝑢𝑖 + 𝛽3 𝑋3𝑖 Quais problemas isso pode causar? Variáveis omitidas do modelo 1) Se a variável omitida X3 tiver relação com a variável incluída X2, os estimadores α1 e α2 serão viesados e inconsistentes, ou seja, E(𝛼1 ) não será igual a β1 nem E(𝛼2 ) não será igual a β2; 2) Mesmo que X2 e X3 não tenham correlaçã 𝛼1 ainda é viesado, embora 𝛼2 não o seja; 3) A variância da perturbação σ2 é estimada incorretamente; 4) A variância da 𝛼2 é um estimador viesado da variância do verdadeiro 𝛽2 ; 5) A inferência poderá trazer resultados enganosos. Identificação /teste de Variáveis omitidas do modelo A partir do Teste RESET de Ramsey No Stata, após rodar a regressão utiliza-se o comando: estat ovtest O teste RESET irá avaliar se há omissão de variáveis em nossa regressão. Identificação /teste de Variáveis omitidas do modelo Primeiramente roda-se a regressão (omitimos a variável energia) Identificação /teste de Variáveis omitidas do modelo Em seguida utiliza-se o comando “estat ovtest”: Como a prob > F rejeita-se a hipótese nula de que o modelo não possui variáveis omitidas. Resolvendo o problema das Variáveis omitidas do modelo O modelo econométrico deve seguir o princípio da parcimônia. Entretanto, isso não implica que devemos omitir variáveis relevantes. Neste caso, tem-se que trabalhar o embasamento teórico para verificar se alguma outra variável pode ser incluída no modelo. Inclusão de variáveis irrelevantes Outro problema que podemos ter é a Inclusão de variáveis irrelevantes. Suponha agora que o “correto” modelo econométrico seja: Mas acabamos incluindo uma variável irrelevante: Inclusão de variáveis irrelevantes Neste caso: 𝑣𝑖 = 𝑢𝑖 − 𝛼3 𝑋3𝑖 Entretanto, 3 = 0, por que? Com isso, 𝑣𝑖 = 𝑢𝑖 Isso é bom ou ruim? Consequências da Inclusão de variáveis irrelevantes 1) Os estimadores por MQO são todos não viesados e consistentes, ou seja, E(𝛼1 ) = β1, E(𝛼2 ) = β2, E(𝛼3 ) = β3; 2) A variância da perturbação σ2 está estimada corretamente; 3) É possível fazer inferências e calcular o IC; 4) Porém, os estimados serão geralmente ineficientes, pois, suas variâncias serão, em geral, maiores do que as dos βs do modelo verdadeiro. 2 Como 𝑟23 tem valor entre 0 e 1: Consequências da Inclusão de variáveis irrelevantes A implicação deste resultado: A inclusão de variáveis irrelevantes torna a variância dos coeficientes maior do que a necessária, tornando as inferências de probabilidade sobre os parâmetros são menos precisas. Então incluir variáveis irrelevantes é indicado? Não. Porque provoca a perda de eficiência, pode levar a problemas de multicolinearidade e reduz os graus de liberdade. Parcimônia. Consequências da Inclusão de variáveis irrelevantes A implicação deste resultado: A inclusão de variáveis irrelevantes torna a variância dos coeficientes maior do que a necessária, tornando as inferências de probabilidade sobre os parâmetros são menos precisas. Então incluir variáveis irrelevantes é indicado? Não. Porque provoca a perda de eficiência, pode levar a problemas de multicolinearidade e reduz os graus de liberdade. Parcimônia. Testando a Inclusão de variáveis irrelevantes Verificar se a inclusão de uma variável é irrelevante é simples, basta verificar sua estatística t individualmente, ou a F em conjunto. Entretanto, se temos um modelo e vamos incluindo variáveis aos poucos, é possível ir testando cada um dos parâmetros, com o seguinte comando: Statistics → postestimation → tests → test parameters Testando a Inclusão de variáveis irrelevantes Que apresentará a seguinte janela: Testando a Inclusão de variáveis irrelevantes Que no caso do exemplo estamos testando se as variáveis energia, emprego e desemprego, em conjunto são iguais a zero. Neste exemplo, rejeita-se a hipótese nula de que as três variáveis analisadas, em conjunto, sejam iguais a zero. Corrigindo o problema da inclusão de variáveis irrelevantes Para corrigir o problema da inclusão de variáveis irrelevantes basta testar se a inclusão da variável colabora com a explicação do modelo. Caso contrário é só excluí-la. Adoção da forma funcional errada Considere, agora que um modelo corretamente especificado tenha a seguinte forma: E que um pesquisador tenha o modelado assim: Aqui incorre-se no problema de utilizar uma forma funcional “errada”. Consequências da forma funcional errada Os estimadores por MQO podem ser viesados. Meu modelo pode não explicar nada. (R2 baixo e estatisticas t insignificantes). Detecção do problema de forma funcional errada Novamente, neste caso, tem-se que trabalhar o embasamento teórico para verificar se a forma funcional é a melhor possível. Caso não seja teremos R2 baixo e estatisticas t insignificantes. Isso ocorre porque, a priori, podemos não saber exatamente a forma funcional a ser utilizada. Testando uma ou mais delas será possível escolher entre as melhores. Critério de Informação de Akaike e Critério de Schwarz Além do R2 e R2 ajustado como a medidas de grau de ajustamento do modelo, outros critérios utilizados para julgar a adequação de um modelo de regressão são: Critério de Informação de Akaike Critério de Schwarz Critério de Informação de Akaike (AIC) e Critério de Schwarz Além do R2 e R2 ajustado como a medidas de grau de ajustamento do modelo, outros critérios utilizados para julgar a adequação de um modelo de regressão são: Critério de Informação de Akaike Critério de Schwarz Os dois critérios servem para se comparar dois ou mais modelos e decidir, dentre estes, qual o melhor. Neste sentido, o melhor modelo será aquele com menor AIC. Critério de Informação de Akaike (AIC) e Critério de Schwarz NO caso do exemplo podemos testar qual modelo é o melhor: 𝑝𝑖𝑏 = 𝛼1 + 𝛼2 𝑒𝑛𝑒𝑟𝑔𝑖𝑎𝑖 + 𝛼3 𝑒𝑚𝑝𝑖 + 𝛼4 𝑑𝑒𝑠𝑒𝑚𝑝𝑖 + 𝛼5 𝑖𝑔𝑝𝑚𝑖 + 𝛼6 𝑓𝑜𝑙ℎ𝑎𝑖 + 𝑢𝑖 Ou log 𝑝𝑖𝑏 = 𝛼1 + 𝛼2 𝑒𝑛𝑒𝑟𝑔𝑖𝑎𝑖 + 𝛼3 𝑒𝑚𝑝𝑖 + 𝛼4 𝑑𝑒𝑠𝑒𝑚𝑝𝑖 + 𝛼5 𝑖𝑔𝑝𝑚𝑖 + 𝛼6 𝑓𝑜𝑙ℎ𝑎𝑖 + 𝑢𝑖 Critério de Informação de Akaike (AIC) e Critério de Schwarz Pelo STATA é possível calcular o valor do AIC para ambas as regressões. Para tanto, o primeiro passo é rodar a regressão a ser analisada e em seguida, aplicar o seguinte comando: estat ic Critério de Informação de Akaike (AIC) e Critério de Schwarz Para o nosso exemplo temos: Modelo linear Modelo log