EXERCICIOS – regressão múltipla e problemas econométricos PARTE 1 Um instituto de pesquisa elaborou um estudo para investigar quais são os determinantes do preço de imóveis em uma determinada localidade. Para isso foi realizado um levantamento de dados sobre 321 imóveis vendidos em um determinado ano. As variáveis utilizadas no estudo encontram-se descritas no Quadro 1. Inicialmente, os pesquisadores estimaram um Modelo de Regressão Linear Simples (MODELO 1), pelo método dos Mínimos Quadrados, para investigar se a idade do imóvel determinava, em parte, o preço de venda do imóvel (price). Os resultados são apresentados nas Tabelas de 1 a 3. Na segunda fase do estudo, os pesquisadores estimaram um Modelo de Regressão Linear Múltipla, também pelo Método dos Mínimos Quadrados (MODELO 2), buscando investigar os determinantes do “preço de venda dos imóveis” (price) (Tabelas 4 a 6). Com base nestas informações e nos resultados apresentados, faça a análise dos dois Modelos estimados. Sua análise deve seguir o roteiro descrito nas questões de 1 a 6. (OBS: as saídas com os resultados dos modelos foram obtidas utilizando-se programa SPSS. As vírgulas foram usados como separadores de milhares e os pontos como separadores de decimais). 1. Apresente as equações que descrevem o comportamento do preço de venda dos imóveis. 2. Faça análise de variância: SQR, SQE e SQT. 3. Interprete de r2 e R2, destacando os motivos para que R2 > r2e razões pelas quais é recomendável considerar as medidas ajustadas (r2 e R2 ajustados). 4. Interprete os estimadores dos coeficientes parciais do MODELO 2 (lembre-se de diferenciar as variáveis quantitativas das Dummy para a interpretação). 5. Analise se as variáveis independentes consideradas possuem efeito sobre a variável dependente (utilizando informações da estatística t e/ou nível de significância). 6. Suponha que você está entre os pesquisadores deste estudo e que você tenha que apresentar um Modelo que possibilite averiguar o papel da idade do imóvel da determinação do seu preço de venda. Dentre os modelos apresentados, selecione um e apresente argumentos para sua escolha. 1 Quadro 1: Descrição das variáveis Nome da variável price cbd intst rooms area land baths dist nearinc dólares (EUA) Tipo de variável dependente pés quadrados independente Descrição preço de venda distância até a estação central de ônibus Medidas distância até pés quadrados interestadual número de quartos área construída (em pés pés quadrados quadrados) independente independente independente área do terreno (em pés pés quadrados quadrados) número de banheiros distância até o incinerador mais pés quadrados próximo proximidade com o incinerador mais =1 if dist <= 15840 próximo independente independente independente independente MODELO 1 – REGRESSÃO SIMPLES Tabela 1: Model Summary Adjusted R Model R R Square Square 1 0,332 0,110 0,107 a. Predictors: (Constant), AGE Model 1 Regression Residual Total a. Predictors: (Constant), AGE b. Dependent Variable: PRICE Tabela 2: ANOVA(b) Sum of Squares df 65.871.386.000,943 1 531.981.649.897,044 319 597.853.035.897,987 320 Std. Error of the Estimate 40.836,920 Mean Square F Sig. 65.871.386.000,943 39,499 0,000 1.667.654.074,912 Tabela 3: Coefficients(a) Model 1 (Constant) AGE a. Dependent Variable: PRICE Unstandardized Coefficients B Std. Error 104.034,967 2.605,563 -440,566 70,100 Standardized Coefficients Beta t Sig. 39,928 0,000 -0,332 -6,285 0,000 2 MODELO 2 – REGRESSÃO MÚLTIPLA Tabela 4: Model Summary Adjusted R Std. Error of the Model R R Square Square Estimate 1 0.744 0.554 0.542 29,248.940 a. Predictors: (Constant), NEARINC, AREA, LAND, AGE, ROOMS, INTST, BATHS, CBD Tabela 5: ANOVA(b) Sum of Squares df Mean Square F Sig. Regression 330,936,880,614.593 8 41,367,110,076.824 48.354 0.000 Residual 266,916,155,283.394 312 855,500,497.703 Total 597,853,035,897.987 320 a. Predictors: (Constant), NEARINC, AREA, LAND, AGE, ROOMS, INTST, BATHS, CBD b. Dependent Variable: PRICE Model 1 Tabela 6: Coefficients(a) Model 1 (Constant) AGE CBD INTST AREA LAND ROOMS BATHS NEARINC a. Dependent Variable: PRICE Unstandardized Coefficients B Std. Error 12,994.294 14,495.004 -353.004 59.820 0.915 1.283 -1.840 1.214 30.100 3.349 0.100 0.046 2,966.284 2,434.999 9,461.238 3,542.094 -12,782.707 5,877.504 Standardized Coefficients Beta -0.266 0.190 -0.384 0.484 0.092 0.062 0.169 -0.136 t 0.896 -5.901 0.713 -1.516 8.988 2.164 1.218 2.671 -2.175 3 Sig. 0.371 0.000 0.476 0.131 0.000 0.031 0.224 0.008 0.030 PARTE 2 – PROBLEMAS ECONOMÉTRICOS Considere o Modelo 3, apresentado nas Tabelas 7 a 9, obtidos com os mesmos dados da pesquisa descrita na Parte I. No Modelo 3 foram retiradas as variáveis “area” e “baths”. Faça a comparação entre os Modelos 2 e 3 e responda as questões 7 e 8. 7. Observe as mudanças ocorridas no Modelo 3, sobretudo com relação ao valor e à significância do coeficiente da variável “rooms” e discuta a possibilidade de existência de multicolinearidade no Modelo 2. 8. Discuta em que medida a decisão de retirada das variáveis “area” e “baths” no Modelo 3 poderia minimizar um possível problema de multicolinearidade. Por outro lado, em que medida essa decisão poderia resultar em problema de viés por omissão de variável relevante? MODELO 3 – REGRESSÃO MÚLTIPLA: modelo reduzido Tabela 7: Model Summary Adjusted R Std. Error of the Model R R Square Square Estimate 1 0.567 0.322 0.309 35,928.497 a. Predictors: (Constant), NEARINC, LAND, AGE, ROOMS, INTST, CBD Tabela 8: ANOVA(b) Model Sum of Squares df Mean Square F Sig. 1 Regression 192,523,968,708.615 6 32,087,328,118.103 24.857 0.000 Residual 405,329,067,189.372 314 1,290,856,901.877 Total 597,853,035,897.987 320 a. Predictors: (Constant), NEARINC, LAND, AGE, ROOMS, INTST, CBD b. Dependent Variable: PRICE Tabela 9: Coefficients(a) Model 1 (Constant) AGE CBD INTST LAND ROOMS NEARINC a. Dependent Variable: PRICE Unstandardized Coefficients B Std. Error -7,435.084 17,679.505 -425.224 67.670 -0.756 1.567 -0.309 1.483 0.152 0.057 19,339.930 2,416.718 -17,183.946 7,172.726 Standardized Coefficients Beta -0.320 -0.157 -0.065 0.139 0.403 -0.182 t -0.421 -6.284 -0.482 -0.209 2.678 8.003 -2.396 4 Sig. 0.674 0.000 0.630 0.835 0.008 0.000 0.017 PARTE 3 – Outros exercícios 9. Considere o seguinte modelo de regressão linear simples estimado por MQO apresentado Yestimado= 20,857 + 0,0821 Xi onde Y é o consumo (em milhões de dólares) e X é a renda (em milhões de dólares). Considere que a unidade de medida do consumo for alterada para bilhões (Y for dividido por 1000) e a unidade de medida da renda permanecer inalterada. 9.1. Qual deve ser o novo valor do coeficiente linear (intercepto-y) da reta de regressão? 9.2. Qual deve ser o novo valor do coeficiente angular da reta de regressão? 10. Considere a seguinte função de produção para determinada indústria: ln(Yi ) 0 1 ln( Li ) 2 ln( K i ) ui , em que Y é o valor adicionado por firma (em reais), L é o trabalho empregado, K é o valor do capital (em reais) e u é o termo aleatório. Uma amostra aleatória de 27 observações leva às seguintes estimativas: ln(Yi ) 1,1755 0,6022 ln( Li ) 0,3856 ln( K i ) 27 SQR uˆ i2 0,84 i 1 R 0,76 2 Com base neste modelo, interprete o valor do coeficiente relacionado a L. 5