Análise Espacial de Áreas: Regressão Análise Espacial de Dados Geográficos SER-303 Novembro/2005 (Flávia Feitosa) Análise de Regressão Descreve ou estima uma variável dependente (Y) a partir de seu relacionamento com variáveis independentes (X) Ex: Y = aX + b Objetivos Determinar como (e se) duas ou mais variáveis se relacionam. Descrever como as variáveis se relacionam (função). Prever valores futuros da variável dependente (Y). Regressão Linear Simples Yi=0+1Xi +i Yi é o valor da variável dependente na i-ésima observação; 0 e 1 são parâmetros; Xi é uma constante conhecida; é o valor da variável independente na iésima observação; i é um termo de erro aleatório com distribuição normal, média zero e variância constante 2 (E(i )=0 e 2 (i )= 2 ) i e j são não correlacionados (independentes) para i j Modelo de Regressão Linear Inclinação Intercepto Populacional Populacional Variável Independente Yi=0+1Xi +i Variável Dependente Yi i Y 1 Erro Aleatório Y = E(Y) = 0 + 1 X Coeficiente angular Ŷi=b0+b1Xi Modelo estimado i =Yi-Ŷi Resíduo 0 X Regressão Linear Múltipla Yi=0+1Xi1 + 2Xi2 +…+ pXip + i Yi é o valor da variável dependente na i-ésima observação 0, …, p são parâmetros Xi1 ,…,Xip são os valores das variáveis independentes na i-ésima observação i é um termo de erro aleatório com distribuição normal, média zero e variância constante 2 (E(i )=0 e 2 (i )= 2 ) i e j são não correlacionados (independentes) para i j Coeficiente de Determinação Análise de Variância SQTo = SQReg + SQRes 2 ˆ Y)2 (Y Yˆ )2 (Y Y ) ( Y i i i i Coeficiente de determinação: R2=SQReg/SQTo Proporção da variância total de Y que é “explicada” pela equação de regressão. Varia entre 0 e 1 Quanto mais próximo de 1, melhor o ajuste do modelo. Análise da Aptidão do Modelo Análise dos Resíduos – Verificar: Se função de regressão é linear Resíduo 0 X Não Linearidade Análise da Aptidão do Modelo Análise dos Resíduos – Verificar: Se os erros possuem variância constante (homocedasticidade) Variância Não Constante Resíduo 0 X Análise da Aptidão do Modelo Análise dos Resíduos – Verificar: Se os erros são independentes Resíduo 0 X Erros Correlacionados Análise da Aptidão do Modelo Análise dos Resíduos – Verificar: A presença de outliers Gráfico dos Resíduos 1 0,8 Resíduos Padronizados 0,6 0,4 0,2 0 150 155 160 165 170 -0,2 -0,4 X 175 180 185 Análise da Aptidão do Modelo Análise dos Resíduos – Verificar: Se erros são normalmente distribuídos Análise da Aptidão do Modelo Análise dos Resíduos – Modelo Adequado: Resíduo 0 X Análise da Aptidão do Modelo Análise dos Resíduos : DADOS ESPACIAIS Hipótese de independência das observações em geral é Falsa Dependência Espacial Efeitos Espaciais Se existir forte tendência ou correlação espacial, os resultados serão influenciados, apresentando associação estatística onde não existe (e vice-versa). Como verificar? Medir a autocorrelação espacial dos resíduos da regressão (Índice de Moran dos resíduos) Exemplo São José dos Campos Crescimento Populacional 91-00 X Densidade Populacional 91 Índice de Moran sobre mapa de resíduos I=0,45 Testes de pseudosignificância indicam autocorrelação espacial Regressão Espacial Autocorrelação espacial constatada! E agora? Modelos de regressão que incorporam efeitos espaciais: Globais: utilizam um único parâmetro para capturar a estrutura de correlação espacial Locais: parâmetros variam continuamente no espaço Modelos com Efeitos Espaciais Globais Suposição: É possível capturar a estrutura de correlação espacial num único parâmetro (adicionado ao modelo de regressão). Alternativas: Spatial Lag Models: atribuem a autocorrelação espacial à variável dependente Y. Spatial Error Models: atribuem a autocorrelação ao erro. Spatial Lag Model Suposição a variável yi depende dos valores da variável dependente nas áreas vizinhas a i: Y = WY + X + = medida de correlação espacial = 0, se autocorrelação é nula W = matriz de proximidade espacial Spatial Error Model Efeitos espaciais são um ruído Y = X + = W + ξ W = erro com efeitos espaciais = medida de correlação espacial ξ = componente do erro com variância constante e não correlacionada. Spatial Lag Model X Spatial Error Model Motivações diferentes, porém próximos em termos formais. Premissa: processo espacial analisado é estacionário e pode ser capturado em um único parâmetro. Porém isto nem sempre é verdade! Verificar se padões diversos de associação espacial estão presentes. Indicadores Locais de Autocorrelação Espacial Indicadores Locais de Variabilidade Espacial distribuição dos valores de correlação local para o índice de exclusão % Exclusão Não significantes p = 0.05 [95% (1,96)] p = 0.01 [99% (2,54)] p = 0.001 [99,9% (3,2)] Modelos com Efeitos Espaciais Locais Modelos de Regressão com Efeitos Espaciais Discretos variações espaciais modeladas de maneira discreta. Regimes espaciais Modelos de Regressão com Efeitos Espaciais Contínuos variações espaciais modeladas de forma contínua, com parâmetros variando no espaço. “Geographically Weighted Regression” – GWR. Regimes Espaciais Regionalizações da área de estudo Diferentes tipos de variabilidade espacial Métricas: Diagrama de espalhamento e índices locais e globais Ex: Regimes espaciais para índice de exclusão Regimes Espaciais x Regiões Administrativas Impacto de Regimes Espaciais Análise de Regressão Regressão Linear Idosos = f ( Domicílios Sem Esgoto) R2 = 0,35 Regressão Espacial Regiões Adm (R2 = 0,72) Regimes Espaciais (R2 = 0,83) Para dados socioeconômicos: modelo de regimes espaciais tende a apresentar resultados melhores que os de regressão simples ou de regressão espacial com efeitos globais. GWR – geographically weighted regression Ajusta um modelo de regressão a cada ponto observado, ponderando todas as demais observações como função da distância deste ponto. Y(s) = (s)X + Y(s): variável que representa o processo no ponto s. (s): parâmetros estimados no ponto s. GWR – geographically weighted regression Os parâmetros podem ser apresentados visualmente para identificar como se comportam espacialmente os relacionamentos entre as variáveis. Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente) GWR – geographically weighted regression Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente) Mapa de resíduos (I = 0,04) : Softwares GeoDa SPRING e Terraview Regressão Clássica e Espacial (Spatial Lag & Spatial Error) R, aRT + TerraView Índice de Moran, LISA maps SpaceStat Índice de Moran, LISA maps, Regressão Clássica e Espacial (Spatial Lag & Spatial Error) Regressão Clássica, Espacial (Spatial Lag & Spatial Error) e GWR GWR 3.0 Regressão Clássica e Espacial (GWR)