VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 UTILIZAÇÃO DE TÉCNICAS DE REGRESSÃO LINEAR ESPACIAL NO ESTUDO SOBRE A RELAÇÃO ENTRE RENDA E DISTÂNCIA DA FONTE DE ENERGIA ELÉTRICA NO ESTADO DO AMAZONAS, BRASIL Paulo Cesar P. Menezes – Centro de Pesquisas em Energia Elétrica [email protected] Julia Célia M. Strauch – Escola Nacional de Ciências Estatísticas [email protected] Jorge Machado Damázio – Centro de Pesquisas em Energia Elétrica [email protected] Cesar Ajara – Escola Nacional de Ciências Estatísticas [email protected] 1. INTRODUÇÃO Nos dias atuais, a energia elétrica representa, sem dúvida, um recurso essencial para a humanidade. A falta de eletricidade contribui para as más condições de vida, uma vez que implica em dificuldades quanto à qualidade de serviço de saúde (atendimento e serviços limitados em hospitais, inadequado acondicionamento de medicamentos e vacinas), de abastecimento de água, de educação, além de acesso limitado a informações e interferência em atividades econômicas e de subsistência, por dificultar o acondicionamento adequado de bens perecíveis e seu beneficiamento. Os dados do Instituto Brasileiro de Geografia e Estatística (IBGE) mostram que, atualmente, 2,5 milhões de domicílios brasileiros (5,2%) – cerca de 12 milhões de habitantes (6,52%) - não têm acesso à energia elétrica (MME, 2003). “O mapa da exclusão elétrica no país revela que as famílias sem acesso à energia estão majoritariamente nas localidades de menor Índice de Desenvolvimento Humano e nas famílias de baixa renda. Cerca de 90% destas famílias têm renda inferior a três saláriosmínimos e 80% estão no meio rural” (MME, 2003). A região Norte do país é uma das mais críticas no que se refere à falta de acesso à eletricidade no Brasil: “estatísticas oficiais revelam que, no Norte do país, 62,5% da população rural (cerca de 2,6 milhões de pessoas) não tem acesso aos serviços de energia elétrica. No Nordeste, 39,3% dos moradores da área rural (cerca de 5,8 milhões de pessoas) não têm luz. No CentroOeste, somam 27,6% (cerca de 370 mil pessoas); no Sudeste, 11,9% (cerca de 810 mil); enquanto que no Sul 8,2% (cerca de 480 mil pessoas)” (MME, 2003). Na região Amazônica, o atendimento a comunidades isoladas figura como um dos maiores desafios a serem vencidos para atingir a universalização, principalmente se levados em conta os fatores complicadores, tais como: as grandes distâncias, a 1 Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física: aplicações emergentes ausência de estradas, as dificuldades de acesso, o isolamento das populações, a falta de infra-estrutura adequada e mão de obra qualificada. Este trabalho tem por objetivo o desenvolvimento de um exercício de regressão espacial com dados georreferenciados para realizar no software de geoprocessamento GEODA. Deverão ser selecionadas duas variáveis que servirão de variável dependente e de variável independente. O estado do Amazonas é o objeto do presente documento, onde será discutida, de forma abrangente, a caracterização ambiental e socioeconômica, a caracterização do atual sistema elétrico e a referida análise de regressão espacial. 2. CARACTERIZAÇÃO DO SISTEMA ELÉTRICO NO ESTADO DO AMAZONAS O sistema elétrico do Amazonas, assim como em outros estados da região Norte do Brasil, caracteriza-se por ser totalmente isolado do sistema interligado brasileiro. O atendimento ao mercado de energia elétrica é realizado por duas empresas: MANAUS ENERGIA S.A. (MESA), que atende a capital (Manaus) e a CEAM – Companhia Energética do Amazonas, que atende ao interior do Estado. No sistema da capital, a MANAUS ENERGIA é responsável pela transmissão, distribuição e parte da geração de energia elétrica. A parcela restante da energia gerada é comprada de produtores independentes (PIEs). No sistema da capital, a MANAUS ENERGIA é responsável pela transmissão, distribuição e parte da geração de energia elétrica. A parcela restante da energia gerada é comprada de produtores independentes (PIEs). O atendimento energético aos Sistemas Isolados do interior do Estado do Amazonas é feito através de parque puramente térmico a base de óleo diesel, basicamente transportado por via fluvial, sendo que a localidade mais distante está a cerca de 40 dias de viagem de barcaça, o que demanda uma atenção especial por parte da CEAM na logística de abastecimento do diesel para os seus Sistemas (Figura 01). 2 VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 Figura 01 - Sistema elétrico do estado do Amazonas em 2000. Fonte: CEPEL (2004). 3. REGRESSÃO ESPACIAL 3.1. METODOLOGIA A proposta metodológica deste exercício se baseará na utilização dos Modelos de Regressão Linear Globais (MLRS) e Locais (GWR). Com a aplicação do modelo de regressão, pretende-se avaliar o grau de influência que pode ter a variável explicativa (distância a unidade geradora de energia) sobre a variável resposta (Total do rendimento nominal mensal das pessoas responsáveis por domicílios particulares permanentes), ambas disponibilizadas na base de dados. Na primeira etapa deste trabalho será ajustado um MRLS com análise dos parâmetros e dos resíduos, verificando a necessidade de realizar novos ajustes no modelo. Em caso de rejeição do modelo inicial, será formulado um novo modelo ajustado às dificuldades que porventura sejam apresentadas. Em um segundo momento, será utilizado um modelo de regressão de ajuste. Desta forma, serão feitos tantos ajustes quantas observações existirem e o resultado será um conjunto de parâmetros, sendo que cada ponto considerado terá seus próprios coeficientes de ajuste. Estes parâmetros podem ser apresentados visualmente para identificar como se comportam espacialmente os relacionamentos entre variáveis. Esta técnica é denominada geographically weighted regression (GWR ou Regressão Geograficamente Ponderada). As fontes de dados utilizadas neste trabalho foram os dados, por setor censitário do estado do Amazonas, do CENSO 2000 (IBGE, 2001) e a localização das unidades geradoras de energia do Amazonas, disponível no SIGEL/ANEEL (Sistema de Informações Georreferenciadas do Setor Elétrico), disponível em 3 Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física: aplicações emergentes http://sigel.aneel.gov.br/brasil/viewer.htm. Foram trabalhados, inicialmente, 83 pontos de geração de energia referentes ao sistema elétrico CEAM/MESA para o ano de 2000 e 3110 setores censitários utilizados pelo IBGE para o CENSO 2000. Como primeira abordagem, a intenção foi trabalhar com a variável distância à Unidade geradora mais próxima como a variável independente e com a VAR02 (total do rendimento nominal mensal das pessoas responsáveis por domicílios particulares permanentes) como a variável dependente. Esta análise busca verificar a existência de uma correlação espacial entre a proximidade de uma fonte geradora de energia e a renda gerada em um setor censitário. Ao se analisar o gráfico de dispersão destas variáveis e seus respectivos histogramas percebeu-se que seria necessária a realização de algumas transformações para que os dados apresentassem uma melhor distribuição. Desta forma, optou-se por seguir as recomendações de MAINDONALD e BRAUN (2008) sobre o uso de transformações para tornar as distribuições das variáveis utilizadas mais simétricas. Assim, neste trabalho, utilizaremos como variável resposta (dependente) o Ln do total do rendimento nominal mensal das pessoas responsáveis por domicílios particulares permanentes em reais (LnVAR02) e a variável explicativa (independente) será atribuída ao Ln da distância do centróide do setor censitário à unidade geradora mais próxima. 4. ANÁLISE DOS RESULTADOS 4.1. ANÁLISE DO MODELO DE REGRESSÃO GLOBAL (MRLS) O coeficiente de correlação de Pearson (R), que mede a relação linear entre as duas variáveis, corresponde a -0,5562, o que indica uma relação forte negativa ou indireta. Assim espera-se que quanto maior a distância do setor censitário para uma unidade geradora, menor a renda gerada pelos chefes de família neste setor. Tendo em vista essa relação entre as variáveis, é possível propor o ajuste de uma regressão linear simples de ajuste global. Outra dúvida é quanto a necessidade de ajuste no modelo proposto, então foi calculado o Coeficiente de Determinação (R2) que expressa a quantidade da variabilidade nos dados explicada pelo modelo de regressão. O R2 encontrado para a base da dados foi de 0,309. Como resultado da análise das superfícies de tendência criadas verifica-se que a superfície linear indica um decréscimo da renda (LnVAR02) de leste para oeste (Figura 02a), enquanto que na superfície de tendência quadrática as maiores rendas 4 VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 (LnVAR02) estão localizados na porção nordeste do estado do Amazonas e decaem em direção ao sudoeste amazonense (Figura 02b). Ambas as análises vão ao encontro com a região com maior índice de distribuição elétrica rural no Amazonas, apresentada anteriormente, sugerindo uma possível correlação entre renda e penetração do acesso a energia elétrica. (a) (b) Figura 02 – Cartogramas com superfícies de tendência para LnVAR02. Ao se analisar detalhadamente os resultados do modelo de ajuste global (MRLS), é possível notar alguns indícios da presença de uma não-estacionariedade nos dados analisados. De acordo com GODFREY (1996), a presença de significância tanto na estatística de Koenker como no teste de Jarque-Bera são fortes indícios de que a passagem para o modelo GWR é uma boa decisão. Desta forma, neste estudo utilizou-se a análise de Hot Spot para identificar clusters (agrupamentos) espaciais com valores de atributos estatisticamente significativos. Dado um conjunto de pontos ponderados de dados, e que operam sob a expectativa de que os valores de dados são distribuídos aleatoriamente em toda a área de estudo, esta ferramenta delineia grupos de blocos incidentes com maiores valores do que o esperado. Na literatura técnica internacional estes conjuntos são chamados de hot spot, ou áreas quentes (SCOTT e WARMERDAM, 2005). Os resultados da análise de Hot-spots demonstram que as principais áreas de clusters encontrados são de baixos valores (áreas azuis), e elas apresentam uma boa correlação com os principais bolsões de pobreza (áreas de menor renda) do estado do Amazonas. Nesta análise fica claro que dentro da realidade amazonense do ano de 2000, somente encontramos duas “ilhas de prosperidade” no estado, a região manauara e o entorno de Tefé-Coari. Estes resultados comprovam a não-estacionariedade dos dados presentes no modelo global e reafirmam a necessidade de adoção de um modelo de regressão de ajuste local, que contemple as diferenças espaciais presentes nos dados. 5 Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física: aplicações emergentes Figura 44 – Análise de Hot Spot dos resíduos padronizados gerados pelo MRLS. 4.2. ANÁLISE DE MODELO DE REGRESÃO LOCAL (GWR) Originalmente, essa metodologia foi elaborada para tratar da heterogeneidade extrema, manifestada nos coeficientes na presença de não-estacionariedade das respostas das variáveis explicativas através do espaço. Assim, de acordo com FOTHERINGHAM et al. (2002), o método GWR reconhece que é possível existir variações espaciais nas relações (não-estacionariedade), que se refletem em diferentes coeficientes, um para cada região i. Para a análise do modelo de regressão GWR optou-se pelos seguintes parâmetros de entrada: Variável dependente: LOGVAR02 (renda); Variável Explicativa: LOGDIST; Type: Adaptative; e, Bandwitch Method: AICc. A escolha do método adaptativo justifica-se pela heterogeneidade das áreas a serem analisadas, já na escolha do método de largura de banda (AICc) optou-se por um parâmetro que já foi utilizado no modelo global e que assim permite uma comparação dos resultados. O número de vizinhos utilizados para cada estimativa local foi de 695 elementos, e é talvez o parâmetro mais importante para o modelo de Regressão Geograficamente Ponderada. A estatística Residual Squares indica a soma dos quadrados dos resíduos no modelo (o resíduo é a diferença entre um valor y observado e seu valor estimado retornado pelo modelo GWR). Quanto menor esta medida, melhor. Nesta análise o valor encontrado foi de 2117,09. A estatística AICc é uma medida de desempenho do modelo e é útil para comparar diferentes modelos de regressão. Assim, nesta análise podemos comprovar o sucesso da troca de modelos, pois o valor de AIC para o modelo de ajuste global foi de 8932, enquanto que o valor para o modelo GWR foi de apenas 7445. 6 VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 O mapeamento dos valores R2 local fornecem uma boa análise de onde o modelo GWR está melhor ajustado e onde o desempenho está fraco. Este indicador pode ainda fornecer informações importantes sobre as variáveis que podem estar faltando no modelo de regressão. As regiões onde melhor o modelo se ajustou foram três: ao longo do extremo sul do estado, junto à divisa com Acre, Rondônia e Mato Grosso; ao longo do eixo das rodovias BR-319 (Manaus-Porto Velho) e BR-230 (transamazônica); e, no entorno ocidental da cidade de Manaus. Em contrapartida, as regiões onde o modelo apresentou maiores dificuldades foram nas regiões com melhores níveis de renda, na região de Manaus-Barcelos-Itacoatiara e na região de Coari-Tefé (Figura 03). Figura 03 – Mapa do R2 local – Modelo GWR. 5. CONSIDERAÇÕES FINAIS Este trabalho visou contribuir com o desenvolvimento do planejamento do setor elétrico e na melhoria da análise da equidade no acesso a energia elétrica. Os modelos de regressão linear utilizados apresentaram resultados bastante interessantes e que de certa forma sintetizam uma parte da problemática do planejamento e do desenvolvimento sustentável para a Amazônia. Sob o aspecto dos estudos populacionais, a contribuição deste trabalho está na descrição das superfícies e caracterizações de tendência global. A estruturação dos dados originais e resultantes das análises em um sistema de banco de dados 7 Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física: aplicações emergentes geográfico possibilitou a realização de estudos populacionais que confirmaram a grande relação entre renda e acesso a energia elétrica. A relação entre a quantidade de renda e a distância do centróide do setor censitário pôde ser mensurada por algumas fórmulas ou modelos não lineares como os de HUXLEY (1932). A análise espacial da regressão revelou que os dados analisados possuem uma forte autocorrelação espacial global. A análise local detectou que 41% dos setores censitários analisados possuem significância estatística para a autocorrelação espacial local (LISA), estes setores representam 75% do território estudado e 65% do estado do Amazonas. Apesar de em algumas regiões o modelo não apresentar significância, as superfícies de tendência criadas parecem ter ido ao encontro com as informações levantadas pelo diagnóstico da área de estudo. Conforme observado por CÂMARA et al. (2003), a ausência de significância no modelo espacial do alcance (lag) indica que a autocorrelação espacial NÃO é atribuída à variável dependente, ou seja, não se considera a dependência espacial através da adição ao modelo de regressão de um novo termo na forma de uma relação espacial para a variável dependente. Em contra partida, a significância encontrada no modelo espacial do erro significa que os efeitos espaciais são um ruído, ou perturbação. Neste caso, os efeitos da autocorrelação espacial são associados ao termo de erro (ANSELIN e MORENO, 2003). Por outro lado, a modelagem com ajuste local permitiu perceber que o “ruído” encontrado pelo modelo global é muito mais estruturado do que simples perturbações. Essas variações são resultados de regionalidades e particularidades presentes no território amazonense e necessitam de um tratamento diferenciado que o modelo global não se mostra capaz de proporcionar. Ambas as modelagem, global e local, sofreram devido a grande variação de áreas nos setores censitários utilizados. A heterogeneidade de áreas presente nos setores urbanos e rurais do estado do Amazonas proporcionou uma menor precisão na geração dos centróides dos setores censitários. Essa diferença de resultados matemáticos sintetiza um dos grandes desafios enfrentados pelos planejadores e gestores do território e salientada por AJARA (2003). Segundo este autor, viabilizar o desenvolvimento sustentável, de maneira a considerar as especificidades e diferenças locais com um ferramental metodológico disponível se torna um grande desafio. 8 VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 Confirmando AJARA (2003), modelos de desenvolvimento alternativos que consideram a escala local têm sido privilegiados em relação aos modelos vigentes por lidarem melhor com os problemas da pobreza e da sustentabilidade, os modelos de regressão linear de ajuste locais são preferidos para modelar matematicamente problemáticas que envolvem fatores socioeconômicas e/ou políticas por conseguirem “enxergar” variações locais produzidas por fatores derivados da ação humana. Espera-se que este trabalho se consolide como mais um passo para aplicar geoinformação em estudos populacionais. Este trabalho procura demonstrar a viabilidade da inclusão de dados populacionais na modelagem espacial de processos ambientais e socioeconômicos na região Amazônica. Espera-se ter criado uma interface para que técnicas de análise espacial e os Sistemas de Informação Geográfica possam ser mais amplamente utilizadas em estudos populacionais. E por outro lado, espera-se que o conhecimento sobre as populações possa aprimorar a aplicação das técnicas da geoinformação. Assim, como meta final, talvez seja possível em longo prazo aumentar a compreensão sobre a dinâmica socioeconômica da população na Amazônia não apenas como determinante, mas também como conseqüência de fatores socioambientais. Os resultados mostram que quanto mais próximo das áreas com energia elétrica maior a renda das famílias, e indicam a validade da decisão de se investir em políticas de universalização do acesso à energia elétrica. Estas políticas poderão gerar, como conseqüência, ganhos de renda para as famílias atendidas. As dificuldades encontradas neste trabalho salientam a necessidade da inclusão de perguntas sobre o atendimento de eenrgia elétrica no questionário do universo do próximo Censo. Uma maior cobertura sobre questões sobre a distribuição de energia no Brasil iria contribuir de sobre maneira para o desenvolvimento do setor elétrico brasileiro. Devido às longas distâncias envolvidas na ligação de novos clientes, os custos unitários de instalação são normalmente superiores aos encontrados em áreas urbanas e não atrativos as empresas de distribuição de eletricidade. Por causa das características acima, sistemas de abastecimento para comunidades isoladas muitas vezes exigem subsídios do governo quer para facilitar novas conexões, quer para sustentar o custo do consumo. A fim de alcançar benefícios econômicos, ambientais e sociais a eletrificação rural deverá ser integrada com as comunidades rurais e com programas de desenvolvimento local (WEC, 1999). 9 Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física: aplicações emergentes A lógica utilizada no processo da universalização ao acesso à energia elétrica no restante do Brasil NÃO deve ser reproduzida na região Amazônica. A simples ampliação da rede de distribuição de energia elétrica não coaduna com a realidade socioespacial amazônica. O processo de implementação de novas redes de distribuição de energia deve estar associada com sistemas descentralizados e baseados em fontes alternativas de energia. Esta combinação de soluções se mostra o melhor caminho para o estado do Amazonas 6. BIBLIOGRAFIA AJARA, C. 2003. As difíceis vias para o desenvolvimento sustentável: gestão descentralizada do território e zoneamento ecológico-econômico. Textos para discussão ENCE nº 8. ANSELIN L., MORENO R. 2003. Properties of tests for spatial error components, Regional Science and Urban Economics, Volume 33, Issue 5, September, pp 595618. CÂMARA,G., MONTEIRO, A. M.V.,DRUCK S., CARVALHO,M. S. 2003. Análise espacial de dados geográficos. INEP/EMBRAPA/FIOCRUZ/USP, Disponível em http://www.dpi.inpe.br/gilberto/livro/analise/index.html acessado em 02/04/2009. FOTHERINGHAM, S. A., BRUNSDON, C., e CHARLTON, M. 2002. Geographically Weighted Regression: the analysis of spatially varying relationships. John Wiley & Sons. GODFREY, L.G. 1996. Some results on the Glejser and Koenker tests for heteroskedasticity. Journal of Econometrics, Volume 72, Number 1, May, pp. 275299 (25). HUXLEY, J.S. 1932. Problems of relative growth. London:Methuen. 577p. IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. 2001. Censo Demográfico 2000. Rio de Janeiro, IBGE. (disponível no sítio eletrônico SIDRA www.sidra.ibge.gov.br). 10 VI Seminário Latino-Americano de Geografia Física II Seminário Ibero-Americano de Geografia Física Universidade de Coimbra, Maio de 2010 MAINDONALD, J. and BRAUN, W. J. DAAG. 2008. Data Analysis and Graphics. R Package Version 0.97. Disponível em http://CRAN.R-project.org/package=DAAC. Acesso em 20/12/2008. MME – MINISTÉRIO DE MINAS E ENERGIA. 2003. Programa Luz para Todos. Brasília. Disponível em http://www.mme.gov.br/luzparatodos/. SCOTT, L. e WARMERDAM, N. 2005. Extend Crime Analysis with ArcGIS Spatial Statistics Tools in ArcUser Online, April - June. WEC - WORLD ENERGY COUNCIL. 1999. The Challenge of Rural Energy Poverty in Developing Countries. World Energy Council (WEC), London, United Kingdom. 11