LISTA 01 – RESPOSTAS - Universidade de Coimbra

Propaganda
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
UTILIZAÇÃO DE TÉCNICAS DE REGRESSÃO LINEAR ESPACIAL NO ESTUDO
SOBRE A RELAÇÃO ENTRE RENDA E DISTÂNCIA DA FONTE DE ENERGIA
ELÉTRICA NO ESTADO DO AMAZONAS, BRASIL
Paulo Cesar P. Menezes – Centro de Pesquisas em Energia Elétrica [email protected]
Julia Célia M. Strauch – Escola Nacional de Ciências Estatísticas
[email protected]
Jorge Machado Damázio – Centro de Pesquisas em Energia Elétrica
[email protected]
Cesar Ajara – Escola Nacional de Ciências Estatísticas [email protected]
1. INTRODUÇÃO
Nos dias atuais, a energia elétrica representa, sem dúvida, um recurso essencial
para a humanidade. A falta de eletricidade contribui para as más condições de vida,
uma vez que implica em dificuldades quanto à qualidade de serviço de saúde
(atendimento e serviços limitados em hospitais, inadequado acondicionamento de
medicamentos e vacinas), de abastecimento de água, de educação, além de acesso
limitado a informações e interferência em atividades econômicas e de subsistência,
por dificultar o acondicionamento adequado de bens perecíveis e seu beneficiamento.
Os dados do Instituto Brasileiro de Geografia e Estatística (IBGE) mostram que,
atualmente, 2,5 milhões de domicílios brasileiros (5,2%) – cerca de 12 milhões de
habitantes (6,52%) - não têm acesso à energia elétrica (MME, 2003). “O mapa da
exclusão elétrica no país revela que as famílias sem acesso à energia estão
majoritariamente nas localidades de menor Índice de Desenvolvimento Humano e nas
famílias de baixa renda. Cerca de 90% destas famílias têm renda inferior a três saláriosmínimos e 80% estão no meio rural” (MME, 2003). A região Norte do país é uma das
mais críticas no que se refere à falta de acesso à eletricidade no Brasil: “estatísticas
oficiais revelam que, no Norte do país, 62,5% da população rural (cerca de 2,6 milhões
de pessoas) não tem acesso aos serviços de energia elétrica. No Nordeste, 39,3% dos
moradores da área rural (cerca de 5,8 milhões de pessoas) não têm luz. No CentroOeste, somam 27,6% (cerca de 370 mil pessoas); no Sudeste, 11,9% (cerca de 810 mil);
enquanto que no Sul 8,2% (cerca de 480 mil pessoas)” (MME, 2003).
Na região Amazônica, o atendimento a comunidades isoladas figura como um dos
maiores desafios a serem vencidos para atingir a universalização, principalmente se
levados em conta os fatores complicadores, tais como: as grandes distâncias, a
1
Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física:
aplicações emergentes
ausência de estradas, as dificuldades de acesso, o isolamento das populações, a falta
de infra-estrutura adequada e mão de obra qualificada.
Este trabalho tem por objetivo o desenvolvimento de um exercício de regressão
espacial com dados georreferenciados para realizar no software de geoprocessamento
GEODA. Deverão ser selecionadas duas variáveis que servirão de variável dependente
e de variável independente. O estado do Amazonas é o objeto do presente
documento, onde será discutida, de forma abrangente, a caracterização ambiental e
socioeconômica, a caracterização do atual sistema elétrico e a referida análise de
regressão espacial.
2. CARACTERIZAÇÃO DO SISTEMA ELÉTRICO NO ESTADO DO AMAZONAS
O sistema elétrico do Amazonas, assim como em outros estados da região Norte do
Brasil, caracteriza-se por ser totalmente isolado do sistema interligado brasileiro. O
atendimento ao mercado de energia elétrica é realizado por duas empresas: MANAUS
ENERGIA S.A. (MESA), que atende a capital (Manaus) e a CEAM – Companhia
Energética do Amazonas, que atende ao interior do Estado.
No sistema da capital, a MANAUS ENERGIA é responsável pela transmissão,
distribuição e parte da geração de energia elétrica. A parcela restante da energia
gerada é comprada de produtores independentes (PIEs). No sistema da capital, a
MANAUS ENERGIA é responsável pela transmissão, distribuição e parte da geração de
energia elétrica. A parcela restante da energia gerada é comprada de produtores
independentes (PIEs).
O atendimento energético aos Sistemas Isolados do interior do Estado do Amazonas
é feito através de parque puramente térmico a base de óleo diesel, basicamente
transportado por via fluvial, sendo que a localidade mais distante está a cerca de 40
dias de viagem de barcaça, o que demanda uma atenção especial por parte da CEAM
na logística de abastecimento do diesel para os seus Sistemas (Figura 01).
2
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
Figura 01 - Sistema elétrico do estado do Amazonas em 2000. Fonte: CEPEL (2004).
3. REGRESSÃO ESPACIAL
3.1. METODOLOGIA
A proposta metodológica deste exercício se baseará na utilização dos Modelos de
Regressão Linear Globais (MLRS) e Locais (GWR). Com a aplicação do modelo de
regressão, pretende-se avaliar o grau de influência que pode ter a variável explicativa
(distância a unidade geradora de energia) sobre a variável resposta (Total do
rendimento nominal mensal das pessoas responsáveis por domicílios particulares
permanentes), ambas disponibilizadas na base de dados.
Na primeira etapa deste trabalho será ajustado um MRLS com análise dos
parâmetros e dos resíduos, verificando a necessidade de realizar novos ajustes no
modelo. Em caso de rejeição do modelo inicial, será formulado um novo modelo
ajustado às dificuldades que porventura sejam apresentadas. Em um segundo
momento, será utilizado um modelo de regressão de ajuste. Desta forma, serão feitos
tantos ajustes quantas observações existirem e o resultado será um conjunto de
parâmetros, sendo que cada ponto considerado terá seus próprios coeficientes de
ajuste. Estes parâmetros podem ser apresentados visualmente para identificar como
se comportam espacialmente os relacionamentos entre variáveis. Esta técnica é
denominada geographically weighted regression (GWR ou Regressão Geograficamente
Ponderada).
As fontes de dados utilizadas neste trabalho foram os dados, por setor censitário do
estado do Amazonas, do CENSO 2000 (IBGE, 2001) e a localização das unidades
geradoras de energia do Amazonas, disponível no SIGEL/ANEEL (Sistema de
Informações
Georreferenciadas
do
Setor
Elétrico),
disponível
em
3
Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física:
aplicações emergentes
http://sigel.aneel.gov.br/brasil/viewer.htm. Foram trabalhados, inicialmente, 83
pontos de geração de energia referentes ao sistema elétrico CEAM/MESA para o ano
de 2000 e 3110 setores censitários utilizados pelo IBGE para o CENSO 2000.
Como primeira abordagem, a intenção foi trabalhar com a variável distância à
Unidade geradora mais próxima como a variável independente e com a VAR02 (total
do rendimento nominal mensal das pessoas responsáveis por domicílios particulares
permanentes) como a variável dependente. Esta análise busca verificar a existência de
uma correlação espacial entre a proximidade de uma fonte geradora de energia e a
renda gerada em um setor censitário.
Ao se analisar o gráfico de dispersão destas variáveis e seus respectivos histogramas
percebeu-se que seria necessária a realização de algumas transformações para que os
dados apresentassem uma melhor distribuição. Desta forma, optou-se por seguir as
recomendações de MAINDONALD e BRAUN (2008) sobre o uso de transformações para
tornar as distribuições das variáveis utilizadas mais simétricas.
Assim, neste trabalho, utilizaremos como variável resposta (dependente) o Ln do
total do rendimento nominal mensal das pessoas responsáveis por domicílios
particulares permanentes em reais (LnVAR02) e a variável explicativa (independente)
será atribuída ao Ln da distância do centróide do setor censitário à unidade geradora
mais próxima.
4. ANÁLISE DOS RESULTADOS
4.1. ANÁLISE DO MODELO DE REGRESSÃO GLOBAL (MRLS)
O coeficiente de correlação de Pearson (R), que mede a relação linear entre as duas
variáveis, corresponde a -0,5562, o que indica uma relação forte negativa ou indireta.
Assim espera-se que quanto maior a distância do setor censitário para uma unidade
geradora, menor a renda gerada pelos chefes de família neste setor. Tendo em vista
essa relação entre as variáveis, é possível propor o ajuste de uma regressão linear
simples de ajuste global.
Outra dúvida é quanto a necessidade de ajuste no modelo proposto, então foi
calculado o Coeficiente de Determinação (R2) que expressa a quantidade da
variabilidade nos dados explicada pelo modelo de regressão. O R2 encontrado para a
base da dados foi de 0,309.
Como resultado da análise das superfícies de tendência criadas verifica-se que a
superfície linear indica um decréscimo da renda (LnVAR02) de leste para oeste (Figura
02a), enquanto que na superfície de tendência quadrática as maiores rendas
4
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
(LnVAR02) estão localizados na porção nordeste do estado do Amazonas e decaem em
direção ao sudoeste amazonense (Figura 02b). Ambas as análises vão ao encontro com
a região com maior índice de distribuição elétrica rural no Amazonas, apresentada
anteriormente, sugerindo uma possível correlação entre renda e penetração do acesso
a energia elétrica.
(a)
(b)
Figura 02 – Cartogramas com superfícies de tendência para LnVAR02.
Ao se analisar detalhadamente os resultados do modelo de ajuste global (MRLS), é
possível notar alguns indícios da presença de uma não-estacionariedade nos dados
analisados. De acordo com GODFREY (1996), a presença de significância tanto na
estatística de Koenker como no teste de Jarque-Bera são fortes indícios de que a
passagem para o modelo GWR é uma boa decisão.
Desta forma, neste estudo utilizou-se a análise de Hot Spot para identificar clusters
(agrupamentos) espaciais com valores de atributos estatisticamente significativos.
Dado um conjunto de pontos ponderados de dados, e que operam sob a expectativa
de que os valores de dados são distribuídos aleatoriamente em toda a área de estudo,
esta ferramenta delineia grupos de blocos incidentes com maiores valores do que o
esperado. Na literatura técnica internacional estes conjuntos são chamados de hot
spot, ou áreas quentes (SCOTT e WARMERDAM, 2005).
Os resultados da análise de Hot-spots demonstram que as principais áreas de
clusters encontrados são de baixos valores (áreas azuis), e elas apresentam uma boa
correlação com os principais bolsões de pobreza (áreas de menor renda) do estado do
Amazonas. Nesta análise fica claro que dentro da realidade amazonense do ano de
2000, somente encontramos duas “ilhas de prosperidade” no estado, a região
manauara e o entorno de Tefé-Coari.
Estes resultados comprovam a não-estacionariedade dos dados presentes no
modelo global e reafirmam a necessidade de adoção de um modelo de regressão de
ajuste local, que contemple as diferenças espaciais presentes nos dados.
5
Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física:
aplicações emergentes
Figura 44 – Análise de Hot Spot dos resíduos padronizados gerados pelo MRLS.
4.2. ANÁLISE DE MODELO DE REGRESÃO LOCAL (GWR)
Originalmente, essa metodologia foi elaborada para tratar da heterogeneidade
extrema, manifestada nos coeficientes na presença de não-estacionariedade das
respostas das variáveis explicativas através do espaço. Assim, de acordo com
FOTHERINGHAM et al. (2002), o método GWR reconhece que é possível existir
variações espaciais nas relações (não-estacionariedade), que se refletem em diferentes
coeficientes, um para cada região i.
Para a análise do modelo de regressão GWR optou-se pelos seguintes parâmetros
de entrada: Variável dependente: LOGVAR02 (renda); Variável Explicativa: LOGDIST;
Type: Adaptative; e, Bandwitch Method: AICc. A escolha do método adaptativo
justifica-se pela heterogeneidade das áreas a serem analisadas, já na escolha do
método de largura de banda (AICc) optou-se por um parâmetro que já foi utilizado no
modelo global e que assim permite uma comparação dos resultados.
O número de vizinhos utilizados para cada estimativa local foi de 695 elementos, e é
talvez o parâmetro mais importante para o modelo de Regressão Geograficamente
Ponderada. A estatística Residual Squares indica a soma dos quadrados dos resíduos
no modelo (o resíduo é a diferença entre um valor y observado e seu valor estimado
retornado pelo modelo GWR). Quanto menor esta medida, melhor. Nesta análise o
valor encontrado foi de 2117,09.
A estatística AICc é uma medida de desempenho do modelo e é útil para comparar
diferentes modelos de regressão. Assim, nesta análise podemos comprovar o sucesso
da troca de modelos, pois o valor de AIC para o modelo de ajuste global foi de 8932,
enquanto que o valor para o modelo GWR foi de apenas 7445.
6
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
O mapeamento dos valores R2 local fornecem uma boa análise de onde o modelo
GWR está melhor ajustado e onde o desempenho está fraco. Este indicador pode ainda
fornecer informações importantes sobre as variáveis que podem estar faltando no
modelo de regressão. As regiões onde melhor o modelo se ajustou foram três: ao
longo do extremo sul do estado, junto à divisa com Acre, Rondônia e Mato Grosso; ao
longo do eixo das rodovias BR-319 (Manaus-Porto Velho) e BR-230 (transamazônica);
e, no entorno ocidental da cidade de Manaus. Em contrapartida, as regiões onde o
modelo apresentou maiores dificuldades foram nas regiões com melhores níveis de
renda, na região de Manaus-Barcelos-Itacoatiara e na região de Coari-Tefé (Figura 03).
Figura 03 – Mapa do R2 local – Modelo GWR.
5. CONSIDERAÇÕES FINAIS
Este trabalho visou contribuir com o desenvolvimento do planejamento do setor
elétrico e na melhoria da análise da equidade no acesso a energia elétrica. Os modelos
de regressão linear utilizados apresentaram resultados bastante interessantes e que
de certa forma sintetizam uma parte da problemática do planejamento e do
desenvolvimento sustentável para a Amazônia.
Sob o aspecto dos estudos populacionais, a contribuição deste trabalho está na
descrição das superfícies e caracterizações de tendência global. A estruturação dos
dados originais e resultantes das análises em um sistema de banco de dados
7
Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física:
aplicações emergentes
geográfico possibilitou a realização de estudos populacionais que confirmaram a
grande relação entre renda e acesso a energia elétrica.
A relação entre a quantidade de renda e a distância do centróide do setor censitário
pôde ser mensurada por algumas fórmulas ou modelos não lineares como os de
HUXLEY (1932).
A análise espacial da regressão revelou que os dados analisados possuem uma forte
autocorrelação espacial global. A análise local detectou que 41% dos setores
censitários analisados possuem significância estatística para a autocorrelação espacial
local (LISA), estes setores representam 75% do território estudado e 65% do estado do
Amazonas. Apesar de em algumas regiões o modelo não apresentar significância, as
superfícies de tendência criadas parecem ter ido ao encontro com as informações
levantadas pelo diagnóstico da área de estudo.
Conforme observado por CÂMARA et al. (2003), a ausência de significância no
modelo espacial do alcance (lag) indica que a autocorrelação espacial NÃO é atribuída
à variável dependente, ou seja, não se considera a dependência espacial através da
adição ao modelo de regressão de um novo termo na forma de uma relação espacial
para a variável dependente. Em contra partida, a significância encontrada no modelo
espacial do erro significa que os efeitos espaciais são um ruído, ou perturbação. Neste
caso, os efeitos da autocorrelação espacial são associados ao termo de erro (ANSELIN e
MORENO, 2003).
Por outro lado, a modelagem com ajuste local permitiu perceber que o “ruído”
encontrado pelo modelo global é muito mais estruturado do que simples
perturbações. Essas variações são resultados de regionalidades e particularidades
presentes no território amazonense e necessitam de um tratamento diferenciado que
o modelo global não se mostra capaz de proporcionar.
Ambas as modelagem, global e local, sofreram devido a grande variação de áreas
nos setores censitários utilizados. A heterogeneidade de áreas presente nos setores
urbanos e rurais do estado do Amazonas proporcionou uma menor precisão na
geração dos centróides dos setores censitários.
Essa diferença de resultados matemáticos sintetiza um dos grandes desafios
enfrentados pelos planejadores e gestores do território e salientada por AJARA (2003).
Segundo este autor, viabilizar o desenvolvimento sustentável, de maneira a considerar
as especificidades e diferenças locais com um ferramental metodológico disponível se
torna um grande desafio.
8
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
Confirmando AJARA (2003), modelos de desenvolvimento alternativos que
consideram a escala local têm sido privilegiados em relação aos modelos vigentes por
lidarem melhor com os problemas da pobreza e da sustentabilidade, os modelos de
regressão linear de ajuste locais são preferidos para modelar matematicamente
problemáticas que envolvem fatores socioeconômicas e/ou políticas por conseguirem
“enxergar” variações locais produzidas por fatores derivados da ação humana.
Espera-se que este trabalho se consolide como mais um passo para aplicar
geoinformação em estudos populacionais. Este trabalho procura demonstrar a
viabilidade da inclusão de dados populacionais na modelagem espacial de processos
ambientais e socioeconômicos na região Amazônica.
Espera-se ter criado uma interface para que técnicas de análise espacial e os
Sistemas de Informação Geográfica possam ser mais amplamente utilizadas em
estudos populacionais. E por outro lado, espera-se que o conhecimento sobre as
populações possa aprimorar a aplicação das técnicas da geoinformação. Assim, como
meta final, talvez seja possível em longo prazo aumentar a compreensão sobre a
dinâmica socioeconômica da população na Amazônia não apenas como determinante,
mas também como conseqüência de fatores socioambientais.
Os resultados mostram que quanto mais próximo das áreas com energia elétrica
maior a renda das famílias, e indicam a validade da decisão de se investir em políticas
de universalização do acesso à energia elétrica. Estas políticas poderão gerar, como
conseqüência, ganhos de renda para as famílias atendidas.
As dificuldades encontradas neste trabalho salientam a necessidade da inclusão de
perguntas sobre o atendimento de eenrgia elétrica no questionário do universo do
próximo Censo. Uma maior cobertura sobre questões sobre a distribuição de energia
no Brasil iria contribuir de sobre maneira para o desenvolvimento do setor elétrico
brasileiro.
Devido às longas distâncias envolvidas na ligação de novos clientes, os custos
unitários de instalação são normalmente superiores aos encontrados em áreas
urbanas e não atrativos as empresas de distribuição de eletricidade. Por causa das
características acima, sistemas de abastecimento para comunidades isoladas muitas
vezes exigem subsídios do governo quer para facilitar novas conexões, quer para
sustentar o custo do consumo. A fim de alcançar benefícios econômicos, ambientais e
sociais a eletrificação rural deverá ser integrada com as comunidades rurais e com
programas de desenvolvimento local (WEC, 1999).
9
Tema 2 - Expansão e democratização das novas tecnologias em Geografia Física:
aplicações emergentes
A lógica utilizada no processo da universalização ao acesso à energia elétrica no
restante do Brasil NÃO deve ser reproduzida na região Amazônica. A simples
ampliação da rede de distribuição de energia elétrica não coaduna com a realidade
socioespacial amazônica. O processo de implementação de novas redes de distribuição
de energia deve estar associada com sistemas descentralizados e baseados em fontes
alternativas de energia. Esta combinação de soluções se mostra o melhor caminho
para o estado do Amazonas
6. BIBLIOGRAFIA
AJARA, C. 2003. As difíceis vias para o desenvolvimento sustentável: gestão
descentralizada do território e zoneamento ecológico-econômico. Textos para
discussão ENCE nº 8.
ANSELIN L., MORENO R. 2003. Properties of tests for spatial error components,
Regional Science and Urban Economics, Volume 33, Issue 5, September, pp 595618.
CÂMARA,G., MONTEIRO, A. M.V.,DRUCK S., CARVALHO,M. S. 2003. Análise espacial de
dados
geográficos.
INEP/EMBRAPA/FIOCRUZ/USP,
Disponível
em
http://www.dpi.inpe.br/gilberto/livro/analise/index.html
acessado
em
02/04/2009.
FOTHERINGHAM, S. A., BRUNSDON, C., e CHARLTON, M. 2002. Geographically
Weighted Regression: the analysis of spatially varying relationships. John Wiley &
Sons.
GODFREY, L.G. 1996. Some results on the Glejser and Koenker tests for
heteroskedasticity. Journal of Econometrics, Volume 72, Number 1, May, pp. 275299 (25).
HUXLEY, J.S. 1932. Problems of relative growth. London:Methuen. 577p.
IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. 2001. Censo Demográfico
2000. Rio de Janeiro, IBGE. (disponível no sítio eletrônico SIDRA www.sidra.ibge.gov.br).
10
VI Seminário Latino-Americano de Geografia Física
II Seminário Ibero-Americano de Geografia Física
Universidade de Coimbra, Maio de 2010
MAINDONALD, J. and BRAUN, W. J. DAAG. 2008. Data Analysis and Graphics. R Package
Version 0.97. Disponível em http://CRAN.R-project.org/package=DAAC. Acesso em
20/12/2008.
MME – MINISTÉRIO DE MINAS E ENERGIA. 2003. Programa Luz para Todos. Brasília.
Disponível em http://www.mme.gov.br/luzparatodos/.
SCOTT, L. e WARMERDAM, N. 2005. Extend Crime Analysis with ArcGIS Spatial
Statistics Tools in ArcUser Online, April - June.
WEC - WORLD ENERGY COUNCIL. 1999. The Challenge of Rural Energy Poverty in
Developing Countries. World Energy Council (WEC), London, United Kingdom.
11
Download