VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG A CORREÇÃO DE FALHAS E SELEÇÃO DE CLASSES PARA INTERPOLAÇÃO DE DADOS PLUVIOMÉTRICOS PAULO HENRIQUE PEREIRA PINTO1 LUCAS BARBOSA E SOUZA2 JOÃO AFONSO ZAVATTINI3 RESUMO: O objetivo central deste trabalho e apresentar de forma detalhada a aplicação do Coeficiente de Correlação de Pearson e da Regressão Linear simples, e seleção de classes a partir da utilização da Fórmula de Pearson, por meio do software Excel, na correção de falhas em dados pluviométricos. Um dos maiores problemas enfrentados pelos pesquisadores que trabalham com dados pluviométricos depois da aquisição inicial dos mesmos é a correção das falhas encontradas nas séries temporais. A aplicação das técnicas apresentadas permite o tratamento adequado destes dados possibilitando os processos posteriores de interpolação, quando o objetivo é produzir mapas ou cartas de isoietas. Palavras-chave: Climatologia; Chuvas; Estações Pluviométricas; Interpolação de dados. ABSTRACT: The central objective of this work and present in detail the application of the Pearson correlation coefficient and simple linear regression and selection of classes from the use of Formula Pearson, through the Excel software, the error correction in rainfall data. One of the biggest problems faced by researchers working with rainfall data after the initial purchase of the same is the correction of faults found in the time series. The application of the presented techniques allows the appropriate processing of such data enabling the subsequent processes of interpolation, when the goal is to produce maps or charts of isohyets. Keywords: climatology; Rains; Rainfall Stations; Interpolation. 1 - Introdução Um dos maiores problemas enfrentados pelos pesquisadores que trabalham com dados pluviométricos depois da aquisição dos dados é a correção das falhas encontradas nas séries temporais. Os dados pluviométricos que são coletados por uma densa rede hidrológica ao longo do território brasileiro são disponibilizados em consideráveis séries temporais pela Agência Nacional das Águas (ANA) e também pelo Instituto Nacional de em Geografia pela Universidade Estadual Paulista “Julho de Mesquita Filho” UNESP/Rio Claro. E-mail de contato: [email protected]; Bolsista da CAPES. 2 Docente do programa de pós-graduação em Geografia da Universidade Federal do Tocantins campus de Porto Nacional. E-mail de contato: [email protected] 3 Docente do programa de pós-graduação em Geografia da Universidade Estadual Paulista “Julho de Mesquita Filho” UNESP/Rio Claro. E-mail de contato: [email protected] 1Doutorando 13 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG Meteorologia (INMET) em seus respectivos sites na internet. Contudo, a ocorrência de falhas ou a ausência de dados impede a homogeneização aceitável de um longo período temporal de dados. Para alcançar o melhor aproveitamento da série e sua homogeneização é preciso lançar mão do uso de técnicas tais como as de Correlação e Regressão Linear Simples (GERARDI, 1981; VIEIRA, 2011). O objetivo deste trabalho é apresentar de forma detalhada a aplicação do Coeficiente de Correlação de Pearson e da Regressão Linear simples, e a seleção de classes a partir da utilização da Fórmula de Pearson, por meio do software Excel na correção de falhas em dados pluviométricos. 2 – Material e Métodos Os dados utilizados neste trabalho foram adquiridos a partir das plataformas online do Instituto Nacional de Meteorologia (INMET) e da Agência Nacional de Águas (ANA). Os dados meteorológicos de elementos atmosféricos como temperatura, umidade relativa do ar, pressão, nebulosidade, direção e velocidade dos ventos podem ser adquiridos a partir do acesso ao site do INMET no endereço que segue: http://www.inmet.gov.br/portal/index.php?r=bdmep/bdmep. Este endereço virtual hospeda o Banco de Dados Meteorológicos para Ensino e Pesquisa (BDMEP), no são disponibilizadas séries históricas de dados meteorológicos. No que se refere aos dados pluviométricos, a ANA também possui um endereço online (http://www.snirh.gov.br/hidroweb/). Este site hospeda o HIDROWEB, sistema que fornece séries de históricas de dados pluviométricos de todo o território brasileiro. Mais informações relevantes sobre a rede pluviométrica do Brasil podem ser encontradas no Inventário de estações pluviométricas do Brasil (BRASIL, 2009). As técnicas utilizadas neste trabalho são Coeficiente de Correlação de Pearson e da Regressão Linear simples, e seleção de classes a partir da utilização da Fórmula de Pearson (Gerardi, 1981) por meio do software Excel. 3 – Resultados Os resultados aqui apresentados referem-se à aplicação das técnicas já mencionadas ao tratamento de dados pluviométricos. 14 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG 3.1 – A Correção de falhas A aplicação da fórmula do Coeficiente de Correlação de Pearson pode ser feita automaticamente a partir da utilização do Excel [Microsoft Corporation] por meio do menu fórmulas estatísticas aplicando a função “PEARSON”. A fórmula do coeficiente de correlação apresentada pelo Excel é: onde x e y são as médias de amostra MÉDIA(matriz1) e MÉDIA(matriz2). Sua utilização é realizada da seguinte forma. 1º passo: são organizadas duas matrizes lado a lado. A matriz Estação A é a referência e a matriz Estação B é aquela cujas falhas deverão ser corrigidas (Quadro 1a). 2º passo: as linhas que contém as falhas são retiradas (Quadro 1b). Depois, a fórmula de Pearson deverá ser aplicada por meio da seleção das respectivas matrizes conforme solicitado pelo programa. Quadro 01a: Os dados contendo falhas Quadro 01b: Retiradas as células com falhas Fonte: ANA/ INMET – Org. pelos autores Após esse procedimento o resultado será o coeficiente de correlação que é considerado adequado quanto mais próximo de 1 ou de -1. Esse procedimento deve ser aplicado a todas as estações mais próximas daquela que possui falhas sendo selecionada aquela que tiver maior correlação para servir de referência para a correção das falhas. 15 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG Verificado esse coeficiente, aquelas estações as quais os dados apresentarem falhas, as mesmas deverão ser corrigidas a partir da regressão linear simples usando-se como base os dados da estação cuja correlação apresentou-se mais alta. A aplicação da regressão linear simples se dá por meio de uma fórmula gerada pelo Excel dependendo de cada coeficiente de correlação encontrado. A geração dessa fórmula é realizada da seguinte maneira: utilizam-se as matrizes sem as células que contém falhas para gerar um gráfico (Figura 01). Figura 01: Gráfico com a fórmula de regressão linear simples Elaborado pelos autores Neste gráfico aparece a linha de tendência e a fórmula que irá proporcionar a regressão linear simples, que no caso do exemplo usado foi a seguinte: y=1,149x + 19,80. Sendo que x é o valor de referencia da (Estação A: mês de janeiro) e y o valor que se quer corrigir (Estação B: mês de janeiro). Assim, aplica-se a fórmula aos valores correspondentes e temos a planilha corrigida (Quadro 02). Quadro 02: Exemplo de correção de falhas 16 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG Fonte: ANA/INMET – Org. pelos autores 3.2 – A seleção do intervalo de classes A seleção dos intervalos de classes é realizada a partir da aplicação da fórmula de Sturges (GERARDI, 1981). A utilização desta técnica é muito simples e é realizada a partir da resolução de sua fórmula, como segue abaixo: K = 1 + 3,3 Log N Onde N é o valor de dados em todo o período. Então K = 1 + 3,3 x Log (24*) [*N do exemplo na correção de falhas] K = 1 + 3,3 x 1,3802112417116060229362445874286 K = 5,5546970976482998756896071385144 K = 6 é o numero de classes a serem criadas . Após esse procedimento, é preciso calcular o intervalo de classes por meio da divisão da amplitude pelo número de classes sugeridas. Esse processo é realizado da seguinte forma: Amplitude = Maior – Menor 485,3 mm – 0 mm = 485,3 mm. 485,3 / 6 = 80,9 O valor do intervalo entre as classes é 80,9. A partir dos intervalos de classe sugeridos pela fórmula de Sturges e da verificação da frequência da ocorrência dos dados pluviométricos em cada uma das classes, podem ser atribuídas cores representativas paras as chuvas escassas, as chuvas frequêntes/habituais e para as chuvas abundantes (Quadro 03). Essa seleção semiológica permite 17 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG posteriormente uma interpolação e melhor representação das cartas de isoietas destacando com clareza os diferentes níveis de precipitação para o período. Classes 6 5 4 3 2 1 Intervalos 414 494,9 333 413,9 252 332,9 171 251,9 90 170,9 0 80,9 Frequência 1 1 3 2 4 13 Cor Quadro 03: Intervalos de classes / Org. pelos autores Após a aplicação dos procedimentos apresentados até aqui, o pesquisador provavelmente irá realizar a interpolação dos dados pluviométricos, se o seu objetivo for, por exemplo, a representação espacial desses dados. Se for esse o caso recomenda-se o uso do software Surffer. Esse sistema é simples e prático, além de possuir inúmeras vantagens quando se trata de dados pluviométricos. Dependendo do tipo de pesquisa, dos objetivos da mesma, caso este seja a confecção de mapas ou cartas de isoietas, recomenda-se a consulta ao trabalho de Landim (2000), que trata das razões para a escolha dos métodos de interpolação de dados a serem utilizados confecção de mapas. Este trabalho leva em consideração as características dos dados pluviométricos (quantidade e distribuição espacial de postos de coleta) e também do terreno no que se refere às diferenças de altitude e possíveis acidentes geográficos entre os postos. Alguns exemplos da utilização satisfatória das técnicas de correção e falhas e seleção de classes para interpolação de dados são os trabalhos de Pinto (2013) que apresentou, dentre outros aspectos, a distribuição espacial das chuvas no estado do Tocantins e Zandonadi (2013) que realizou um estudo sobre ritmo climático das chuvas na Bacia Hidrográfica do Rio Paraná. 4 – Considerações Finais A aplicação da fórmula que permite calcular o coeficiente de correlação de Pearson e da Regressão Linear simples pode garantir a correção de falhas em dados pluviométricos possibilitando a realização de trabalhos embasados nas mais diversas abordagens. Contudo, este procedimento envolve o uso de fórmulas estatísticas e deve ser realizado com bastante cautela, pois no tratamento de fenômenos dinâmicos tais como a precipitação de chuva deve-se considerar inúmeros fatores geográficos que podem influenciar no 18 VARIABILIDADE E SUSCEPTIBILIDADE CLIMÁTICA: Implicações Ecossistêmicas e Sociais de 25 a 29 de outubro de 2016 Goiânia (GO)/UFG comportamento deste elemento climático. Em caso como este, em que a correção de falhas em dados é necessária, é extremamente relevante o conhecimento prévio do fenômeno o qual se estuda, assim como da área onde ele ocorre para que sejam evitados equívocos que comprometam os resultados da pesquisa. Referências BRASIL, AGÊNCIA NACIONAL DAS ÁGUAS. Inventário estações pluviométricas. 2 ed. Brasília DF, abr., 2009. BDMEP. Banco de Dados Meteorológicos para Ensino e Pesquisa. Instituto Nacional de Meteorologia (INMET) http://www.inmet.gov.br/portal/index.php?r=bdmep/bdmep Acesso em: 10/10/2015 GERARDI, L. H. Quantificação em Geografia. São Paulo: DIFEL, 1981 HIDROWEB, Agência Nacional http://www.snirh.gov.br/hidroweb/ Acesso em: 10/10/2015 das Águas (ANA). Disponível em: LANDIM, P. M. B. Introdução aos métodos de estimação espacial para a confecção de mapas. DGA/IGCE/UNESP/Rio Claro, Lab. Geomatemática, Texto Didático 02, 20 p. 2000. PINTO, P. H. P. As chuvas no estado do Tocantins: distribuição geográfica e gênese das variações rítmicas. 2013. 183f. Dissertação (Mestrado em Geografia), Instituto de Geociências e Ciências Exatas, Universidade Estadual Paulista, Rio Claro, 2013. Suffer®, versão 8.0, Golden Software Inc, 2002 VIEIRA, S. Introdução à bioestatística. 4 ed. Rio de Janeiro: Elsevier, 2011 ZANDONADI. L. 2013. As Chuvas na Bacia Hidrográfica do Rio Paraná, Brasil: um estudo do ritmo climático e algumas considerações sobre a vazão hídrica Tese (Doutorado em Geografia), Instituto de Geociências e Ciências Exatas, Universidade Estadual Paulista, Rio Claro, 2013. 19