Análise dos dados da Estação Convencional do IFSC Henrique Holtrup [email protected] Camila Jasmini Rodrigues Schiar [email protected] Rosamaria Hahn [email protected] Curso Técnico de Meteorologia Instituto Federal de Educação, Ciência e Tecnologia de Santa Catarina Avenida Mauro Ramos, 950-Centro-Florianópolis-SC Resumo: As variáveis de temperatura máxima, temperatura mínima e precipitação são fundamentais para desenvolvimento de trabalhos relacionados á meteorologia, especialmente a variabilidade climática e seus extremos. Assim, isto leva a necessidade de realizar um tratamento nos dados medidos para que estes gerem informações e posteriormente sejam analisados e interpretados. Neste trabalho foi realizado um tratamento nos dados do banco de dados da Estação Meteorológica Convencional do Instituto Federal de Santa Catarina (IFSC) no período de 2006 a 2010. As variáveis selecionadas foram a temperatura máxima e mínima e precipitação. O tratamento consistiu de uma analise minuciosa das medições utilizando planilhas de dados e programação de consultas via banco de dados. Também se fez um levantamento das planilhas de dados da estação para investigar, corrigir ou inserir dados faltantes ou inconsistentes do banco de dados. Além disso, foi elaborada uma comparação com a série de dados da Estação Meteorológica Automática do IFSC no período de 2006 e 2007. Os resultados mostram que a margem de diferenças entre as duas séries de dados ficou consideravelmente reduzida em relação aos dados sem tratamento. Palavras-chave: Banco de Dados, Estação convencional, Temperatura Máxima. Temperatura Mínima. Precipitação. Analise. Consciência. Abstract: The meteorological variables are very important to development work related to the weather, especially climate variability and extreme events. Thus, we lead to treatment in these measured data for to generate information and to be investigated later. Daily meteorological data from Federal Institute of Santa Catarina (IFSC) are used during 2006 to 2010. The variables are defined like the maximum and minimum temperature and precipitation in previous analyses. Analysis and treatment of measurement data are investigated with spreadsheets and programming via database queries. It is shown also that a survey of the data sheets from the station to investigate, correct and find the missing data or inconsistent database. Furthermore, a comparison is also examined with automatic weather station data from the IFSC during 2006 to 2007. The results show that the difference between both is considerably small compared to the data without our analysis. 1 Introdução Há um grande interesse por parte da comunidade científica nos dados meteorológicos para o desenvolvimento de pesquisas em diversas áreas de interesse, por exemplo, geociências e ciências ambientais. Porém, faz-se necessário um tratamento dos dados medidos para que os resultados sejam satisfatórios, tragam informações relevantes e novas descobertas. Conforme foi discutido em Moscati et al (2008), um tratamento nos dados permite que os resultados sejam mais confiáveis. Assim, após um tratamento e consistência nos dados, há uma maior segurança para o desenvolvimento de pesquisas e avanços científicos. Segundo Mendonza (2008), um banco de dados tem de atender necessidades de uma proposta específica, de acordo com o interesse do grupo de usuários. “A disponibilidade de séries pluviométricas com qualidade e confiabilidade é fundamental para a realização de estudos na área de modelagem agroclimática” (ZULLO, 2004). Segundo Zullo et al (2008) existem diferentes formas para desenvolver o tratamento de uma série de dados. Assim, a metodologia utilizada depende da disponibilidade de medições correlatas próximas a região analisada. Neste caso, quando há ausência de dados é possível utilizar técnicas de preenchimento para suprir a falta destes. Porém, métodos de preenchimento não fornecem com exatidão a valor do dado faltante, mas sim uma aproximação do mesmo. A consistência dos dados consiste em utilizar diversas ferramentas e análises estatísticas para encontrar erros nas medições ocasionadas pelos instrumentos ou por falha no registro dos dados das estações convencionais de meteorologia. Esta consistência pode ser elaborada pela análise da série temporal considerando valores esperados, comparação com outras estações para avaliar a consistência espacial e temporal dos dados meteorológicos. Utilizando um software descrito em linguagem Fortran, Barbieri et al (2008) mostraram uma metodologia de analise de consistência para verificar anomalias de precipitação na Região Sul do Brasil. O banco de dados da Estação Meteorológica Convencional do Instituto Federal de Santa Catarina (IFSC) representa uma série única de dados atmosféricos próximos à superfície junto ao centro urbano da cidade de Florianópolis desde 9 de fevereiro de 2004. Assim, ressalta-se a importância deste banco de dado, uma vez que este representa uma importante fonte de dados para a comunidade científica e um tratamento permite melhorar os resultados e interpretações das pesquisas. Diariamente são realizados registros dos dados meteorológicos sendo necessária uma verificação periódica para garantir a qualidade dos mesmos. Neste trabalho foram utilizados métodos semelhantes aos descritos por Barbieri et al (2008), na qual foi baseada na análise e correção dos dados. O objetivo deste trabalho foi analisar e fazer um tratamento dos dados pluviométricos e de temperaturas máxima e mínimas medidas pela estação convencional do IFSC no período de 2005 a 2010, corrigindo dados faltantes e falhos. Para isso, utilizou-se de uma comparação entre a estação convencional e automática do IFSC como suporte para as análises e discussões. 2 Metodologia Analisou-se a série histórica de dados diários da estação convencional do IFSC que contém dados pluviométricos e de temperaturas máximas e mínimas, no período de 2005 a 2010. Essas variáveis foram selecionadas por serem variáveis principais utilizadas nos estudos de variabilidade climática e seus extremos. Os dados medidos diariamente no horário das 12UTC são coletados pelo observados e registrados na planilha de campo e posteriormente repassados a planilha de registro. Este procedimento contribui para que ao transpor as medições, o observador tenha destreza de observar falhas e problemas nos instrumentos. Porém, permite que falhas humanas possam ocorrer. Posteriormente, os dados são armazenados no banco em formato SQL (Linguagem de Consulta Estruturada, do inglês Structured Query Language). O banco de dados apresenta uma compatibilidade com programação de webpage que executa um mínimo controle de qualidade de dados, por exemplo, não permitindo inserir precipitação negativa, ou temperatura máxima menor do que a mínima. Essas informações são disponibilizadas no site meteorologia.florianopolis.ifsc.edu.br, para eventuais consultas da comunidade científica. Nesta série temporal, verificaram-se problemas como dados faltantes (nulos), datas ausentes na série ou inconsistentes dos valores típicos das variáveis. Para identificar estas inconsistências, foram executadas consultas mediante o programa SQL. Assim, as mais evidentes falhas foram encontradas. Por exemplo, notou-se o número de dias em determinado ano sendo maior do que 365 dias (não bissexto) durante o período de análise de dados. Tendo conhecimento de dados faltantes e datas incoerentes, a primeira etapa para eliminar erros contidos no banco, faz-se necessário inserir as datas faltantes e retirar datas incoerentes, respectivamente. Os dados originais foram analisados antes de inserir os dados corrigidos. Por exemplo, fez-se a busca das medições duvidosas como valores atípicos e diante desta circunstância, comparou-se com a estação automática. Uma análise cuidadosa ocorreu em casos específicos para que não houvesse errônea interpretação de eventos anômalos ou extremos comuns em séries de dados meteorológicos. Utilizou-se a técnica Turkey para a análise de dados duvidosos segundo Barbieri et al (2008). O método calcula a média da precipitação mensal e indica se o valor apresenta-se três vezes acima ou abaixo do desvio padrão. No banco de dados constava inúmeras variáveis na qual não houve preenchimento de dado naquele dia e mostrava o registro “NULL”. Neste caso, utilizaram-se as planilhas de registro em que são arquivadas as observações diárias e da hora. Assim, recorreu-se aos termogramas, gráficos do instrumento termógrafo, e aos pluviogramas, gráficos do instrumento pluviógrafo quando não havia opções de obter os dados requeridos. Também foi possível consultar a Estação Meteorológica Automática do IFSC. Esta verificação dos dados apresentou uma pesquisa dispendiosa que elevou o tempo de execução e protelou o cronograma previsto. A pesquisa das variáveis no banco de dados da estação automática foi realizada para substituição de dados faltantes, mas também foram utilizados os dados da estação automática para comparar as duas estações meteorológicas do IFSC, no período de 2006 e 2007. Esta comparação foi importante para os estudos propostos e propiciou uma segurança na utilização e substituição dos dados faltantes da estação convencional. Os resultados e dados tratados que serão mostrados no item 3 foram disponibilizados em uma página de internet utilizando programação PHP (Personal Home Page, Hypertext Preprocessor). 3 Resultados A análise inicial nos dados da estação meteorológica convencional mediante consulta do SQL, buscando datas incoerentes encontrou uma margem de erro em torno de 0,75% do total avaliado. Analises posteriores mostraram que após o tratamento alguns erros persistiram. Em relação a datas incoerentes, um problema que persistiu nos dados foi a ausência das mesmas, por não apresentarem registros de dados medidos totalizando 4 dias. Os dados da estação automática do IFSC auxiliaram para o tratamento de dados por conter uma série temporal mais constante, por isso gerou-se resultados para analisar os dados das duas estações e visualizar a diferença dos dados oferecidos pelas duas estações, convencional e automática. Do período escolhido (2006 e 2007), o mês de Janeiro de 2006, foi o que mais apresentou diferenças entre as variáveis. Na Fig. 1, nota-se uma diferença de precipitação registrada relativa às duas estações, diferença essa de 2 mm a 8 mm. Esta diferença é relativamente representativa a toda série de dados comparada. A maior diferença encontrada entre os resultados de precipitação mostrou que não houve registro desta variável em três dias no mês de janeiro de 2006 na Estação Convencional. A importância dessa análise e comparação possibilitou o preenchimento desses dias sem dados, no banco de dados da Estação Convencional com tratamento executado. Já nos resultados de temperaturas máxima e mínima foram gerados a partir dos dados da estação meteorológica convencional e automática. Para representar esta análise, foram adotados os dados diários do mês de Janeiro de 2006 (Fig. 2 e Fig. 3). Os dados comparados apresentam uma pequena diferença entre as temperaturas mínimas observadas e maior diferença entre as temperaturas máximas (Fig. 3), em que variam de 4°C a 5°C em alguns dias. O resultado observado na Fig. 2 não indica grandes diferenças dos dados coletados das estações do IFSC, a maior variação da temperatura mínima entre a estação automática e convencional foi de 0,8°C, no dia 14 do período analisado. Os registros nulos (significando que não há dados em determinado dia) antes da analise inicial para os dados de precipitação somaram 0,18% de toda a série temporal do período de 2005 a 2010. Para os dados de temperatura máxima e mínima, os registros nulos resultam em 1,08% e 3,99%, respectivamente. É importante ressaltar que houve um período de 3 meses (Março a Maio) do ano de 2008 em que não houve registro no banco de dados de temperatura mínima, problema este que provavelmente elevou a porcentagem de registros nulos. Este aspecto pode causar uma margem de erro significativa na climatologia desta variável. Informação que é utilizada e divulgada pelo curso de meteorologia do IFSC. Esses dados foram recuperados através da estação automática. Feita analise de consistência da estação têm-se os seguintes resultados referente às variáveis de precipitação e temperaturas máximas e mínimas, em que após a consistência teve uma margem de erro, respectivamente, de 0,31%, 0,23% e 0,15%. Este resultado, em relação às variáveis de temperatura máxima e mínima supriu as expectativas do projeto, tornando o banco mais eficiente em suas pesquisas. Porém, nota-se um resultado negativo em relação à variável de precipitação, em que após a análise 0,13% de campos NULL foram somados ao banco em relação a esta tabela. Provavelmente este problema ocorreu por serem adicionadas novas datas ao banco em que não foi possível encontrar dados de precipitação em nenhuma das alternativas de procura de dados. Finalmente, foi gerado um banco com os dados tratados correspondente ao período de 2005 a2010 para pesquisas da comunidade científica. Figura 1: Comparação entre os dados de precipitação da estação convencional e automática do Instituto federal de Santa Catarina em janeiro de 2006. Figura 2: Como na Fig. 1, mas para temperaturas mínimas. Figura 3: Como na Fig. 1, mas para temperaturas máximas. As figuras 4 e 5 apresentam a distribuição de frequência da variável de precipitação do período de 2006 a 2007 das estações automática e convencional respectivamente, após o tratamento de dados da estação convencional concluído. Nota-se uma pequena diferença entre os dados de ambas as estações, aproximadamente 85% dos dados de precipitação registraram valores entre 0 e 7 mm. Figura 4: Distribuição de frequência de precipitação da estação automática do IFSC ( ano 2006 a 2007). Figura 4: Distribuição de frequência de precipitação da estação convencional do IFSC ( ano 2006 a 2007). 4 Conclusão Este estudo analisou e realizou um tratamento dos dados pluviométricos e de temperaturas máxima e mínimas medidas pela estação convencional do IFSC no período de 2005 a 2010. Foram encontrados dados faltantes e falhos. Estes foram corrigidos, utilizando levantamento de registros antigos da estação e através de uma comparação entre a estação convencional e automática do IFSC, gerando um banco com tratamento dos dados. Além disso, o presente estudo permitiu identificar dados inconsistentes decorrente de dados faltantes, no qual o banco ficou desatualizado durante dezenas de dias e até mesmo meses em sua serie histórica. Entretanto, a pesquisa aqui desenvolvida refere-se a um estudo preliminar de análise e identificação de dados errôneos e incoerentes em relação ao banco de dados investigado, no qual foram eliminados ou consistidos. É importante ressaltar que ainda há inconsistências no banco de dados, não apenas nas variáveis analisadas neste trabalho, mas também nas outras variáveis contidas neste, o que leva a necessidade do desenvolvimento de futuras analises no banco para um tratamento destas. Considera-se que não houve uma análise mais aprofundada dos dados estudados por ser uma etapa que requer mais tempo. Neste contexto, foi realizada a consistência dos dados faltantes e errôneos mais evidentes, quanto a datas e inserção de dados faltantes. Por ser um processo minucioso e detalhado, não houve uma análise mais aprofundada em relação à consistência dos dados. Por exemplo, utilizando-se de métodos de preenchimentos de falhas comumente usados em análise de consistência de dados. No presente projeto iniciou-se uma revisão sobre o assunto, porém está investigação pode ser considerada uma sugestão para trabalhos futuros. Além disso, pode-se comparar as estações convencionais e automáticas para diferentes quantidades de precipitação e magnitudes de temperatura para distinguir suas diferenças entre a distribuição de freqüência dos dados. Isso permitiria uma mais apropriada análise e consistência dos dados. E m relação à análise e comparação com a Estação Automática, os resultados mostraram aspectos interessantes, pois apenas em algumas datas observaram-se diferenças significativas entre as duas estações. De fato, o período escolhido referese exatamente aos anos de melhor funcionamento e garantia da empresa fornecedora da estação automática. Foi gerado um banco com os dados tratados correspondente ao período de 2005 a2010. Os dados analisados e tratados serão disponibilizados juntamente aos dados originais de temperatura máxima e mínima, e precipitação, para um melhor desenvolvimento de futuras pesquisas e estudos técnicos. Agradecimento: Os autores agradecem a todos os professores do curso de meteorologia do IFSC pelos valiosos ensinamentos e ao IFSC pelos dados meteorológicos disponibilizados. REFERENCIAS JUNIOR, Jurandir Zullo et al. Organização e consistência de banco de dados pluviométricos. CEPAGRI/UNICAMP, Campinas/SP. 2004. MENDONZA, Mariana et al. Estrutura do banco de dados meteorológicos da Fundação Universidade Federal do Rio Grande. FURG. Rio Grande/RS. 2008. MOSCATI, Marley ET AL. Estudo climatológico sobre a costa sul-sudeste do Brasil. Parte II: organização e tratamento dos dados meteorológicos. DCM/INPE/MCT. 2008. BARBIERI, Daniela et al. Anomalias d precipitação para a região sul do Brasil: Analise de consistência. INPE/CRS. 2008.