Análise dos dados da Estação Convencional do IFSC

Propaganda
Análise dos dados da Estação
Convencional do IFSC
Henrique Holtrup
[email protected]
Camila Jasmini Rodrigues Schiar
[email protected]
Rosamaria Hahn
[email protected]
Curso Técnico de Meteorologia
Instituto Federal de Educação, Ciência e Tecnologia de Santa Catarina
Avenida Mauro Ramos, 950-Centro-Florianópolis-SC
Resumo: As variáveis de temperatura máxima, temperatura mínima e precipitação são
fundamentais para desenvolvimento de trabalhos relacionados á meteorologia, especialmente a
variabilidade climática e seus extremos. Assim, isto leva a necessidade de realizar um
tratamento nos dados medidos para que estes gerem informações e posteriormente sejam
analisados e interpretados. Neste trabalho foi realizado um tratamento nos dados do banco de
dados da Estação Meteorológica Convencional do Instituto Federal de Santa Catarina (IFSC)
no período de 2006 a 2010. As variáveis selecionadas foram a temperatura máxima e mínima e
precipitação. O tratamento consistiu de uma analise minuciosa das medições utilizando
planilhas de dados e programação de consultas via banco de dados. Também se fez um
levantamento das planilhas de dados da estação para investigar, corrigir ou inserir dados
faltantes ou inconsistentes do banco de dados. Além disso, foi elaborada uma comparação com
a série de dados da Estação Meteorológica Automática do IFSC no período de 2006 e 2007. Os
resultados mostram que a margem de diferenças entre as duas séries de dados ficou
consideravelmente reduzida em relação aos dados sem tratamento.
Palavras-chave: Banco de Dados, Estação convencional, Temperatura Máxima. Temperatura
Mínima. Precipitação. Analise. Consciência.
Abstract: The meteorological variables are very important to development work related to the
weather, especially climate variability and extreme events. Thus, we lead to treatment in these
measured data for to generate information and to be investigated later. Daily meteorological
data from Federal Institute of Santa Catarina (IFSC) are used during 2006 to 2010. The
variables are defined like the maximum and minimum temperature and precipitation in previous
analyses. Analysis and treatment of measurement data are investigated with spreadsheets and
programming via database queries. It is shown also that a survey of the data sheets from the
station to investigate, correct and find the missing data or inconsistent database. Furthermore,
a comparison is also examined with automatic weather station data from the IFSC during 2006
to 2007. The results show that the difference between both is considerably small compared to
the data without our analysis.
1 Introdução
Há um grande interesse por
parte da comunidade científica nos dados
meteorológicos para o desenvolvimento de
pesquisas em diversas áreas de interesse, por
exemplo, geociências e ciências ambientais.
Porém, faz-se necessário um tratamento dos
dados medidos para que os resultados sejam
satisfatórios, tragam informações relevantes e
novas descobertas. Conforme foi discutido em
Moscati et al (2008), um tratamento nos
dados permite que os resultados sejam mais
confiáveis. Assim, após um tratamento e
consistência nos dados, há uma maior
segurança para o desenvolvimento de
pesquisas e avanços científicos. Segundo
Mendonza (2008), um banco de dados tem de
atender necessidades de uma proposta
específica, de acordo com o interesse do
grupo de usuários.
“A disponibilidade de séries
pluviométricas
com
qualidade
e
confiabilidade é fundamental para a
realização de estudos na área de modelagem
agroclimática” (ZULLO, 2004). Segundo
Zullo et al (2008) existem diferentes formas
para desenvolver o tratamento de uma série de
dados. Assim, a metodologia utilizada
depende da disponibilidade de medições
correlatas próximas a região analisada. Neste
caso, quando há ausência de dados é possível
utilizar técnicas de preenchimento para suprir
a falta destes. Porém, métodos de
preenchimento não fornecem com exatidão a
valor do dado faltante, mas sim uma
aproximação do mesmo. A consistência dos
dados consiste em utilizar diversas
ferramentas e análises estatísticas para
encontrar erros nas medições ocasionadas
pelos instrumentos ou por falha no registro
dos dados das estações convencionais de
meteorologia. Esta consistência pode ser
elaborada pela análise da série temporal
considerando valores esperados, comparação
com outras estações para avaliar a
consistência espacial e temporal dos dados
meteorológicos. Utilizando um software
descrito em linguagem Fortran, Barbieri et al
(2008) mostraram uma metodologia de
analise de consistência para verificar
anomalias de precipitação na Região Sul do
Brasil.
O banco de dados da Estação
Meteorológica Convencional do Instituto
Federal de Santa Catarina (IFSC) representa
uma série única de dados atmosféricos
próximos à superfície junto ao centro urbano
da cidade de Florianópolis desde 9 de
fevereiro de 2004. Assim, ressalta-se a
importância deste banco de dado, uma vez
que este representa uma importante fonte de
dados para a comunidade científica e um
tratamento permite melhorar os resultados e
interpretações das pesquisas. Diariamente são
realizados registros dos dados meteorológicos
sendo necessária uma verificação periódica
para garantir a qualidade dos mesmos. Neste
trabalho
foram
utilizados
métodos
semelhantes aos descritos por Barbieri et al
(2008), na qual foi baseada na análise e
correção dos dados. O objetivo deste trabalho
foi analisar e fazer um tratamento dos dados
pluviométricos e de temperaturas máxima e
mínimas medidas pela estação convencional
do IFSC no período de 2005 a 2010,
corrigindo dados faltantes e falhos. Para isso,
utilizou-se de uma comparação entre a
estação convencional e automática do IFSC
como suporte para as análises e discussões.
2 Metodologia
Analisou-se a série histórica de
dados diários da estação convencional do
IFSC que contém dados pluviométricos e de
temperaturas máximas e mínimas, no período
de 2005 a 2010. Essas variáveis foram
selecionadas por serem variáveis principais
utilizadas nos estudos de variabilidade
climática e seus extremos.
Os dados medidos diariamente no
horário das 12UTC são coletados pelo
observados e registrados na planilha de
campo e posteriormente repassados a planilha
de registro. Este procedimento contribui para
que ao transpor as medições, o observador
tenha destreza de observar falhas e problemas
nos instrumentos. Porém, permite que falhas
humanas possam ocorrer. Posteriormente, os
dados são armazenados no banco em formato
SQL (Linguagem de Consulta Estruturada, do
inglês Structured Query Language). O banco
de dados apresenta uma compatibilidade com
programação de webpage que executa um
mínimo controle de qualidade de dados, por
exemplo, não permitindo inserir precipitação
negativa, ou temperatura máxima menor do
que a mínima. Essas informações são
disponibilizadas
no
site
meteorologia.florianopolis.ifsc.edu.br,
para
eventuais consultas da comunidade científica.
Nesta
série
temporal,
verificaram-se
problemas como dados faltantes (nulos), datas
ausentes na série ou inconsistentes dos
valores típicos das variáveis. Para identificar
estas inconsistências, foram executadas
consultas mediante o programa SQL. Assim,
as mais evidentes falhas foram encontradas.
Por exemplo, notou-se o número de dias em
determinado ano sendo maior do que 365 dias
(não bissexto) durante o período de análise de
dados.
Tendo conhecimento de dados
faltantes e datas incoerentes, a primeira etapa
para eliminar erros contidos no banco, faz-se
necessário inserir as datas faltantes e retirar
datas incoerentes, respectivamente.
Os
dados
originais
foram
analisados antes de inserir os dados
corrigidos. Por exemplo, fez-se a busca das
medições duvidosas como valores atípicos e
diante desta circunstância, comparou-se com
a estação automática. Uma análise cuidadosa
ocorreu em casos específicos para que não
houvesse errônea interpretação de eventos
anômalos ou extremos comuns em séries de
dados meteorológicos. Utilizou-se a técnica
Turkey para a análise de dados duvidosos
segundo Barbieri et al (2008). O método
calcula a média da precipitação mensal e
indica se o valor apresenta-se três vezes acima
ou abaixo do desvio padrão.
No banco de dados constava
inúmeras variáveis na qual não houve
preenchimento de dado naquele dia e
mostrava o registro “NULL”. Neste caso,
utilizaram-se as planilhas de registro em que
são arquivadas as observações diárias e da
hora. Assim, recorreu-se aos termogramas,
gráficos do instrumento termógrafo, e aos
pluviogramas, gráficos do instrumento
pluviógrafo quando não havia opções de obter
os dados requeridos. Também foi possível
consultar
a
Estação
Meteorológica
Automática do IFSC.
Esta verificação dos dados
apresentou uma pesquisa dispendiosa que
elevou o tempo de execução e protelou o
cronograma previsto. A pesquisa das variáveis
no banco de dados da estação automática foi
realizada para substituição de dados faltantes,
mas também foram utilizados os dados da
estação automática para comparar as duas
estações meteorológicas do IFSC, no período
de 2006 e 2007. Esta comparação foi
importante para os estudos propostos e
propiciou uma segurança na utilização e
substituição dos dados faltantes da estação
convencional. Os resultados e dados tratados
que serão mostrados no item 3 foram
disponibilizados em uma página de internet
utilizando programação PHP (Personal Home
Page, Hypertext Preprocessor).
3 Resultados
A análise inicial nos dados da
estação meteorológica convencional mediante
consulta do SQL, buscando datas incoerentes
encontrou uma margem de erro em torno de
0,75% do total avaliado. Analises posteriores
mostraram que após o tratamento alguns erros
persistiram. Em relação a datas incoerentes,
um problema que persistiu nos dados foi a
ausência das mesmas, por não apresentarem
registros de dados medidos totalizando 4 dias.
Os dados da estação automática
do IFSC auxiliaram para o tratamento de
dados por conter uma série temporal mais
constante, por isso gerou-se resultados para
analisar os dados das duas estações e
visualizar a diferença dos dados oferecidos
pelas duas estações, convencional e
automática. Do período escolhido (2006 e
2007), o mês de Janeiro de 2006, foi o que
mais apresentou diferenças entre as variáveis.
Na Fig. 1, nota-se uma diferença de
precipitação registrada relativa às duas
estações, diferença essa de 2 mm a 8 mm.
Esta diferença é relativamente representativa
a toda série de dados comparada.
A maior diferença encontrada
entre os resultados de precipitação mostrou
que não houve registro desta variável em três
dias no mês de janeiro de 2006 na Estação
Convencional. A importância dessa análise e
comparação possibilitou o preenchimento
desses dias sem dados, no banco de dados da
Estação Convencional com tratamento
executado.
Já nos resultados de temperaturas
máxima e mínima foram gerados a partir dos
dados da estação meteorológica convencional
e automática. Para representar esta análise,
foram adotados os dados diários do mês de
Janeiro de 2006 (Fig. 2 e Fig. 3). Os dados
comparados apresentam uma pequena
diferença entre as temperaturas mínimas
observadas e maior diferença entre as
temperaturas máximas (Fig. 3), em que
variam de 4°C a 5°C em alguns dias.
O resultado observado na Fig. 2
não indica grandes diferenças dos dados
coletados das estações do IFSC, a maior
variação da temperatura mínima entre a
estação automática e convencional foi de
0,8°C, no dia 14 do período analisado.
Os registros nulos (significando
que não há dados em determinado dia) antes
da analise inicial para os dados de
precipitação somaram 0,18% de toda a série
temporal do período de 2005 a 2010. Para os
dados de temperatura máxima e mínima, os
registros nulos resultam em 1,08% e 3,99%,
respectivamente. É importante ressaltar que
houve um período de 3 meses (Março a Maio)
do ano de 2008 em que não houve registro no
banco de dados de temperatura mínima,
problema este que provavelmente elevou a
porcentagem de registros nulos. Este aspecto
pode causar uma margem de erro significativa
na climatologia desta variável. Informação
que é utilizada e divulgada pelo curso de
meteorologia do IFSC. Esses dados foram
recuperados através da estação automática.
Feita analise de consistência da
estação têm-se os seguintes resultados
referente às variáveis de precipitação e
temperaturas máximas e mínimas, em que
após a consistência teve uma margem de erro,
respectivamente, de 0,31%, 0,23% e 0,15%.
Este resultado, em relação às variáveis de
temperatura máxima e mínima supriu as
expectativas do projeto, tornando o banco
mais eficiente em suas pesquisas. Porém,
nota-se um resultado negativo em relação à
variável de precipitação, em que após a
análise 0,13% de campos NULL foram
somados ao banco em relação a esta tabela.
Provavelmente este problema ocorreu por
serem adicionadas novas datas ao banco em
que não foi possível encontrar dados de
precipitação em nenhuma das alternativas de
procura de dados. Finalmente, foi gerado um
banco com os dados tratados correspondente
ao período de 2005 a2010 para pesquisas da
comunidade científica.
Figura 1: Comparação entre os dados de precipitação da
estação convencional e automática do Instituto federal de Santa
Catarina em janeiro de 2006.
Figura 2: Como na Fig. 1, mas para temperaturas mínimas.
Figura 3: Como na Fig. 1, mas para temperaturas máximas.
As figuras 4 e 5 apresentam a
distribuição de frequência da variável de
precipitação do período de 2006 a 2007 das
estações
automática
e
convencional
respectivamente, após o tratamento de dados da
estação convencional concluído. Nota-se uma
pequena diferença entre os dados de ambas as
estações,
aproximadamente 85% dos dados de
precipitação registraram valores entre 0 e 7 mm.
Figura 4: Distribuição de frequência de precipitação da
estação automática do IFSC ( ano 2006 a 2007).
Figura 4: Distribuição de frequência de precipitação da
estação convencional do IFSC ( ano 2006 a 2007).
4 Conclusão
Este estudo analisou e realizou
um tratamento dos dados pluviométricos e de
temperaturas máxima e mínimas medidas pela
estação convencional do IFSC no período de
2005 a 2010. Foram encontrados dados
faltantes e falhos. Estes foram corrigidos,
utilizando levantamento de registros antigos
da estação e através de uma comparação entre
a estação convencional e automática do IFSC,
gerando um banco com tratamento dos dados.
Além disso, o presente estudo permitiu
identificar dados inconsistentes decorrente de
dados faltantes, no qual o banco ficou
desatualizado durante dezenas de dias e até
mesmo meses em sua serie histórica.
Entretanto, a pesquisa aqui
desenvolvida refere-se a um estudo preliminar
de análise e identificação de dados errôneos e
incoerentes em relação ao banco de dados
investigado, no qual foram eliminados ou
consistidos. É importante ressaltar que ainda
há inconsistências no banco de dados, não
apenas nas variáveis analisadas neste
trabalho, mas também nas outras variáveis
contidas neste, o que leva a necessidade do
desenvolvimento de futuras analises no banco
para um tratamento destas. Considera-se que
não houve uma análise mais aprofundada dos
dados estudados por ser uma etapa que requer
mais tempo. Neste contexto, foi realizada a
consistência dos dados faltantes e errôneos
mais evidentes, quanto a datas e inserção de
dados faltantes. Por ser um processo
minucioso e detalhado, não houve uma
análise mais aprofundada em relação à
consistência dos dados. Por exemplo,
utilizando-se de métodos de preenchimentos
de falhas comumente usados em análise de
consistência de dados. No presente projeto
iniciou-se uma revisão sobre o assunto, porém
está investigação pode ser considerada uma
sugestão para trabalhos futuros. Além disso,
pode-se comparar as estações convencionais e
automáticas para diferentes quantidades de
precipitação e magnitudes de temperatura
para distinguir suas diferenças entre a
distribuição de freqüência dos dados. Isso
permitiria uma mais apropriada análise e
consistência dos dados. E m relação à análise
e comparação com a Estação Automática, os
resultados mostraram aspectos interessantes,
pois apenas em algumas datas observaram-se
diferenças significativas entre as duas
estações. De fato, o período escolhido referese exatamente aos anos de melhor
funcionamento e garantia da empresa
fornecedora da estação automática. Foi
gerado um banco com os dados tratados
correspondente ao período de 2005 a2010. Os
dados
analisados
e
tratados
serão
disponibilizados juntamente aos dados
originais de temperatura máxima e mínima, e
precipitação,
para
um
melhor
desenvolvimento de futuras pesquisas e
estudos técnicos.
Agradecimento: Os autores agradecem a
todos os professores do curso de meteorologia
do IFSC pelos valiosos ensinamentos e ao
IFSC pelos dados meteorológicos
disponibilizados.
REFERENCIAS
JUNIOR, Jurandir Zullo et al. Organização e
consistência
de
banco
de
dados
pluviométricos.
CEPAGRI/UNICAMP,
Campinas/SP. 2004.
MENDONZA, Mariana et al. Estrutura do
banco de dados meteorológicos da
Fundação Universidade Federal do Rio
Grande. FURG. Rio Grande/RS. 2008.
MOSCATI, Marley ET AL. Estudo
climatológico sobre a costa sul-sudeste do
Brasil. Parte II: organização e tratamento
dos dados meteorológicos. DCM/INPE/MCT.
2008.
BARBIERI, Daniela et al. Anomalias d
precipitação para a região sul do Brasil:
Analise de consistência. INPE/CRS. 2008.
Download