SISTEMA DE GERENCIAMENTO E VALIDAÇÃO DE DADOS

Propaganda
SISTEMA DE GERENCIAMENTO E VALIDAÇÃO DE DADOS DE RADIAÇÃO SOLAR
Amanda Monteiro Galvão¹,² , Juan Carlos Ceballos¹
¹Divisão de Satélites e Sistemas Ambientais,CPTEC/INPE, Cachoeira Paulista-SP;
²Centro Universitário Salesiano de Lorena, UNISAL-SP
e-mails: [email protected], [email protected]
RESUMO: É descrita uma estrutura de análise de dados, destinada a comparar estimativas de radiação solar
diária por satélite com dados de “verdade terrestre” e elaborar relatórios numa base mensal. Diversos
programas realizam pré-processamento de informações provenientes de diversas redes solarimétricas e do
modelo GL, padronizam os dados, realizam uma análise estatística simples e apresentam os resultados. Os
dados estão servindo para popular um banco de dados (estrutura PostGres). Parte das rotinas serão
implementadas no banco, permitindo o processamento de dados automatizado e a consulta interativa de
usuários utilizando uma interface web.
ABSTRACT. We describe a data processing scheme, designed for comparison of daily values of solar
radiation estimated by satellite and measured by ground stations, with reports on a monthly basis. A set of
programs are charged on pre-processing data provided by different solarimetric networks and by GL model,
standardizing quantities and formats, performing a simplified statistical analysis and reporting results. Data
are nowadays populating a database (PostGres structure). Some routines will be implemented within the data
base, allowing for automatic data processing and users interactive query through a web interface.
Palavras-Chave: radiação solar, banco de dados
1. INTRODUÇÃO
O regime de radiação solar é de importância primordial para o desenvolvimento de coberturas
vegetais, tanto no espectro fotossinteticamente ativo (radiação PAR, necessária para fotossíntese), como no
espectro global (diretamente ligado a taxas de evapotranspiração), sin contar seu aspecto de fonte de energia
alternativa. Todavia, existe uma escassez histórica de dados de radiação solar. Os mais freqüentes têm sido
os gerados por heliógrafo (horas de sol diárias ou insolação), a partir dos quais a irradiação solar é estimada.
Nessas condições, apenas médias mensais têm alguma confiabilidade (Ceballos et al. 1992). Nos últimos
anos o número de estações solarimétricas tem aumentado consideravelmente. Mesmo assim, detalhes das
variações espaciais da radiação solar costumam não ser evidenciados; em compensação, as estimativas por
satélite podem ter uma resolução de uma dezena de quilômetros.
No CPTEC roda operacionalmente o modelo GL de estimativa de radiação solar, baseado na
refletância medida pelo sensor Imager VIS do satélite GOES sobre a América do Sul. Descrição dele está
disponível em http://satelite.cptec.inpe.br/htmldocs/radiacao/fluxos/radsat.htm. Embora o modelo GL
forneça informações horárias e diárias com alta resolução espacial, suas estimativas devem ser validadas. A
validação das estimativas é realizada através da comparação com valores obtidos por estações terrestres, o
que, reciprocamente, permite a detecção de funcionamentos anômalos nas redes de superfície. Este controle
recíproco é uma característica interessante do método utilizado e difere de outros sistemas de controle de
qualidade, como o aplicado à rede SONDA de instrumentos gerenciados pelo CPTEC (Martins et al. 2007),
seguindo normas da Baseline Surface Radiation Network (BSRN 2006).
Este trabalho descreve o sistema de controle da qualidade GL/verdade terrestre, que será
implementado num banco de dados e apresentará resultados através de uma interface web.
2. METODOLOGIA
2.1 Aquisição de Dados
Todas as imagens do canal VIS obtidas com o satélite GOES sobre a América do Sul, durante o
período diurno, são submetidas ao Modelo GL de Radiação Solar. O resultado são imagens com estimativas
de radiação solar: global, visível e reflectância; em projeção regular, 1800 por 1800 pixels, com resolução
espacial de 0.04º. Para realizar a comparação de um dado real com uma estimativa atualmente são
recuperados dados de diversas redes, totalizando mais de 800 estações terrestres (Tabela 1).
REDE
CPTEC (SCD)
INMET
COLÔMBIA
PIRATA
SIMEPAR
SOLRADNET
SONDA
PERIODICIDADE
Média Diária (Integral de 3 em 3 horas)
De 1 em 1 hora
Média Diária
Média Diária
Média Diária
De 2 em 2 minutos
De 1 em 1 minuto
TOTAL
350
279
69
42
38
8
17
803 estações
Tabela 1. Redes de Estações cujos dados solarimétricos foram utilizados neste trabalho.
2.2 Padronização dos Dados
Cada instituição produtora de dados terrestres possui uma padronização própria dos arquivos
fornecidos e do tipo de dado. Os dados fornecidos ao banco são padronizados, contendo as informações
seguintes para cada estação (‘metadados’):
- ID Estação (identificação no banco) e ID Rede (identificação na rede original)
- Latitud, Longitude, Altitude
- Cidade (Nome), Estado (Sigla), Área (região do Brasil ou país da América do Sul)
- Proprietário (Instituição responsável pela estação) e Status (em operação ou inativa)
Os dados de radiação fornecidos são:
- ID Estação
- Data (YYYY:MM:DD hh:mm:ss)
- Média Diária de Radiação (medida ou estimada) padrão: W/m²
A lista de coordenadas de estações e o arquivo binário de estimativa obtido com o Modelo GL são
passadas a um programa responsável por extrair o valor de estimativa para cada estação.(figura 3).
Modelo GL
Banco
de
Dados
Binário – GOES
VIS
Dados Estimados
(Formato Texto)
Dados Observados
(Formato Texto)
Estações Terrestres
Figura 1. Fontes Fornecedoras de Dados.
Dados estimados são obtidos através da saída do Modelo GL que utilizou uma imagem do satélite GOES.
Dados observados são obtidos através da mensuração da radiação por parte das estações solarimétricas.
CPTEC
Dados Estações
Terrestres
INMET
PIRATA
SONDA
Lista de
Coordenadas
SOLRADNET
Padronização
W/m²
SIMEPAR
Radiação Observada
ESTAÇÃO
COLÔMBIA
Figura 2. Aquisição e Padronização dos Dados das Estações Terrestres.
Arquivo Binário de
Estimativa Modelo GL
Extração da
estimativa para
todas as estações
Radiação Estimada
(MODELO)
Lista de Coordenadas
das Estações
Figura 3. Radiação estimada nas coordenadas das estações terrestres.
2.3 Processamento dos Dados: Relatório Mensal do Modelo GL
O relatório mensal consiste de várias planilhas:
- DIFERENÇA (MODELO-ESTACAO)
- STATUS (Sinalização dos dados segundo uma tabela de classificação)
- ESTATISTICA (Estatística das médias diárias num mês)
Primeiramente, calcula-se a diferença entre as duas fontes obtendo uma terceira planilha
(DIFERENÇA = MODELO – ESTAÇÃO).
Sinalização dos Dados: É criada uma planilha de STATUS sinalizando a qualidade dos dados de
cada dia para cada estação.
O método de filtragem consiste na sinalização dos dados, criando uma planilha de códigos de
qualidade. Cada dia tem dados do MODELO, da ESTAÇÃO e da DIFERENÇA, sendo assim, cada dado
será validado e receberá um ‘flag’ (índices numéricos estabelecidos com base na realidade) sinalizando a sua
qualidade. Será criada assim a planilha de STATUS que contém os códigos de qualidade dos dados. Cada
código contém 3 flags (índices numéricos estabelecidos com base na realidade). Confira os valores que os
flags podem assumir e seus respectivos significados:
Planilha Status
MODELO
0
MODELO ou ESTAÇÃO
Flag
Significado
0
Dado Válido
1
Dado Inexistente
2
Dado < 30 W/m²
3
Dado > 400 W/m²
ESTAÇÃO
0
DIFERENÇA
2
DIFERENÇA
Flag
0
1
2
3
Significado
Dado Válido
Dado Inexistente
Dado < -120 W/m²
Dado > +120 W/m²
Figura 4. Amostragem uma planilha STATUS, contendo id da estação, latitude, longitude, 7 dias de dados
sinalizados. Cada dia Tabela de Flags e significados para as planilhas e MODELO, ESTACÃO e
DIFERENÇA.
A seguir abre-se uma planilha de ESTATISTICA com resultados mensais da análise.
Filtro Grosseiro: estatística mensal de MODELO, ESTACAO e DIFERENÇA. São considerados
somente os dados com flags nulos, ou seja, os valores das três fontes têm que ser válidos. Além disso, a
estação deve ter pelo menos 10 dias com dados. Calcula-se para cada estação a quantidade de dados válidos,
a média e o desvio padrão.
Filtro Fino: para MODELO, ESTAÇÃO e DIFERENÇA, considera-se apenas dados cujo valor se
desvia até 3 vezes o seu desvio padrão. Calcula-se novamente a quantidade de dados válidos, a média e o
desvio padrão.
Filtro Grosseiro
MODELO
Filtro Fino
MODELO
Filtro Grosseiro
ESTAÇÃO
Filtro Fino
ESTAÇÃO
Filtro Grosseiro
DIFERENÇA
Filtro Fino
DIFERENÇA
Figura 5. Planilha ESTATISTICA.
Laranja: filtro grosseiro para o MODELO; Amarelo: filtro fino para o MODELO; Azul escuro: filtro grosseiro
para ESTAÇÃO; Azul claro: filtro fino para ESTAÇÃO; Verde escuro: filtro grosseiro para DIFERENÇA;
Verde claro: filtro fino para DIFERENÇA.
3. CONCLUSÕES E PERSPECTIVAS
O sistema em desenvolvimento permitirá tanto o monitoramento do desempenho do modelo GL,
como da qualidade dos dados de estações terrestres. Funcionalidades como uma consulta interativa estarão
disponíveis ao usuário, dando a este a opção de combinar restrições como: a data, a região, o estado, a
cidade, a instituição fornecedora de dados, estações em específico, estações no raio de 1 km de uma
determinada localidade, estações com comportamento duvidoso com base nas análises estatísticas geradas.
Tais consultas gerariam gráficos em tempo real e já estariam disponíveis os usuários.
Planejado para fornecer planilhas de dados assim como para facilitar o acesso dos usuários aos
mesmos, o sistema apresentará uma interface amigável e interativa. A utilização de um banco de dados
proporcionará:
- A centralização dos dados (parâmetros e resultados);
- A independência da formatação de arquivos;
- A independência da forma de disposição dos dados nos arquivos;
- O controle sobre a quantidade de estações;
- Acesso facilitado;
- Evita dados duplicados;
- Facilita o desenvolvimento de programas que manipulam os dados;
- A padronização de acesso.
Status Atual do Sistema:
O sistema consiste de um conjunto de programas e um banco de dados. Os programas permitem:
1. A extração pontual de estimativas do Modelo GL. O programa consulta coordenadas geográfica
no banco de dados de acordo com alguma restrição, extrai os dados dos arquivos binário modelo GL e
armazena no banco de dados.
2. Suíte de programas para integração diária de dados para diferentes redes. Por exemplo: INMET
(dados horários), SOLRADNET (dados a cada 2 minutos), SONDA (dados a cada minuto), etc.
3. Padronização dos dados das estações e armazenamento no banco.
4. Criação das planilhas STATUS e ESTATÍSTICA a partir das planilhas: MODELO, ESTAÇÃO e
DIFERENÇA Programas em Fortran 77.
5. O banco está sendo ‘populado’ e permite fazer consultas combinando restrições.
Em implementação:
Utilização da linguagem Java para:
- Extração de estimativas GL, integração diária dos dados de redes, armazenamento dos resultados
(itens 1 a 3 do status atual).
- Geração de estatística mensal de dados (STATUS e ESTATÍSTICA) e relatórios mensais.
- Criação de Interface web: sistema x usuário para escolha de restrições.
- Implementação de relatórios gráficos em interface web.
- Interação do sistema com o software MatLab para geração de gráficos.
AGRADECIMENTOS: Os autores agradecem o apoio do CNPq (bolsa PIBIC do primeiro autor).
REFERÊNCIAS BIBLIOGRÁFICAS
BSRN, Baseline Solar Radiation Network – Quality assurance of Database. World Meteorological
Organisation [online] http://bsrn.ethz.ch/ , 2006.
Ceballos, J.C., G.B.A. Moura, V.F. Bezerra, J.D.A. Farias. Desempenho de heliógrafos e actinógrafos na
estimativa de insolação e fluxo direcional. Revista Brasileira de Meteorologia; Vol. 7(2), 563-581, 1992.
Martins, F.R., R.A. Guarnieri, R.C. Chagas, S.L.Mantelli Neto, E.B. Pereira, E. Andrade, C. Thomaz.
Projeto SONDA – Rede Nacional de estações para coleta de dados meteorológicos aplicados ao setor de
energia. Anais, I Congresso Brasileiro de Energia Solar, ABENS, Fortaleza abril 2007 (CD-ROM)
Download