SISTEMA DE GERENCIAMENTO E VALIDAÇÃO DE DADOS DE RADIAÇÃO SOLAR Amanda Monteiro Galvão¹,² , Juan Carlos Ceballos¹ ¹Divisão de Satélites e Sistemas Ambientais,CPTEC/INPE, Cachoeira Paulista-SP; ²Centro Universitário Salesiano de Lorena, UNISAL-SP e-mails: [email protected], [email protected] RESUMO: É descrita uma estrutura de análise de dados, destinada a comparar estimativas de radiação solar diária por satélite com dados de “verdade terrestre” e elaborar relatórios numa base mensal. Diversos programas realizam pré-processamento de informações provenientes de diversas redes solarimétricas e do modelo GL, padronizam os dados, realizam uma análise estatística simples e apresentam os resultados. Os dados estão servindo para popular um banco de dados (estrutura PostGres). Parte das rotinas serão implementadas no banco, permitindo o processamento de dados automatizado e a consulta interativa de usuários utilizando uma interface web. ABSTRACT. We describe a data processing scheme, designed for comparison of daily values of solar radiation estimated by satellite and measured by ground stations, with reports on a monthly basis. A set of programs are charged on pre-processing data provided by different solarimetric networks and by GL model, standardizing quantities and formats, performing a simplified statistical analysis and reporting results. Data are nowadays populating a database (PostGres structure). Some routines will be implemented within the data base, allowing for automatic data processing and users interactive query through a web interface. Palavras-Chave: radiação solar, banco de dados 1. INTRODUÇÃO O regime de radiação solar é de importância primordial para o desenvolvimento de coberturas vegetais, tanto no espectro fotossinteticamente ativo (radiação PAR, necessária para fotossíntese), como no espectro global (diretamente ligado a taxas de evapotranspiração), sin contar seu aspecto de fonte de energia alternativa. Todavia, existe uma escassez histórica de dados de radiação solar. Os mais freqüentes têm sido os gerados por heliógrafo (horas de sol diárias ou insolação), a partir dos quais a irradiação solar é estimada. Nessas condições, apenas médias mensais têm alguma confiabilidade (Ceballos et al. 1992). Nos últimos anos o número de estações solarimétricas tem aumentado consideravelmente. Mesmo assim, detalhes das variações espaciais da radiação solar costumam não ser evidenciados; em compensação, as estimativas por satélite podem ter uma resolução de uma dezena de quilômetros. No CPTEC roda operacionalmente o modelo GL de estimativa de radiação solar, baseado na refletância medida pelo sensor Imager VIS do satélite GOES sobre a América do Sul. Descrição dele está disponível em http://satelite.cptec.inpe.br/htmldocs/radiacao/fluxos/radsat.htm. Embora o modelo GL forneça informações horárias e diárias com alta resolução espacial, suas estimativas devem ser validadas. A validação das estimativas é realizada através da comparação com valores obtidos por estações terrestres, o que, reciprocamente, permite a detecção de funcionamentos anômalos nas redes de superfície. Este controle recíproco é uma característica interessante do método utilizado e difere de outros sistemas de controle de qualidade, como o aplicado à rede SONDA de instrumentos gerenciados pelo CPTEC (Martins et al. 2007), seguindo normas da Baseline Surface Radiation Network (BSRN 2006). Este trabalho descreve o sistema de controle da qualidade GL/verdade terrestre, que será implementado num banco de dados e apresentará resultados através de uma interface web. 2. METODOLOGIA 2.1 Aquisição de Dados Todas as imagens do canal VIS obtidas com o satélite GOES sobre a América do Sul, durante o período diurno, são submetidas ao Modelo GL de Radiação Solar. O resultado são imagens com estimativas de radiação solar: global, visível e reflectância; em projeção regular, 1800 por 1800 pixels, com resolução espacial de 0.04º. Para realizar a comparação de um dado real com uma estimativa atualmente são recuperados dados de diversas redes, totalizando mais de 800 estações terrestres (Tabela 1). REDE CPTEC (SCD) INMET COLÔMBIA PIRATA SIMEPAR SOLRADNET SONDA PERIODICIDADE Média Diária (Integral de 3 em 3 horas) De 1 em 1 hora Média Diária Média Diária Média Diária De 2 em 2 minutos De 1 em 1 minuto TOTAL 350 279 69 42 38 8 17 803 estações Tabela 1. Redes de Estações cujos dados solarimétricos foram utilizados neste trabalho. 2.2 Padronização dos Dados Cada instituição produtora de dados terrestres possui uma padronização própria dos arquivos fornecidos e do tipo de dado. Os dados fornecidos ao banco são padronizados, contendo as informações seguintes para cada estação (‘metadados’): - ID Estação (identificação no banco) e ID Rede (identificação na rede original) - Latitud, Longitude, Altitude - Cidade (Nome), Estado (Sigla), Área (região do Brasil ou país da América do Sul) - Proprietário (Instituição responsável pela estação) e Status (em operação ou inativa) Os dados de radiação fornecidos são: - ID Estação - Data (YYYY:MM:DD hh:mm:ss) - Média Diária de Radiação (medida ou estimada) padrão: W/m² A lista de coordenadas de estações e o arquivo binário de estimativa obtido com o Modelo GL são passadas a um programa responsável por extrair o valor de estimativa para cada estação.(figura 3). Modelo GL Banco de Dados Binário – GOES VIS Dados Estimados (Formato Texto) Dados Observados (Formato Texto) Estações Terrestres Figura 1. Fontes Fornecedoras de Dados. Dados estimados são obtidos através da saída do Modelo GL que utilizou uma imagem do satélite GOES. Dados observados são obtidos através da mensuração da radiação por parte das estações solarimétricas. CPTEC Dados Estações Terrestres INMET PIRATA SONDA Lista de Coordenadas SOLRADNET Padronização W/m² SIMEPAR Radiação Observada ESTAÇÃO COLÔMBIA Figura 2. Aquisição e Padronização dos Dados das Estações Terrestres. Arquivo Binário de Estimativa Modelo GL Extração da estimativa para todas as estações Radiação Estimada (MODELO) Lista de Coordenadas das Estações Figura 3. Radiação estimada nas coordenadas das estações terrestres. 2.3 Processamento dos Dados: Relatório Mensal do Modelo GL O relatório mensal consiste de várias planilhas: - DIFERENÇA (MODELO-ESTACAO) - STATUS (Sinalização dos dados segundo uma tabela de classificação) - ESTATISTICA (Estatística das médias diárias num mês) Primeiramente, calcula-se a diferença entre as duas fontes obtendo uma terceira planilha (DIFERENÇA = MODELO – ESTAÇÃO). Sinalização dos Dados: É criada uma planilha de STATUS sinalizando a qualidade dos dados de cada dia para cada estação. O método de filtragem consiste na sinalização dos dados, criando uma planilha de códigos de qualidade. Cada dia tem dados do MODELO, da ESTAÇÃO e da DIFERENÇA, sendo assim, cada dado será validado e receberá um ‘flag’ (índices numéricos estabelecidos com base na realidade) sinalizando a sua qualidade. Será criada assim a planilha de STATUS que contém os códigos de qualidade dos dados. Cada código contém 3 flags (índices numéricos estabelecidos com base na realidade). Confira os valores que os flags podem assumir e seus respectivos significados: Planilha Status MODELO 0 MODELO ou ESTAÇÃO Flag Significado 0 Dado Válido 1 Dado Inexistente 2 Dado < 30 W/m² 3 Dado > 400 W/m² ESTAÇÃO 0 DIFERENÇA 2 DIFERENÇA Flag 0 1 2 3 Significado Dado Válido Dado Inexistente Dado < -120 W/m² Dado > +120 W/m² Figura 4. Amostragem uma planilha STATUS, contendo id da estação, latitude, longitude, 7 dias de dados sinalizados. Cada dia Tabela de Flags e significados para as planilhas e MODELO, ESTACÃO e DIFERENÇA. A seguir abre-se uma planilha de ESTATISTICA com resultados mensais da análise. Filtro Grosseiro: estatística mensal de MODELO, ESTACAO e DIFERENÇA. São considerados somente os dados com flags nulos, ou seja, os valores das três fontes têm que ser válidos. Além disso, a estação deve ter pelo menos 10 dias com dados. Calcula-se para cada estação a quantidade de dados válidos, a média e o desvio padrão. Filtro Fino: para MODELO, ESTAÇÃO e DIFERENÇA, considera-se apenas dados cujo valor se desvia até 3 vezes o seu desvio padrão. Calcula-se novamente a quantidade de dados válidos, a média e o desvio padrão. Filtro Grosseiro MODELO Filtro Fino MODELO Filtro Grosseiro ESTAÇÃO Filtro Fino ESTAÇÃO Filtro Grosseiro DIFERENÇA Filtro Fino DIFERENÇA Figura 5. Planilha ESTATISTICA. Laranja: filtro grosseiro para o MODELO; Amarelo: filtro fino para o MODELO; Azul escuro: filtro grosseiro para ESTAÇÃO; Azul claro: filtro fino para ESTAÇÃO; Verde escuro: filtro grosseiro para DIFERENÇA; Verde claro: filtro fino para DIFERENÇA. 3. CONCLUSÕES E PERSPECTIVAS O sistema em desenvolvimento permitirá tanto o monitoramento do desempenho do modelo GL, como da qualidade dos dados de estações terrestres. Funcionalidades como uma consulta interativa estarão disponíveis ao usuário, dando a este a opção de combinar restrições como: a data, a região, o estado, a cidade, a instituição fornecedora de dados, estações em específico, estações no raio de 1 km de uma determinada localidade, estações com comportamento duvidoso com base nas análises estatísticas geradas. Tais consultas gerariam gráficos em tempo real e já estariam disponíveis os usuários. Planejado para fornecer planilhas de dados assim como para facilitar o acesso dos usuários aos mesmos, o sistema apresentará uma interface amigável e interativa. A utilização de um banco de dados proporcionará: - A centralização dos dados (parâmetros e resultados); - A independência da formatação de arquivos; - A independência da forma de disposição dos dados nos arquivos; - O controle sobre a quantidade de estações; - Acesso facilitado; - Evita dados duplicados; - Facilita o desenvolvimento de programas que manipulam os dados; - A padronização de acesso. Status Atual do Sistema: O sistema consiste de um conjunto de programas e um banco de dados. Os programas permitem: 1. A extração pontual de estimativas do Modelo GL. O programa consulta coordenadas geográfica no banco de dados de acordo com alguma restrição, extrai os dados dos arquivos binário modelo GL e armazena no banco de dados. 2. Suíte de programas para integração diária de dados para diferentes redes. Por exemplo: INMET (dados horários), SOLRADNET (dados a cada 2 minutos), SONDA (dados a cada minuto), etc. 3. Padronização dos dados das estações e armazenamento no banco. 4. Criação das planilhas STATUS e ESTATÍSTICA a partir das planilhas: MODELO, ESTAÇÃO e DIFERENÇA Programas em Fortran 77. 5. O banco está sendo ‘populado’ e permite fazer consultas combinando restrições. Em implementação: Utilização da linguagem Java para: - Extração de estimativas GL, integração diária dos dados de redes, armazenamento dos resultados (itens 1 a 3 do status atual). - Geração de estatística mensal de dados (STATUS e ESTATÍSTICA) e relatórios mensais. - Criação de Interface web: sistema x usuário para escolha de restrições. - Implementação de relatórios gráficos em interface web. - Interação do sistema com o software MatLab para geração de gráficos. AGRADECIMENTOS: Os autores agradecem o apoio do CNPq (bolsa PIBIC do primeiro autor). REFERÊNCIAS BIBLIOGRÁFICAS BSRN, Baseline Solar Radiation Network – Quality assurance of Database. World Meteorological Organisation [online] http://bsrn.ethz.ch/ , 2006. Ceballos, J.C., G.B.A. Moura, V.F. Bezerra, J.D.A. Farias. Desempenho de heliógrafos e actinógrafos na estimativa de insolação e fluxo direcional. Revista Brasileira de Meteorologia; Vol. 7(2), 563-581, 1992. Martins, F.R., R.A. Guarnieri, R.C. Chagas, S.L.Mantelli Neto, E.B. Pereira, E. Andrade, C. Thomaz. Projeto SONDA – Rede Nacional de estações para coleta de dados meteorológicos aplicados ao setor de energia. Anais, I Congresso Brasileiro de Energia Solar, ABENS, Fortaleza abril 2007 (CD-ROM)