1 Análise de Desempenho de um Modelo Híbrido em uma Série Temporal de Descargas Atmosféricas N. T. Santos, B. R. P. Rocha, V. G. Macedo, L. A. S. Lessa, L. M. Dentel, D. G. dos Santos, J. R. S. de Souza Resumo—Neste artigo é testada a adequação de um modelo híbrido inteligente para previsão de uma série temporal composta por um conjunto de observações da frequência diária de descargas atmosféricas por um período de doze meses. Na primeira fase foram testados alguns modelos ARIMA para definir o que melhor representasse a série e o eleito foi o ARIMA (1,1,0). Os resíduos, a previsão e as defasagens resultantes desse pré-processamento foram utilizadas como dados de entrada para a segunda fase que consiste na implementação de uma rede neural artificial em ambiente Matlab. A rede MLP proposta no modelo original não teve um bom desempenho, por isso, foi necessário encontrar outra opção e a escolha foi pela rede RBF que tem como característica similar a MLP serem aproximadoras universais de função. A rede RBF obteve uma aproximação melhor em menos época de execução. Palavras-chave—Descargas Atmosféricas, Modelo Híbrido, Redes Neurais Artificiais, Séries Temporais. I. INTRODUÇÃO N enhum país recebe mais descargas elétricas atmosféricas (ou raios) que o Brasil. Por ano caem cerca de 60 milhões de raios [1]. Em 2010, 89 pessoas morreram após serem atingidas por raios de acordo com o Instituto Nacional de Pesquisas Espaciais (Inpe), mas o número é menor do que a média registrada entre 2000 e 2009, de 132 vítimas por ano. No primeiro semestre de 2011, segundo o Inpe foram registrados 28 casos de mortes causadas por raios em todo o país [2]. Além dos riscos de morte (pessoas e pecuária) os raios causam muitos prejuízos ao setor elétrico, telecomunicações, setor de transportes (aéreo, marítimo e terrestre), construção civil, agricultura, entre outras. Por isso, o Grupo de N. T. Santos, Universidade Federal do Pará, Belém, Brasil, [email protected]) V. G. Macedo, Universidade Federal do Pará, Belém, Brasil, [email protected]) L. A. S. Lessa, Universidade Federal do Pará, Belém, Brasil, [email protected]) B. R. P. Rocha, Universidade Federal do Pará, Belém, Brasil, [email protected]) L. M. Dentel, Universidade Federal do Pará, Belém, Brasil, [email protected]) D. G. dos Santos, Universidade Federal do Pará, Belém, Brasil, [email protected]) J. R. S. de Souza, Universidade Federal do Pará, Belém, Brasil, [email protected]) (email: Eletricidade Atmosférica (ELAT) do Instituto Nacional de Pesquisas Espaciais (INPE) realizou um estudo junto a vários setores que são prejudicados e concluiu que os raios causam prejuízos anuais de aproximadamente um bilhão de dólares [3]. Diante do exposto anteriormente é fácil compreender a necessidade de estudos mais apurados e propostas de modelos, implementações e sistemas que contribuam com o processo de conhecimento desse fenômeno natural considerado imprevisível. A previsão da quantidade de raios é um processo em fase de aperfeiçoamento, pois vários estudos desenvolvem conceitos através da análise das características elétricas dos raios e dos seus dados históricos. Na literatura há várias propostas de previsão de raios como em [4] que os autores apresentam um sistema de previsão probabilística de descargas atmosféricas, denominado SIPPER e em [5] onde a autora utiliza o modelo WRF (Weather Research and Forecasting) para simular variáveis meteorológicas que irão alimentar a entrada de uma rede neural artificial cuja saída é a previsão para um futuro próximo. Essa mesma autora em [6] utiliza apenas o modelo WRF que é um sistema de modelagem numérica da atmosfera, em diferentes escalas espaciais (metros até milhares de quilômetros) para prever raios. Não existe um modelo que seja considerado o melhor, por isso há vários modelos que podem ser usados separadamente ou em conjunto. Neste trabalho realizamos uma implementação híbrida inteligente proposta por [7] que utiliza as vantagens do modelo ARIMA em associação com as redes neurais MLPs (Perceptron de Múltiplas Camadas) para prever valores futuros através de um conjunto de observações históricas, que nesse caso são observações passadas da freqüência diárias de raios em um período de doze meses, mas os resultados não tiveram um bom desempenho e por isso o modelo RBF (Função de Base Radial) foi escolhido para substituir a rede MLP. (email: (email: (email: (email: (email: (email: II. MODELO ARIMA, REDES NEURAIS E O MODELO DE KHASHEI E BIJARI PARA PREVISÃO DE SÉRIES TEMPORAIS Uma série temporal pode ser definida como um conjunto de observações feitas seqüencialmente no tempo [8]. A previsão de séries temporais é aplicada em diversas áreas (metereologia, economia, marketing, energia, epidemiologia, entre outras), por isso há interesse no desenvolvimento e aperfeiçoamento dos modelos. 2 Onde Lt denota a componente linear e Nt a componente não linear. Na primeira fase o objetivo principal é a modelagem linear através do modelo auto-regressivo. Os resíduos da primeira etapa conterão a seguinte relação não linear: (2) Onde Lt é o valor da previsão para o tempo t; e et é o resíduo no tempo t a partir do modelo linear. Os resíduos são importantes para medir o grau de suficiência de modelos lineares. Um modelo linear não é suficiente se ainda existem estruturas de correlação linear negativas nos resíduos. Na segunda fase é feita a análise não linear e, portanto uma rede neural artificial é usada para modelar os relacionamentos não lineares e provavelmente os lineares existentes nos resíduos da modelagem linear. Assim, (3) Onde f1, f2 e f são funções não lineares determinadas pela rede neural; n e m são inteiros e referem-se ao grau do modelo. Desse modo a previsão combinada terá a seguinte forma: (4) Onde n1 n e m1 m são inteiros determinados no processo final do modelo neural. III. APLICAÇÃO DO MODELO Nesse trabalho o modelo proposto no item II foi implementado para analisar a eficiência deste aplicado em um banco de dados que contém a freqüência das ocorrências de raios no período de 366 dias. Na primeira fase os dados salvos em uma planilha do Excel foram carregados no Gretl (acrônimo de Gnu Regression, Econometrics and Time-series Library) que foi escolhido porque é um software livre que compila e interpreta dados econométricos/estatísticos. A fig. 1 mostra o gráfico com os dados originais carregados no Gretl. 800000 700000 600000 500000 ocorrencias Os modelos estatísticos mais conhecidos para análise de séries temporais no domínio do tempo são os de Box-Jenkings que têm este nome devido ao algoritmo desenvolvido pelos autores na década de 70. Os autores [9] afirmam que os modelos Box-Jenkings partem da idéia de que cada valor da série pode ser explicado por valores prévios, a partir do uso da estrutura de correlação temporal que geralmente há entre os valores da série. O guia para modelagem ARIMA (p,d,q) consiste em três passos: identificação do modelo, estimação e verificação da adequação. Na fase de identificação estuda-se o comportamento das funções de auto correlação (ACF) e auto correlação parcial (PACF); a segunda fase consiste em estimar os parâmetros auto-regressivos, os parâmetros de médias móveis e a variância dos resíduos. A verificação da adequação do modelo é efetuada em dois momentos: primeiro examinando o grau de ajustamento (Variância do erro, Erro Quadrado Médio ou o Erro Percentual Médio Absoluto) e segundo examinando a aleatoriedade dos resíduos através de sua função de auto correlação; validado o modelo é possível construir uma função de previsão [10], [11], [12], [13]. Os modelos ARIMA (modelo auto-regressivo integrado e de média móvel), pertencentes à família de modelos propostos por Box-Jenkings, descrevem tanto o comportamento estacionário como o não-estacionário com a vantagem de requerer poucos parâmetros. Esses modelos são baseados no principio da parcimônia, ou seja, procuram representar uma série utilizando um número mínimo de parâmetros [14]. Os modelos ARIMA têm uma limitação porque só resolvem problemas lineares e para superar esse problema é utilizada uma rede neural. Essa combinação de modelos é denominada modelagem híbrida inteligente. A idéia básica de combinar modelos de previsão é a utilização de características únicas de cada modelo para capturar diferentes padrões nos dados e construir uma solução global através de soluções parciais [15]. A Rede Neural Artificial inspirada no funcionamento dos neurônios biológicos é um dos modelos não-lineares e nãoparamétricos mais utilizadas para previsão de séries temporais devido suas diversas vantagens, tais como, capacidade de mapeamento flexível da função não-linear e generalização. Os autores [15] aplicaram o modelo ARIMA à série temporal original e depois modelaram seus resíduos através das redes neurais MLPs. Para formulação do modelo foi considerada a série temporal como uma função composta por uma componente linear e uma não-linear, (1) yt f ( Lt , Nt ) (1) 400000 300000 200000 100000 0 2007 2008 Fig. 1: Representação da Série Original no Gretl Após alguns testes, análise do correlograma e da previsão foi escolhido o ARIMA (1,1,0), o termo diferenciável d=1 foi suficiente para estacionar o modelo. Em seguida foi implementada uma rede neural de Múltiplas Camadas com 12 entradas, 4 neurônios ocultos e função de treinamento backpropagation com bayesiana regularizada, mas para esses dados a rede não teve bons resultados, por isso, em busca de um caminho para alcançar um desempenho melhor outra rede também supervisionada e aproximadora universal foi implementada. A principal diferença entre elas é que as redes RBF tendem 3 a produzir aproximações locais, enquanto as redes MLP tendem a resultar em aproximações globais. Quando se trata de aprendizado continuado, como é o caso de predição de séries temporais, as redes MLP se mostram menos adequadas porque o custo computacional de treino de uma rede MLP é muito superior ao de uma rede RBF, o que impossibilita a operação de forma dinâmica [16]. IV. RESULTADOS Após o processamento linear com o modelo ARIMA (1,1,0) os resíduos com defasagens, a previsão e as defasagens da série original foram modeladas pela rede neural implementada em ambiente Matlab. A Fig. 1 mostra dois gráficos que apresentam os mesmos resultados em representações diferentes do treinamento realizado com 75% dos dados com uma rede MLP backpropagation. Grafico a) DADOS DE TREINAMENTO - ESTIMADOS X REAIS Grafico b) DADOS DE TREINAMENTO - ESTIMADOS X REAIS 1 1 DADOS REAIS DADOS REAIS DADOS ESTIMADOS DADOS ESTIMADOS 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Para confirmar a afirmação do parágrafo anterior a tabela I apresenta as medidas estatísticas de desempenho do treinamento e da validação da rede. Tabela I. Medidas Estatísticas de Desempenho Treinamento Validação MSE 0.0114 0.0236 MAE 0.0708 0.1087 SSE 3.0178 2.0967 A rede não atingiu um objetivo ótimo, por isso, o próximo passo foi treinar e validar os dados com uma rede RBF. O Matlab possui duas funções de implementação de RBF: a newrb e a newrbe. A diferença entre elas está na forma de criação dos nodos da camada escondida. A função newrb cria uma rede de forma iterativa, adicionando um neurônio por vez até que o SSE atinja a meta de erro ou o número de neurônios exceda o máximo. A função newrbe cria a rede RBF com os neurônios da camada oculta igual ao número de vetores da entrada. Cada neurônio na camada oculta funciona como um detector para um vetor de entradas diferentes. As duas funções foram testadas e a newrbe alcançou o melhor resultado. A Fig. 3 mostra os gráficos com os resultados do treinamento (75% dados). 0.1 Grafico a) DADOS DE TREINAMENTO - ESTIMADOS X REAIS Grafico b) DADOS DE TREINAMENTO - ESTIMADOS X REAIS 1 0 0 50 100 150 200 250 300 50 100 150 200 250 300 Fig. 1. Treinamento de uma rede MLP Na fase de treinamento a rede opera em uma sequência de dois passos. Primeiro, um padrão é apresentado à camada de entrada da rede e flui camada por camada até que a resposta seja produzida pela camada de saída. No segundo passo, a saída obtida é comparada à saída desejada para esse padrão particular e se estas não forem iguais, o erro é calculado e propagado a partir da camada de saída até a camada de entrada. Os pesos das conexões das unidades da camada de saída e das camadas intermediárias vão sendo modificados conforme o erro é retro propagado. Após a fase de treinamento, 25% dos dados guardados para validação foram apresentados a entrada da rede para testar sua capacidade de generalização. Na Fig. 2 pode ser observado que o previsor não funcionou adequadamente. Grafico a) DADOS DE TESTE - ESTIMADOS X REAIS Grafico b) DADOS DE TESTE - ESTIMADOS X REAIS 1 1 DADOS REAIS DADOS REAIS DADOS ESTIMADOS DADOS ESTIMADOS 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 260 270 280 290 300 310 320 330 340 350 360 0 260 1 DADOS REAIS 0 0 270 280 290 300 Fig. 2. Treinamento de uma rede MLP 310 320 330 340 350 360 DADOS REAIS DADOS ESTIMADOS DADOS ESTIMADOS 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0 0 0.1 50 100 150 200 250 300 0 0 50 100 150 200 250 300 Fig. 3. Treinamento de uma rede RBF Diferentemente da rede MLP que pode apresentar uma ou duas camadas de neurônios ocultos, a rede RBF, em sua concepção básica, apresenta apenas uma camada oculta, além de uma camada de saída. A ativação de uma unidade oculta é determinada pela distância entre o vetor de entrada e um vetor protótipo. O treinamento desta rede é realizado em dois estágios: primeiro são determinados os parâmetros das funções de base (não-supervisionado) e depois são determinados os pesos da camada de saída (problema linear). Como conseqüência o treinamento desta rede foi muito mais rápido do que a MLP. O aprendizado é equivalente a encontrar uma superfície no espaço multidimensional do mapeamento que resulta no melhor ajuste aos dados de treinamento. A Fig. 4 mostra os gráficos com os resultados de validação (25% dados). 4 Grafico a) DADOS DE TESTE - ESTIMADOS X REAIS 1 DADOS REAIS DADOS REAIS DADOS ESTIMADOS DADOS ESTIMADOS 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0 260 a pretensão de afirmar que esta técnica é a melhor para este tipo de dados, mesmo porque o desenvolvimento de técnicas de representação de séries é um processo contínuo. Apenas é possível afirmar que o modelo proposto no item II não é adequado para esta série como foi apresentado na íntegra, mas com algumas mudanças ele pôde ser aplicado produzindo bons resultados. Grafico b) DADOS DE TESTE - ESTIMADOS X REAIS 1 0.9 VI. 0.1 270 280 290 300 310 320 330 340 350 360 0 260 270 280 290 300 310 320 330 340 350 360 Fig. 4. Treinamento de uma rede RBF A generalização/aprendizagem corresponde a interpolar dados em superfície multidimensional que melhor se ajuste ao conjunto de dados de treinamento. Na tabela II são apresentadas as medidas estatísticas de desempenho do treinamento e da validação da rede. Tabela II. Medidas Estatísticas de Desempenho Treinamento Todos os autores agradecem ao SIPAM (Sistema de Proteção da Amazônia) por disponibilizarem os dados de sua rede para este estudo e os autores Santos, Lessa e Dentel agradecem ao Conselho Nacional de Desenvolvimento Cientifico e Tecnológico (CNPq) pelo apoio financeiro recebido em forma de bolsa de doutorado. VII. [1] Validação MSE 5.2822 x 10 -022 1.1076 x 10-022 [2] MAE 1.6107 x 10-011 8.0119 x 10-012 [3] SSE 1.3998 x 10-019 9.8577 x 10-021 [4] A rede RBF obteve uma aproximação melhor (menor taxa de erro) em menos épocas de execução (convergência mais rápida). Já a MLP apresentou uma resposta mais lenta e com uma taxa de erro superior a RBF. V. CONSIDERAÇÕES A área de previsão de séries temporais é um campo em que a pesquisa atua de forma constante e não há um modelo específico que seja considerado o melhor porque cada série temporal requer uma investigação acerca de suas características como critério para escolha do melhor modelo ou a combinação de modelos. A combinação de previsões permite aumentar a confiabilidade da previsão e reduzir a possibilidade de grandes desvios. As análises realizadas neste trabalho procuraram testar a eficiência de um modelo híbrido inteligente aplicado em uma série temporal de descargas atmosféricas que tem um comportamento de ocorrência altamente aleatório. Os testes com o modelo ARIMA foram importantes para que pudesse escolher o que melhor representasse os padrões lineares envolvidos nos dados e no caso da rede neural a rede backpropagation envolveu um alto custo computacional associado a um baixo desempenho, portanto a melhor combinação de modelos encontrada para representar esta série foi uma modelagem ARIMA (1,1,0) combinada com uma rede RBF iterativa com 12 entradas, e 4 neurônios ocultos. Os valores das entradas para a rede neural foram os dados préprocessados pelo modelo estatístico (os resíduos com 6 defasagens, o previsor e a série original com 5 defasagens). As medidas estatísticas mostraram que o modelo escolhido realizou uma representação da série, mas este trabalho não tem AGRADECIMENTOS [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] REFERÊNCIAS http://noticias.terra.com.br/brasil/noticias/0,,OI3513807-EI306,00vc+reporter+Brasil+lidera+queda+de+raios+no+mundo.html. Acessado em 14/12/2011. http://www.brasil.gov.br/noticias/arquivos/2011/06/20/inpe-registra-89mortes-por-raios-em-2010. Acessado em: 14/12/2011. http://www.inpe.br/noticias/noticia.php?Cod_Noticia=936. Acessado em 14/12/2011. E. A. Leite; O. C. Rotunno Filho. “Sistema de previsão probabilística de eventos de raios – SIPPER”, in XIV Congresso Brasileiro de Meteorologia, 2006, Florianópolis. Anais do XIV Congresso Brasileiro de Meteorologia, 2006. vol 1, pp 1-6. G. S. Zepka. “Uso de Redes Neurais para a Previsão de Descargas Atmosféricas no Sudeste do Brasil. Relatório final da disciplina Princípios e Aplicações de Mineração de Dados (CAP-359) do Programa de Pós-Graduação em Computação Aplicada”. São José dos Campos, 2009. G. S. Zepka. “Previsão de Descargas Atmosféricas Usando o Modelo de Mesoescala WRF.” Tese de Doutorado do Curso de Pós-Graduação em Geofísica Espacial/Ciências Atmosféricas, São José dos Campos, 2011. M. Khashei; M. Bijari. “A novel hybridization of artificial neural networks and ARIMA models for time series forecasting”, Applied Soft Computing, 2664–2675. 2011. P. A. Morettin; C. M. C. Toloi. “Análise de Séries Temporais.” Ed. Edgard Blucher. São Paulo. 2006. L. Werner; J. L. D. Ribeiro. “Previsão de demanda: uma aplicação dos modelos Box-Jenkins na área de assistência técnica de computadores pessoais”, Gest. Prod., vol.10, no.1, p.47-67, Abr 2003. F. C. Gomes. “Os modelos ARIMA e a abordagem de Box-Jenkings: uma aplicação na previsão do IBOVESPA a curtíssimo prazo”, Revista de Administração de Empresas, 29 (2), p. 63-70, Abr./Jun. 1989. J. H. F. Flores. “Comparação de modelos MLP/RNA e modelos BoxJenkings em séries temporais não lineares.” Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia de Produção, Universidade Federal do Rio Grande do Sul, 2009. K. T. Mynbaev; A. Lemos, “Manual de Econometria”, 1ª Ed. Rio de Janeiro: FGV, 2004. L. M. O. Silva. “Uma aplicação de árvores de decisão, redes neurais e KNN para a identificação de modelos ARMA não-sazonais e sazonais”. Tese (Doutorado). Programa de Pós-Graduação em Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro, 2005. M. Valença. “Aplicando Redes Neurais: um guia completo.” Ed. do Autor. Olinda – PE. 2005. M. Khashei; M. Bijari. “A novel hybridization of artificial neural networks and ARIMA models for time series forecasting”, Applied Soft Computing, 2664–2675. 2011. M. C. F. de Castro. “Predição Não-Linear de Séries Temporais usando Redes Neurais RBF por Decomposição em Componentes Principais.” Tese (Doutorado). Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de Campinas, 2001. 5 VIII. BIOGRAFIAS Neuma Teixeira dos Santos Possui graduação em Licenciatura Plena em Matemática (2008), mestrado em Sistemas de Energia pela Universidade Federal do Pará (2011) e atualmente realiza doutorado no Programa de Pósgraduação em Engenharia Elétrica da Universidade Federal do Pará na área de descargas atmosféricas. Tem experiência em Processamento de imagens Digitais e Redes Neurais Artificiais. Brígida Ramati Pereira da Rocha Possui graduação em Engenharia Elétrica pela Universidade Federal do Pará (1976), mestrado em Geofísica pela Universidade Federal do Pará (1979), doutorado em Geofísica pela Universidade Federal do Pará (1995) e Pós-Doutorado pela UNICAMP, na área de Alta Tensão. Atualmente é professor associado III da Universidade Federal do Pará. Tem experiência na área de Engenharia Elétrica, com ênfase em Descargas Atmosféricas, Alta Tensão e Compatibilidade Eletromagnética, atuando principalmente nos seguintes temas: descargas atmosféricas, energia, processamento digital de sinais, biomassa, planejamento energético. Valquíria Gusmão Macedo Possui graduação em Engenharia Elétrica pela Universidade Federal do Pará (1977), graduação em Licenciatura em Física pela Universidade Federal do Pará (1977), mestrado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (1985) e doutorado em Engenharia Elétrica pela Universidade Federal do Pará (2002). Atualmente é professor associado da Universidade Federal do Pará. Tem experiência na área de Engenharia Elétrica, com ênfase em Telecomunicações e Processamento Digital de Sinais, atuando principalmente nos seguintes temas: Processamento de voz, Processamento computacional da língua portuguesa, Transdutores Ultra-sônicos e Processamento de Imagens. Luis Antonio Salim Lessa Possui graduação em Engenharia Elétrica, mestrado em Sistemas de Energia pela Universidade Federal do Pará e atualmente realiza doutorado no Programa de Pós-graduação em Engenharia Elétrica da Universidade Federal do Pará na área de descargas atmosféricas. Tem experiência em Planejamento Energético, Descargas Atmosféricas e Geoprocessamento. Laure Madeleine Dentel Possui graduação em Engenharia Mecânica, mestrado em energias renováveis pela universidade de Zaragoza (2007) e atualmente realiza doutorado no Programa de Pós-graduação em Engenharia Elétrica da Universidade Federal do Pará na área de descargas atmosféricas. Tem experiência em Acústica, Engenharia Térmica e Energias Renováveis. Diego Guimarães dos Santos é Técnico em Eletrotécnica (2010) e Licenciado Pleno em Física (2011), pelo Instituto Federal de Educação Ciência e Tecnologia do Pará. Atualmente é graduando em Engenharia Elétrica pela Universidade Federal do Pará, e desenvolve atividades de iniciação científica no SIPAM. José Ricardo Santos de Souza Possui Bacharelado em Física pela Universidade de São Paulo (1966), mestrado em Astro Geophysics University of Colorado (1973), mestrado em Geomagnetismo pelo Instituto Nacional de Pesquisas Espaciais (1969) e doutorado em Meteorologia University of Colorado (1979). Atualmente é Professor Associado 2 da Universidade Federal do Pará. Tem atuado principalmente nos seguintes temas: Amazônia, temperatura e umidade em solos, geotermia, microclima, eletricidade atmosférica e raios.