XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” Redes Neurais aplicadas à previsão de preços da soja no mercado futuro Celma de Oliveira Ribeiro Departamento de Engenharia de Produção – Escola Politécnica da USP Av. Prof. Almeida Prado, Trav. 2, Nº128 05508-900 – Cidade Universitária – São Paulo – SP - Brasil [email protected] Anna Andréa Kajdacsy Balla Sosnoski Departamento de Engenharia de Produção – Escola Politécnica da USP Av. Prof. Almeida Prado, Trav. 2, Nº128 05508-900 – Cidade Universitária – São Paulo – SP – Brasil [email protected] Carlos A. Widonsck Bolsa de Mercadorias & Futuros Rua Maestro Torquato Amore, 332 apto 43 - bloco 3 [email protected] Administração Rural e Gestão do Agronegócio Apresentação com presidente da sessão e sem a presença de debatedor 1 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” Redes Neurais aplicadas à previsão de preços da soja no mercado futuro Resumo Este artigo analisa o comportamento dos preços futuros da soja em grão através de um modelo de redes neurais. Além de empregar informações contidas nas séries históricas de preços, como é usual nos modelos de previsão tradicionais, foram utilizadas informações sobre o mercado mundial desta commodity, obtendo-se resultados bastante expressivos. São apresentados alguns resultados computacionais que indicam que informações sobre produção e consumo mundiais são relevantes para a formação de preços dos mercados futuros de soja. Os resultados obtidos indicam que as redes neurais podem ser uma ferramenta bastante eficaz para previsão de preços. Palavras chave: Redes neurais, modelos de previsão, preços de soja, mercado futuro. 2 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” Redes Neurais aplicadas à previsão de preços da soja no mercado futuro 1.Introdução A agroindústria é um dos mercados mais promissores no Brasil, que além de abastecer o mercado interno, representa parcela importante nas exportações brasileiras, movimentando o país economicamente. Estima-se que sua participação no Produto Interno Bruto (PIB) seja de 33%. Atualmente, sua participação nas vendas externas está em torno de 40%, não só pela diversificação da pauta de exportações, mas também pela tendência à queda dos preços das commodities agrícolas nos últimos 20 anos. O Brasil ocupa a posição de segundo produtor mundial de soja, tendo como principal consumidor o mercado chinês. A soja brasileira é produzida de Norte a Sul do País, sendo o Mato Grosso, Mato Grosso do Sul, Paraná e Rio Grande do Sul, respectivamente, os principais estados produtores. Até a década de 80, a produção brasileira concentrava-se nos estados do Sul do Brasil. A partir da década de 90, o CentroOeste tornou-se a principal região produtora, sendo atualmente responsável por cerca de 40% do total da produção brasileira. O aumento da produção e da capacidade competitiva da soja brasileira estão associados aos avanços científicos e à disponibilização de tecnologias ao setor produtivo. Há perspectivas de crescimento da produtividade devido à liberação dos produtos transgênicos e ao desenvolvimento de novos métodos mais eficazes de produção. A demanda mundial de soja tende a crescer com a abertura comercial, queda de barreiras tarifárias, com o conhecimento dos valores nutricionais desta oleaginosa e com a possibilidade de sua utilização em biocombustíveis. Estas perspectivas positivas exigem um maior controle sobre a previsão dos preços para garantir a confiabilidade e competitividade brasileira no mercado mundial. Apesar de bastante rentável, o mercado agrícola pode oferecer alguns riscos devido à variabilidade de seus preços. A sazonalidade do produto, dependência de condições climáticas, ação de especuladores, variações cambiais, de inflação e de demanda, são fatores que aumentam a incerteza. Para minimizar riscos de preço e assegurá-los, agentes do mercado , bem como produtores e consumidores utilizam estratégias de hedging através do mercado futuro. Este é um mercado maduro e bastante líquido, especialmente no caso da soja, e que negocia preços em datas futuras. Neste contexto, é essencial estimar adequadamente estes valores tanto do ponto de vista do produtor agrícola como sob a ótica do investidor do mercado de capitais. O problema de apreçamento de ativos financeiros é abordado com grande freqüência na literatura. Do ponto de vista cientifico, há um grande potencial de desenvolvimento de modelos matemáticos, o que por si só, justifica o interesse pelo problema. Mas, além disso, sua relevância também reside no interesse nacional em estabelecer preços justos que solidifiquem a posição brasileira no mercado internacional. Há hoje uma grande diversidade de modelos estatísticos, bastante sofisticados para determinação de preços. No entanto sua aplicação em mercados agrícolas muitas vezes não é possível devido a peculiaridades destes ativos como as condições e regras impostas pelo mercado mundial, protecionismo econômico, barreiras tarifárias e políticas particulares de cada país. 3 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” O principal objetivo deste estudo é construir modelos que antecipem o comportamento futuro do preço da soja, de modo a fornecer aos investidores (ou hedgers) um prognóstico que os auxilie na tomada de decisões. Pretende-se também averiguar se informações sobre oferta e demanda interferem de forma significativa na formação dos destes preços. Em função da flexibilidade e habilidade de ajuste a diversas aplicações, optou-se pelo modelo de redes neurais para a previsão dos preços futuros da soja. A estrutura do artigo é a seguinte. Na seção 2 apresenta-se um breve histórico do mercado de soja. Posteriormente, na seção 3, são apresentados modelos de previsões tradicionais cujos resultados são utilizados como dados entrada para as redes neurais. A estrutura das redes é detalhada na seção 4. Na seção 5 estabelece-se o processo de seleção de variáveis e a implementação do modelo, seguindo-se os resultados obtidos e as conclusões, seções 6 e 7 respectivamente. 2. O mercado de soja A soja aparece com importância no cenário mundial a partir do século XIX na China. No final do século o país asiático era produtor de pouco mais de 2 milhões de toneladas, chegando a exportar o produto. No entanto, será a partir do final da Primeira Guerra Mundial, em 1919, que a oleaginosa passa a ter um destaque efetivamente internacional. Um dos primeiros países a cultivá-la de forma comercial, além de China e EUA, passa a ser o Brasil a partir dos anos de 1960. A história da soja no Brasil, iniciada no Rio Grande do Sul está ligada à modernização da agricultura gaúcha. A partir da Revolução Verde proposta ao mundo, o governo brasileiro nos anos 50 passou a apoiar uma nova agricultura, a comercial, investindo em novas tecnologias de produção. Após sua consolidação no estado gaúcho, a soja espalhou-se para outras regiões do país, acompanhando a migração de produtores gaúchos em busca de novas terras cultiváveis. Em pouco tempo, esta cultura ocupou o oeste catarinense e especialmente o Paraná, chegando logo em seguida ao Centro-Oeste e, hoje, atingindo a Bahia, Maranhão, Piauí, Rondônia e outras regiões ao norte do país. Este avanço significativo, que levou o Brasil a se tornar o segundo maior produtor individual de soja do mundo nas últimas décadas, foi possível graças a três motivos: o mercado internacional e nacional da oleaginosa em constante crescimento, sobretudo no início, o forte apoio estatal, com crédito subsidiado para investimentos nesta cultura; e o espírito empreendedor dos produtores rurais ocupantes do sul do Brasil inicialmente. A produção brasileira de soja adentra o século XXI com aumentos importantes de produtividade, especialmente a partir do excepcional período de 2002/03. Assim, o futuro da soja no Brasil continua sendo promissor, especialmente diante de novos mercados que se abrem, como o chinês, além do forte potencial consumidor de nosso mercado interno. A primeira metade da nova década está chegando ao fim com a América do Sul (Brasil, Argentina, Paraguai e Bolívia) produzindo, pelo terceiro ano consecutivo, mais do que os EUA, consolidando-se como a principal região produtora da oleaginosa no mundo. A soja é negociada nos mercados futuros, que buscam aproximar o mercado de negociação por um modelo de competição perfeita, permitindo que os preços ajustem-se conforme as leis de mercado, ou seja, de acordo com as pressões de oferta e demanda, que são orientadas pelas informações disponíveis aos participantes do mercado. As operações que nele ocorrem são divulgadas publicamente a todos os seus participantes, caracterizando a informação livre. Outra característica do mercado futuro é a 4 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” homogeneidade dos produtos nele negociados. Através de contratos padronizados pela bolsa, estabelecem-se limites quanto à especificação do produto, sua qualidade, locais e meses de entrega, embalagem, formalidades na entrega e pagamentos. Os participantes deste mercado têm ampla liberdade de mobilidade de seus recursos, porém devem dispor de capital suficiente para lidar com os ajustes diários, que consistem em uma compensação financeira diária decorrente da oscilação de preços diária. Os hedgers (sojicultores, esmagadoras, tradings, etc), investidores do mercado, necessitam de dados confiáveis a respeito do comportamento futuro de seus produtos para fixarem seus preços de venda/compra, reduzindo assim seu risco de perda e garantindo uma rentabilidade mínima. Esta necessidade somada à reduzida literatura a respeito de modelos de apreçamento para o mercado da soja justifica a presente pesquisa. 3. Modelos tradicionais de previsão de séries temporais Uma abordagem comum na literatura consiste no estudo da variabilidade de preços ou taxas de retorno, ou seja, da volatilidade. Um estudo sobre o comportamento da volatilidade de preços da soja em mercados futuros é apresentado por Kam, Hung e Wai (2004). Com base em dados do mercado chinês, os autores utilizam um modelo para a previsão da volatilidade da soja e examinam diversas hipóteses relacionadas à volatilidade diária, observando como os contratos futuros reagem com variações do volume de negociação, taxas de juros e participação de países como China e EUA nas negociações. Diversos autores estudam o comportamento da volatilidade nos mercados futuros. A assimetria da volatilidade futura, foi estudada French et al. (1987); Campbell e Hentschel (1992) e Bekaert e Wu (2000). O impacto do volume na volatilidade é apresentado por Bessembinder e Seguin (1993). Garcia et al. (1986) estudam modelos através de relações de realimentação (feedback) entre volatilidade e volume. Najand e Yung (1991) e Foster (1995), empregam um modelo heterocedástico auto regressivo (GARCH) para estimar a volatilidade. Embora haja diversos estudos relacionados à volatilidade do retorno do preço da soja, poucos tratam de modelos que estimam preços futuros, embora a informação sobre o preço seja de muito interesse para produtores, além de outros investidores. O objetivo deste estudo é construir modelos de previsão capazes de fornecer dados confiáveis a respeito do preço da soja em grão no mercado futuro. Dois modelos de previsão são comumente utilizados para a previsão de preços: os modelos de médias móveis e de alisamento exponencial. Apesar de serem os modelos de simples aplicação, são os que apresentam os melhores resultados para previsões em curto prazo (Morettin 2004). O modelo de médias móveis consiste em prever o valor para o próximo instante com base nos dados históricos, a dimensão da janela de observação do passado (o lag da média móvel) é o parâmetro deste modelo. O valor previsto é obtido através da expressão Z + Z t −1 + ... + Z t − r +1 (3.1) Mt = t r onde r é o intervalo de observações que irá se utilizar e Zt é o valor da observação realizada no instante t. Já o modelo de alisamento exponencial realiza uma média ponderada entre os dados históricos e as previsões realizadas anteriormente. O parâmetro neste caso, α, determina qual o peso dado para as observações passadas no cálculo da média ponderada. Este parâmetro varia entre 0 e 1, sendo o modelo com parâmetro 1 o mais simples de todos por considerar que o valor do futuro será exatamente igual à última observação. As previsões são determinadas a partir da expressão: 5 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” Z t* = α ⋅ Z t + (1 − α ) ⋅ Z t*−1 (3.2) onde Z é o valor da previsão para o período t, Z é o valor da observação obtida na data t e α é a constante de alisamento. Há uma grande variedade de modelos de previsão na literatura. Embora outros modelos também tenham sido estudados, seus erros de previsão sempre foram superiores aos modelos de média móvel e alisamento. Testaram-se modelos mais sofisticados como ARMA e ARIMA, sem que houvesse melhoria significativa na estimação, razão pela qual optou-se pelos dois modelos mais simples. * 4. Modelos de redes neurais Redes neurais são modelos que relacionam dados de entrada com suas respectivas saídas (Azoff 1991). Através da observação de exemplos e seu constante treinamento, obtém-se uma matriz de pesos que representa as ligações entre os neurônios de entrada e de saída, imitando o que ocorre no cérebro humano em suas interconexões entre células nervosas. A sua maior vantagem é a adaptabilidade que permite seu refinamento e minimização dos erros de previsão. Escondida Entrada X1 f(a) X2 Xn [.. .][.. .] a = n ∑ i =1 W i ⋅ xi [.. .] Saída [.. .] [.. [.. .] .] bias [.. .] Nó de entrada Neurônios [...] Figura 1 – Neurônio artificial Pesos Figura 2 – Arquitetura da rede Há uma primeira camada que recebe os dados de entrada e os valores de saída desta estão conectados aos neurônios da próxima camada através das linhas de interconexão. Cada linha apresenta um peso respectivo, os quais são parâmetros ajustáveis que atenuam o valor de entrada ao longo da rede. No início os valores dos pesos atribuídos às linhas são aleatórios, com média em torno de zero. Durante a fase de treinamento eles são ajustados gradativamente, de forma a reduzir os erros do processo de previsão. Este processo de ajuste é realizado através de algoritmos de otimização. A próxima camada (escondida) representa os neurônios artificiais, que são os nós de processamento. Estes recebem os valores da camada de entrada, os quais são multiplicados por pesos. Os resultados são somados gerando um valor a que passa por um processo de atenuação, através de uma função de transferência, que fornece o valor de saída f(a). Normalmente são utilizadas funções de ativação não lineares nas redes neurais. Estas funções representam são em geral exponenciais ou trigonométricas. Também há a presença na camada de entrada, do nó bias, que alimenta todos os demais nós e que tem valor fixo de 1. Ele representa um nó de ajuste entre níveis que leva a uma implementação mais eficiente do algoritmo para determinação dos pesos. Ao final de um ciclo, os dados de entrada foram propagados para os neurônios de saída, que é o estado final da rede. Os valores de saída fornecidos pela rede são agora comparados com os seus alvos (dados observados) e calculam-se seus erros (diferença entre previsão do modelo e dado observado). Estes erros são re-enviados para as camadas 6 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” iniciais, no caminho reverso, para as devidas correções nos pesos. Um grupo de apresentações dos vetores de treinamento da rede constitui um epoch. O processo de refinamento dos resultados através do estudo dos erros e envio destes para o início do ciclo é conhecido como feedforward backpropagation. O algoritmo de utiliza uma técnica de otimização através do gradiente descendente para o ajuste dos pesos entre conexões. Dessa forma, segue em direção a um ponto de mínimo na curva da superfície de erros. Este algoritmo é o tradicionalmente utilizado, porém neste estudo empregou-se um algoritmo mais eficiente, implementado no aplicativo Matlab. 5. Seleção de variáveis e implementação do modelo A definição dos fatores que poderiam afetar os preços foi realizada ex-ante, optando-se por analisar o comportamento das seguintes variáveis: preços de contratos futuros da soja, cotações do dólar, taxa de retorno dos preços da soja e do dólar, oferta e demanda da soja, número de dias para o vencimento do contrato futuro, evolução da área plantada, evolução das importações brasileiras, exportação mundial e consumo. A fim de melhorar a qualidade do modelo, ao invés de empregar os preços da soja diretamente, foram considerados como entrada da rede a saída de dois modelos de previsão tradicionais; as Médias Móveis Simples (MMS) e o Alisamento Exponencial Simples (AES). Para o modelo de Médias Móveis realizaram-se diversos testes variando o valor do lag da média móvel, o parâmetro r, a fim de determinar o modelo que obtivesse um erro quadrático médio reduzido e que conseguisse determinar a tendência da série temporal utilizada. Selecionou-se r = 20 dias, valor que suaviza a curva de evolução dos preços mantendo erros de previsão razoáveis, sendo também este o valor utilizado pelo mercado financeiro. Para o modelo de suavização exponencial, a partir da realização de testes, decidiu-se pelo valor α = 0.3, que suaviza a série e mantém erros de previsão reduzidos. Estes modelos foram estudados a fim de utilizá-los como entrada em modelos das redes neurais, que serão tratadas adiante. O objetivo até o momento não era selecionar o modelo que fornecesse o menor erro quadrático médio entre previsão e valor real, mas sim aquele que conseguisse determinar a tendência da série temporal, suavizando os dados para que estes pudessem ser inseridos nas redes neurais. Duas abordagens podem ser utilizadas para esta previsão. Uma delas estima os valores dos preços diretamente, outra corrige os resíduos resultantes dos modelos tradicionais de previsão, somando-os aos valores obtidos previamente. A primeira abordagem, através de testes preliminares, mostrou-se mais eficaz, fornecendo erros com uma ordem de grandeza bastante inferior ao da segunda. Enquanto o erro quadrático médio da primeira abordagem era da ordem de, no máximo, 900, o da segunda abordagem ultrapassava os 3000. As séries de dados utilizadas foram as seguintes: a) preços diários de contratos futuros da soja em grão, para o 1º vencimento, da CBOT (Chicago Board of Trade). b) preços diários de mercado futuro de câmbio da Bolsa de Mercadorias e de Futuros (BM&F). c) Prazo para vencimento do contrato futuro da soja. d) Volumes de importações/exportações, consumo, oferta e demanda. Como não são disponíveis em valores diários, admitem-se valores projetados, mantendo-os constantes no período em que foram mensurados (BM&F). Optou-se pelo uso de dados diários, pois estes fornecem maiores informações a respeito da evolução da série. E também, é este horizonte de tempo desejado pelos 7 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” investidores para as previsões. Os contratos futuros de soja possuem vencimentos nos meses de janeiro, março, maio, julho, agosto, setembro e novembro. A série de dados da soja obtida refere-se ao período de janeiro de 2000 até novembro de 2004, constituindo 1184 dados no total, o que determinou a dimensão das demais séries utilizadas. S o ja C B O T - 1º v e nc im e nt o 1100 1050 1000 950 900 850 800 750 700 650 600 550 500 450 400 Gráfico 1 – Evolução do preço da soja para o 1º vencimento no mercado futuro. Estatistica Área plantada Consumo mundial Exportação brasileira Exportação mundial Importação brasileira Produção brasileira Dolar AES. a= 0.3 AES. a= 0.938 MM Taxa dólar Taxa preço Vencimento Tabela 1 – Dados estatísticos das séries utilizadas Unidade Média Desvio Variância padrão 1000 hc 17.405,51 2.850,50 8.125.364,60 1000 ton 185.668,4 13.230,89 1,75E+08 1000 ton 19.256,85 5.354,54 28.671113 Curtose Máximo Mínimo -1,46 -0,89 -1,33 21.069,4 201.358 26.700 13.507,8 159.850 11.161 1000 ton 58.673,98 7.017,53 49.245.682 -1,15 67.315 45.550 1000 ton 1.153,71 167,63 28.100,86 -1,47 1.321 900 1000 ton U$ cU$/bushel cU$/bushel cU$/bushel dias 48.000,11 2,63 574,82 574,82 574,65 0,0004 1,97E-05 19,13 10.023,93 0,56 145,96 146,60 144,92 0,01 0,02 11,67 1E+08 0,31 21.304,33 21.492,79 21.003,25 0,0001 0,0003 136,26 -1,46 -0,81 1,67 1,73 1,54 9,73 21,11 -1,06 61.000 3,95 1.040,07 1.053,75 1.014,69 0,05 0,08 45 32.344,6 1,72 424,95 418,40 430,97 -0,09 -0,20 1 A previsão através de redes neurais requer várias etapas para a seleção dos parâmetros, entradas, funções de ativação, etc. Primeiramente estuda-se como os dados se comportam com as diferentes funções de transferência disponíveis. Estes testes são preliminares, fornecendo através dos erros quadráticos médios obtidos, a função que os minimize. Essa função será utilizada nos testes posteriores, assumindo-se que é a que melhor se adapta aos dados fornecidos, porém para uma confirmação, novos testes serão realizados após todos os parâmetros terem sido determinados, para a verificação da sua validade. Após a definição da função de transferência, inicia-se o processo de seleção do método que será utilizado para dividir os dados entre treinamento e validação das redes 8 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” neurais. Utiliza-se o método de cross validation (Bradley 1983) para a seleção de dados para o treinamento. O método consiste, no caso mais simples, em separar os dados em k grupos, realizar o treinamento com (k-1) grupos e a validação apenas com um dos grupos. Dessa forma estima-se o erro quadrático médio obtido para apenas um grupo k. Num caso mais complexo, o número de k iguala-se ao número de dados, realiza-se o treinamento com todos os dados menos um para a previsão. Isso quando realizado com todos os dados permite o cálculo do erro quadrático médio, mais preciso, porém num processo que exige maior disponibilidade de tempo. Neste artigo foi empregado um método intermediário. Selecionou-se um intervalo com número de dados fixo, no caso 790 dados, um terço do total, com os quais realizou-se o treinamento para uma nova previsão. Conforme os dados evoluem, descarta-se o mais antigo, inserindo-se o do período anterior, dessa forma mantém-se fixo o número de dados fornecidos ao treinamento. Seleciona-se as melhores arquiteturas através do Erro ∑ Quadrático Médio: n ( x i = 1 − i x i ) 2 , onde xi é o valor observado; xi é o valor n previsto e n o número total de observações. Para a seleção das variáveis de entrada, uma série de dados é fixada. A seguir testam-se diversas combinações desta variável fixa com as demais. Neste caso, todos os testes são realizados com duas variáveis de entrada. Após realizarem-se os testes, seleciona-se a variável que contribuiu para uma redução do erro quadrático médio. Repetese o procedimento, agora com duas variáveis fixas. Analisam-se os resultados e selecionam-se as variáveis a serem utilizadas com entrada para o modelo de redes neurais. Após a seleção das variáveis de entrada resta a definição da arquitetura ideal. Com os dados de entrada fixos, varia-se o número de camadas intermediárias e de neurônios. Através do comportamento do erro, opta-se pelo modelo com estimativas mais precisas. 6. Resultados Os primeiros testes realizados tinham por objetivo identificar a função de transferência que melhor se adaptava ao problema em questão. As opções eram as funções: logarítmica, sigmoidal, tangente hiperbólica sigmoidal, e linear pura. Para isso fixou-se uma entrada, verificando como o erro quadrático médio da previsão variava. As entradas selecionadas foram: resíduos do modelo de média móvel com parâmetro r = 20 (eq. 3.1), série de previsões do Alisamento Exponencial com parâmetro a = 0,3 (eq.3.2), taxa de retorno dos preços da soja e cotação do dólar. Estes modelos foram estudados a fim de utilizá-los como entrada em modelos das redes neurais, que serão tratadas adiante. A análise prévia dos erros obtidos com esses testes propõe que a função de ativação logarítmica sigmoidal fornece estimativas melhores na previsão de preços. O modelo com menor Erro Quadrático Médio (EQM) possui duas camadas intermediárias, uma com 4 e outra com 2 neurônios, e EQM = 839,41. Portanto, para os testes posteriores assumiu-se como função de ativação a logarítmica sigmoidal. Para determinação das variáveis de entrada no modelo de redes neurais, selecionaram-se como as principais, as séries de previsões obtidas através dos modelos tradicionais de previsão, alisamento exponencial e média móvel. Para a seleção de qual das duas forneceria melhores resultados nas estimativas, fixou-se a média móvel, realizando vários testes onde se combinava a ela uma outra variável. O mesmo foi realizado com o alisamento exponencial. Em todos os testes o alisamento exponencial obteve melhores resultados, por isso optou-se por considerá-lo uma entrada importante para o modelo. A 9 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” média do erro quadrático médio com o alisamento exponencial era, EQM = 804.74, e da média móvel, EQM = 935.27. Com uma entrada fixa - o alisamento exponencial - realizaram-se novos testes, introduzindo um segundo dado de entrada. Para o segundo dado de entrada, utilizaram-se todas as séries descritas na seção 5. Os resultados são apresentados a seguir: Tabela 2 – Erro Quadrático Médio das previsões com 2 variáveis de entrada Alisamento exponencial com Alisamento exponencial com a = 0,3 a = 0,938 Segunda Variável 5_2 4_2 3_2 3_2 5_2 Área plantada 796,80 820,75 826,55 823,45 792,10 Consumo mundial 790,95 787,75 815,25 795,35 806,25 Dólar 799,95 817,05 810,70 843,10 820,20 Exportação brasileira 814,3 825,70 820,75 795,55 812,20 Exportação mundial 799,65 809,30 790,45 791,20 789,45 Importação brasileira 805,25 796,35 814,80 796,45 822,80 MM 20 832,85 819,35 853,90 877,90 874,95 Produção brasileira 831,70 816,00 799,40 791,25 794,75 Resíduo alisamento exp. 795,40 799,25 799,40 801,40 802,80 Resíduo MM 792,45 792,55 792,55 792,45 792,20 Taxa dólar 792,60 793,00 792,45 792,50 792,55 Taxa preço 792,15 792,95 794,80 792,45 792,70 Vencimento 791,95 792,65 792,75 793,10 791,95 onde x_y representa a arquitetura com x neurônios na primeira camada intermediaria e y neurônios na segunda camada intermediaria. Realizados estes testes verificou-se que os resultados dos modelos com o vencimento como segunda entrada apresentaram, em todos os tipos de arquitetura, um resultado razoável, sem grandes variações e com erros reduzidos. O vencimento é uma variável que aproxima o preço futuro do à vista, e por essa natureza é constantemente utilizada pelos investidores para previsão de preços. Portanto considerou-se esta uma variável importante para o modelo. Novos testes foram realizados, agora com três entradas, Alisamento exponencial e vencimento, variando apenas o terceiro dado. Os erros obtidos estão na tabela a seguir: Tabela 3 – Erro Quadrático Médio para previsões com 3 variáveis de entrada Alisamento exponencial com alfa = 0,3 Terceira Variável 5_2 4_2 3_2 Área plantada 782,30 793,50 787,15 Consumo mundial 786,65 795,15 771,95 Dólar 795,50 792,55 812,40 Exportação brasileira 791,05 813,35 813,40 Exportação mundial 816,85 789,25 781,15 Importação brasileira 796,10 802,75 807,45 MM 20 806,30 795,95 793,95 Produção brasileira 796,90 792,10 798,75 Resíduo ewma 794,75 796,50 794,95 Resíduo MM 791,75 791,95 792,40 Taxa dólar 916,30 871,75 867,85 Taxa preço 802,50 793,90 791,45 Após esta nova série de testes, observa-se que informações como o consumo mundial e exportação mundial favorecem a previsão, reduzindo os erros. Os resultados 10 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” obtidos com estes testes são consistentes, pois como a soja é uma commodity negociada em dólar no mercado internacional, seu preço é fortemente influenciado por valores de demanda e oferta mundiais, sendo os valores do mercado brasileiro menos significativos para a previsão. O mesmo ocorre com a série de cotações do dólar, pois esta informação já esta inserida no preço de negociação, não fornecendo novas informações a respeito da evolução do preço da soja. Decidiu-se não acrescentar mais entradas a rede, uma vez que apesar de fornecer maiores informações a respeito do preço da soja, irá aumentar o número de parâmetros a serem estimados, o que pode aumentar os erros de previsão. Após estes testes define-se a entrada que será utilizada para o modelo de redes neurais, restando agora definir qual a arquitetura que melhor se adequará ao problema. A literatura (Liao 2005) afirma que as melhores arquiteturas são aquelas com um número reduzido de neurônios e de camadas intermediárias, portanto decidiu-se testar arquiteturas que variassem entre uma até três camadas escondidas, com um número pequeno de neurônios. Outro fator a ser considerado é a configuração inicial da rede em relação aos parâmetros fornecidos a cada ligação entre os neurônios. A determinação dos parâmetros ótimos de uma rede neural é realizada através de métodos de gradiente descendente, que visam reduzir o erro quadrático médio. Este tipo de algoritmo tem como inconveniente a possibilidade de parar em mínimos locais ao invés de mínimos globais. Conseqüentemente, para evitar que isto ocorresse o algoritmo foi inicializado com diferentes valores de parâmetros. Por os erros não terem variado significativamente, pode-se admitir que a superfície seja regular. Os erros obtidos para as diversas arquiteturas são os seguintes: Tabela 4 – Evolução do Erro Quadrático Médio variando-se arquitetura Arquitetura Erro Quadrático Médio 3 732,53 4 738,01 5 738,20 3_2 739,40 4_2 739,28 5_2 738,57 3_3 738,21 4_3 744,91 5_3 741,18 4_3_2 739,00 4_2_2 738,88 4_3_3 739,87 Os resultados acima comprovam a afirmação da literatura, de que redes menores fornecem melhores previsões. A arquitetura que melhor se adaptou aos dados de entrada foi a que contém uma camada intermediária com três neurônios. Para confirmar este resultado, realizou-se um novo teste, variando-se as funções de transferência novamente. Este teste tem a finalidade de comprovar a correta seleção realizada no inicio do procedimento de previsão através de redes neurais. Os resultados para as diversas funções de transferência, para a melhor rede obtida acima foram os seguintes: 11 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” Tabela 5 – Erros Quadráticos Médios para as diferentes funções de transferência Função de transferência Log. Sigmoidal Tangente Hiperb. Linear pura Erro Quadrático Médio 732,53 770,72 888,13 Os novos testes confirmam a superioridade da função de transferência logarítmica sigmoidal, havendo diferenças significativas entre seus erros. 7. Conclusões Os testes realizados indicam que o modelo de previsão através de redes neurais fornece resultados confiáveis a respeito do comportamento futuro do preço da soja. O modelo com quatro entradas, sendo elas: previsões de preços através do modelo de alisamento exponencial, exportação mundial, consumo mundial e prazo para o vencimento, consegue prever, com erros de estimativa reduzidos, o preço no mercado futuro da soja em grão. Pode-se comprovar o que a literatura afirma a respeito das arquiteturas ideais para as redes neurais, conseguindo melhores resultados com redes pequenas, com menor número de neurônios. As variáveis de entrada selecionadas indicam ainda que os preços futuros são diretamente relacionados à produção e demanda mundiais, conceitos empregados informalmente no mercado de capitais. O processo de seleção de variáveis utilizado permitiu identificar o grupo de variáveis considerado mais significativo e que fornece maiores informações a respeito do processo de formação dos preços futuros da commodity. O modelo estudado mostrou-se adequado ao problema proposto, oferecendo ao mercado uma nova visão sobre modelos de previsão. Com foco em preços e não na volatilidade, um modelo não linear como a rede neural pode prever o comportamento do mercado futuro de maneira bastante satisfatória. 8. Referências Bibliográficas -AZOFF, E.M. – Neural network time series forecasting of financial markets, Chichestes, John Wiley, 1994 - BEKAERT, G., WU, G., 2000. Asymmetric volatility and risk in equity markets. Review of Financial Studies 13 (1),1–42. -BERA, A.K. and JARQUE, C. M. – An efficient large sample test for normality of observations and regression residuals, Working papers in Econometrics, 4º ed. , Australian National University, Camberra, 1981 -BESSEMBINDER H., S, P.J., 1993. Price volatility, trading volume, and market depth: evidence from futures markets. Journal of Financial and Quantitative Analysis 28 (1), 21–39. 12 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” -BM&F, Estatísticas dos mercados físico e futuro, 2004. -BRADLEY, E., Estimating the error rate of a prediction rule: Improvement on crossvalidation. Journal of the American Statistical Association, 78:316-331, 1983. -BROCKWELL, P.J., DAVIS, R.A.- Time Series: Theory and Methods, 2ºed. , Nova York, Springer, 1991 - CAMPBELL, J.Y., HENTSCEL, L., 1992. No news is good news: an asymmetric model of changing volatility in stock returns. Journal of Financial Economics 31, 281– 318. -FOSTER, A.J., 1995. Volume-volatility relationships for crude oil futures markets. Journal of Futures Markets 15 (8), 929–951. - FRENCH, K.R., Schwert, G.W., Stambaugh, R.F., 1987. Expected stock returns and volatility. Journal of Financial Economics 19, 3–29 -KALMAN, R.E. - A new approach to linear filtering and prediction problems, Trans. ASME J. Basic Eng., 82º ed. ,1960 -KAM C. C., , HUNG-G. F., WAI K. L., Daily volatility behavior in Chinese futures markets, Int. Fin. Markets, Inst. and Money 14 (2004) 491–505 -KENDALL, M.G. - Time Series, Londres, Griffin, 1973 -LIAO, K.P.; Fildes, R., The accuracy of a procedural approach to specifying feedfoward neural networks for forecasting. Computer & Operations Research 32 (2005) 2151-2169. -MORETTIN, P.A.; TOLOI, C.M.C. - Modelos para Previsão de Séries Temporais. Vol. 1, 13º edição, Rio de Janeiro, Instituto de Matemática Pura e Aplicada, 1981 -MORETTIN, P.A.; TOLOI, C.M.C. - Análises de Séries Temporais. 1º edição, São Paulo, Edgar Blücher, 2004. -NAJAND, M., Yung, K., 1991. A GARCH examination of the relationship between volume and price variability in futures markets. Journal of Futures Markets 11 (5), 613–621. - PLISKA, S.R., Shalen, C.T., 1991. The effects of regulations on trading activities and return volatility in futures markets. Journal of Futures Markets 11 (2), 135–152. -RIBEIRO, C.O.- Um modelo de previsão hierárquico com indicadores técnicos. Tese (Doutorado) - Escola Politécnica, USP, Departamento de Engenharia de Produção. 1997. 13 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural XLIII CONGRESSO DA SOBER “Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial” -WHEELWRIGHT, S.C. ; MAKRIDAKIS, S. Forecasting Methods for Management, 4º edição, Nova York, John Wiley & Sons Inc., 1985 14 Ribeirão Preto, 24 a 27 de Julho de 2005 Sociedade Brasileira de Economia e Sociologia Rural