Alm do Primeiro Lugar em Exportaes de Carne Bovina

Propaganda
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
Redes Neurais aplicadas à previsão de preços da soja no
mercado futuro
Celma de Oliveira Ribeiro
Departamento de Engenharia de Produção – Escola Politécnica da USP
Av. Prof. Almeida Prado, Trav. 2, Nº128
05508-900 – Cidade Universitária – São Paulo – SP - Brasil
[email protected]
Anna Andréa Kajdacsy Balla Sosnoski
Departamento de Engenharia de Produção – Escola Politécnica da USP
Av. Prof. Almeida Prado, Trav. 2, Nº128
05508-900 – Cidade Universitária – São Paulo – SP – Brasil
[email protected]
Carlos A. Widonsck
Bolsa de Mercadorias & Futuros
Rua Maestro Torquato Amore, 332 apto 43 - bloco 3
[email protected]
Administração Rural e Gestão do Agronegócio
Apresentação com presidente da sessão e sem a presença de debatedor
1
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
Redes Neurais aplicadas à previsão de preços da soja no
mercado futuro
Resumo
Este artigo analisa o comportamento dos preços futuros da soja em grão através de
um modelo de redes neurais. Além de empregar informações contidas nas séries históricas
de preços, como é usual nos modelos de previsão tradicionais, foram utilizadas
informações sobre o mercado mundial desta commodity, obtendo-se resultados bastante
expressivos. São apresentados alguns resultados computacionais que indicam que
informações sobre produção e consumo mundiais são relevantes para a formação de preços
dos mercados futuros de soja. Os resultados obtidos indicam que as redes neurais podem
ser uma ferramenta bastante eficaz para previsão de preços.
Palavras chave:
Redes neurais, modelos de previsão, preços de soja, mercado futuro.
2
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
Redes Neurais aplicadas à previsão de preços da soja no
mercado futuro
1.Introdução
A agroindústria é um dos mercados mais promissores no Brasil, que além de
abastecer o mercado interno, representa parcela importante nas exportações brasileiras,
movimentando o país economicamente. Estima-se que sua participação no Produto Interno
Bruto (PIB) seja de 33%. Atualmente, sua participação nas vendas externas está em torno
de 40%, não só pela diversificação da pauta de exportações, mas também pela tendência à
queda dos preços das commodities agrícolas nos últimos 20 anos.
O Brasil ocupa a posição de segundo produtor mundial de soja, tendo como
principal consumidor o mercado chinês. A soja brasileira é produzida de Norte a Sul do
País, sendo o Mato Grosso, Mato Grosso do Sul, Paraná e Rio Grande do Sul,
respectivamente, os principais estados produtores. Até a década de 80, a produção
brasileira concentrava-se nos estados do Sul do Brasil. A partir da década de 90, o CentroOeste tornou-se a principal região produtora, sendo atualmente responsável por cerca de
40% do total da produção brasileira. O aumento da produção e da capacidade competitiva
da soja brasileira estão associados aos avanços científicos e à disponibilização de
tecnologias ao setor produtivo.
Há perspectivas de crescimento da produtividade devido à liberação dos produtos
transgênicos e ao desenvolvimento de novos métodos mais eficazes de produção. A
demanda mundial de soja tende a crescer com a abertura comercial, queda de barreiras
tarifárias, com o conhecimento dos valores nutricionais desta oleaginosa e com a
possibilidade de sua utilização em biocombustíveis.
Estas perspectivas positivas exigem um maior controle sobre a previsão dos preços
para garantir a confiabilidade e competitividade brasileira no mercado mundial. Apesar de
bastante rentável, o mercado agrícola pode oferecer alguns riscos devido à variabilidade de
seus preços. A sazonalidade do produto, dependência de condições climáticas, ação de
especuladores, variações cambiais, de inflação e de demanda, são fatores que aumentam a
incerteza.
Para minimizar riscos de preço e assegurá-los, agentes do mercado , bem como
produtores e consumidores utilizam estratégias de hedging através do mercado futuro. Este
é um mercado maduro e bastante líquido, especialmente no caso da soja, e que negocia
preços em datas futuras. Neste contexto, é essencial estimar adequadamente estes valores
tanto do ponto de vista do produtor agrícola como sob a ótica do investidor do mercado de
capitais.
O problema de apreçamento de ativos financeiros é abordado com grande
freqüência na literatura. Do ponto de vista cientifico, há um grande potencial de
desenvolvimento de modelos matemáticos, o que por si só, justifica o interesse pelo
problema. Mas, além disso, sua relevância também reside no interesse nacional em
estabelecer preços justos que solidifiquem a posição brasileira no mercado internacional.
Há hoje uma grande diversidade de modelos estatísticos, bastante sofisticados para
determinação de preços. No entanto sua aplicação em mercados agrícolas muitas vezes não
é possível devido a peculiaridades destes ativos como as condições e regras impostas pelo
mercado mundial, protecionismo econômico, barreiras tarifárias e políticas particulares de
cada país.
3
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
O principal objetivo deste estudo é construir modelos que antecipem o
comportamento futuro do preço da soja, de modo a fornecer aos investidores (ou hedgers)
um prognóstico que os auxilie na tomada de decisões. Pretende-se também averiguar se
informações sobre oferta e demanda interferem de forma significativa na formação dos
destes preços. Em função da flexibilidade e habilidade de ajuste a diversas aplicações,
optou-se pelo modelo de redes neurais para a previsão dos preços futuros da soja.
A estrutura do artigo é a seguinte. Na seção 2 apresenta-se um breve histórico do
mercado de soja. Posteriormente, na seção 3, são apresentados modelos de previsões
tradicionais cujos resultados são utilizados como dados entrada para as redes neurais. A
estrutura das redes é detalhada na seção 4. Na seção 5 estabelece-se o processo de seleção
de variáveis e a implementação do modelo, seguindo-se os resultados obtidos e as
conclusões, seções 6 e 7 respectivamente.
2. O mercado de soja
A soja aparece com importância no cenário mundial a partir do século XIX na
China. No final do século o país asiático era produtor de pouco mais de 2 milhões de
toneladas, chegando a exportar o produto. No entanto, será a partir do final da Primeira
Guerra Mundial, em 1919, que a oleaginosa passa a ter um destaque efetivamente
internacional.
Um dos primeiros países a cultivá-la de forma comercial, além de China e EUA,
passa a ser o Brasil a partir dos anos de 1960. A história da soja no Brasil, iniciada no Rio
Grande do Sul está ligada à modernização da agricultura gaúcha. A partir da Revolução
Verde proposta ao mundo, o governo brasileiro nos anos 50 passou a apoiar uma nova
agricultura, a comercial, investindo em novas tecnologias de produção.
Após sua consolidação no estado gaúcho, a soja espalhou-se para outras regiões do
país, acompanhando a migração de produtores gaúchos em busca de novas terras
cultiváveis. Em pouco tempo, esta cultura ocupou o oeste catarinense e especialmente o
Paraná, chegando logo em seguida ao Centro-Oeste e, hoje, atingindo a Bahia, Maranhão,
Piauí, Rondônia e outras regiões ao norte do país. Este avanço significativo, que levou o
Brasil a se tornar o segundo maior produtor individual de soja do mundo nas últimas
décadas, foi possível graças a três motivos: o mercado internacional e nacional da
oleaginosa em constante crescimento, sobretudo no início, o forte apoio estatal, com
crédito subsidiado para investimentos nesta cultura; e o espírito empreendedor dos
produtores rurais ocupantes do sul do Brasil inicialmente.
A produção brasileira de soja adentra o século XXI com aumentos importantes de
produtividade, especialmente a partir do excepcional período de 2002/03. Assim, o futuro
da soja no Brasil continua sendo promissor, especialmente diante de novos mercados que
se abrem, como o chinês, além do forte potencial consumidor de nosso mercado interno. A
primeira metade da nova década está chegando ao fim com a América do Sul (Brasil,
Argentina, Paraguai e Bolívia) produzindo, pelo terceiro ano consecutivo, mais do que os
EUA, consolidando-se como a principal região produtora da oleaginosa no mundo.
A soja é negociada nos mercados futuros, que buscam aproximar o mercado de
negociação por um modelo de competição perfeita, permitindo que os preços ajustem-se
conforme as leis de mercado, ou seja, de acordo com as pressões de oferta e demanda, que
são orientadas pelas informações disponíveis aos participantes do mercado. As operações
que nele ocorrem são divulgadas publicamente a todos os seus participantes,
caracterizando a informação livre. Outra característica do mercado futuro é a
4
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
homogeneidade dos produtos nele negociados. Através de contratos padronizados pela
bolsa, estabelecem-se limites quanto à especificação do produto, sua qualidade, locais e
meses de entrega, embalagem, formalidades na entrega e pagamentos. Os participantes
deste mercado têm ampla liberdade de mobilidade de seus recursos, porém devem dispor
de capital suficiente para lidar com os ajustes diários, que consistem em uma compensação
financeira diária decorrente da oscilação de preços diária.
Os hedgers (sojicultores, esmagadoras, tradings, etc), investidores do mercado,
necessitam de dados confiáveis a respeito do comportamento futuro de seus produtos para
fixarem seus preços de venda/compra, reduzindo assim seu risco de perda e garantindo
uma rentabilidade mínima. Esta necessidade somada à reduzida literatura a respeito de
modelos de apreçamento para o mercado da soja justifica a presente pesquisa.
3. Modelos tradicionais de previsão de séries temporais
Uma abordagem comum na literatura consiste no estudo da variabilidade de preços
ou taxas de retorno, ou seja, da volatilidade. Um estudo sobre o comportamento da
volatilidade de preços da soja em mercados futuros é apresentado por Kam, Hung e Wai
(2004). Com base em dados do mercado chinês, os autores utilizam um modelo para a
previsão da volatilidade da soja e examinam diversas hipóteses relacionadas à volatilidade
diária, observando como os contratos futuros reagem com variações do volume de
negociação, taxas de juros e participação de países como China e EUA nas negociações.
Diversos autores estudam o comportamento da volatilidade nos mercados futuros.
A assimetria da volatilidade futura, foi estudada French et al. (1987); Campbell e
Hentschel (1992) e Bekaert e Wu (2000). O impacto do volume na volatilidade é
apresentado por Bessembinder e Seguin (1993). Garcia et al. (1986) estudam modelos
através de relações de realimentação (feedback) entre volatilidade e volume. Najand e
Yung (1991) e Foster (1995), empregam um modelo heterocedástico auto regressivo
(GARCH) para estimar a volatilidade.
Embora haja diversos estudos relacionados à volatilidade do retorno do preço da
soja, poucos tratam de modelos que estimam preços futuros, embora a informação sobre o
preço seja de muito interesse para produtores, além de outros investidores. O objetivo deste
estudo é construir modelos de previsão capazes de fornecer dados confiáveis a respeito do
preço da soja em grão no mercado futuro. Dois modelos de previsão são comumente
utilizados para a previsão de preços: os modelos de médias móveis e de alisamento
exponencial. Apesar de serem os modelos de simples aplicação, são os que apresentam os
melhores resultados para previsões em curto prazo (Morettin 2004).
O modelo de médias móveis consiste em prever o valor para o próximo instante
com base nos dados históricos, a dimensão da janela de observação do passado (o lag da
média móvel) é o parâmetro deste modelo. O valor previsto é obtido através da expressão
Z + Z t −1 + ... + Z t − r +1
(3.1)
Mt = t
r
onde r é o intervalo de observações que irá se utilizar e Zt é o valor da observação
realizada no instante t.
Já o modelo de alisamento exponencial realiza uma média ponderada entre os dados
históricos e as previsões realizadas anteriormente. O parâmetro neste caso, α, determina
qual o peso dado para as observações passadas no cálculo da média ponderada. Este
parâmetro varia entre 0 e 1, sendo o modelo com parâmetro 1 o mais simples de todos por
considerar que o valor do futuro será exatamente igual à última observação.
As previsões são determinadas a partir da expressão:
5
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
Z t* = α ⋅ Z t + (1 − α ) ⋅ Z t*−1
(3.2)
onde Z é o valor da previsão para o período t, Z é o valor da observação obtida na data t e
α é a constante de alisamento.
Há uma grande variedade de modelos de previsão na literatura. Embora outros
modelos também tenham sido estudados, seus erros de previsão sempre foram superiores
aos modelos de média móvel e alisamento. Testaram-se modelos mais sofisticados como
ARMA e ARIMA, sem que houvesse melhoria significativa na estimação, razão pela qual
optou-se pelos dois modelos mais simples.
*
4. Modelos de redes neurais
Redes neurais são modelos que relacionam dados de entrada com suas respectivas
saídas (Azoff 1991). Através da observação de exemplos e seu constante treinamento,
obtém-se uma matriz de pesos que representa as ligações entre os neurônios de entrada e
de saída, imitando o que ocorre no cérebro humano em suas interconexões entre células
nervosas. A sua maior vantagem é a adaptabilidade que permite seu refinamento e
minimização dos erros de previsão.
Escondida
Entrada
X1
f(a)
X2
Xn
[..
.][..
.]
a =
n
∑
i =1
W i ⋅ xi
[..
.]
Saída
[..
.] [..
[..
.]
.]
bias
[..
.]
Nó de entrada
Neurônios
[...]
Figura 1 – Neurônio artificial
Pesos
Figura 2 – Arquitetura da rede
Há uma primeira camada que recebe os dados de entrada e os valores de saída desta
estão conectados aos neurônios da próxima camada através das linhas de interconexão.
Cada linha apresenta um peso respectivo, os quais são parâmetros ajustáveis que atenuam o
valor de entrada ao longo da rede. No início os valores dos pesos atribuídos às linhas são
aleatórios, com média em torno de zero. Durante a fase de treinamento eles são ajustados
gradativamente, de forma a reduzir os erros do processo de previsão. Este processo de
ajuste é realizado através de algoritmos de otimização.
A próxima camada (escondida) representa os neurônios artificiais, que são os nós
de processamento. Estes recebem os valores da camada de entrada, os quais são
multiplicados por pesos. Os resultados são somados gerando um valor a que passa por um
processo de atenuação, através de uma função de transferência, que fornece o valor de
saída f(a). Normalmente são utilizadas funções de ativação não lineares nas redes neurais.
Estas funções representam são em geral exponenciais ou trigonométricas.
Também há a presença na camada de entrada, do nó bias, que alimenta todos os
demais nós e que tem valor fixo de 1. Ele representa um nó de ajuste entre níveis que leva
a uma implementação mais eficiente do algoritmo para determinação dos pesos.
Ao final de um ciclo, os dados de entrada foram propagados para os neurônios de
saída, que é o estado final da rede. Os valores de saída fornecidos pela rede são agora
comparados com os seus alvos (dados observados) e calculam-se seus erros (diferença
entre previsão do modelo e dado observado). Estes erros são re-enviados para as camadas
6
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
iniciais, no caminho reverso, para as devidas correções nos pesos. Um grupo de
apresentações dos vetores de treinamento da rede constitui um epoch.
O processo de refinamento dos resultados através do estudo dos erros e envio destes
para o início do ciclo é conhecido como feedforward backpropagation. O algoritmo de
utiliza uma técnica de otimização através do gradiente descendente para o ajuste dos pesos
entre conexões. Dessa forma, segue em direção a um ponto de mínimo na curva da
superfície de erros. Este algoritmo é o tradicionalmente utilizado, porém neste estudo
empregou-se um algoritmo mais eficiente, implementado no aplicativo Matlab.
5. Seleção de variáveis e implementação do modelo
A definição dos fatores que poderiam afetar os preços foi realizada ex-ante,
optando-se por analisar o comportamento das seguintes variáveis: preços de contratos
futuros da soja, cotações do dólar, taxa de retorno dos preços da soja e do dólar, oferta e
demanda da soja, número de dias para o vencimento do contrato futuro, evolução da área
plantada, evolução das importações brasileiras, exportação mundial e consumo.
A fim de melhorar a qualidade do modelo, ao invés de empregar os preços da soja
diretamente, foram considerados como entrada da rede a saída de dois modelos de previsão
tradicionais; as Médias Móveis Simples (MMS) e o Alisamento Exponencial Simples
(AES). Para o modelo de Médias Móveis realizaram-se diversos testes variando o valor do
lag da média móvel, o parâmetro r, a fim de determinar o modelo que obtivesse um erro
quadrático médio reduzido e que conseguisse determinar a tendência da série temporal
utilizada. Selecionou-se r = 20 dias, valor que suaviza a curva de evolução dos preços
mantendo erros de previsão razoáveis, sendo também este o valor utilizado pelo mercado
financeiro. Para o modelo de suavização exponencial, a partir da realização de testes,
decidiu-se pelo valor α = 0.3, que suaviza a série e mantém erros de previsão reduzidos.
Estes modelos foram estudados a fim de utilizá-los como entrada em modelos das redes
neurais, que serão tratadas adiante. O objetivo até o momento não era selecionar o modelo
que fornecesse o menor erro quadrático médio entre previsão e valor real, mas sim aquele
que conseguisse determinar a tendência da série temporal, suavizando os dados para que
estes pudessem ser inseridos nas redes neurais.
Duas abordagens podem ser utilizadas para esta previsão. Uma delas estima os
valores dos preços diretamente, outra corrige os resíduos resultantes dos modelos
tradicionais de previsão, somando-os aos valores obtidos previamente. A primeira
abordagem, através de testes preliminares, mostrou-se mais eficaz, fornecendo erros com
uma ordem de grandeza bastante inferior ao da segunda. Enquanto o erro quadrático médio
da primeira abordagem era da ordem de, no máximo, 900, o da segunda abordagem
ultrapassava os 3000.
As séries de dados utilizadas foram as seguintes:
a) preços diários de contratos futuros da soja em grão, para o 1º vencimento, da
CBOT (Chicago Board of Trade).
b) preços diários de mercado futuro de câmbio da Bolsa de Mercadorias e de
Futuros (BM&F).
c) Prazo para vencimento do contrato futuro da soja.
d) Volumes de importações/exportações, consumo, oferta e demanda. Como não
são disponíveis em valores diários, admitem-se valores projetados, mantendo-os constantes
no período em que foram mensurados (BM&F).
Optou-se pelo uso de dados diários, pois estes fornecem maiores informações a
respeito da evolução da série. E também, é este horizonte de tempo desejado pelos
7
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
investidores para as previsões. Os contratos futuros de soja possuem vencimentos nos
meses de janeiro, março, maio, julho, agosto, setembro e novembro.
A série de dados da soja obtida refere-se ao período de janeiro de 2000 até
novembro de 2004, constituindo 1184 dados no total, o que determinou a dimensão das
demais séries utilizadas.
S o ja C B O T - 1º v e nc im e nt o
1100
1050
1000
950
900
850
800
750
700
650
600
550
500
450
400
Gráfico 1 – Evolução do preço da soja para o 1º vencimento no mercado futuro.
Estatistica
Área plantada
Consumo mundial
Exportação
brasileira
Exportação
mundial
Importação
brasileira
Produção brasileira
Dolar
AES. a= 0.3
AES. a= 0.938
MM
Taxa dólar
Taxa preço
Vencimento
Tabela 1 – Dados estatísticos das séries utilizadas
Unidade
Média
Desvio
Variância
padrão
1000 hc
17.405,51
2.850,50
8.125.364,60
1000 ton
185.668,4
13.230,89
1,75E+08
1000 ton
19.256,85
5.354,54
28.671113
Curtose
Máximo
Mínimo
-1,46
-0,89
-1,33
21.069,4
201.358
26.700
13.507,8
159.850
11.161
1000 ton
58.673,98
7.017,53
49.245.682
-1,15
67.315
45.550
1000 ton
1.153,71
167,63
28.100,86
-1,47
1.321
900
1000 ton
U$
cU$/bushel
cU$/bushel
cU$/bushel
dias
48.000,11
2,63
574,82
574,82
574,65
0,0004
1,97E-05
19,13
10.023,93
0,56
145,96
146,60
144,92
0,01
0,02
11,67
1E+08
0,31
21.304,33
21.492,79
21.003,25
0,0001
0,0003
136,26
-1,46
-0,81
1,67
1,73
1,54
9,73
21,11
-1,06
61.000
3,95
1.040,07
1.053,75
1.014,69
0,05
0,08
45
32.344,6
1,72
424,95
418,40
430,97
-0,09
-0,20
1
A previsão através de redes neurais requer várias etapas para a seleção dos
parâmetros, entradas, funções de ativação, etc. Primeiramente estuda-se como os dados se
comportam com as diferentes funções de transferência disponíveis. Estes testes são
preliminares, fornecendo através dos erros quadráticos médios obtidos, a função que os
minimize. Essa função será utilizada nos testes posteriores, assumindo-se que é a que
melhor se adapta aos dados fornecidos, porém para uma confirmação, novos testes serão
realizados após todos os parâmetros terem sido determinados, para a verificação da sua
validade.
Após a definição da função de transferência, inicia-se o processo de seleção do
método que será utilizado para dividir os dados entre treinamento e validação das redes
8
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
neurais. Utiliza-se o método de cross validation (Bradley 1983) para a seleção de dados
para o treinamento. O método consiste, no caso mais simples, em separar os dados em k
grupos, realizar o treinamento com (k-1) grupos e a validação apenas com um dos grupos.
Dessa forma estima-se o erro quadrático médio obtido para apenas um grupo k. Num caso
mais complexo, o número de k iguala-se ao número de dados, realiza-se o treinamento com
todos os dados menos um para a previsão. Isso quando realizado com todos os dados
permite o cálculo do erro quadrático médio, mais preciso, porém num processo que exige
maior disponibilidade de tempo.
Neste artigo foi empregado um método intermediário. Selecionou-se um intervalo
com número de dados fixo, no caso 790 dados, um terço do total, com os quais realizou-se
o treinamento para uma nova previsão. Conforme os dados evoluem, descarta-se o mais
antigo, inserindo-se o do período anterior, dessa forma mantém-se fixo o número de dados
fornecidos ao treinamento. Seleciona-se as melhores arquiteturas através do Erro
∑
Quadrático Médio:
n
( x
i = 1
−
i
x
i
)
2
, onde xi é o valor observado; xi é o valor
n
previsto e n o número total de observações.
Para a seleção das variáveis de entrada, uma série de dados é fixada. A seguir
testam-se diversas combinações desta variável fixa com as demais. Neste caso, todos os
testes são realizados com duas variáveis de entrada. Após realizarem-se os testes,
seleciona-se a variável que contribuiu para uma redução do erro quadrático médio. Repetese o procedimento, agora com duas variáveis fixas. Analisam-se os resultados e
selecionam-se as variáveis a serem utilizadas com entrada para o modelo de redes neurais.
Após a seleção das variáveis de entrada resta a definição da arquitetura ideal. Com
os dados de entrada fixos, varia-se o número de camadas intermediárias e de neurônios.
Através do comportamento do erro, opta-se pelo modelo com estimativas mais precisas.
6. Resultados
Os primeiros testes realizados tinham por objetivo identificar a função de
transferência que melhor se adaptava ao problema em questão. As opções eram as funções:
logarítmica, sigmoidal, tangente hiperbólica sigmoidal, e linear pura. Para isso fixou-se
uma entrada, verificando como o erro quadrático médio da previsão variava. As entradas
selecionadas foram: resíduos do modelo de média móvel com parâmetro r = 20 (eq. 3.1),
série de previsões do Alisamento Exponencial com parâmetro a = 0,3 (eq.3.2), taxa de
retorno dos preços da soja e cotação do dólar. Estes modelos foram estudados a fim de
utilizá-los como entrada em modelos das redes neurais, que serão tratadas adiante. A
análise prévia dos erros obtidos com esses testes propõe que a função de ativação
logarítmica sigmoidal fornece estimativas melhores na previsão de preços. O modelo com
menor Erro Quadrático Médio (EQM) possui duas camadas intermediárias, uma com 4 e
outra com 2 neurônios, e EQM = 839,41. Portanto, para os testes posteriores assumiu-se
como função de ativação a logarítmica sigmoidal.
Para determinação das variáveis de entrada no modelo de redes neurais,
selecionaram-se como as principais, as séries de previsões obtidas através dos modelos
tradicionais de previsão, alisamento exponencial e média móvel. Para a seleção de qual das
duas forneceria melhores resultados nas estimativas, fixou-se a média móvel, realizando
vários testes onde se combinava a ela uma outra variável. O mesmo foi realizado com o
alisamento exponencial. Em todos os testes o alisamento exponencial obteve melhores
resultados, por isso optou-se por considerá-lo uma entrada importante para o modelo. A
9
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
média do erro quadrático médio com o alisamento exponencial era, EQM = 804.74, e da
média móvel, EQM = 935.27.
Com uma entrada fixa - o alisamento exponencial - realizaram-se novos testes,
introduzindo um segundo dado de entrada. Para o segundo dado de entrada, utilizaram-se
todas as séries descritas na seção 5. Os resultados são apresentados a seguir:
Tabela 2 – Erro Quadrático Médio das previsões com 2 variáveis de entrada
Alisamento exponencial com
Alisamento exponencial com
a = 0,3
a = 0,938
Segunda Variável
5_2
4_2
3_2
3_2
5_2
Área plantada
796,80
820,75
826,55
823,45
792,10
Consumo mundial
790,95
787,75
815,25
795,35
806,25
Dólar
799,95
817,05
810,70
843,10
820,20
Exportação brasileira
814,3
825,70
820,75
795,55
812,20
Exportação mundial
799,65
809,30
790,45
791,20
789,45
Importação brasileira
805,25
796,35
814,80
796,45
822,80
MM 20
832,85
819,35
853,90
877,90
874,95
Produção brasileira
831,70
816,00
799,40
791,25
794,75
Resíduo alisamento exp.
795,40
799,25
799,40
801,40
802,80
Resíduo MM
792,45
792,55
792,55
792,45
792,20
Taxa dólar
792,60
793,00
792,45
792,50
792,55
Taxa preço
792,15
792,95
794,80
792,45
792,70
Vencimento
791,95
792,65
792,75
793,10
791,95
onde x_y representa a arquitetura com x neurônios na primeira camada intermediaria e y
neurônios na segunda camada intermediaria.
Realizados estes testes verificou-se que os resultados dos modelos com o
vencimento como segunda entrada apresentaram, em todos os tipos de arquitetura, um
resultado razoável, sem grandes variações e com erros reduzidos. O vencimento é uma
variável que aproxima o preço futuro do à vista, e por essa natureza é constantemente
utilizada pelos investidores para previsão de preços. Portanto considerou-se esta uma
variável importante para o modelo.
Novos testes foram realizados, agora com três entradas, Alisamento exponencial e
vencimento, variando apenas o terceiro dado. Os erros obtidos estão na tabela a seguir:
Tabela 3 – Erro Quadrático Médio para previsões com 3 variáveis de entrada
Alisamento exponencial com alfa = 0,3
Terceira Variável
5_2
4_2
3_2
Área plantada
782,30
793,50
787,15
Consumo mundial
786,65
795,15
771,95
Dólar
795,50
792,55
812,40
Exportação brasileira
791,05
813,35
813,40
Exportação mundial
816,85
789,25
781,15
Importação brasileira
796,10
802,75
807,45
MM 20
806,30
795,95
793,95
Produção brasileira
796,90
792,10
798,75
Resíduo ewma
794,75
796,50
794,95
Resíduo MM
791,75
791,95
792,40
Taxa dólar
916,30
871,75
867,85
Taxa preço
802,50
793,90
791,45
Após esta nova série de testes, observa-se que informações como o consumo
mundial e exportação mundial favorecem a previsão, reduzindo os erros. Os resultados
10
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
obtidos com estes testes são consistentes, pois como a soja é uma commodity negociada em
dólar no mercado internacional, seu preço é fortemente influenciado por valores de
demanda e oferta mundiais, sendo os valores do mercado brasileiro menos significativos
para a previsão. O mesmo ocorre com a série de cotações do dólar, pois esta informação já
esta inserida no preço de negociação, não fornecendo novas informações a respeito da
evolução do preço da soja.
Decidiu-se não acrescentar mais entradas a rede, uma vez que apesar de fornecer
maiores informações a respeito do preço da soja, irá aumentar o número de parâmetros a
serem estimados, o que pode aumentar os erros de previsão.
Após estes testes define-se a entrada que será utilizada para o modelo de redes
neurais, restando agora definir qual a arquitetura que melhor se adequará ao problema. A
literatura (Liao 2005) afirma que as melhores arquiteturas são aquelas com um número
reduzido de neurônios e de camadas intermediárias, portanto decidiu-se testar arquiteturas
que variassem entre uma até três camadas escondidas, com um número pequeno de
neurônios.
Outro fator a ser considerado é a configuração inicial da rede em relação aos
parâmetros fornecidos a cada ligação entre os neurônios. A determinação dos parâmetros
ótimos de uma rede neural é realizada através de métodos de gradiente descendente, que
visam reduzir o erro quadrático médio. Este tipo de algoritmo tem como inconveniente a
possibilidade de parar em mínimos locais ao invés de mínimos globais. Conseqüentemente,
para evitar que isto ocorresse o algoritmo foi inicializado com diferentes valores de
parâmetros. Por os erros não terem variado significativamente, pode-se admitir que a
superfície seja regular.
Os erros obtidos para as diversas arquiteturas são os seguintes:
Tabela 4 – Evolução do Erro Quadrático Médio variando-se arquitetura
Arquitetura Erro Quadrático Médio
3
732,53
4
738,01
5
738,20
3_2
739,40
4_2
739,28
5_2
738,57
3_3
738,21
4_3
744,91
5_3
741,18
4_3_2
739,00
4_2_2
738,88
4_3_3
739,87
Os resultados acima comprovam a afirmação da literatura, de que redes menores
fornecem melhores previsões. A arquitetura que melhor se adaptou aos dados de entrada
foi a que contém uma camada intermediária com três neurônios. Para confirmar este
resultado, realizou-se um novo teste, variando-se as funções de transferência novamente.
Este teste tem a finalidade de comprovar a correta seleção realizada no inicio do
procedimento de previsão através de redes neurais.
Os resultados para as diversas funções de transferência, para a melhor rede obtida
acima foram os seguintes:
11
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
Tabela 5 – Erros Quadráticos Médios para as diferentes funções de transferência
Função de transferência
Log. Sigmoidal
Tangente Hiperb.
Linear pura
Erro Quadrático Médio
732,53
770,72
888,13
Os novos testes confirmam a superioridade da função de transferência logarítmica
sigmoidal, havendo diferenças significativas entre seus erros.
7. Conclusões
Os testes realizados indicam que o modelo de previsão através de redes neurais
fornece resultados confiáveis a respeito do comportamento futuro do preço da soja. O
modelo com quatro entradas, sendo elas: previsões de preços através do modelo de
alisamento exponencial, exportação mundial, consumo mundial e prazo para o vencimento,
consegue prever, com erros de estimativa reduzidos, o preço no mercado futuro da soja em
grão.
Pode-se comprovar o que a literatura afirma a respeito das arquiteturas ideais para
as redes neurais, conseguindo melhores resultados com redes pequenas, com menor
número de neurônios. As variáveis de entrada selecionadas indicam ainda que os preços
futuros são diretamente relacionados à produção e demanda mundiais, conceitos
empregados informalmente no mercado de capitais. O processo de seleção de variáveis
utilizado permitiu identificar o grupo de variáveis considerado mais significativo e que
fornece maiores informações a respeito do processo de formação dos preços futuros da
commodity.
O modelo estudado mostrou-se adequado ao problema proposto, oferecendo ao
mercado uma nova visão sobre modelos de previsão. Com foco em preços e não na
volatilidade, um modelo não linear como a rede neural pode prever o comportamento do
mercado futuro de maneira bastante satisfatória.
8. Referências Bibliográficas
-AZOFF, E.M. – Neural network time series forecasting of financial markets,
Chichestes, John Wiley, 1994
- BEKAERT, G., WU, G., 2000. Asymmetric volatility and risk in equity markets.
Review of Financial Studies 13 (1),1–42.
-BERA, A.K. and JARQUE, C. M. – An efficient large sample test for normality of
observations and regression residuals, Working papers in Econometrics, 4º ed. ,
Australian National University, Camberra, 1981
-BESSEMBINDER H., S, P.J., 1993. Price volatility, trading volume, and market
depth: evidence from futures markets. Journal of Financial and Quantitative Analysis
28 (1), 21–39.
12
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
-BM&F, Estatísticas dos mercados físico e futuro, 2004.
-BRADLEY, E., Estimating the error rate of a prediction rule: Improvement on crossvalidation. Journal of the American Statistical Association, 78:316-331, 1983.
-BROCKWELL, P.J., DAVIS, R.A.- Time Series: Theory and Methods, 2ºed. , Nova
York, Springer, 1991
- CAMPBELL, J.Y., HENTSCEL, L., 1992. No news is good news: an asymmetric
model of changing volatility in stock returns. Journal of Financial Economics 31, 281–
318.
-FOSTER, A.J., 1995. Volume-volatility relationships for crude oil futures markets.
Journal of Futures Markets 15 (8),
929–951.
- FRENCH, K.R., Schwert, G.W., Stambaugh, R.F., 1987. Expected stock returns and
volatility. Journal of Financial Economics 19, 3–29
-KALMAN, R.E. - A new approach to linear filtering and prediction problems, Trans.
ASME J. Basic Eng., 82º ed. ,1960
-KAM C. C., , HUNG-G. F., WAI K. L., Daily volatility behavior in Chinese
futures markets, Int. Fin. Markets, Inst. and Money 14 (2004) 491–505
-KENDALL, M.G. - Time Series, Londres, Griffin, 1973
-LIAO, K.P.; Fildes, R., The accuracy of a procedural approach to specifying
feedfoward neural networks for forecasting. Computer & Operations Research 32
(2005) 2151-2169.
-MORETTIN, P.A.; TOLOI, C.M.C. - Modelos para Previsão de Séries Temporais.
Vol. 1, 13º edição, Rio de Janeiro, Instituto de Matemática Pura e Aplicada, 1981
-MORETTIN, P.A.; TOLOI, C.M.C. - Análises de Séries Temporais. 1º edição, São
Paulo, Edgar Blücher, 2004.
-NAJAND, M., Yung, K., 1991. A GARCH examination of the relationship between
volume and price variability in
futures markets. Journal of Futures Markets 11 (5), 613–621.
- PLISKA, S.R., Shalen, C.T., 1991. The effects of regulations on trading activities and
return volatility in futures markets. Journal of Futures Markets 11 (2), 135–152.
-RIBEIRO, C.O.- Um modelo de previsão hierárquico com indicadores técnicos. Tese
(Doutorado) - Escola Politécnica, USP, Departamento de Engenharia de Produção.
1997.
13
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
XLIII CONGRESSO DA SOBER
“Instituições, Eficiência, Gestão e Contratos no Sistema Agroindustrial”
-WHEELWRIGHT, S.C. ; MAKRIDAKIS, S. Forecasting Methods for
Management, 4º edição, Nova York, John Wiley & Sons Inc., 1985
14
Ribeirão Preto, 24 a 27 de Julho de 2005
Sociedade Brasileira de Economia e Sociologia Rural
Download