Abrir Arquivo

Propaganda
ÁREA TEMÁTICA: FINANÇAS
AUTORES
FELIPE DIAS PAIVA
Centro Federal de Educação Tecnológica de Minas Gerais - CEFET-MG
[email protected]
RODRIGO TOMAS NOGUEIRA CARDOSO
Centro Federal de Educação Tecnológica de Minas Gerais - CEFET-MG
[email protected]
RICARDO PEREIRA REIS
Universidade Federal de Lavras
[email protected]
ESTEVÃO FELIPE GOMES FINAMORA
Centro Federal de Educação Tecnológica de Minas Gerais
[email protected]
PRECIFICAÇÃO DE UM ATIVO FINANCEIRO BASEADO EM REDES NEURAIS
RESUMO: O presente trabalho aplicou a técnica de redes neurais (RN) para precificar um
ativo financeiro do mercado acionário brasileiro, PETR4 (ação preferencial da Petrobrás).
Porém, a fim de buscar um respaldo maior para o uso da RN, discutiu-se inicialmente o quão
pertinente é o seu uso, pois muito se questiona a previsão de valores futuros de títulos
mobiliários a partir de dados históricos. Assim, foi calculado o coeficiente de Hurst, tendo o
mesmo indicado que a série temporal do ativo PETR4 não segue um movimento browniano,
refutando dessa forma a hipótese de mercado eficiente (HME). Ou seja, a série do referido
ativo financeiro possui uma memória de longo prazo. Acredita-se então, existir razões
plausíveis para justificar o uso de um modelo baseado em redes neurais como método de
precificação para PETR4. Assim, utilizou-se o período amostral de 01/08/2008 a 11/11/2010
para precificar ações preferenciais da Petrobrás. Os resultados alcançados pelo modelo foram
bastante significativos, a melhor estrutura da rede produziu as seguintes medidas estatísticas
de desempenho: erro médio quadrático (EMQ = 0,000459), coeficiente de explicação
(76,20%), U de Theil (0,9595) e POCID (61,97%).
ABSTRACT: This study applied the technique of neural networks (NN) to price a capital
asset of the Brazilian stock market, PETR4 (preferred shares of Petrobras). However, in order
to seek a deeper support for the use of NN, was initially discussed how relevant is their use as
has often been asked to forecast future values of securities from historical data. Thus, we
calculated the Hurst Coefficient, having the same series indicated that the asset PETR4 does
not follow a Brownian motion, thus rejecting the efficient market hypothesis (EMH). That is,
the series of financial asset that has a long-term memory. It is believed then there are
reasonable grounds to justify the use of a model based on neural networks as a method of
pricing for PETR4. Thus, we used the sample period from 01/08/2008 to 11/11/2010 for
pricing preferred shares of Petrobras. The results achieved by the model were significant, the
best NN structure produced the following statistical measures of performance: mean square
error (RMSE = 0.000459), coefficient of determination (76.20%), U of Theil (0.9595 ) and
POCID (61.97%).
Palavras-chave: Redes neurais, Hipótese de Mercado Eficiente; Expoente de Hurst.
1. INTRODUÇÃO
Poucos assuntos na área financeira geram tanta polêmica quanto a teoria do mercado
eficiente. A hipótese de mercado eficiente tem capturado de forma intensa a atenção de
muitos estudiosos. Esses, por sua vez, produzem constantemente uma série de estudos
empíricos, a fim de testar as bases reguladoras da referida teoria. Vários estudos confirmam a
sua existência, da mesma forma que um número considerável a contesta.
Assim muito se questiona sobre a real possibilidade e capacidade de prognosticar o preço
futuro de um ativo financeiro, tendo como ponto de partida dados históricos desse ativo. A
temática inevitavelmente é um dos temas mais instigantes no estudo das finanças. Nos últimos
anos, tem-se destacado os avanços das finanças computacionais como uma linha de pesquisa
promissora, haja vista alguns resultados já apresentados. Mais especificamente, os resultados
encontrados pelos modelos baseados na técnica de redes neurais artificiais.
A rede neural artificial trata-se de uma técnica de inteligência artificial que estrutura sua
dinâmica de processamento de dados inspirada na arquitetura do cérebro humano. Os estudos
dessa técnica, em questões no âmbito das finanças, tem se mostrado bastante eficiente,
principalmente em decorrência da possibilidade de se trabalhar com dados ruidosos
(incompletos, inconsistentes e ambíguos), além de prever sistemas não lineares.
[…] o modelo linear pode não ser preciso o bastante para aplicação em mercados
financeiros voláteis, nos quais podem ocorrer processos não lineares na evolução de
dados. Movimentos lentos com aumento consistente dos preços dos ativos, seguidos
por colapsos repentinos conhecidos como bolhas especulativas são comuns de
acontecer. Dessa forma, o modelo linear pode falhar em capturar ou prever pontos
de mudança acentuada nos dados. (LIMA et al., 2009, p. 38).
Frente a este cenário, o presente trabalho propós aplicar a técnica de redes neurais para
precificar um ativo financeiro do mercado acionário brasileiro. Porém, o estudo buscou
inicialmente verificar o quão pertinente é o uso dessa técnica em problemas de natureza
similar ao aqui proposto, pois muito se questiona a possibilidade prever valores futuros de
títulos mobiliários com o uso de dados históricos.
2. MERCADO FINANCEIRO: aleatório ou previsível?
O conceito de mercado eficiente protagoniza ainda hoje intensos debates na comunidade
acadêmica. Inúmeros estudiosos já se dedicaram à procura de dados passados, que permitam
explicar e inferir valores futuros do mercado acionário, possibilitando, assim, ganhos
extraordinários. Contudo, apesar da grande quantidade de estudos, nada de revolucionário foi
descoberto, o que faz com que a teoria de mercados eficientes se torne base para muitas outras
teorias da administração financeira.
Segundo Fama (1991), a hipótese de mercado eficiente se comprova quando os preços das
ações refletem toda a informação disponível. Alexander, Sharper e Bailey (2000, p. 73)
complementam afirmando que a market is efficient with respect to particular set of
information if it is impossible to make abnormal profits (others than by chance) by using this
set of information to formulate buying and selling decisions.
De acordo com Brealey e Myers (1998, p. 323), caso o mercado de capitais seja eficiente, a
compra ou venda de qualquer valor mobiliário ao preço vigente no mercado nunca será uma
transação com valor presente líquido positivo.
Ou seja, segundo os preceitos teóricos da HME, a tarefa de prever preços futuros tendo como
base comportamentos passados de um ativo financeiro, é um procedimento ineficaz. Pois, a
distribuição de uma série financeira denota de um movimento browniano, que é concebido
por características randômicas e independentes.
Contudo, tal como a base dos estudos do biólogo Robert Brown (a teoria dos movimentos
browniano tem esse nome em sua homenagem), que trata do caminho aleatório de partículas
macroscópicas num fluído, foi contestada pelas ideias conceituais dos fractais, a distribuição
White Noise de uma série temporal de ativos financeiros também é questionada. Um dos
estudos de maior impacto nessa área, é apresentado pelo americano Edgar E. Peters, que
adaptou o modelo desenvolvido na metade do século XX por Harold E. Hurst, para avaliar o
comportamento randômico de uma série temporal financeira.
O estudo do hidrólogo Hurst, teve como cenário de discussão as cheias do Rio Nilo. Seu
objetivo foi verificar se havia um padrão de memória ligada a esses eventos ou se estes
acontecimentos não passavam de eventos aleatórios independentes. Esses estudos então,
culminaram no desenvolvimento da estatística conhecida como Coeficiente de Hurst (H). Para
aplicação do modelo em séries temporais financeiras, apresenta-se a seguir, os passos
sugeridos por Peters (1994).
1o. Calcula-se o retorno logaritmo da série financeira.
N i = ln(M it / M it −1 )
(2.1)
Onde: Mit = representa o preço da ação i ao final do período t;
Mit-1 = representa o preço da ação i no início do período t.
2o. Particiona-se a série financeira em frações temporais e calcula-se a média de cada
conjunto de dados.
⎛⎛ 1⎞ n
⎞
ea = ⎜ ⎜ ⎟ * ∑ N k,a ⎟
⎝ ⎝ n ⎠ k =1
⎠
(2.2)
ea = valor médio do log retorno do ativo financeiro
n = número de elementos por partição
3o. Calcular o desvio acumulado de cada série particionada.
k
X k,a = ∑ (N i,a − ea )
(2.3)
j =1
Onde, cada retorno de uma série particionada (Ia) possui um grupo de retornos do ativo,
representado por k = 1, 2, 3, ..., n.
Xk,a = desvios acumulados em relação a ea
4o. Verificar quais são os pontos máximos e mínimos do conjunto Ia. Seguido da
diferença entre estes.
RIa = max(X k,a ) − min(X k,a )
(2.4)
enquanto que, 1 ≤ k ≤ n
5o. Calcula-se o desvio-padrão de cada partição.
2⎞
⎛⎛ 1⎞
SIa = ⎜ ⎜ ⎟ ∗ ∑ ( N k,a − ea ) ⎟
⎝ ⎝ n ⎠ k =1
⎠
n
1
2
(2.5)
SIa = desvio padrão de cada partição
6o. A série A valores RIa é normalizada dividindo estes valores de amplitude pelos
correspondentes desvios padrões SIa. A média destes valores padronizados mantém a
relação entre H e n.
(
⎛ R⎞
⎛ 1⎞ A
=
⎜⎝ ⎟⎠
⎜ ⎟ * ∑ RI / SI
S n ⎝ A ⎠ a =1 a a
)
(2.6)
7o. Para concluir o processo de mensuração do expoente de Hurst, calcula-se uma
regressão linear simples, atribuindo como variável dependente ln R/Sn e variável
independente ln n. Os passos de 1 a 6 devem ser repetidos várias vezes, mas com
tamanhos de partições diferentes, até que haja um número suficiente de dados para
calcular a regressão e que a série tenha sido calculada numa ordem decrescente de
partições, até o momento em que toda a série limite-se há 02 partições apenas.
ln (R/S)n = ln a + b * ln (n)
(2.7)
Onde: a = intercepto;
b = coeficiente de Hurst
Calculado o expoente Hurst, ter-se-á as seguintes possibilidades de resultado: 0 < H < 0,5:
série antipersistente, há uma probalidade maior que 50% de um valor negativo ser precedido
de um positivo; H = 0,5: série apresenta randon walk; H > 0,5: série persistente, há
probabilidade de repetição de um valor concentra acima dos 50%. Sendo assim, justifica-se
precificar ativos financeiros com base em dados históricos, quando o coeficiente de Hurst
indicar um valor diferente de 0,5.
3. SISTEMAS INTELIGENTES
A complexidade de problemas que emanam à tomada de uma decisão com opções
excludentes, aliado aos avanços da área computacional de processamento de dados, têm
estimulado o desenvolvimento de pesquisas que abordam técnicas de inteligência artificial,
que por sua vez, têm apresentado resultados bastante significativos, com aplicação em
diversas áreas do conhecimento.
É importante ressaltar que, apesar do nome “inteligência computacional” instigar a suspeita de
leitores não familiarizados com a temática, de que trata-se de uma abordagem teórica recente,
dado o nome evocar uma ideia de visão futurista. Esclarece-se que as primeiras pesquisas na
referida área, remontam a década de 1940, onde estudos iniciais a respeito de máquinas de
aprendizagem contribuíram para primeira representação do neurônio artificial e a criação da
regra de aprendizagem, que culminaram na criação das redes neurais artificiais.
Segundo Narain e Narain (2002), o conceito de rede neural artificial foi desenvolvido nas
décadas de 1940 e de 1950, porém este apenas foi apresentado à comunidade científica pela
primeira vez em 1956, na Dartmouth Conference. Apesar de John McCarthy ser considerado
o “pai” da teoria das redes neurais, credita-se ao matemático inglês Alan Turing, o primeiro
trabalho de impacto nesta área.
Mas, por que o termo inteligência artificial? De acordo com Negnevitsky (2002), inteligência
artificial é uma ciência que se dedica a construir hardware e software com capacidade de
processamento e tomada de decisão inteligente, com desempenho similar ao de um ser
humano. Assim, inteligente refere-se a habilidade para aprender e entender determinada
situação.
Entre os sistemas inteligentes, encontram-se as redes neurais, que procuram emular o
funcionamento do cérebro humano. Essa técnica tem despertado a atenção de inúmeros
pesquisadores da área das finanças. Prova disso é o crescente número de trabalhos que têm
abordado a referida temática, no intuito de explorar suas potencialidades para resolver
problemas de grande complexidade. A previsão de preço de ativos financeiros, por exemplo, é
um dos temas mais intrigantes da gestão financeira, objeto de aplicação de inúmeros modelos,
na tentativa de encontrar uma técnica que consiga projetar, nos preços de um ativo, situações
de risco e oportunidade às quais ele está exposto. Dessa forma, a técnica de redes neurais tem
sido alvo de pesquisas que exploram a temática de precificação de ativos financeiros.
3.1. Redes neurais
De acordo com Tofoli et al. (2008), a técnica de redes neurais objetiva simular o
funcionamento do cérebro humano, no que tange à sua dinâmica de processamento de dados,
sendo ela capaz de reconhecer padrões, extrair regularidades e detectar relações subjacentes
em um conjunto de dados aparentemente desconexos, além de ser possuir habilidades para
operar com dados ruidosos, incompletos ou imprecisos, e de prever sistemas não-lineares, o
que torna a sua aplicação no setor financeiro bastante eficiente.
Swales e Yoon (1992, p. 82) destacam que, justamente por comporem o rol de técnicas de
inteligência artificial, um dos principais pontos fortes das redes neurais artificiais é a
habilidade para aprender, learning is a function of interative processing aimed at minimizing
predictive erros. Os erros constituem a diferença entre as saídas atuais e as saídas projetadas.
De acordo com Haykin (2001, p. 23), redes neurais podem ser definidas como:
[...] um processador maciçamente e paralelamente distribuído, constituído de
unidades de processamento simples, que têm a propensão natural para armazenar
conhecimento experimental e torná-lo disponível para uso. Ela assemelha-se ao
cérebro humano em dois aspectos: (1) o conhecimento adquirido pela rede, a partir
de seu ambiente, através de um processo de aprendizagem; (2) as forças de conexão
entre neurônios (os pesos sinápticos) são utilizadas para armazenar o conhecimento
adquirido.
Segundo Freitas (2001), tal como o cérebro humano, as redes neurais são formadas a partir de
um conjunto de unidades de processamento interligadas entre si, conhecidas como neurônios.
Cada neurônio tem uma função de ativação, permitindo que, a partir de um valor recebido
como entrada e do valor já armazenado internamente, seja gerado um valor de saída, que será
transmitido ao neurônio seguinte. Em uma rede neural, a cada conexão que liga um neurônio a
outro é atribuído um peso, chamado de peso sináptico. Durante o processo de aprendizagem,
os pesos dados a cada conexão vão se ajustando até que se chegue a um conjunto de valores
de pesos que, aplicados aos valores de entrada de cada neurônio, resultem em respostas
satisfatórias ao problema estudado. Em um neurônio artificial, também é comum a presença
de um parâmetro, conhecido como bias, que permite a calibragem do sinal de saída. Pode-se
visualizar este esquema a partir da Figura 1.
FIGURA 1 - Modelo de neurônio artificial
Fonte: Freitas (2001, p. 35)
Sendo, X1 = X2 = X3: valores de entradas (input); Yi: valor de saída (output);
w1 = w2 = w3: pesos sinápticos; B: bias; ν: potencial de ativação;
ϕ (.): função de ativação.
Matematicamente, o funcionamento de um neurônio pode assim ser descrito:
Yi = ϕ (u + B)
em que,
m
u = ∑ (w j * X j ) ; ν = u + B
j =1
Existem diferentes topologias de redes neurais, entre as principais estão:
a) redes alimentadas adiante com camada única: essa estrutura consiste num modelo de
camada única, apenas a saída. Não significa que não há neurônios de entrada, mas esses não
são efetivamente contabilizados como camada, uma vez que não há transformações
computacionais nesta fase. Sua maior aplicabilidade centra no reconhecimento de padrões
linearmente separáveis, o que acaba por restringir bastante o seu uso;
b) redes alimentadas diretamente com múltiplas camadas: como o próprio nome sugere,
esse tipo de rede é caracterizado por utilizar uma ou mais camadas ocultas (hidden layer) de
neurônios. A principal função dos neurônios ocultos é intervir no ajuste da entrada, no intuito
de produzir uma saída mais fidedigna da realidade;
c) redes recorrentes: esse modelo se distingue dos demais por receber um sinal de entrada
advindo das saídas, ou seja, tem-se aqui um processo de realimentação. De acordo com
Haykin (2001), o processo de autorrealimento delineia uma situação em que a saída de um
neurônio é reaproveitada no processo recorrente de entrada.
Outro ponto que merece ser explicitado refere-se aos modelos de função de ativação, que são:
função linear, sigmoidal logística, tangente hiperbólica e degrau. Vide Figura 2 abaixo.
FIGURA 2 – Funções de ativação
Fonte: Adaptado Haykin (2001)
Sendo: (a) Função linear; (b) Função sigmoidal logística; (c) Função tangente hiperbólica, (d) Função degrau.
Com a utilização das funções de ativação, com exceção da função linear, o Yi passa por mais
uma transformação numérica da seguinte forma:
Função degrau
Função tangente hiperbólica
Yi =
−Yi
1− e
1+ e−Yi
Função sigmoidal logística
1
Yi =
1− e−Yi
De acordo com Másson e Wang1 (1990) apud Mueller (1996), a função de ativação
corresponde a um limiar que restringe a propagação do impulso nervoso à transposição de um
certo nível de atividade, entre a saída do sinal de uma camada para outra. Seu papel será
mapear e filtrar o potencial da unidade de processamento (v) para um intervalo préespecificado de saída.
Outro ponto de destaque, talvez o mais importante na estrutura teórica das redes neurais,
refere-se à habilidade de aprender. Nenhuma rede neural nasce pronta; seu desempenho
dependerá, obviamente, dos códigos de programação que a compõem, até porque ele é que
determinará todo o fluxo de ação e estrutura, mas o processo de aprendizado é item
determinante para a acurácia das saídas. O resultado final dessa rede será potencializado por
meio do aprendizado. Segundo Haykin (2001, p. 75), aprendizagem é um processo pelo qual
os parâmetros livres de uma rede neural são adaptados através de um processo de
estimulação pelo ambiente no qual a rede está inserida.
Em síntese, o uso do conceito de redes neurais para solução de um problema, requer, antes de
qualquer coisa, que se defina a arquitetura que esta rede irá trabalhar. Para Braga, Carvalho e
Ludermir (2007), definir a arquitetura de uma rede neural significa determinar a estrutura
sobre o qual os neurônios da rede estarão organizados.
3.1.1. Perceptron de múltiplas camadas
A discussão da rede neural de múltiplas camadas será aqui abordada com mais detalhes, haja
vista que esse foi o modelo utilizado na presente pesquisa. Assim, conforme já destacado, a
rede de camadas múltiplas ou multilayer perceptron (MLP) tem, além dos neurônios de
entrada e saída, uma ou mais camadas ocultas.
1
MÁSSON, Egill; WANG, Yih-Jeou. Introduction to computation and learning in artificial neural networks.
European Journal of Operational Research, North-Holand , 47, 1990. p. 1 - 28.
A existência da camada escondida torna o treinamento da rede mais difícil, pois não se sabe o
erro médio quadrático (EMQ) associado aos pesos a cada camada. Para o treinamento dessa
rede, utiliza-se um algoritmo conhecido como backpropagation. Esse algoritmo baseia-se na
regra de aprendizagem por correção de erro, em que o valor do EMQ encontrado na camada
de saída é propagado para a camada de entrada, por meio de cálculo da sensibilidade, no
intuito de ajustar os pesos na camada intermediária. Portanto, o cálculo de uma saída para a
MLP se dá em duas etapas, a primeira com a propagação normal (da camada de entrada para a
camada de saída) e a segunda, a de retropropagação do erro (da camada de saída para a
camada de entrada) (BRAGA; CARVALHO; LUDEMIR, 2007). Usa-se a equação de ajuste
abaixo, em que δ é a sensibilidade em função da agora saída calculada yj; η é a constante de
momentum que auxilia no aumento da velocidade de aprendizagem e α é a taxa de
aprendizagem e t o ciclo.
wij (t+1) = wij (t) + η δj (t) + α (wij (t) – wij (t-1))
A determinação de pesos ótimos para qualquer problema estudado caracteriza o fit, que
significa dar a modelagem mais precisa possível ao problema estudado, observada sua
complexidade. Dessa forma, overfitting e underfitting são modelagens que superestimam a
complexidade do problema, retornando pesos com excessiva precisão e que subestimam a
complexidade do problema, retornando pesos com baixa precisão, respectivamente. Ambos os
casos, overfitting e underfitting, são modelagens enviesadas do problema.
Em síntese, Haykin (2001) destaca três as características marcantes da rede MLP:
a) o uso de funções de ativação não-lineares, funções estas não-lineares suaves, não havendo
transmissão abrupta de sinal;
b) o uso de uma ou mais camada oculta de neurônios, habilitando a rede por sua vez a
aprender tarefas mais complexas;
c) rede com alto grau de conectividade, determinado pelas sinapses da estrutura.
4. METODOLOGIA
Para a classificação da pesquisa, foram tomados como base os critérios apresentados por
Vergara (1998), que qualifica a pesquisa em relação a duas vertentes: quanto aos fins e quanto
aos meios. Quanto aos fins, consistiu em uma pesquisa conclusiva, pois é um tipo de pesquisa
que testa hipóteses e examina relações específicas entre variáveis.
Quanto aos meios, trata-se de uma pesquisa ex-post-facto e bibliográfica. A investigação é expost-facto, em função de se referir a um fato já ocorrido. Conforme Vergara (1998), esse tipo
de investigação é recomendado quando o pesquisador não pode controlar ou manipular
variáveis, porque suas manifestações já ocorreram, pois as variáveis não são controláveis.
Para Gil (1989), na pesquisa ex-post-facto, a manipulação das variáveis independentes é
impossível, pois estas chegam até o pesquisador já prontas. É também bibliográfica porque
recorreu-se ao uso de materiais acessíveis ao público em geral, como livros, artigos, notícias,
cotações de ações e índices de mercado.
A essência investigativa do presente trabalho é a pesquisa quantitativa que, segundo AlvesMazzotti e Gewandsznajder (2001), é um método de investigação que torna os conceitos mais
precisos, além de dar mais informações sobre os fenômenos, devido ao rigor estatístico na
análise dos dados coletados.
Para a elaboração deste trabalho, foram utilizadas como objeto de estudo a série temporal das
ações preferenciais da empresa Petróleo Brasileiro S/A (Petrobrás – PETR4). Portanto,
trabalhou-se com uma amostra não probabilística intencional. A escolha pela Petrobrás para
ancorar a pesquisa, deveu-se ao fato de suas ações possuírem alta liquidez e
representatividade frente ao mercado de capitais brasileiro.
Para tratamento quantitativo dos dados, bem como elaboração dos gráficos, recorreu-se aos
softwares Matlab e Gretl.
4.1. Expoente de Hurst
Para cálculo do expoente de Hurst foi utilizado uma série financeira de 2.700 observações,
acolhendo assim recomendações de Feder2 (1988) apud Souza, Tabak e Cajueiro (2006), que
sugere uma quantidade mínima de 2.500 observações. A série contempla o período de
03/01/2000 a 25/11/2010. As informações foram conseguidas por meio do banco de dados da
Economática, sendo que as cotações diárias foram ajustadas (dividendos, bonificações, split e
implit).
4.2. Modelo de previsão baseado em redes neurais
Para construção do modelo de previsão baseado em redes neurais do ativo financeiro PETR4,
foi utilizado séries temporais diárias do referido ativo e do índice da bolsa de valores de São
Paulo no período de 01/02/2008 a 11/11/2010, obtidas também a partir do banco de dados da
Economática. Optou-se por trabalhar com um horizonte temporal mais reduzido, se
comparado com aquele utilizado no cálculo do coeficiente de Hurst, uma vez que simulações
realizadas indicam não haver resultados superiores dado séries maiores. Está observação
aplica-se, a priori, para o caso aqui estudado e de configurações de rede também similares.
A série foi composta de 708 observações e dividida em duas partes, 637 pontos foram
utilizados na primeira etapa dos testes, sendo novamente divididos em treinamento, teste e
validação, cujos percentuais das observações foram 80, 10 e 10, respectivamente. E os outros
71 pontos foram utilizados para simular a rede treinada, projetando assim os preços futuros do
ativo.
Todos os dados na rede foram transformados para base logarítmica ou foram calculados a
partir de dados assim alterados. Essa medida foi adotada no intuito de harmonizar os dados na
rede. A taxa de aprendizagem adotada foi de 0,1. Com relação a função de ativação, na
primeira e segunda camada intermediária e na camada de saída, as funções de ativação foram
sigmoidal logística, tangente hiperbólica e linear, respectivamente. Nesta etapa verificou-se o
valor do erro médio quadrático (EMQ).
Os testes foram realizados com 5, 8 e 9 neurônios de entrada, sendo estes as cotações diárias
de abertura, fechamento, máximo e mínimo; Ibovespa; média móvel de 21 dias do valor de
fechamento do ativo; valores baseados na formação de um candlestick, são eles: sombra
superior, corpo e sombra inferior.
2
FEDER, J. Fractals. New York: Plenum Press, 1988.
Na etapa de simulação das projeções, foi empregado o uso de algumas técnicas para avaliação
do modelo, a fim de apurar o quanto ajustado a rede ficou para tomar decisões assertivas. Os
indicadores utilizados foram U de Theil, percentage of change in direction (POCID),
coeficiente de explicação (R²), além do EMQ.
O teste U de Theil indica o quanto os resultados estão melhores que a previsão trivial, que diz
que a melhor estimativa para o preço de amanhã é o preço de hoje, (ABELÉM, 1994).
Qualquer valor inferior a 1 indica que é melhor usar a projeção do que se ater à previsão
trivial. O cálculo é feito da seguinte forma:
n
U=
∑(d
i
− yi )
2
i =1
(4.1)
n
∑(d
i
− di −1 )
2
i =1
O cálculo do POCID, mede a previsão em termos de mudanças de sinais, não deve ser
confundido com uma medida de exatidão da previsão, mas deve ser visto como uma indicação
do quanto a previsão acompanhou a tendência da série real (ABELÉM, 1994). Amorim Neto
(2008) afirma que essa métrica de desempenho é de grande importância para as aplicações
feitas no mercado de ações, pois pode-se assim medir as subidas e descidas das cotações. O
cálculo é feito da seguinte forma:
POCID =
1 n
∑ ai
n i =1
(4.2)
O cálculo do R² indica o quanto as previsões estão próximas dos valores reais, quanto mais
próximo de 1 melhor é a previsão realizada (VALENÇA, 2009).
⎛ COVd, y ⎞
R2 = ⎜
⎟
⎝ σd *σy ⎠
2
(4.3)
Segundo Amorim Neto (2008), o EMQ não fornece uma visão completa e livre de dúvidas
sobre o desempenho do modelo, sendo assim é importante avaliar um modelo com outras
métricas que possibilitem melhores visões e conclusões. O EMQ pode ser obtido através da
seguinte expressão:
1 n
(4.4)
EMQ = ∑ (di − yi )2
n i =1
5. RESULTADOS
Inicia-se à apresentação dos resultados da pesquisa pela exposição do gráfico da série
financeira das ações preferenciais da Petrobrás. O Gráfico 1 indica os valores diários de
fechamento do ativo PETR4, no período de 03/01/2000 a 25/11/2010. A série apresenta que o
valor mínimo atingiu R$ 2,95 na data de 14/02/2002, patamar esse, próximo do valor do
início da análise, que era de R$ 3,48. A cotação com maior valor de fechamento, alcançou o
preço de R$ 47,10, uma valorização de aproximadamente 1.250% para um período de cerca
de 8 anos. Uma queda acentuada do valor da PETR4 foi também sentida.
GRÁFICO 1 – Valor de fechamento PETR4 – Jan/2000 a Nov/2010
Fonte: Dados da pesquisa (2011)
O passo seguinte foi converter as variáveis de input e target para a base ln. Para que, na
sequência fosse calculado os retornos da série (vide fórmula 2.1). Nota-se pelo Gráfico 2, que
perdas e ganhos concentram seus valores no intervalo entre -15% e 15%.
GRÁFICO 2 – Ln retorno Valor de fechamento PETR4 – Jan/2000 a Nov/2010
Fonte: Dados da pesquisa (2011)
Ainda com o objetivo de mensurar o coeficiente de Hurst, os dados foram submetidos às
fórmulas listadas em 2.2 a 2.6. O resultado dos cálculos, processados a partir das fórmulas
indicadas, são aqui apresentados por meio da Tabela 1.
TABELA 1
Valores para a estimativa do expoente de Hurst
n
(R/S)n
n
(R/S)n
3
1,35114
60
8,59684
4
1,66833
75
10,39153
5
1,95450
10,78555
90
6
2,20862
100
11,86925
10
3,10308
108
11,92090
12
3,48759
135
13,89568
15
3,98726
14,60230
150
4,45389
180
15,70610
18
4,68893
225
16,17640
20
25
5,40150
270
18,25039
27
5,71938
300
18,61291
30
6.02337
450
24,72970
36
6,67582
540
27,96025
45
7,66020
675
29,21204
50
8,20719
900
32,88216
1350
44,27773
54
8,70719
Fonte: Dados da pesquisa (2011)
Os resultados da Tabela 1, foram na sequência linearizados, a fim de que se utilize o modelo
de regressão linear simples, resultando assim na indicação do coeficiente de Hurst.
Lembrando que, o ln do número de observações por partição (n) foi utilizado como variável
independente e o ln da estatística R/Sn como variável dependente.
Processada a regressão, os resultados são apresentados por meio da Figura 6.
FIGURA 6 – Resultados do modelo de regressão utilizado para cálculo do expoente de Hurst
Fonte: Dados da pesquisa (2011)
Como pode-se notar por meio da análise da Figura 6, os parâmetros do modelo de regressão
são significativos para um intervalo de confiança de 99%. Além de atender os preceitos
exigidos de homocedasticidade e normalidade dos resíduos, acrescenta-se o fato da variável
independente (n) explicar 99,39% das variações da variável dependente (R/Sn).
Especificamente no que tange o resultado do expoente de Hurst, deduz que a série do ativo
PETR4 apresenta um comportamento persistente, um vez que H = 0,5515.
Ou seja, a série temporal das ações preferenciais da Petrobrás, no período analisado, não
atende ao preceito básico da hipótese de mercado eficiente, o “passeio aleatório” e
independente da distribuição. Uma vez que, os resultados indicam que é possível identificar
padrões de comportamento da série temporal do ativo PETR4, logo conclui-se que há uma
memória de longo prazo presente na série.
Dado o resultado do expoente de Hurst, o objetivo de precificar um ativo financeiro com base
em dados passados, tem seu grau de pertinência elevado. Desta forma, o modelo proposto
baseado na técnica de redes neurais MLP, iniciou-se à averiguação da estrutura que melhor se
adéqua ao conjunto de dados disponíveis. Para isso, foram testados configurações para as
camadas intermediárias contendo de 1 a 20 neurônios. Os resultados alcançados são
apresentados na Tabela 2 e referem-se a implementação da rede para os pontos reservados à
simulação, conforme destacado no capítulo da metodologia do trabalho.
TABELA 2
Resultados dos testes de configuração da rede neural
Estrutura
Arquitetura
EMQ
U de Theil
POCID
I
5
1
1
1
0,000497
0,998300
0,493000
II
5
2
4
1
0,000495
0,996800
0,549300
III
5
3
1
1
0,000481
0,982700
0,535200
IV
5
4
3
1
0,000495
0,996300
0,535200
V
5
4
4
1
0,000482
0,983600
0,591500
VI
5
5
1
1
0,000469
0,970200
0,549300
VII
5
5
3
1
0,000499
0,999700
0,563400
VIII
5
6
1
1
0,000491
0,992200
0,507000
IX
5
6
2
1
0,000487
0,988800
0,549300
X
5
6
3
1
0,000450
0,950000
0,507000
XI
8
1
1
1
0,000483
0,984400
0,549300
XII
8
2
1
1
0,000497
0,998600
0,535200
XIII
8
2
2
1
0,000483
0,983800
0,563400
XIV
8
3
1
1
0,000471
0,971800
0,563400
XV
8
4
2
1
0,000468
0,968900
0,605600
XVI
9
1
1
1
0,000471
0,971500
0,521100
XVII
9
2
1
1
0,000482
0,983800
0,549300
XVIII
9
4
2
1
0,000474
0,975300
0,549300
XIX
9
5
2
1
0,000494
0,994900
0,563400
XX
9
6
6
1
0,000459
0,959500
0,619700
Fonte: Dados da pesquisa (2011)
R²
0,754800
0,753000
0,756100
0,758700
0,753500
0,750100
0,761100
0,755300
0,754000
0,763300
0,759200
0,762800
0,763800
0,763300
0,753700
0,762600
0,756500
0,754100
0,758700
0,762000
Algumas explicações para melhor compreensão da Tabela 2 tornam-se necessárias. A coluna
referente a arquitetura do modelo deve ser assim interpretada: 1a. coluna indica número de
neurônios de entrada, 2a. e 3a. coluna número de neurônios nas camadas intermediárias e 4a.
coluna que indica o número de neurônios na saída do modelo. As configurações dos
neurônios de entrada foram assim sistematizadas: a) 05 neurônios: cotações diárias do ativo
PETR4 posições de abertura, fechamento, máximo e mínimo; Ibovespa. b) 08 neurônios:
cotações diárias de abertura, fechamento, máximo e mínimo; Ibovespa; valores baseados na
formação de um candlestick, são eles: sombra superior, corpo e sombra inferior. c) 09
neurônios: cotações diárias de abertura, fechamento, máximo e mínimo; Ibovespa; média
móvel de 21 dias do valor de fechamento do ativo; valores baseados na formação de um
candlestick, são eles: sombra superior, corpo e sombra inferior.
Com referência aos resultados dispostos na Tabela 2, destaca-se aqui as estruturas V, XV e
XX. Sendo que, a estrutura XX pode ser ressaltada como a rede que melhor melhores índices
de performance. Pois, o erro médio quadrático apresentou um valor baixo (EMQ =
0,000459), que em termos percentuais indica que o modelo tem errado em média 0,12%, se
comparado o valor desejado e o calculado. No que tange a estatística do U de Theil, tem-se o
indicativo que o modelo aqui delineado possui resultados melhores que decisões triviais de
projeção (U de Theil < 1). Já o resultado do POCID indica que em 61,97% das reversões de
tendência são acompanhadas pelo modelo proposto. Quanto ao coeficiente de explicação (R2)
do preço de fechamento, tem-se que a estrutura delineada é capaz de explicar em média
76,20% dos resultados da projeção.
Para uma visualização complementar dos resultados alcançados, indica-se que seja observado
o Gráfico 3. Note que a escala do eixo de precificação do ativo está numa base logarítmica,
com variação de 0,05.
GRÁFICO 3 – Resultados esperados e desejados da arquitetura 9x6x6x1 (Estrutura XX)
Fonte: Dados da pesquisa (2011)
6. CONSIDERAÇÕS FINAIS
O artigo foi elaborado com o objetivo de analisar o desempenho de um modelo de
precificação de ativos financeiros baseado em redes neurais, utilizando para tanto dados
históricos. Inicialmente essa proposta é rechaçada a luz da hipótese de mercado eficiente, que
defende a ideia de “passeios aleatórios dos dados”. Porém, essa é uma teoria fortemente
contestada por inúmeras pesquisas já realizadas.
Assim, avaliou-se a HME, tendo como aporte teórico o coeficiente de Hurst. Os resultados
indicam que a série temporal do ativo PETR4 possui uma memória de longo prazo. Ou seja, é
possível identificar padrões de comportamento na cotação dos preços do referido ativo.
Estabelecendo, desta forma, condições básicas e desejáveis para que se utilize dados passados
como estratégia de precificação de títulos mobiliários.
Desta forma, o modelo estruturado a partir da técnica de redes neurais para precificar o ativo
PETR4, recebeu contornos mais consistentes e confiáveis. Pode-se inferir que os resultados
do modelo em questão apresentaram resultados bastante satisfatórios, considerando os
parâmetros avaliativos utilizados. Sendo que, a rede adaptou-se bem à uma arquitetura com
números mais elevados neurônios de entrada e intermediários.
A título de comparação, os mesmos dados de entrada utilizados na melhor das arquiteturas
(9x6x6x1), foram aplicados num modelo de regressão linear múltipla. Sendo que, as entradas
da rede neural passaram aqui a ser tratadas como variáveis indepentendes. Contudo, não foi
possível obter dados para comparação, uma vez que os parâmetros do modelo não são
significativos para um nível de confiança de 95%.
Conclui-se então, ensejando que o uso da técnica de redes neurais em pesquisas no âmbito das
finanças possui ainda muito campo a ser explorado. Assim, os autores do presente artigo tem
trabalhado com problemas na área de mercado de capitais que utilizem técnicas híbridas de
inteligência computacionais, estruturas mais sofisticadas de redes, além do simples uso e
tratamento de outras variáveis exógenas para compor modelos.
REFERÊNCIAS
ABELÉM, A. J. G. Redes neurais artificiais na previsão de séries temporais. Dissertação
(Mestrado em engenharia elétrica). Pontifícia Universidade Católica do Rio de Janeiro, Rio
de Janeiro, 1994.
ALEXANDER, G. J.; SHARPER, W. F.; BAILEY, J. V. Fundamentals of investments. 3rd.
ed. New Jersey: Prentice Hall, 2000.
ALVES-MAZZOTTI, A. J.; GEWANDSZNAJDER, F. O método nas ciências naturais e
sociais: pesquisa quantitativa e qualitativa. 3. ed. São Paulo: Pioneira, 2001.
AMORIN NETO, M. C. de. Previsão séries temporais usando séries exógenas e
combinação de redes neurais aplicada ao mercado financeiro. Dissertação (Mestrado em
ciência da computação). Universidade Federal de Pernambuco, Pernambuco, 2008.
BRAGA, A. de P.; CARVALHO, A. P. de L. F. de; LUDEMIR, T. B. Redes neurais
artificiais: teoria e aplicações. Rio de Janeiro: LTC, 2007.
BREALEY, R. A.; MYERS, S. C. Princípios de finanças empresariais. 5. ed. Lisboa:
McGraw-Hill de Portugal, 1998.
COELHO, L. dos S.; SANTOS, P. A. A.; COSTA JR., N. C. A. da C. Podemos prever a taxa
de câmbio brasileira? Evidência empírica utilizando inteligência computacional e modelos
econométricos. Gestão da Produção, São Carlos, v. 15, n. 3, p. 635-647, set.-dez. 2008.
FAMA, E. F. Efficient capital markets: II. Journal of Finance, Oxford, v. 46, n. 5, p. 15751617, dec. 1991.
FREITAS, A. A. C. de.; SILVA, I. N. da. Análise técnica de títulos financeiros através de
redes neurais artificiais. IV Congresso Brasileiro de Redes Neurais - ITA, São José dos
Campos, p. 67-71, Jul/1999.
FREITAS, S. O. Utilização de um modelo baseado em redes neurais para a precificação
de opções. 2001. Dissertação (Mestrado em Administração) – Faculdade de Ciências
Econômicas, UFMG, Belo Horizonte.
GIL, A. C. Como elaborar projetos de pesquisa. 2. ed. São Paulo: Atlas, 1989.
HAYKIN, S. Redes neurais: princípios e prática. 2. ed. Porto Alegre: Bookman, 2001.
MATSUMOTO, E. Y. Aplicação de redes neurais na classificação de rentabilidade futura
de empresas. Dissertação (Mestrado em economia). Fundação Getúlio Vargas, São Paulo,
2008.
MUELLER, A. Uma aplicação de redes neurais artificiais na previsão do mercado
acionário. 1996. Dissertação (Mestrado em engenharia da produção). Universidade Federal
de Santa Catarina, Florianópolis, 2006.
NARAIN, L. S.; NARAIN, R. L. Stock market prediction: a comparative study of
multivariate statistical and artificial neural network models. Journal of Accounting and
Finance Research, v. 10, n. 2, p. 85-94, summer 2002.
NEGNEVITSKY, M. Artificial intelligence: a guide to intelligent systems. 2nd. ed. Essex:
Pearson, 2005.
OLIVEIRA. M. A de. Aplicação de redes neurais artificiais na análise de séries temporais
econômico-financeiras. Tese (Doutorado em administação). Universidade de São Paulo, São
Paulo 2007.
PETERS, E. E. Fractal market analysis: applying chaos theory to investment and
economics. New York: Wiley, 1994.
REZENDE, S. O.; GARCIA, A. C. B.; EVSUKOFF, A. G. Sistemas inteligentes:
fundamentos e aplicações. Barueri SP: Manole, 525 p. 2003.
ROSS, S. A.; WESTERFIELD, R. W.; JAFFE, J. F. Administração financeira. São Paulo:
Atlas, 2002.
SOAREZ, F. FROZZA, R. PAZOS, R. E. de. Predição de séries temporais financeiras
utilizando wavelets e a rede neural TLFN distribuída. XXVIII Encontro Nacional de
Engenharia de Produção. Rio de Janeiro, p. 13-16, Out/2008.
SOUZA, S. R. S. ; TABAK, B. M.; CAJUEIRO, D. O. Investigação da memória de longo
prazo na taxa de câmbio no Brasil. Revista Brasileira de Economia, v. 60, p. 193-209, 2006.
SWALES, G. S.; YOON, Y. Applying artificial neural networks to investments analysis.
Financial Analysts Journal, v. 48, n. 5, p. 78-80, sep./oct. 1992.
TOFOLI, E. T. et al. A tecnologia das redes neurais para o apoio à decisão na administração
financeira. In: ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO, XXVIII,
Anais… Rio de Janeiro: ABEPRO, out. 2008. 14 p.
VALENÇA, M. Fundamentos das redes neurais: exemplos em Java. 2. ed. Olinda: Livro
Rápido, 2009.
VERGARA, S. C. Projetos e relatórios de pesquisa em administração. São Paulo: Atlas,
1998.
ZANETI JR, L. A. ALMEIDA, F. C. de. Exploração do uso de redes neurais na previsão
do comportamento de ativos financeiros. III Semead, Univeridade de São Paulo. São Paulo,
p. 21-23, Out/1998.
Download