ÁREA TEMÁTICA: FINANÇAS AUTORES FELIPE DIAS PAIVA Centro Federal de Educação Tecnológica de Minas Gerais - CEFET-MG [email protected] RODRIGO TOMAS NOGUEIRA CARDOSO Centro Federal de Educação Tecnológica de Minas Gerais - CEFET-MG [email protected] RICARDO PEREIRA REIS Universidade Federal de Lavras [email protected] ESTEVÃO FELIPE GOMES FINAMORA Centro Federal de Educação Tecnológica de Minas Gerais [email protected] PRECIFICAÇÃO DE UM ATIVO FINANCEIRO BASEADO EM REDES NEURAIS RESUMO: O presente trabalho aplicou a técnica de redes neurais (RN) para precificar um ativo financeiro do mercado acionário brasileiro, PETR4 (ação preferencial da Petrobrás). Porém, a fim de buscar um respaldo maior para o uso da RN, discutiu-se inicialmente o quão pertinente é o seu uso, pois muito se questiona a previsão de valores futuros de títulos mobiliários a partir de dados históricos. Assim, foi calculado o coeficiente de Hurst, tendo o mesmo indicado que a série temporal do ativo PETR4 não segue um movimento browniano, refutando dessa forma a hipótese de mercado eficiente (HME). Ou seja, a série do referido ativo financeiro possui uma memória de longo prazo. Acredita-se então, existir razões plausíveis para justificar o uso de um modelo baseado em redes neurais como método de precificação para PETR4. Assim, utilizou-se o período amostral de 01/08/2008 a 11/11/2010 para precificar ações preferenciais da Petrobrás. Os resultados alcançados pelo modelo foram bastante significativos, a melhor estrutura da rede produziu as seguintes medidas estatísticas de desempenho: erro médio quadrático (EMQ = 0,000459), coeficiente de explicação (76,20%), U de Theil (0,9595) e POCID (61,97%). ABSTRACT: This study applied the technique of neural networks (NN) to price a capital asset of the Brazilian stock market, PETR4 (preferred shares of Petrobras). However, in order to seek a deeper support for the use of NN, was initially discussed how relevant is their use as has often been asked to forecast future values of securities from historical data. Thus, we calculated the Hurst Coefficient, having the same series indicated that the asset PETR4 does not follow a Brownian motion, thus rejecting the efficient market hypothesis (EMH). That is, the series of financial asset that has a long-term memory. It is believed then there are reasonable grounds to justify the use of a model based on neural networks as a method of pricing for PETR4. Thus, we used the sample period from 01/08/2008 to 11/11/2010 for pricing preferred shares of Petrobras. The results achieved by the model were significant, the best NN structure produced the following statistical measures of performance: mean square error (RMSE = 0.000459), coefficient of determination (76.20%), U of Theil (0.9595 ) and POCID (61.97%). Palavras-chave: Redes neurais, Hipótese de Mercado Eficiente; Expoente de Hurst. 1. INTRODUÇÃO Poucos assuntos na área financeira geram tanta polêmica quanto a teoria do mercado eficiente. A hipótese de mercado eficiente tem capturado de forma intensa a atenção de muitos estudiosos. Esses, por sua vez, produzem constantemente uma série de estudos empíricos, a fim de testar as bases reguladoras da referida teoria. Vários estudos confirmam a sua existência, da mesma forma que um número considerável a contesta. Assim muito se questiona sobre a real possibilidade e capacidade de prognosticar o preço futuro de um ativo financeiro, tendo como ponto de partida dados históricos desse ativo. A temática inevitavelmente é um dos temas mais instigantes no estudo das finanças. Nos últimos anos, tem-se destacado os avanços das finanças computacionais como uma linha de pesquisa promissora, haja vista alguns resultados já apresentados. Mais especificamente, os resultados encontrados pelos modelos baseados na técnica de redes neurais artificiais. A rede neural artificial trata-se de uma técnica de inteligência artificial que estrutura sua dinâmica de processamento de dados inspirada na arquitetura do cérebro humano. Os estudos dessa técnica, em questões no âmbito das finanças, tem se mostrado bastante eficiente, principalmente em decorrência da possibilidade de se trabalhar com dados ruidosos (incompletos, inconsistentes e ambíguos), além de prever sistemas não lineares. […] o modelo linear pode não ser preciso o bastante para aplicação em mercados financeiros voláteis, nos quais podem ocorrer processos não lineares na evolução de dados. Movimentos lentos com aumento consistente dos preços dos ativos, seguidos por colapsos repentinos conhecidos como bolhas especulativas são comuns de acontecer. Dessa forma, o modelo linear pode falhar em capturar ou prever pontos de mudança acentuada nos dados. (LIMA et al., 2009, p. 38). Frente a este cenário, o presente trabalho propós aplicar a técnica de redes neurais para precificar um ativo financeiro do mercado acionário brasileiro. Porém, o estudo buscou inicialmente verificar o quão pertinente é o uso dessa técnica em problemas de natureza similar ao aqui proposto, pois muito se questiona a possibilidade prever valores futuros de títulos mobiliários com o uso de dados históricos. 2. MERCADO FINANCEIRO: aleatório ou previsível? O conceito de mercado eficiente protagoniza ainda hoje intensos debates na comunidade acadêmica. Inúmeros estudiosos já se dedicaram à procura de dados passados, que permitam explicar e inferir valores futuros do mercado acionário, possibilitando, assim, ganhos extraordinários. Contudo, apesar da grande quantidade de estudos, nada de revolucionário foi descoberto, o que faz com que a teoria de mercados eficientes se torne base para muitas outras teorias da administração financeira. Segundo Fama (1991), a hipótese de mercado eficiente se comprova quando os preços das ações refletem toda a informação disponível. Alexander, Sharper e Bailey (2000, p. 73) complementam afirmando que a market is efficient with respect to particular set of information if it is impossible to make abnormal profits (others than by chance) by using this set of information to formulate buying and selling decisions. De acordo com Brealey e Myers (1998, p. 323), caso o mercado de capitais seja eficiente, a compra ou venda de qualquer valor mobiliário ao preço vigente no mercado nunca será uma transação com valor presente líquido positivo. Ou seja, segundo os preceitos teóricos da HME, a tarefa de prever preços futuros tendo como base comportamentos passados de um ativo financeiro, é um procedimento ineficaz. Pois, a distribuição de uma série financeira denota de um movimento browniano, que é concebido por características randômicas e independentes. Contudo, tal como a base dos estudos do biólogo Robert Brown (a teoria dos movimentos browniano tem esse nome em sua homenagem), que trata do caminho aleatório de partículas macroscópicas num fluído, foi contestada pelas ideias conceituais dos fractais, a distribuição White Noise de uma série temporal de ativos financeiros também é questionada. Um dos estudos de maior impacto nessa área, é apresentado pelo americano Edgar E. Peters, que adaptou o modelo desenvolvido na metade do século XX por Harold E. Hurst, para avaliar o comportamento randômico de uma série temporal financeira. O estudo do hidrólogo Hurst, teve como cenário de discussão as cheias do Rio Nilo. Seu objetivo foi verificar se havia um padrão de memória ligada a esses eventos ou se estes acontecimentos não passavam de eventos aleatórios independentes. Esses estudos então, culminaram no desenvolvimento da estatística conhecida como Coeficiente de Hurst (H). Para aplicação do modelo em séries temporais financeiras, apresenta-se a seguir, os passos sugeridos por Peters (1994). 1o. Calcula-se o retorno logaritmo da série financeira. N i = ln(M it / M it −1 ) (2.1) Onde: Mit = representa o preço da ação i ao final do período t; Mit-1 = representa o preço da ação i no início do período t. 2o. Particiona-se a série financeira em frações temporais e calcula-se a média de cada conjunto de dados. ⎛⎛ 1⎞ n ⎞ ea = ⎜ ⎜ ⎟ * ∑ N k,a ⎟ ⎝ ⎝ n ⎠ k =1 ⎠ (2.2) ea = valor médio do log retorno do ativo financeiro n = número de elementos por partição 3o. Calcular o desvio acumulado de cada série particionada. k X k,a = ∑ (N i,a − ea ) (2.3) j =1 Onde, cada retorno de uma série particionada (Ia) possui um grupo de retornos do ativo, representado por k = 1, 2, 3, ..., n. Xk,a = desvios acumulados em relação a ea 4o. Verificar quais são os pontos máximos e mínimos do conjunto Ia. Seguido da diferença entre estes. RIa = max(X k,a ) − min(X k,a ) (2.4) enquanto que, 1 ≤ k ≤ n 5o. Calcula-se o desvio-padrão de cada partição. 2⎞ ⎛⎛ 1⎞ SIa = ⎜ ⎜ ⎟ ∗ ∑ ( N k,a − ea ) ⎟ ⎝ ⎝ n ⎠ k =1 ⎠ n 1 2 (2.5) SIa = desvio padrão de cada partição 6o. A série A valores RIa é normalizada dividindo estes valores de amplitude pelos correspondentes desvios padrões SIa. A média destes valores padronizados mantém a relação entre H e n. ( ⎛ R⎞ ⎛ 1⎞ A = ⎜⎝ ⎟⎠ ⎜ ⎟ * ∑ RI / SI S n ⎝ A ⎠ a =1 a a ) (2.6) 7o. Para concluir o processo de mensuração do expoente de Hurst, calcula-se uma regressão linear simples, atribuindo como variável dependente ln R/Sn e variável independente ln n. Os passos de 1 a 6 devem ser repetidos várias vezes, mas com tamanhos de partições diferentes, até que haja um número suficiente de dados para calcular a regressão e que a série tenha sido calculada numa ordem decrescente de partições, até o momento em que toda a série limite-se há 02 partições apenas. ln (R/S)n = ln a + b * ln (n) (2.7) Onde: a = intercepto; b = coeficiente de Hurst Calculado o expoente Hurst, ter-se-á as seguintes possibilidades de resultado: 0 < H < 0,5: série antipersistente, há uma probalidade maior que 50% de um valor negativo ser precedido de um positivo; H = 0,5: série apresenta randon walk; H > 0,5: série persistente, há probabilidade de repetição de um valor concentra acima dos 50%. Sendo assim, justifica-se precificar ativos financeiros com base em dados históricos, quando o coeficiente de Hurst indicar um valor diferente de 0,5. 3. SISTEMAS INTELIGENTES A complexidade de problemas que emanam à tomada de uma decisão com opções excludentes, aliado aos avanços da área computacional de processamento de dados, têm estimulado o desenvolvimento de pesquisas que abordam técnicas de inteligência artificial, que por sua vez, têm apresentado resultados bastante significativos, com aplicação em diversas áreas do conhecimento. É importante ressaltar que, apesar do nome “inteligência computacional” instigar a suspeita de leitores não familiarizados com a temática, de que trata-se de uma abordagem teórica recente, dado o nome evocar uma ideia de visão futurista. Esclarece-se que as primeiras pesquisas na referida área, remontam a década de 1940, onde estudos iniciais a respeito de máquinas de aprendizagem contribuíram para primeira representação do neurônio artificial e a criação da regra de aprendizagem, que culminaram na criação das redes neurais artificiais. Segundo Narain e Narain (2002), o conceito de rede neural artificial foi desenvolvido nas décadas de 1940 e de 1950, porém este apenas foi apresentado à comunidade científica pela primeira vez em 1956, na Dartmouth Conference. Apesar de John McCarthy ser considerado o “pai” da teoria das redes neurais, credita-se ao matemático inglês Alan Turing, o primeiro trabalho de impacto nesta área. Mas, por que o termo inteligência artificial? De acordo com Negnevitsky (2002), inteligência artificial é uma ciência que se dedica a construir hardware e software com capacidade de processamento e tomada de decisão inteligente, com desempenho similar ao de um ser humano. Assim, inteligente refere-se a habilidade para aprender e entender determinada situação. Entre os sistemas inteligentes, encontram-se as redes neurais, que procuram emular o funcionamento do cérebro humano. Essa técnica tem despertado a atenção de inúmeros pesquisadores da área das finanças. Prova disso é o crescente número de trabalhos que têm abordado a referida temática, no intuito de explorar suas potencialidades para resolver problemas de grande complexidade. A previsão de preço de ativos financeiros, por exemplo, é um dos temas mais intrigantes da gestão financeira, objeto de aplicação de inúmeros modelos, na tentativa de encontrar uma técnica que consiga projetar, nos preços de um ativo, situações de risco e oportunidade às quais ele está exposto. Dessa forma, a técnica de redes neurais tem sido alvo de pesquisas que exploram a temática de precificação de ativos financeiros. 3.1. Redes neurais De acordo com Tofoli et al. (2008), a técnica de redes neurais objetiva simular o funcionamento do cérebro humano, no que tange à sua dinâmica de processamento de dados, sendo ela capaz de reconhecer padrões, extrair regularidades e detectar relações subjacentes em um conjunto de dados aparentemente desconexos, além de ser possuir habilidades para operar com dados ruidosos, incompletos ou imprecisos, e de prever sistemas não-lineares, o que torna a sua aplicação no setor financeiro bastante eficiente. Swales e Yoon (1992, p. 82) destacam que, justamente por comporem o rol de técnicas de inteligência artificial, um dos principais pontos fortes das redes neurais artificiais é a habilidade para aprender, learning is a function of interative processing aimed at minimizing predictive erros. Os erros constituem a diferença entre as saídas atuais e as saídas projetadas. De acordo com Haykin (2001, p. 23), redes neurais podem ser definidas como: [...] um processador maciçamente e paralelamente distribuído, constituído de unidades de processamento simples, que têm a propensão natural para armazenar conhecimento experimental e torná-lo disponível para uso. Ela assemelha-se ao cérebro humano em dois aspectos: (1) o conhecimento adquirido pela rede, a partir de seu ambiente, através de um processo de aprendizagem; (2) as forças de conexão entre neurônios (os pesos sinápticos) são utilizadas para armazenar o conhecimento adquirido. Segundo Freitas (2001), tal como o cérebro humano, as redes neurais são formadas a partir de um conjunto de unidades de processamento interligadas entre si, conhecidas como neurônios. Cada neurônio tem uma função de ativação, permitindo que, a partir de um valor recebido como entrada e do valor já armazenado internamente, seja gerado um valor de saída, que será transmitido ao neurônio seguinte. Em uma rede neural, a cada conexão que liga um neurônio a outro é atribuído um peso, chamado de peso sináptico. Durante o processo de aprendizagem, os pesos dados a cada conexão vão se ajustando até que se chegue a um conjunto de valores de pesos que, aplicados aos valores de entrada de cada neurônio, resultem em respostas satisfatórias ao problema estudado. Em um neurônio artificial, também é comum a presença de um parâmetro, conhecido como bias, que permite a calibragem do sinal de saída. Pode-se visualizar este esquema a partir da Figura 1. FIGURA 1 - Modelo de neurônio artificial Fonte: Freitas (2001, p. 35) Sendo, X1 = X2 = X3: valores de entradas (input); Yi: valor de saída (output); w1 = w2 = w3: pesos sinápticos; B: bias; ν: potencial de ativação; ϕ (.): função de ativação. Matematicamente, o funcionamento de um neurônio pode assim ser descrito: Yi = ϕ (u + B) em que, m u = ∑ (w j * X j ) ; ν = u + B j =1 Existem diferentes topologias de redes neurais, entre as principais estão: a) redes alimentadas adiante com camada única: essa estrutura consiste num modelo de camada única, apenas a saída. Não significa que não há neurônios de entrada, mas esses não são efetivamente contabilizados como camada, uma vez que não há transformações computacionais nesta fase. Sua maior aplicabilidade centra no reconhecimento de padrões linearmente separáveis, o que acaba por restringir bastante o seu uso; b) redes alimentadas diretamente com múltiplas camadas: como o próprio nome sugere, esse tipo de rede é caracterizado por utilizar uma ou mais camadas ocultas (hidden layer) de neurônios. A principal função dos neurônios ocultos é intervir no ajuste da entrada, no intuito de produzir uma saída mais fidedigna da realidade; c) redes recorrentes: esse modelo se distingue dos demais por receber um sinal de entrada advindo das saídas, ou seja, tem-se aqui um processo de realimentação. De acordo com Haykin (2001), o processo de autorrealimento delineia uma situação em que a saída de um neurônio é reaproveitada no processo recorrente de entrada. Outro ponto que merece ser explicitado refere-se aos modelos de função de ativação, que são: função linear, sigmoidal logística, tangente hiperbólica e degrau. Vide Figura 2 abaixo. FIGURA 2 – Funções de ativação Fonte: Adaptado Haykin (2001) Sendo: (a) Função linear; (b) Função sigmoidal logística; (c) Função tangente hiperbólica, (d) Função degrau. Com a utilização das funções de ativação, com exceção da função linear, o Yi passa por mais uma transformação numérica da seguinte forma: Função degrau Função tangente hiperbólica Yi = −Yi 1− e 1+ e−Yi Função sigmoidal logística 1 Yi = 1− e−Yi De acordo com Másson e Wang1 (1990) apud Mueller (1996), a função de ativação corresponde a um limiar que restringe a propagação do impulso nervoso à transposição de um certo nível de atividade, entre a saída do sinal de uma camada para outra. Seu papel será mapear e filtrar o potencial da unidade de processamento (v) para um intervalo préespecificado de saída. Outro ponto de destaque, talvez o mais importante na estrutura teórica das redes neurais, refere-se à habilidade de aprender. Nenhuma rede neural nasce pronta; seu desempenho dependerá, obviamente, dos códigos de programação que a compõem, até porque ele é que determinará todo o fluxo de ação e estrutura, mas o processo de aprendizado é item determinante para a acurácia das saídas. O resultado final dessa rede será potencializado por meio do aprendizado. Segundo Haykin (2001, p. 75), aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo de estimulação pelo ambiente no qual a rede está inserida. Em síntese, o uso do conceito de redes neurais para solução de um problema, requer, antes de qualquer coisa, que se defina a arquitetura que esta rede irá trabalhar. Para Braga, Carvalho e Ludermir (2007), definir a arquitetura de uma rede neural significa determinar a estrutura sobre o qual os neurônios da rede estarão organizados. 3.1.1. Perceptron de múltiplas camadas A discussão da rede neural de múltiplas camadas será aqui abordada com mais detalhes, haja vista que esse foi o modelo utilizado na presente pesquisa. Assim, conforme já destacado, a rede de camadas múltiplas ou multilayer perceptron (MLP) tem, além dos neurônios de entrada e saída, uma ou mais camadas ocultas. 1 MÁSSON, Egill; WANG, Yih-Jeou. Introduction to computation and learning in artificial neural networks. European Journal of Operational Research, North-Holand , 47, 1990. p. 1 - 28. A existência da camada escondida torna o treinamento da rede mais difícil, pois não se sabe o erro médio quadrático (EMQ) associado aos pesos a cada camada. Para o treinamento dessa rede, utiliza-se um algoritmo conhecido como backpropagation. Esse algoritmo baseia-se na regra de aprendizagem por correção de erro, em que o valor do EMQ encontrado na camada de saída é propagado para a camada de entrada, por meio de cálculo da sensibilidade, no intuito de ajustar os pesos na camada intermediária. Portanto, o cálculo de uma saída para a MLP se dá em duas etapas, a primeira com a propagação normal (da camada de entrada para a camada de saída) e a segunda, a de retropropagação do erro (da camada de saída para a camada de entrada) (BRAGA; CARVALHO; LUDEMIR, 2007). Usa-se a equação de ajuste abaixo, em que δ é a sensibilidade em função da agora saída calculada yj; η é a constante de momentum que auxilia no aumento da velocidade de aprendizagem e α é a taxa de aprendizagem e t o ciclo. wij (t+1) = wij (t) + η δj (t) + α (wij (t) – wij (t-1)) A determinação de pesos ótimos para qualquer problema estudado caracteriza o fit, que significa dar a modelagem mais precisa possível ao problema estudado, observada sua complexidade. Dessa forma, overfitting e underfitting são modelagens que superestimam a complexidade do problema, retornando pesos com excessiva precisão e que subestimam a complexidade do problema, retornando pesos com baixa precisão, respectivamente. Ambos os casos, overfitting e underfitting, são modelagens enviesadas do problema. Em síntese, Haykin (2001) destaca três as características marcantes da rede MLP: a) o uso de funções de ativação não-lineares, funções estas não-lineares suaves, não havendo transmissão abrupta de sinal; b) o uso de uma ou mais camada oculta de neurônios, habilitando a rede por sua vez a aprender tarefas mais complexas; c) rede com alto grau de conectividade, determinado pelas sinapses da estrutura. 4. METODOLOGIA Para a classificação da pesquisa, foram tomados como base os critérios apresentados por Vergara (1998), que qualifica a pesquisa em relação a duas vertentes: quanto aos fins e quanto aos meios. Quanto aos fins, consistiu em uma pesquisa conclusiva, pois é um tipo de pesquisa que testa hipóteses e examina relações específicas entre variáveis. Quanto aos meios, trata-se de uma pesquisa ex-post-facto e bibliográfica. A investigação é expost-facto, em função de se referir a um fato já ocorrido. Conforme Vergara (1998), esse tipo de investigação é recomendado quando o pesquisador não pode controlar ou manipular variáveis, porque suas manifestações já ocorreram, pois as variáveis não são controláveis. Para Gil (1989), na pesquisa ex-post-facto, a manipulação das variáveis independentes é impossível, pois estas chegam até o pesquisador já prontas. É também bibliográfica porque recorreu-se ao uso de materiais acessíveis ao público em geral, como livros, artigos, notícias, cotações de ações e índices de mercado. A essência investigativa do presente trabalho é a pesquisa quantitativa que, segundo AlvesMazzotti e Gewandsznajder (2001), é um método de investigação que torna os conceitos mais precisos, além de dar mais informações sobre os fenômenos, devido ao rigor estatístico na análise dos dados coletados. Para a elaboração deste trabalho, foram utilizadas como objeto de estudo a série temporal das ações preferenciais da empresa Petróleo Brasileiro S/A (Petrobrás – PETR4). Portanto, trabalhou-se com uma amostra não probabilística intencional. A escolha pela Petrobrás para ancorar a pesquisa, deveu-se ao fato de suas ações possuírem alta liquidez e representatividade frente ao mercado de capitais brasileiro. Para tratamento quantitativo dos dados, bem como elaboração dos gráficos, recorreu-se aos softwares Matlab e Gretl. 4.1. Expoente de Hurst Para cálculo do expoente de Hurst foi utilizado uma série financeira de 2.700 observações, acolhendo assim recomendações de Feder2 (1988) apud Souza, Tabak e Cajueiro (2006), que sugere uma quantidade mínima de 2.500 observações. A série contempla o período de 03/01/2000 a 25/11/2010. As informações foram conseguidas por meio do banco de dados da Economática, sendo que as cotações diárias foram ajustadas (dividendos, bonificações, split e implit). 4.2. Modelo de previsão baseado em redes neurais Para construção do modelo de previsão baseado em redes neurais do ativo financeiro PETR4, foi utilizado séries temporais diárias do referido ativo e do índice da bolsa de valores de São Paulo no período de 01/02/2008 a 11/11/2010, obtidas também a partir do banco de dados da Economática. Optou-se por trabalhar com um horizonte temporal mais reduzido, se comparado com aquele utilizado no cálculo do coeficiente de Hurst, uma vez que simulações realizadas indicam não haver resultados superiores dado séries maiores. Está observação aplica-se, a priori, para o caso aqui estudado e de configurações de rede também similares. A série foi composta de 708 observações e dividida em duas partes, 637 pontos foram utilizados na primeira etapa dos testes, sendo novamente divididos em treinamento, teste e validação, cujos percentuais das observações foram 80, 10 e 10, respectivamente. E os outros 71 pontos foram utilizados para simular a rede treinada, projetando assim os preços futuros do ativo. Todos os dados na rede foram transformados para base logarítmica ou foram calculados a partir de dados assim alterados. Essa medida foi adotada no intuito de harmonizar os dados na rede. A taxa de aprendizagem adotada foi de 0,1. Com relação a função de ativação, na primeira e segunda camada intermediária e na camada de saída, as funções de ativação foram sigmoidal logística, tangente hiperbólica e linear, respectivamente. Nesta etapa verificou-se o valor do erro médio quadrático (EMQ). Os testes foram realizados com 5, 8 e 9 neurônios de entrada, sendo estes as cotações diárias de abertura, fechamento, máximo e mínimo; Ibovespa; média móvel de 21 dias do valor de fechamento do ativo; valores baseados na formação de um candlestick, são eles: sombra superior, corpo e sombra inferior. 2 FEDER, J. Fractals. New York: Plenum Press, 1988. Na etapa de simulação das projeções, foi empregado o uso de algumas técnicas para avaliação do modelo, a fim de apurar o quanto ajustado a rede ficou para tomar decisões assertivas. Os indicadores utilizados foram U de Theil, percentage of change in direction (POCID), coeficiente de explicação (R²), além do EMQ. O teste U de Theil indica o quanto os resultados estão melhores que a previsão trivial, que diz que a melhor estimativa para o preço de amanhã é o preço de hoje, (ABELÉM, 1994). Qualquer valor inferior a 1 indica que é melhor usar a projeção do que se ater à previsão trivial. O cálculo é feito da seguinte forma: n U= ∑(d i − yi ) 2 i =1 (4.1) n ∑(d i − di −1 ) 2 i =1 O cálculo do POCID, mede a previsão em termos de mudanças de sinais, não deve ser confundido com uma medida de exatidão da previsão, mas deve ser visto como uma indicação do quanto a previsão acompanhou a tendência da série real (ABELÉM, 1994). Amorim Neto (2008) afirma que essa métrica de desempenho é de grande importância para as aplicações feitas no mercado de ações, pois pode-se assim medir as subidas e descidas das cotações. O cálculo é feito da seguinte forma: POCID = 1 n ∑ ai n i =1 (4.2) O cálculo do R² indica o quanto as previsões estão próximas dos valores reais, quanto mais próximo de 1 melhor é a previsão realizada (VALENÇA, 2009). ⎛ COVd, y ⎞ R2 = ⎜ ⎟ ⎝ σd *σy ⎠ 2 (4.3) Segundo Amorim Neto (2008), o EMQ não fornece uma visão completa e livre de dúvidas sobre o desempenho do modelo, sendo assim é importante avaliar um modelo com outras métricas que possibilitem melhores visões e conclusões. O EMQ pode ser obtido através da seguinte expressão: 1 n (4.4) EMQ = ∑ (di − yi )2 n i =1 5. RESULTADOS Inicia-se à apresentação dos resultados da pesquisa pela exposição do gráfico da série financeira das ações preferenciais da Petrobrás. O Gráfico 1 indica os valores diários de fechamento do ativo PETR4, no período de 03/01/2000 a 25/11/2010. A série apresenta que o valor mínimo atingiu R$ 2,95 na data de 14/02/2002, patamar esse, próximo do valor do início da análise, que era de R$ 3,48. A cotação com maior valor de fechamento, alcançou o preço de R$ 47,10, uma valorização de aproximadamente 1.250% para um período de cerca de 8 anos. Uma queda acentuada do valor da PETR4 foi também sentida. GRÁFICO 1 – Valor de fechamento PETR4 – Jan/2000 a Nov/2010 Fonte: Dados da pesquisa (2011) O passo seguinte foi converter as variáveis de input e target para a base ln. Para que, na sequência fosse calculado os retornos da série (vide fórmula 2.1). Nota-se pelo Gráfico 2, que perdas e ganhos concentram seus valores no intervalo entre -15% e 15%. GRÁFICO 2 – Ln retorno Valor de fechamento PETR4 – Jan/2000 a Nov/2010 Fonte: Dados da pesquisa (2011) Ainda com o objetivo de mensurar o coeficiente de Hurst, os dados foram submetidos às fórmulas listadas em 2.2 a 2.6. O resultado dos cálculos, processados a partir das fórmulas indicadas, são aqui apresentados por meio da Tabela 1. TABELA 1 Valores para a estimativa do expoente de Hurst n (R/S)n n (R/S)n 3 1,35114 60 8,59684 4 1,66833 75 10,39153 5 1,95450 10,78555 90 6 2,20862 100 11,86925 10 3,10308 108 11,92090 12 3,48759 135 13,89568 15 3,98726 14,60230 150 4,45389 180 15,70610 18 4,68893 225 16,17640 20 25 5,40150 270 18,25039 27 5,71938 300 18,61291 30 6.02337 450 24,72970 36 6,67582 540 27,96025 45 7,66020 675 29,21204 50 8,20719 900 32,88216 1350 44,27773 54 8,70719 Fonte: Dados da pesquisa (2011) Os resultados da Tabela 1, foram na sequência linearizados, a fim de que se utilize o modelo de regressão linear simples, resultando assim na indicação do coeficiente de Hurst. Lembrando que, o ln do número de observações por partição (n) foi utilizado como variável independente e o ln da estatística R/Sn como variável dependente. Processada a regressão, os resultados são apresentados por meio da Figura 6. FIGURA 6 – Resultados do modelo de regressão utilizado para cálculo do expoente de Hurst Fonte: Dados da pesquisa (2011) Como pode-se notar por meio da análise da Figura 6, os parâmetros do modelo de regressão são significativos para um intervalo de confiança de 99%. Além de atender os preceitos exigidos de homocedasticidade e normalidade dos resíduos, acrescenta-se o fato da variável independente (n) explicar 99,39% das variações da variável dependente (R/Sn). Especificamente no que tange o resultado do expoente de Hurst, deduz que a série do ativo PETR4 apresenta um comportamento persistente, um vez que H = 0,5515. Ou seja, a série temporal das ações preferenciais da Petrobrás, no período analisado, não atende ao preceito básico da hipótese de mercado eficiente, o “passeio aleatório” e independente da distribuição. Uma vez que, os resultados indicam que é possível identificar padrões de comportamento da série temporal do ativo PETR4, logo conclui-se que há uma memória de longo prazo presente na série. Dado o resultado do expoente de Hurst, o objetivo de precificar um ativo financeiro com base em dados passados, tem seu grau de pertinência elevado. Desta forma, o modelo proposto baseado na técnica de redes neurais MLP, iniciou-se à averiguação da estrutura que melhor se adéqua ao conjunto de dados disponíveis. Para isso, foram testados configurações para as camadas intermediárias contendo de 1 a 20 neurônios. Os resultados alcançados são apresentados na Tabela 2 e referem-se a implementação da rede para os pontos reservados à simulação, conforme destacado no capítulo da metodologia do trabalho. TABELA 2 Resultados dos testes de configuração da rede neural Estrutura Arquitetura EMQ U de Theil POCID I 5 1 1 1 0,000497 0,998300 0,493000 II 5 2 4 1 0,000495 0,996800 0,549300 III 5 3 1 1 0,000481 0,982700 0,535200 IV 5 4 3 1 0,000495 0,996300 0,535200 V 5 4 4 1 0,000482 0,983600 0,591500 VI 5 5 1 1 0,000469 0,970200 0,549300 VII 5 5 3 1 0,000499 0,999700 0,563400 VIII 5 6 1 1 0,000491 0,992200 0,507000 IX 5 6 2 1 0,000487 0,988800 0,549300 X 5 6 3 1 0,000450 0,950000 0,507000 XI 8 1 1 1 0,000483 0,984400 0,549300 XII 8 2 1 1 0,000497 0,998600 0,535200 XIII 8 2 2 1 0,000483 0,983800 0,563400 XIV 8 3 1 1 0,000471 0,971800 0,563400 XV 8 4 2 1 0,000468 0,968900 0,605600 XVI 9 1 1 1 0,000471 0,971500 0,521100 XVII 9 2 1 1 0,000482 0,983800 0,549300 XVIII 9 4 2 1 0,000474 0,975300 0,549300 XIX 9 5 2 1 0,000494 0,994900 0,563400 XX 9 6 6 1 0,000459 0,959500 0,619700 Fonte: Dados da pesquisa (2011) R² 0,754800 0,753000 0,756100 0,758700 0,753500 0,750100 0,761100 0,755300 0,754000 0,763300 0,759200 0,762800 0,763800 0,763300 0,753700 0,762600 0,756500 0,754100 0,758700 0,762000 Algumas explicações para melhor compreensão da Tabela 2 tornam-se necessárias. A coluna referente a arquitetura do modelo deve ser assim interpretada: 1a. coluna indica número de neurônios de entrada, 2a. e 3a. coluna número de neurônios nas camadas intermediárias e 4a. coluna que indica o número de neurônios na saída do modelo. As configurações dos neurônios de entrada foram assim sistematizadas: a) 05 neurônios: cotações diárias do ativo PETR4 posições de abertura, fechamento, máximo e mínimo; Ibovespa. b) 08 neurônios: cotações diárias de abertura, fechamento, máximo e mínimo; Ibovespa; valores baseados na formação de um candlestick, são eles: sombra superior, corpo e sombra inferior. c) 09 neurônios: cotações diárias de abertura, fechamento, máximo e mínimo; Ibovespa; média móvel de 21 dias do valor de fechamento do ativo; valores baseados na formação de um candlestick, são eles: sombra superior, corpo e sombra inferior. Com referência aos resultados dispostos na Tabela 2, destaca-se aqui as estruturas V, XV e XX. Sendo que, a estrutura XX pode ser ressaltada como a rede que melhor melhores índices de performance. Pois, o erro médio quadrático apresentou um valor baixo (EMQ = 0,000459), que em termos percentuais indica que o modelo tem errado em média 0,12%, se comparado o valor desejado e o calculado. No que tange a estatística do U de Theil, tem-se o indicativo que o modelo aqui delineado possui resultados melhores que decisões triviais de projeção (U de Theil < 1). Já o resultado do POCID indica que em 61,97% das reversões de tendência são acompanhadas pelo modelo proposto. Quanto ao coeficiente de explicação (R2) do preço de fechamento, tem-se que a estrutura delineada é capaz de explicar em média 76,20% dos resultados da projeção. Para uma visualização complementar dos resultados alcançados, indica-se que seja observado o Gráfico 3. Note que a escala do eixo de precificação do ativo está numa base logarítmica, com variação de 0,05. GRÁFICO 3 – Resultados esperados e desejados da arquitetura 9x6x6x1 (Estrutura XX) Fonte: Dados da pesquisa (2011) 6. CONSIDERAÇÕS FINAIS O artigo foi elaborado com o objetivo de analisar o desempenho de um modelo de precificação de ativos financeiros baseado em redes neurais, utilizando para tanto dados históricos. Inicialmente essa proposta é rechaçada a luz da hipótese de mercado eficiente, que defende a ideia de “passeios aleatórios dos dados”. Porém, essa é uma teoria fortemente contestada por inúmeras pesquisas já realizadas. Assim, avaliou-se a HME, tendo como aporte teórico o coeficiente de Hurst. Os resultados indicam que a série temporal do ativo PETR4 possui uma memória de longo prazo. Ou seja, é possível identificar padrões de comportamento na cotação dos preços do referido ativo. Estabelecendo, desta forma, condições básicas e desejáveis para que se utilize dados passados como estratégia de precificação de títulos mobiliários. Desta forma, o modelo estruturado a partir da técnica de redes neurais para precificar o ativo PETR4, recebeu contornos mais consistentes e confiáveis. Pode-se inferir que os resultados do modelo em questão apresentaram resultados bastante satisfatórios, considerando os parâmetros avaliativos utilizados. Sendo que, a rede adaptou-se bem à uma arquitetura com números mais elevados neurônios de entrada e intermediários. A título de comparação, os mesmos dados de entrada utilizados na melhor das arquiteturas (9x6x6x1), foram aplicados num modelo de regressão linear múltipla. Sendo que, as entradas da rede neural passaram aqui a ser tratadas como variáveis indepentendes. Contudo, não foi possível obter dados para comparação, uma vez que os parâmetros do modelo não são significativos para um nível de confiança de 95%. Conclui-se então, ensejando que o uso da técnica de redes neurais em pesquisas no âmbito das finanças possui ainda muito campo a ser explorado. Assim, os autores do presente artigo tem trabalhado com problemas na área de mercado de capitais que utilizem técnicas híbridas de inteligência computacionais, estruturas mais sofisticadas de redes, além do simples uso e tratamento de outras variáveis exógenas para compor modelos. REFERÊNCIAS ABELÉM, A. J. G. Redes neurais artificiais na previsão de séries temporais. Dissertação (Mestrado em engenharia elétrica). Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 1994. ALEXANDER, G. J.; SHARPER, W. F.; BAILEY, J. V. Fundamentals of investments. 3rd. ed. New Jersey: Prentice Hall, 2000. ALVES-MAZZOTTI, A. J.; GEWANDSZNAJDER, F. O método nas ciências naturais e sociais: pesquisa quantitativa e qualitativa. 3. ed. São Paulo: Pioneira, 2001. AMORIN NETO, M. C. de. Previsão séries temporais usando séries exógenas e combinação de redes neurais aplicada ao mercado financeiro. Dissertação (Mestrado em ciência da computação). Universidade Federal de Pernambuco, Pernambuco, 2008. BRAGA, A. de P.; CARVALHO, A. P. de L. F. de; LUDEMIR, T. B. Redes neurais artificiais: teoria e aplicações. Rio de Janeiro: LTC, 2007. BREALEY, R. A.; MYERS, S. C. Princípios de finanças empresariais. 5. ed. Lisboa: McGraw-Hill de Portugal, 1998. COELHO, L. dos S.; SANTOS, P. A. A.; COSTA JR., N. C. A. da C. Podemos prever a taxa de câmbio brasileira? Evidência empírica utilizando inteligência computacional e modelos econométricos. Gestão da Produção, São Carlos, v. 15, n. 3, p. 635-647, set.-dez. 2008. FAMA, E. F. Efficient capital markets: II. Journal of Finance, Oxford, v. 46, n. 5, p. 15751617, dec. 1991. FREITAS, A. A. C. de.; SILVA, I. N. da. Análise técnica de títulos financeiros através de redes neurais artificiais. IV Congresso Brasileiro de Redes Neurais - ITA, São José dos Campos, p. 67-71, Jul/1999. FREITAS, S. O. Utilização de um modelo baseado em redes neurais para a precificação de opções. 2001. Dissertação (Mestrado em Administração) – Faculdade de Ciências Econômicas, UFMG, Belo Horizonte. GIL, A. C. Como elaborar projetos de pesquisa. 2. ed. São Paulo: Atlas, 1989. HAYKIN, S. Redes neurais: princípios e prática. 2. ed. Porto Alegre: Bookman, 2001. MATSUMOTO, E. Y. Aplicação de redes neurais na classificação de rentabilidade futura de empresas. Dissertação (Mestrado em economia). Fundação Getúlio Vargas, São Paulo, 2008. MUELLER, A. Uma aplicação de redes neurais artificiais na previsão do mercado acionário. 1996. Dissertação (Mestrado em engenharia da produção). Universidade Federal de Santa Catarina, Florianópolis, 2006. NARAIN, L. S.; NARAIN, R. L. Stock market prediction: a comparative study of multivariate statistical and artificial neural network models. Journal of Accounting and Finance Research, v. 10, n. 2, p. 85-94, summer 2002. NEGNEVITSKY, M. Artificial intelligence: a guide to intelligent systems. 2nd. ed. Essex: Pearson, 2005. OLIVEIRA. M. A de. Aplicação de redes neurais artificiais na análise de séries temporais econômico-financeiras. Tese (Doutorado em administação). Universidade de São Paulo, São Paulo 2007. PETERS, E. E. Fractal market analysis: applying chaos theory to investment and economics. New York: Wiley, 1994. REZENDE, S. O.; GARCIA, A. C. B.; EVSUKOFF, A. G. Sistemas inteligentes: fundamentos e aplicações. Barueri SP: Manole, 525 p. 2003. ROSS, S. A.; WESTERFIELD, R. W.; JAFFE, J. F. Administração financeira. São Paulo: Atlas, 2002. SOAREZ, F. FROZZA, R. PAZOS, R. E. de. Predição de séries temporais financeiras utilizando wavelets e a rede neural TLFN distribuída. XXVIII Encontro Nacional de Engenharia de Produção. Rio de Janeiro, p. 13-16, Out/2008. SOUZA, S. R. S. ; TABAK, B. M.; CAJUEIRO, D. O. Investigação da memória de longo prazo na taxa de câmbio no Brasil. Revista Brasileira de Economia, v. 60, p. 193-209, 2006. SWALES, G. S.; YOON, Y. Applying artificial neural networks to investments analysis. Financial Analysts Journal, v. 48, n. 5, p. 78-80, sep./oct. 1992. TOFOLI, E. T. et al. A tecnologia das redes neurais para o apoio à decisão na administração financeira. In: ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO, XXVIII, Anais… Rio de Janeiro: ABEPRO, out. 2008. 14 p. VALENÇA, M. Fundamentos das redes neurais: exemplos em Java. 2. ed. Olinda: Livro Rápido, 2009. VERGARA, S. C. Projetos e relatórios de pesquisa em administração. São Paulo: Atlas, 1998. ZANETI JR, L. A. ALMEIDA, F. C. de. Exploração do uso de redes neurais na previsão do comportamento de ativos financeiros. III Semead, Univeridade de São Paulo. São Paulo, p. 21-23, Out/1998.