DISTRIBUIÇÕES DE PARETO ESTÁVEIS: APLICAÇÃO AOS ÍNDICES PSI20, DAX E DJIA J. J. Dias Curto* ABSTRACT A normalidade das taxas de rendibilidade dos activos financeiros constitui uma das hipóteses mais importantes dos modelos clássicos da Teoria Financeira. Contudo, na maior parte dos estudos realizados, constatou-se que as distribuições empíricas evidenciam um excesso de curtose em relação à distribuição normal. Este facto contribuíu para o aparecimento de várias alternativas para modelizar a distribuição não condicionada das taxas de rendibilidade dos activos financeiros e as distribuições de Pareto estáveis têm sido utilizadas com alguma frequência. Neste estudo pretendemos analisar a adequabilidade deste tipo de distribuições às taxas de rendibilidade de três índices bolsistas: PSI20, DAX e DJIA. Palavras-chave: Pareto, estável, Bachelier, Osborne, Cauchy, Lévy e leptocurtose. *Assistente convidado no Instituto Superior de Ciências do Trabalho e da Empresa (ISCTE). E-mail: [email protected] 1. Introdução A normalidade da distribuição das taxas de rendibilidade dos activos financeiros, calculadas a partir da variação logarítmica dos preços1, é um dos pressupostos mais importantes dos modelos clássicos da Teoria Financeira nomeadamente, a Teoria da Carteira, o modelo CAPM e a fórmula de Black-Scholes. Para a aceitação generalizada da hipótese da normalidade foram determinantes o modelo do passeio aleatório proposto por Bachelier em 1900 e o teorema do Limite Central. Para a teoria do passeio aleatório, as variações sucessivas no logaritmo do preço dos activos financeiros são variáveis aleatórias independentes e identicamente distribuídas (IID) e, segundo o teorema do Limite Central, a soma estandardizada de variáveis aleatórias IID com variância finita converge para a distribuição normal padrão à medida que o número de variáveis tende para infinito. Uma vez que as taxas de rendibilidade de frequência mais reduzida são iguais à soma das taxas de rendibilidade de frequência mais elevada, pode-se concluir, quando a variância é finita e o processo gerador dos dados é um passeio aleatório, que as taxas de rendibilidade diárias, semanais e mensais têm distribuição normal. Apesar da normalidade constituir uma das hipóteses mais importantes da Teoria Financeira clássica, na maior parte dos estudos realizados constatou-se que as distribuições empíricas (pelo menos quando a frequência dos dados é elevada) são leptocúrticas, isto é, apresentam um maior número de observações no centro e nas abas quando comparadas com a distribuição normal. Este facto estilizado das distribuições empíricas contribuiu para o aparecimento de várias alternativas à distribuição normal para modelizar o excesso de curtose das distribuições dos dados de natureza monetária e financeira. Ao longo do tempo vários autores admitiram que as taxas de rendibilidade dos activos financeiros são geradas a partir de uma distribuição leptocúrtica fixa. Por conseguinte, uma distribuição teórica com estas características deveria ser o modelo mais adequado para descrever as taxas de rendibilidade dos activos financeiros. Neste estudo ensaiamos as distribuições de Pareto estáveis propostas inicialmente por Mandelbrot (1963) e Fama (1965) e o objectivo principal é analisar a adequabilidade destas distribuições para descrever as taxas de rendibilidade dos índices mais representativos dos mercados de capitais português, alemão e americano. A escolha destes mercados é justificada pelo nível de desenvolvimento e respectiva dimensão: um mercado recente e pouco desenvolvido como é o caso português, um mercado intermédio em termos de história e de desenvolvimento (mercado alemão) e um mercado altamente desenvolvido e já bastante antigo como é o mercado americano. Os dados que vamos considerar são as taxas de rendibilidade diárias (calculadas a partir das variações logarítmicas) de cada um dos três índices: PSI20, DAX e DJIA2. O período de análise compreende nove anos de observações: de 31-12-1992 a 31-12-2001 e a data inicial coincide com a criação do índice PSI20 no mercado de capitais português. Quanto à estrutura do artigo, a secção 2 compreende o modelo de Bachelier-Osborne, as distribuições de Pareto estáveis são apresentadas na secção seguinte e a aplicação empírica é feita na secção 4. Por fim são apresentadas as conclusões. 2. O modelo de Bachelier-Osborne (BO) Louis Bachelier (1900) foi o primeiro a utilizar o modelo do passeio aleatório para descrever o comportamento do preço dos activos financeiros. Apesar da sua importância, este trabalho não despertou grande interesse por parte dos economistas e acabou por ser redescoberto em 1959 por Osborne, daí que Fama (1965) tenha adoptado o nome dos dois autores para designar a versão original do modelo do passeio aleatório. No modelo proposto por Bachelier e Osborne admite-se que: As variações no preço de um título individual entre transacções sucessivas são variáveis aleatórias independentes e identicamente distribuídas; As transacções distribuem-se uniformemente por cada período de tempo (um dia, uma semana, um mês, etc.); A distribuição das variações sucessivas no preço de uma acção tem variância finita. Se em cada período de tempo o número de transacções for suficientemente grande, então a variação do preço por período deverá ser a soma de um grande número de variáveis aleatórias independentes e identicamente distribuídas. Nestas condições, e pelo teorema do Limite Central, pode-se admitir que as variações diárias, semanais ou mensais dos preços têm distribuição normal ou Gaussiana. Quanto à variância das distribuições deve ser proporcional ao intervalo de tempo respectivo. Por exemplo, se σ2 é a variância da distribuição das variações diárias, então a variância da distribuição das variações semanais deverá ser aproximadamente igual a 5σ 2 . Admitamos que no período t (um dia, uma semana, um mês, etc.) ocorrem n transacções do mesmo título. Sejam Pt1 , Pt 2 , …, Ptp , …, Ptn os preços do título em cada uma das transacções realizadas. As variações no logaritmo do preço entre transacções sucessivas são variáveis aleatórias independentes e identicamente distribuídas com média zero e variância constante: rt 2 = log(Pt 2 ) − log(Pt1 ) , ou em termos genéricos, rtp = log(Ptp ) − log(Pt ( p −1) ) , ( ) ( ) em que E rtp = 0 e VAR rtp = σ . 2 A variação no logaritmo do preço do título entre os períodos t –1 e t é uma variável aleatória que é o resultado da soma de n variáveis aleatórias independentes e identicamente distribuídas: [ ] rt = ∆ log(Pt ) = log(Pt ) − log(Pt −1 ) = ∑ rtp = ∑ log(Ptp ) − log(Pt ( p −1) ) , n n p =1 p =1 (1) em que Ptn ≈ Pt e Pt 0 ≈ Pt −1 . Pelo teorema do Limite Central pode-se admitir que as variações estandardizadas do logaritmo do preço do título em cada período (dia, semana, mês, etc.) são variáveis aleatórias com distribuição assimptótica normal padrão: n ∑r p =1 tp − nµ σ n = rt σ n a ∩ N (0; 1) , uma vez que E (rt ) = nµ = 0 . (2) 3. As distribuições de Pareto estáveis Apesar de admitirem a hipótese da normalidade da distribuição das taxas de rendibilidade das acções, Kendall(1953) e Osborne(1959) constataram que nas distribuições empíricas analisadas havia demasiadas observações, quando comparadas com a distribuição normal, nas abas (ou extremos) e no centro (junto à média) das distribuições. Isto significa que sem o admitirem explicitamente, estavam a reconhecer que as distribuições eram leptocúrticas. Contudo, a solução encontrada por estes autores, era excluir os valores extremos das análises estatísticas, pois admitia-se que estas observações tinham sido geradas por um mecanismo diferente do da maioria das restantes observações e, por conseguinte, a sua importância deveria ser pouco relevante para a análise estatística global: numa das muitas sucessões cronológicas analisadas, algumas das observações extremas tinham um valor tão elevado que Kendall se sentiu compelido a excluí-las dos testes estatísticos subsequentes (Fama, 1965). Mas quando o número de observações extremas é significativo, a sua exclusão parece não ser a solução mais adequada tanto para os investidores, que não podem deixar de admitir a possibilidade de ocorrerem variações acentuadas no preço dos títulos, como para os estatísticos, pois a exclusão de um grande número de observações reduz a precisão dos resultados obtidos a partir das restantes observações. Para Mandelbrot (1963) a solução não era excluir os valores extremos tentando por essa via forçar a normalidade, mas antes propor uma distribuição de probabilidade mais adequada para representar todas as observações (extremos ou não). As distribuições alternativas propostas por Mandelbrot fazem parte de uma classe de distribuições leptocúrticas designadas por distribuições de Pareto estáveis3, de que a distribuição normal é um caso especial. As propriedades mais importantes das distribuições de Pareto estáveis foram desenvolvidas por Paul Lévy (1925) tendo demonstrado, entre outras, que a massa de probabilidade na aba direita de uma distribuição estável é aproximadamente igual à massa de probabilidade numa distribuição de Pareto, daí a designação de Stable Pareto-Lévy ou Stable Paretian Distributions: Lim [1 − F (x )] ≈ cx −α , em que F ( x ) é a função de distribuição, α é o índice de cauda da x → +∞ distribuição (α > 0) e c > 0 . Portanto, as distribuições dos dados de natureza financeira são em geral assimétricas e têm valores muito elevados para o excesso de curtose, o que significa que em relação à distribuição normal, as distribuições empíricas apresentam um excesso de observações em torno dos valores centrais e nas abas da distribuição. A forma proposta por Mandelbrot (1963) para representar este excesso de curtose consiste em modelizar as distribuições empíricas dos dados de natureza financeira e monetária como membros da família de distribuições de Pareto estáveis, de que a distribuição normal é um caso particular (quando o expoente característico α é igual a 2). O carácter leptocúrtico da generalidade das distribuições empíricas dos dados de natureza monetária e financeira e o teorema do Limite Central Generalizado, como veremos mais adiante, constituem as duas principais razões (empírica e teórica, respectivamente) para a utilização em Finanças deste tipo de modelos. As abas pesadas das distribuições empíricas podem ser explicadas pela forma como os agentes reagem à informação. Para Peters (1996) a informação não surge de forma suave e contínua, tal como prevê a Hipótese da Eficiência dos Mercados, mas aparece de forma brusca e em grandes quantidades. Quando tal acontece, os investidores ignoram essa informação até que as tendências se definam. Só depois é que reagem de forma acumulada a toda a informação previamente acumulada, podendo então aparecerem as abas pesadas que resultam das variações acentuadas no preço (para cima ou para baixo). As distribuições de Pareto estáveis, à excepção da distribuição normal, são distribuições leptocúrticas, isto é, apresentam uma maior massa de probabilidade nas abas (fat tailed) e no centro quando comparadas com a distribuição normal. De facto, a massa de probabilidade nas abas de uma distribuição de Pareto estável não normal é tão elevada, que a variância e todos os momentos de ordem superior a dois são infinitos: as estimativas amostrais da variância e da curtose de variáveis aleatórias com distribuição de Pareto estável (à excepção da distribuição normal) não convergem à medida que a dimensão da amostra aumenta, tendendo a crescer indefinidamente (Campbell, Lo e Mackinlay, 1997). A função densidade de probabilidade e a função de distribuição apenas são conhecidas em três casos particulares de distribuições de Pareto estáveis: Normal, Cauchy e Lévy (Nolan, 2002). A falta de fórmulas exactas para estas duas funções tem sido o maior entrave para a utilização generalizada deste tipo de distribuições. De seguida apresentamos algumas características das distribuições de Cauchy e de Lévy, uma vez que sobre a distribuição normal não nos parece ser necessária qualquer referência. Se uma variável aleatória tem distribuição de Cauchy: X ∩ Cauchy(δ , γ ) , a função densidade de probabilidade e a função de distribuição são dadas por: 1 ⎡ ⎛ x −δ f ( x) = ⎢1 + ⎜ πγ ⎢⎣ ⎜⎝ γ F ( x) = δ e γ ⎞ ⎟⎟ ⎠ 2 ⎤ ⎥ ⎥⎦ −1 = ⎛ x −δ 1 + π −1 arctan⎜⎜ 2 ⎝ γ γ 1 π γ + (x − δ ) 2 2 (3) , ⎞ ⎟⎟ , em que − ∞ < x < ∞ , ⎠ são os parâmetros de localização e de escala, respectivamente. A mediana da distribuição é δ (4) e o primeiro e o terceiro quartis são iguais a δ ±γ . A distribuição de Cauchy não possui momentos finitos de ordem superior ou igual a um e por conseguinte nem a média nem a variância são finitas. A forma padrão da distribuição de Cauchy obtém-se fazendo f ( x) = 1 , − ∞ < x < +∞ . π 1+ x2 δ =0 e γ = 1: 1 (4) Se a variável aleatória X for do tipo contínuo com função densidade de probabilidade f ( x ) , o seu valor esperado existe sempre desde que o integral ∫ +∞ −∞ x f ( x )dx < ∞ seja absolutamente convergente (Murteira, 1990). Numa distribuição de Cauchy padrão o valor esperado E ( X ) não existe porque o integral, ∫ +∞ −∞ x π (1 + x 2 ) dx , é divergente. Seja X uma variável aleatória com distribuição de Lévy: X ∩ Lévy (δ , γ ) . As funções densidade de probabilidade e de distribuição são dadas por: f ( x) = ⎞ ⎛ γ 1 γ ⎟⎟ , exp⎜⎜ − 3/ 2 2π ( x − δ ) ⎝ 2( x − δ ) ⎠ ⎡ ⎛ F ( x) = 2 ⎢1 − Φ⎜⎜ ⎢⎣ ⎝ em que (5) ⎞⎤ ⎟⎥ , (x − δ ) ⎟⎠⎥⎦ γ δ <x<∞ e Φ (.) é a função de distribuição normal padrão. A forma padrão da distribuição de Lévy obtém-se fazendo f ( x) = δ =0 e γ = 1: 1 1 ⎛ 1 ⎞ exp⎜ − ⎟ . 3/ 2 2π ( x ) ⎝ 2x ⎠ (6) Estabelecendo algumas comparações, podemos referir que ambas as distribuições Normal e Cauchy são simétricas. A principal diferença entre estas duas distribuições é que na distribuição de Cauchy as abas são mais alongadas e mais achatadas, podendo a curtose ser infinita (Goria, 1978 e Balanda, 1987)5. Ao contrário das distribuições Normal e Cauchy, a distribuição de Lévy é altamente enviesada, com toda a probabilidade concentrada em valores de x > 0 e tem abas ainda mais pesadas do que a distribuição de Cauchy. Para ilustrar a diferença entre as abas das três distribuições (Nolan, 2002), calcularam-se as probabilidades que se apresentam no quadro seguinte. Como se pode observar, a probabilidade de uma variável aleatória com distribuição normal padrão assumir valores superiores a 3 é muito baixa quando comparada com a mesma probabilidade numa distribuição de Cauchy ou de Lévy. Tabela 1: Probabilidades nas abas P( X > x ) x 0 1 2 3 4 5 Normal 0,5 0,1587 0,0228 0,001347 0,00003167 0,0000002866 Cauchy 0,5 0,25 0,1476 0,1024 0,078 0,0628 Lévy 1 0,6827 0,5205 0,4363 0,3829 0,3453 Tal como referimos anteriormente, a função densidade de probabilidade só está disponível em três casos especiais. Por esta razão, a família das distribuições de Pareto estáveis costuma ser representada pela sua função característica (que existe sempre qualquer que seja a distribuição) e cuja parametrização mais comum6 é a seguinte: ( ) E e itX ⎧ ⎧ πα ⎤⎫ α⎡ sign (t )⎥ ⎬ ⎪exp⎨iδ t − γ t ⎢1 − iβ tan 2 ⎦⎭ ⎣ ⎪ ⎩ =⎨ ⎪exp⎧iδ t − γ t ⎡1 + iβ 2 sign (t ) ln t ⎤ ⎫ ⎥⎦ ⎬ ⎢⎣ ⎪ ⎨⎩ π ⎭ ⎩ se α ≠ 1 (7) se α = 1 ou, considerando o logaritmo, ( ) ln φ X (t ) = ln E e itX ⎧ πα ⎤ α⎡ ⎪iδ t − γ t ⎢1 − iβ tan 2 sign (t )⎥ ⎪ ⎦ ⎣ =⎨ ⎪iδ t − γ t ⎡1 + iβ 2 sign (t ) ln t ⎤ ⎥⎦ ⎢⎣ ⎪⎩ π se α ≠ 1 se α = 1 ⎧− 1 se t < 0 ⎪ e sign (t ) = ⎨ 0 se t = 0 . ⎪ 1 se t > 0 ⎩ Em que α, β, δ e γ são os parâmetros de uma distribuição estável que representamos genericamente por X ∩ S(α , β , δ , γ ) : O parâmetro α designa-se por expoente característico (ou índice de estabilidade) da distribuição e pode assumir valores entre 0 < α ≤ 2 . O valor deste parâmetro determina a massa de probabilidade nas abas da distribuição (curtose). Quando α = 2 a distribuição de Pareto estável relevante é a distribuição Normal, daí afirmarmos que a distribuição normal é um caso especial da família de distribuições de Pareto estáveis. Quando 0 < α < 2 existe uma maior massa de probabilidade nas abas da distribuição de Pareto estável quando comparada com a distribuição normal e a massa de probabilidade nas abas é tanto maior quanto menor for o valor de α . Como consequência, a variância e as covariâncias (segundos momentos) bem como os momentos de ordem superior só existem (são finitos) no caso limite de α = 2 . Quando α < 2 , os momentos absolutos de ordem inferior a α existem, enquanto que os momentos de ordem superior ou igual a α não existem. Portanto, a média existe sempre desde que α > 1 . Para Mandelbrot (1963) o valor do expoente característico da distribuição das taxas de rendibilidade de um acção varia geralmente entre 1 e 2 e por conseguinte, a média da distribuição existe (é igual a δ ) mas a sua variância é infinita; O parâmetro β é um índice de assimetria e pode assumir valores no intervalo − 1 ≤ β ≤ 1 . A distribuição é simétrica quando β = 0 , é assimétrica positiva quando β > 0 (o grau de assimetria é tanto maior quanto maior for o valor de β ) e é assimétrica negativa quando β < 0 (o grau de assimetria é tanto maior quanto menor for o valor de β ); δ é o parâmetro de localização de uma distribuição de Pareto estável e pode asumir valores no intervalo − ∞ < δ < +∞ . Quando α > 1 , δ é o valor esperado ou a média da distribuição. Quando α ≤ 1 , a média da distribuição não está definida. Neste caso δ deverá ser outro parâmetro (a mediana, por exemplo, quando β = 0 ) o qual descreve a localização da distribuição; O parâmetro γ define a escala da distribuição e pode assumir valores no intervalo 0 < γ < +∞ . Por exemplo, quando α = 2 (distribuição normal) γ é ½ da variância. Quando α < 2 a variância da distribuição é infinita. Neste caso deverá existir um parâmetro finito γ que define a escala da distribuição mas que não é a variância. Por exemplo, quando α = 1 e β = 0 (distribuição de Cauchy) γ é metade do intervalo inter-quartis. As distribuições de Pareto estáveis têm propriedades que as tornam bastante atractivas para modelizar as taxas de rendibilidade dos activos financeiros, nomeadamente: (1) são distribuições leptocúrticas, isto é, apresentam uma maior massa de probabilidade nas abas e no centro quando comparadas com a distribuição normal; (2) são estáveis ou invariantes em relação à adição; (3) constituem a distribuição limite para a soma normalizada de variáveis aleatórias independentes e identicamente distribuídas: as distribuições têm domínios de atracção e (4) são razoavelmente flexíveis, pois são caracterizadas por quatro parâmetros. Passamos a explicar a importância de cada uma das propriedades. As distribuições de Pareto estáveis são adequadas para descrever e modelizar as taxas de rendibilidade dos activos financeiros, porque as distribuições empíricas dos dados de natureza monetária e financeira são em geral leptocúrticas. Quanto às demais propriedades, uma distribuição de Pareto estável é, por definição, invariante em relação à adição. Isto significa que a soma de variáveis aleatórias com distribuição de Pareto estável, independentes e identicamente distribuídas, tem também distribuição de Pareto estável com a mesma forma da distribuição das variáveis aleatórias individuais, à excepção dos parâmetros de localização e de escala: δ e γ , respectivamente. Quer isto dizer que o valor dos parâmetros α e β permanece constante na adição. Sejam X1, X 2 , , Xn variáveis aleatórias com distribuição de Pareto estável, independentes e identicamente distribuídas, com parâmetros α , β , δ e γ . Pela propriedade anterior, S n = n ∑X i continua a ter uma distribuição de Pareto estável em que os parâmetros i =1 são: α , β , nδ e nγ . Esta propriedade é muito importante quando se considera uma distribuição de Pareto estável na modelização das variações sucessivas no preço de uma acção. Admitindo que ocorrem várias transacções (negócios) de um mesmo título num determinado período de tempo (um dia, uma semana, um mês, etc.) podemos considerar que a variação do preço do título nesse período é igual à soma de todas as variações ocorridas durante o período entre transacções consecutivas do título. Se as transacções se distribuirem uniformente pelo período de tempo e se as variações no preço entre transacções consecutivas forem variáveis aleatórias com distribuição de Pareto estável independentes e identicamente distribuídas, então as variações diárias, semanais e mensais do preço têm também distribuição de Pareto estável. Por exemplo, se as variações diárias tiverem distribuição de Pareto estável com parâmetros α , β , δ e γ , então a distribuição das variações semanais tem também distribuição de Pareto estável com parâmetros de localização e de escala proporcionais aos parâmetros da distribuição das variações diárias: 5δ e 5γ , respectivamente; e parâmetros de curtose ( α ) e de assimetria ( β ) constantes (iguais aos da distribuição das variações diárias do preço). A terceira propriedade significa que as distribuições de Pareto estáveis têm domínios de atracção e, por conseguinte, se a distribuição de uma soma estandardizada de variáveis aleatórias independentes e identicamente distribuídas existir, então deverá ser um membro da família deste tipo de distribuições. Esta propriedade baseia-se nos teoremas do Limite Central e do Limite Central Generalizado (Feller, 1966). Assim, se essas variáveis aleatórias tiverem variância finita, e pelo teorema do Limite Central, a soma tem distribuição aproximadamente normal. Se as variáveis tiverem variância infinita, e pelo teorema do Limite Central Generalizado, a soma deverá ter distribuição de Pareto estável com 0 < α < 2 . Portanto, se considerarmos que as variações sucessivas no logaritmo do preço de uma acção são variáveis aleatórias independentes e identicamente distribuídas, então as variações diárias, semanais e mensais (a frequência dos dados é cada vez menor da variação diária para a variação mensal) que resultam da soma de um grande número de variáveis aleatórias independentes e identicamente distribuídas e, pelo teorema Limite Central Generalizado, devem ter distribuição de Pareto estável. 4. Aplicação aos índices PSI20, DAX e DJIA Para dar início ao estudo empírico, pretendemos verificar se a distribuição das taxas de rendibilidade dos três índices bolsistas também evidenciam um excesso de curtose em relação à distribuição normal. Como podemos observar pelos dados da tabela seguinte, as distribuições das taxas de rendibilidade diárias são leptocúrticas e assimétricas, o que significa que existe uma maior concentração de observações no centro e nas abas quando comparadas com a distribuição normal e que tende a haver uma maior (se bem que ligeira) concentração de observações à direita da média pois todas as distribuições são assimétricas negativas. Os valores dos coeficientes de assimetria e de curtose são ambos estatisticamente diferentes dos valores característicos de uma distribuição normal (0 e 3, respectivamente) e o valor da curtose é superior a 3 o que significa que as distribuições são leptocúrticas e, por conseguinte, evidenciam um excesso de curtose em relação à distribuição Gaussiana. Tabela 2: Medidas de estatística descritiva das TRD PSI20 Nº de observações DAX DJIA 2.226 2.290 2.268 Média 0,043106 0,053001 0,048963 Mediana 0,033884 0,106379 0,066329 Máximo 6,941259 6,415896 4,860544 Mínimo -9,589772 -8,823020 -7,454935 Variância 1,217006 1,830579 1,011597 Desvio-padrão 1,103180 1,352989 1,005782 -0,663949 -0,482210 -0,532190 -12,789 -9,421 -10,347 10,621450 6,422364 8,241740 Curtose estandardizada 73,400 TRD: Taxas de rendibilidade diárias. 33,430 50,956 Assimetria Assimetria estandardizada Curtose Os histogramas das taxas de rendibilidades (apresentados na figura seguinte) também sugerem que as distribuições são leptocúrticas em relação à distribuição normal. Figura 1: Histograma com sobreposição da curva normal PSI20 DAX DJIA Por último decidimos realizar três testes de aderência para avaliar a bondade do ajustamento das três distribuições empíricas à distribuição normal. Os resultados obtidos são apresentados na tabela seguinte (os valores são todos estatisticamente significativos a 1%). Tabela 3: Testes à normalidade da distribuição das taxas de rendibilidade J-B K-S A-D PSI20 551,068 3,970 35,059 DAX 1206,322 2,607 13,688 DJIA 2703,526 2,882 17,690 Nota: J-B: Jarque-Bera, K-S: Kolmogorov-Smirnov Z e A-D: Anderson-Darling Z. As conclusões, tendo em conta o valor dos testes e as probabilidades associadas, também apontam para uma rejeição clara da hipótese da normalidade. Portanto, as distribuições das taxas de rendibilidade diárias dos três índices bolsistas PSI20, DAX e DJIA são leptocúrticas, assimétricas e, em consequência, uma distribuição normal com parâmetros fixos parece não ser o modelo mais adequado para descrever o seu comportamento ao longo do tempo. Este excesso de curtose das distribuições empíricas das taxas de rendibilidade dos activos financeiros também já tinha sido detectado noutros estudos empíricos aplicados: Ao mercado de capitais português: Garcia (1992), Soares (1994), Afonso e Teixeira (1997 e 1998) e Godinho (1999); Às taxas de câmbio do escudo (ao incerto) em relação ao marco alemão (Nicolau, 1999); Ao índice alemão DAX: Barndorff-Nielsen (1994), Lux (1996) e Jaschke (2000), etc.; Ao índice norte-americano DJIA: Fama (1965), de Lima (1998), Pandey (1998), Rachev e Mittnik (2000), etc. A distribuição das taxas de rendibilidade diárias dos três índices bolsistas é leptocúrtica, característica que é comum à generalidade dos activos financeiros7. O excesso de curtose em relação à distribuição normal é pois um facto estilizado deste tipo de distribuições. Por conseguinte, e atendendo ao resultado dos testes anteriores, a distribuição normal com parâmetros fixos parece não ser o modelo mais adequado para descrever o comportamento das taxas de rendibilidade dos três índices bolsistas e dos activos financeiros em geral. Esta incapacidade da distribuição normal para capturar o excesso de curtose das distribuições empíricas, contribuiu para o aparecimento de vários processos de modelização alternativos. De seguida vamos ensaiar uma distribuição de Pareto estável não Gaussiana. O objectivo é concluir qual das duas distribuições (de Pareto estável ou normal) parece ser mais adequada para descrever as taxas de rendibilidade. A metodologia que pretendemos adoptar é a seguinte. Primeiro, utilizamos o método da máxima verosimilhança e recorremos directamente à versão 3.04 do programa STABLE8 para estimar os quatro parâmetros da distribuição de Pareto estável. Depois recorremos à função de verosimilhança, à distância de Kolmogorov (Rachev e Mittnik, 2000) e aos critérios AICC9 e SBC10 (Mittnik e Paolella, 2002) para comparar a aderência das distribuições empíricas à distribuição de Pareto estável e à distribuição normal: KD = 100 Max Fn ( x ) − F0 ( x ) , (8) x∈R () AICC = −2 log L θ̂ + () SBC = −2 log L θ̂ + 2n(k + 1) , n−k −2 (9) k log(n) , n (10) () em que log L θ̂ é o logaritmo da função de verosimilhança, n é o número de observações e k é o número de parâmetros a estimar. Entre as duas distribuições, a mais adequada para descrever as taxas de rendibilidade diárias de cada índice bolsista deverá ser aquela que apresenta um valor mais elevado para o logaritmo da função de verosimilhança e um valor mais baixo para os dois outros critérios. A tabela seguinte apresenta as estimativas para os parâmetros das três distribuições não condicionadas e os desvios-padrão dos estimadores da máxima verosimilhança (ML). As estimativas obtidas para o expoente característico da distribuição de Pareto estável são todas inferiores a 2 (o valor de desvios-padrão de α̂ α quando os dados são gerados por um processo Gaussiano). Os também sugerem que a distribuição normal não é a mais adequada para descrever as taxas de rendibilidade dos três índices bolsistas, uma vez que as estimativas para o expoente característico são todas estatisticamente inferiores a 2. Tabela 4: Estimativas para os parâmetros das distribuições não condicionadas (TRD) α̂ βˆ γˆ δˆ Normal Estável 2,0000 1,5586 (0,0336) 0,0000 0,0512 (0,0703) 0,7801 0,5504 (0,0122) 0,0431 0,0446 (0,0205) Normal Estável 2,0000 1,7559 (0,0299) 0,0000 -0,2958 (0,1010) 0,9567 0,8080 (0,0156) 0,0530 0,1348 (0,0296) Índices Distribuição PSI20 DAX DJIA Normal 2,000 0,0000 0,7112 0,0490 Estável 1,7133 (0,0314) -0,1716 (0,0918) 0,5763 (0,0115) 0,0922 (0,0213) Nota: Os desvios-padrão encontram-se entre parêntesis. TRD: Taxas de rendibilidade diárias. As medidas comparativas da bondade do ajustamento apresentadas na tabela seguinte evidenciam também que a distribuição de Pareto estável se ajusta melhor às três distribuições empíricas. Tabela VIII.1: Bondade do ajustamento das distribuições não condicionadas L KD Índices Normal Estável PSI20 -3.376,64 DAX DJIA AICC SBC Normal Estável Normal Estável Normal Estável -3.128,86 8,38 1,90 6.755,28 6.261,72 6.753,29 6.257,73 -3.941,17 -3.836,70 4,10 1,69 7.884,34 7.677,40 7.882,35 7.673,41 -3.230,73 -3.086,83 5,44 1,78 6.463,57 6.177,66 6.461,47 6.173,67 Nota: L é o valor do logaritmo da função de verosimilhança. 5. Conclusão A distribuição das taxas de rendibilidade diárias dos três índices bolsistas (PSI20, DAX e DJIA) evidencia um excesso de curtose em relação à distribuição normal, característica que é comum à generalidade dos activos financeiros. Pelos resultados obtidos, uma distribuição de Pareto estável parece ser mais adequada do que uma distribuição normal para modelizar a distribuição não condicionada dos três índices bolsistas. Apesar das estimativas para o expoente característico serem todas inferiores a 2 e das medidas da bondade do ajustamento não favorecerem a distribuição normal, não podemos concluir, no entanto, que as taxas de rendibilidade diárias tenham sido geradas necessariamente por um processo de Pareto estável não Gaussiano. A única conclusão que podemos tirar é que as taxas de rendibilidade dos três índices bolsistas se ajustam melhor a uma distribuição deste tipo. 6. Referências bibliográficas Afonso, Pedro A. e Teixeira, João C. (1997), Efficiency in Portuguese stock exchange indexes: runs tests and BDS statistics, Working paper Nº 2/97, ISEG, Departamento de Economia. Afonso, Pedro A. e Teixeira, João C. (1997), Non-linear tests of weakly efficient markest: evidence from Portugal, Working paper Nº 6/98, ISEG, Departamento de Economia. Bachelier, Louis, Theory of Speculation, in P. Cootner, ed., The random character of stock market prices, Cambridge, MA: MIT Press, 1964. (Originalmente publicado em 1900). Bandorff-Nielsen, O. E. (1995), Normal inverse Gaussian processes and the modeling of stock returns, Research report, Aarhus University. Brockwell, Peter J. e Davis, Richard A., Time series: theory and methods, Springer-Verlag, 2nd edition, New York. Campbell, John Y., Lo, Andrew W., MacKinlay. A. Craig (1997), The econometrics of financial markets, Princeton University Press, New Jersey. De Lima, Pedro J. F. (1997), Nonlinearities and nonstationarities, Journal of Business & Economic Statistics, April 1998, Vol. 16, No. 2. Fama, Eugene F. (1965), The behavior of stock prices, Journal of Business, XXXVIII (1), January, pp. 34-105. Feller, W. (1966), An introduction to probability theory and its applications, John Wiley & Sons, New York. Garcia, Maria T. (1992), Eficiência do mercado de capitais, Tese de Mestrado, Lisboa: ISEG. Goria, M. (1978), Fractional absolute moments of the Cauchy distribution, Quaderni di statistica e matematica applicata alle scienze economico-social, University of Trento , Trento (Italy), 1/2, pp. 89-96. Gnedenko, B. V. e Kolmogorov, A. N. (1954), Limit distributions for sums of independent random variables, Cambridge, Mass.: Addison-Wesley. Hurvich, C. M., Tsai, C. L. (1989), Regression and time series model selection in small samples, Biometrika, 76, 297-307. Jaschke, Stefan R. (2000), A note on stochastic volatility, GARCH models and hiperbolic distributions, [email protected]. Johnson, Norman L., Kotz, Samuel e Balakrishnan, N. (1994), Continuous univariate distributions, second edition, vols. I-II, John Wiley and Sons, New York. Kendall, M. (1953), The analysis of economic time series, Part 1. Prices., Journal of Royal Statistical Society, 96, pp 11-25. Lux, T. (1996), The stable Paretian hypothesis and the frequency of large returns: an examination of major German stocks, Applied Financial Economics, Vol. 6, No 6, pp. 463-475. Mandelbrot, Benoit B. (1963), The variation of certain speculative prices, The Journal of Business, 36, pp. 394-419. Mittnik, Stefan e Paolella, Marc S. (2002), Prediction of financial downside-risk with heavy-tailed conditional distributions, a publicar em Handbook of heavy tailed distributions in finance, NorthHolland. Murteira, Bento J. F. (1979), Probabilidades e estatística, vols. I-II, Editora McGraw-Hill de Portugal, Lisboa. Nicolau, João Carlos H. C. (1999), Modelos ARCH, Instituto Mercado de Capitais, Associação da Bolsa de Derivados do Porto. Nolan, John P. (2002), Stable distributions models for heavy tailed data, cap.1, livro a publicar em Janeiro de 2003. Osborne, M. F. M. (1959), Brownian motion in the stock market, Operations Research, 7, pp. 145-173. Pandey, Vivek, Kohers, Theodor e Kohers, Gerald (1998), Deterministic nonlinearity in the stock returns of major European equity markets and the United States, The Financial Review, 33, 4564. Peters, Edgar E. (1996), Chaos and order in the capital markets, second edition, John Wiley & sons, USA. Rachev, Svetlozar e Mittnik, Stefan (2000), Stable Paretian models in finance, John Wiley & Sons, New York. Schwartz, G. (1978), Estimating the dimension of a model, Annals of Statistics, 6, pp. 461-64. Soares, João A. O. (1994), Preços de acções na Bolsa de Lisboa: análise, previsão e regras de compra e venda, Tese de Doutoramento, Lisboa: IST. NOTAS 1 Esta é a medida de rendibilidade utilizada com maior frequência: rt = 100(log Pt − log Pt −1 ) , em que log é o logaritmo natural e Pt .é o valor de fecho diário de cada índice. 2 PSI: Portuguese Stock Exchange, DAX: Deutscher Aktienindex e DJIA: Dow Jones Industrial Average. 3 Pode ser encontrada uma exposição matemática rigorosa sobre as distribuições em Gnedenko e Kolmogorov (1954). Lévy, Gnedenko e Kolmogorov são referidos por Fama (1965). Mais recentemente ver Rachev e Mittnik (2000). 4 A distribuição não tem momentos de qualquer ordem, mas tem mediana, que é um parâmetro de ordem. 5 Goria, M. (1978), Fractional absolute moments of the Cauchy distribution, Quaderni di statistica e matematica applicata alle scienze economico-social, University of Trento , Trento (Italy), 1/2, 89-96; Balanda, K. P. (1987), Kurtosis comparisons of the Cauchy and double exponencial distributions, Communications in Statistics – Theory and methods, 16, 579-592. Ambos citados por Johnson, Kotz e Balakrishnan (1994, pág. 299). 6 Nolan (2002) refere outros tipos de parametrização. 7 Pelo menos em distribuições de dados de frequência elevada como é o caso das taxas de rendibilidade diárias dos três índices bolsistas. 8 Este software está disponível no site do professor John Nolan: http://www.cas.american.edu/~jpnolan. 9 O critério AICC é uma correcção ao enviesamento do Akaike Information Criterion (AIC) (Akaike, 1974) proposta por Hurvich e Tsai (1989) que é citado por Brockwell e Davis (1991). 10 Schwarz Information Criterion (Schwarz, 1978).