x - iscte

Propaganda
DISTRIBUIÇÕES DE PARETO ESTÁVEIS:
APLICAÇÃO AOS ÍNDICES PSI20, DAX E DJIA
J. J. Dias Curto*
ABSTRACT
A normalidade das taxas de rendibilidade dos activos financeiros constitui uma das hipóteses
mais importantes dos modelos clássicos da Teoria Financeira. Contudo, na maior parte dos
estudos realizados, constatou-se que as distribuições empíricas evidenciam um excesso de
curtose em relação à distribuição normal. Este facto contribuíu para o aparecimento de várias
alternativas para modelizar a distribuição não condicionada das taxas de rendibilidade dos
activos financeiros e as distribuições de Pareto estáveis têm sido utilizadas com alguma
frequência. Neste estudo pretendemos analisar a adequabilidade deste tipo de distribuições às
taxas de rendibilidade de três índices bolsistas: PSI20, DAX e DJIA.
Palavras-chave: Pareto, estável, Bachelier, Osborne, Cauchy, Lévy e leptocurtose.
*Assistente convidado no Instituto Superior de Ciências do Trabalho e da
Empresa (ISCTE).
E-mail: [email protected]
1. Introdução
A normalidade da distribuição das taxas de rendibilidade dos activos financeiros, calculadas
a partir da variação logarítmica dos preços1, é um dos pressupostos mais importantes dos
modelos clássicos da Teoria Financeira nomeadamente, a Teoria da Carteira, o modelo CAPM e
a fórmula de Black-Scholes.
Para a aceitação generalizada da hipótese da normalidade foram determinantes o modelo do
passeio aleatório proposto por Bachelier em 1900 e o teorema do Limite Central. Para a teoria
do passeio aleatório, as variações sucessivas no logaritmo do preço dos activos financeiros são
variáveis aleatórias independentes e identicamente distribuídas (IID) e, segundo o teorema do
Limite Central, a soma estandardizada de variáveis aleatórias IID com variância finita converge
para a distribuição normal padrão à medida que o número de variáveis tende para infinito. Uma
vez que as taxas de rendibilidade de frequência mais reduzida são iguais à soma das taxas de
rendibilidade de frequência mais elevada, pode-se concluir, quando a variância é finita e o
processo gerador dos dados é um passeio aleatório, que as taxas de rendibilidade diárias,
semanais e mensais têm distribuição normal.
Apesar da normalidade constituir uma das hipóteses mais importantes da Teoria Financeira
clássica, na maior parte dos estudos realizados constatou-se que as distribuições empíricas
(pelo menos quando a frequência dos dados é elevada) são leptocúrticas, isto é, apresentam um
maior número de observações no centro e nas abas quando comparadas com a distribuição
normal.
Este facto estilizado das distribuições empíricas contribuiu para o aparecimento de várias
alternativas à distribuição normal para modelizar o excesso de curtose das distribuições dos
dados de natureza monetária e financeira. Ao longo do tempo vários autores admitiram que as
taxas de rendibilidade dos activos financeiros são geradas a partir de uma distribuição
leptocúrtica fixa. Por conseguinte, uma distribuição teórica com estas características deveria ser
o modelo mais adequado para descrever as taxas de rendibilidade dos activos financeiros.
Neste estudo ensaiamos as distribuições de Pareto estáveis propostas inicialmente por
Mandelbrot (1963) e Fama (1965) e o objectivo principal é analisar a adequabilidade destas
distribuições para descrever as taxas de rendibilidade dos índices mais representativos dos
mercados de capitais português, alemão e americano. A escolha destes mercados é justificada
pelo nível de desenvolvimento e respectiva dimensão: um mercado recente e pouco
desenvolvido como é o caso português, um mercado intermédio em termos de história e de
desenvolvimento (mercado alemão) e um mercado altamente desenvolvido e já bastante antigo
como é o mercado americano.
Os dados que vamos considerar são as taxas de rendibilidade diárias (calculadas a partir
das variações logarítmicas) de cada um dos três índices: PSI20, DAX e DJIA2. O período de
análise compreende nove anos de observações: de 31-12-1992 a 31-12-2001 e a data inicial
coincide com a criação do índice PSI20 no mercado de capitais português.
Quanto à estrutura do artigo, a secção 2 compreende o modelo de Bachelier-Osborne, as
distribuições de Pareto estáveis são apresentadas na secção seguinte e a aplicação empírica é
feita na secção 4. Por fim são apresentadas as conclusões.
2. O modelo de Bachelier-Osborne (BO)
Louis Bachelier (1900) foi o primeiro a utilizar o modelo do passeio aleatório para descrever
o comportamento do preço dos activos financeiros. Apesar da sua importância, este trabalho não
despertou grande interesse por parte dos economistas e acabou por ser redescoberto em 1959
por Osborne, daí que Fama (1965) tenha adoptado o nome dos dois autores para designar a
versão original do modelo do passeio aleatório.
No modelo proposto por Bachelier e Osborne admite-se que:
As variações no preço de um título individual entre transacções sucessivas são variáveis
aleatórias independentes e identicamente distribuídas;
As transacções distribuem-se uniformemente por cada período de tempo (um dia, uma
semana, um mês, etc.);
A distribuição das variações sucessivas no preço de uma acção tem variância finita.
Se em cada período de tempo o número de transacções for suficientemente grande, então a
variação do preço por período deverá ser a soma de um grande número de variáveis aleatórias
independentes e identicamente distribuídas. Nestas condições, e pelo teorema do Limite Central,
pode-se admitir que as variações diárias, semanais ou mensais dos preços têm distribuição
normal ou Gaussiana.
Quanto à variância das distribuições deve ser proporcional ao intervalo de tempo respectivo.
Por exemplo, se
σ2
é a variância da distribuição das variações diárias, então a variância da
distribuição das variações semanais deverá ser aproximadamente igual a 5σ 2 .
Admitamos que no período t (um dia, uma semana, um mês, etc.) ocorrem n transacções do
mesmo título. Sejam Pt1 , Pt 2 , …, Ptp , …, Ptn os preços do título em cada uma das transacções
realizadas. As variações no logaritmo do preço entre transacções sucessivas são variáveis
aleatórias independentes e identicamente distribuídas com média zero e variância constante:
rt 2 = log(Pt 2 ) − log(Pt1 ) , ou em termos genéricos, rtp = log(Ptp ) − log(Pt ( p −1) ) ,
( )
( )
em que E rtp = 0 e VAR rtp = σ .
2
A variação no logaritmo do preço do título entre os períodos t –1 e t é uma variável aleatória
que é o resultado da soma de n variáveis aleatórias independentes e identicamente distribuídas:
[
]
rt = ∆ log(Pt ) = log(Pt ) − log(Pt −1 ) = ∑ rtp = ∑ log(Ptp ) − log(Pt ( p −1) ) ,
n
n
p =1
p =1
(1)
em que Ptn ≈ Pt e Pt 0 ≈ Pt −1 .
Pelo teorema do Limite Central pode-se admitir que as variações estandardizadas do
logaritmo do preço do título em cada período (dia, semana, mês, etc.) são variáveis aleatórias
com distribuição assimptótica normal padrão:
n
∑r
p =1
tp
− nµ
σ n
=
rt
σ n
a
∩ N (0; 1) , uma vez que E (rt ) = nµ = 0 .
(2)
3. As distribuições de Pareto estáveis
Apesar de admitirem a hipótese da normalidade da distribuição das taxas de rendibilidade
das acções, Kendall(1953) e Osborne(1959) constataram que nas distribuições empíricas
analisadas havia demasiadas observações, quando comparadas com a distribuição normal, nas
abas (ou extremos) e no centro (junto à média) das distribuições. Isto significa que sem o
admitirem explicitamente, estavam a reconhecer que as distribuições eram leptocúrticas.
Contudo, a solução encontrada por estes autores, era excluir os valores extremos das
análises estatísticas, pois admitia-se que estas observações tinham sido geradas por um
mecanismo diferente do da maioria das restantes observações e, por conseguinte, a sua
importância deveria ser pouco relevante para a análise estatística global: numa das muitas
sucessões cronológicas analisadas, algumas das observações extremas tinham um valor tão
elevado que Kendall se sentiu compelido a excluí-las dos testes estatísticos subsequentes
(Fama, 1965).
Mas quando o número de observações extremas é significativo, a sua exclusão parece não
ser a solução mais adequada tanto para os investidores, que não podem deixar de admitir a
possibilidade de ocorrerem variações acentuadas no preço dos títulos, como para os
estatísticos, pois a exclusão de um grande número de observações reduz a precisão dos
resultados obtidos a partir das restantes observações.
Para Mandelbrot (1963) a solução não era excluir os valores extremos tentando por essa via
forçar a normalidade, mas antes propor uma distribuição de probabilidade mais adequada para
representar todas as observações (extremos ou não). As distribuições alternativas propostas por
Mandelbrot fazem parte de uma classe de distribuições leptocúrticas designadas por
distribuições de Pareto estáveis3, de que a distribuição normal é um caso especial.
As propriedades mais importantes das distribuições de Pareto estáveis foram desenvolvidas
por Paul Lévy (1925) tendo demonstrado, entre outras, que a massa de probabilidade na aba
direita de uma distribuição estável é aproximadamente igual à massa de probabilidade numa
distribuição de Pareto, daí a designação de Stable Pareto-Lévy ou Stable Paretian Distributions:
Lim [1 − F (x )] ≈ cx −α , em que F ( x ) é a função de distribuição, α é o índice de cauda da
x → +∞
distribuição
(α > 0) e c > 0 .
Portanto, as distribuições dos dados de natureza financeira são em geral assimétricas e têm
valores muito elevados para o excesso de curtose, o que significa que em relação à distribuição
normal, as distribuições empíricas apresentam um excesso de observações em torno dos
valores centrais e nas abas da distribuição. A forma proposta por Mandelbrot (1963) para
representar este excesso de curtose consiste em modelizar as distribuições empíricas dos dados
de natureza financeira e monetária como membros da família de distribuições de Pareto
estáveis, de que a distribuição normal é um caso particular (quando o expoente característico
α
é igual a 2).
O carácter leptocúrtico da generalidade das distribuições empíricas dos dados de natureza
monetária e financeira e o teorema do Limite Central Generalizado, como veremos mais adiante,
constituem as duas principais razões (empírica e teórica, respectivamente) para a utilização em
Finanças deste tipo de modelos.
As abas pesadas das distribuições empíricas podem ser explicadas pela forma como os
agentes reagem à informação. Para Peters (1996) a informação não surge de forma suave e
contínua, tal como prevê a Hipótese da Eficiência dos Mercados, mas aparece de forma brusca
e em grandes quantidades. Quando tal acontece, os investidores ignoram essa informação até
que as tendências se definam. Só depois é que reagem de forma acumulada a toda a
informação previamente acumulada, podendo então aparecerem as abas pesadas que resultam
das variações acentuadas no preço (para cima ou para baixo).
As distribuições de Pareto estáveis, à excepção da distribuição normal, são distribuições
leptocúrticas, isto é, apresentam uma maior massa de probabilidade nas abas (fat tailed) e no
centro quando comparadas com a distribuição normal. De facto, a massa de probabilidade nas
abas de uma distribuição de Pareto estável não normal é tão elevada, que a variância e todos os
momentos de ordem superior a dois são infinitos: as estimativas amostrais da variância e da
curtose de variáveis aleatórias com distribuição de Pareto estável (à excepção da distribuição
normal) não convergem à medida que a dimensão da amostra aumenta, tendendo a crescer
indefinidamente (Campbell, Lo e Mackinlay, 1997).
A função densidade de probabilidade e a função de distribuição apenas são conhecidas em
três casos particulares de distribuições de Pareto estáveis: Normal, Cauchy e Lévy (Nolan,
2002). A falta de fórmulas exactas para estas duas funções tem sido o maior entrave para a
utilização generalizada deste tipo de distribuições.
De seguida apresentamos algumas características das distribuições de Cauchy e de Lévy,
uma vez que sobre a distribuição normal não nos parece ser necessária qualquer referência.
Se uma variável aleatória tem distribuição de Cauchy: X ∩ Cauchy(δ , γ ) , a função
densidade de probabilidade e a função de distribuição são dadas por:
1 ⎡ ⎛ x −δ
f ( x) =
⎢1 + ⎜
πγ ⎢⎣ ⎜⎝ γ
F ( x) =
δ
e
γ
⎞
⎟⎟
⎠
2
⎤
⎥
⎥⎦
−1
=
⎛ x −δ
1
+ π −1 arctan⎜⎜
2
⎝ γ
γ
1
π γ + (x − δ )
2
2
(3)
,
⎞
⎟⎟ , em que − ∞ < x < ∞ ,
⎠
são os parâmetros de localização e de escala, respectivamente.
A mediana da distribuição é
δ
(4) e o primeiro e o terceiro quartis são iguais a
δ ±γ
.
A distribuição de Cauchy não possui momentos finitos de ordem superior ou igual a um e por
conseguinte nem a média nem a variância são finitas.
A forma padrão da distribuição de Cauchy obtém-se fazendo
f ( x) =
1
, − ∞ < x < +∞ .
π 1+ x2
δ =0
e
γ = 1:
1
(4)
Se a variável aleatória X for do tipo contínuo com função densidade de probabilidade f ( x ) ,
o seu valor esperado existe sempre desde que o integral
∫
+∞
−∞
x f ( x )dx < ∞ seja absolutamente
convergente (Murteira, 1990). Numa distribuição de Cauchy padrão o valor esperado E ( X ) não
existe porque o integral,
∫
+∞
−∞
x
π (1 + x 2 )
dx , é divergente.
Seja X uma variável aleatória com distribuição de Lévy: X ∩ Lévy (δ , γ ) . As funções
densidade de probabilidade e de distribuição são dadas por:
f ( x) =
⎞
⎛
γ
1
γ
⎟⎟ ,
exp⎜⎜ −
3/ 2
2π ( x − δ )
⎝ 2( x − δ ) ⎠
⎡
⎛
F ( x) = 2 ⎢1 − Φ⎜⎜
⎢⎣
⎝
em que
(5)
⎞⎤
⎟⎥ ,
(x − δ ) ⎟⎠⎥⎦
γ
δ <x<∞
e Φ (.) é a função de distribuição normal padrão.
A forma padrão da distribuição de Lévy obtém-se fazendo
f ( x) =
δ =0
e
γ = 1:
1
1
⎛ 1 ⎞
exp⎜ − ⎟ .
3/ 2
2π ( x )
⎝ 2x ⎠
(6)
Estabelecendo algumas comparações, podemos referir que ambas as distribuições Normal e
Cauchy são simétricas. A principal diferença entre estas duas distribuições é que na distribuição
de Cauchy as abas são mais alongadas e mais achatadas, podendo a curtose ser infinita (Goria,
1978 e Balanda, 1987)5. Ao contrário das distribuições Normal e Cauchy, a distribuição de Lévy
é altamente enviesada, com toda a probabilidade concentrada em valores de x > 0 e tem abas
ainda mais pesadas do que a distribuição de Cauchy.
Para ilustrar a diferença entre as abas das três distribuições (Nolan, 2002), calcularam-se as
probabilidades que se apresentam no quadro seguinte. Como se pode observar, a probabilidade
de uma variável aleatória com distribuição normal padrão assumir valores superiores a 3 é muito
baixa quando comparada com a mesma probabilidade numa distribuição de Cauchy ou de Lévy.
Tabela 1: Probabilidades nas abas
P( X > x )
x
0
1
2
3
4
5
Normal
0,5
0,1587
0,0228
0,001347
0,00003167
0,0000002866
Cauchy
0,5
0,25
0,1476
0,1024
0,078
0,0628
Lévy
1
0,6827
0,5205
0,4363
0,3829
0,3453
Tal como referimos anteriormente, a função densidade de probabilidade só está disponível
em três casos especiais. Por esta razão, a família das distribuições de Pareto estáveis costuma
ser representada pela sua função característica (que existe sempre qualquer que seja a
distribuição) e cuja parametrização mais comum6 é a seguinte:
( )
E e itX
⎧ ⎧
πα
⎤⎫
α⎡
sign (t )⎥ ⎬
⎪exp⎨iδ t − γ t ⎢1 − iβ tan
2
⎦⎭
⎣
⎪ ⎩
=⎨
⎪exp⎧iδ t − γ t ⎡1 + iβ 2 sign (t ) ln t ⎤ ⎫
⎥⎦ ⎬
⎢⎣
⎪ ⎨⎩
π
⎭
⎩
se α ≠ 1
(7)
se α = 1
ou, considerando o logaritmo,
( )
ln φ X (t ) = ln E e
itX
⎧
πα
⎤
α⎡
⎪iδ t − γ t ⎢1 − iβ tan 2 sign (t )⎥
⎪
⎦
⎣
=⎨
⎪iδ t − γ t ⎡1 + iβ 2 sign (t ) ln t ⎤
⎥⎦
⎢⎣
⎪⎩
π
se α ≠ 1
se α = 1
⎧− 1 se t < 0
⎪
e sign (t ) = ⎨ 0 se t = 0 .
⎪ 1 se t > 0
⎩
Em que
α, β, δ
e
γ
são os parâmetros de uma distribuição estável que representamos
genericamente por X ∩ S(α , β , δ , γ ) :
O parâmetro α designa-se por expoente característico (ou índice de estabilidade) da
distribuição e pode assumir valores entre 0 < α ≤ 2 . O valor deste parâmetro determina a
massa de probabilidade nas abas da distribuição (curtose). Quando α = 2 a distribuição de
Pareto estável relevante é a distribuição Normal, daí afirmarmos que a distribuição normal é
um caso especial da família de distribuições de Pareto estáveis. Quando 0 < α < 2 existe
uma maior massa de probabilidade nas abas da distribuição de Pareto estável quando
comparada com a distribuição normal e a massa de probabilidade nas abas é tanto maior
quanto menor for o valor de α . Como consequência, a variância e as covariâncias
(segundos momentos) bem como os momentos de ordem superior só existem (são finitos)
no caso limite de α = 2 . Quando α < 2 , os momentos absolutos de ordem inferior a α
existem, enquanto que os momentos de ordem superior ou igual a α não existem. Portanto,
a média existe sempre desde que α > 1 . Para Mandelbrot (1963) o valor do expoente
característico da distribuição das taxas de rendibilidade de um acção varia geralmente entre
1 e 2 e por conseguinte, a média da distribuição existe (é igual a δ ) mas a sua variância é
infinita;
O parâmetro β é um índice de assimetria e pode assumir valores no intervalo − 1 ≤ β ≤ 1 . A
distribuição é simétrica quando β = 0 , é assimétrica positiva quando β > 0 (o grau de
assimetria é tanto maior quanto maior for o valor de β ) e é assimétrica negativa quando
β < 0 (o grau de assimetria é tanto maior quanto menor for o valor de β );
δ é o parâmetro de localização de uma distribuição de Pareto estável e pode asumir valores
no intervalo − ∞ < δ < +∞ . Quando α > 1 , δ é o valor esperado ou a média da distribuição.
Quando α ≤ 1 , a média da distribuição não está definida. Neste caso δ deverá ser outro
parâmetro (a mediana, por exemplo, quando β = 0 ) o qual descreve a localização da
distribuição;
O parâmetro γ define a escala da distribuição e pode assumir valores no intervalo
0 < γ < +∞ . Por exemplo, quando α = 2 (distribuição normal) γ é ½ da variância. Quando
α < 2 a variância da distribuição é infinita. Neste caso deverá existir um parâmetro finito γ
que define a escala da distribuição mas que não é a variância. Por exemplo, quando α = 1 e
β = 0 (distribuição de Cauchy) γ é metade do intervalo inter-quartis.
As distribuições de Pareto estáveis têm propriedades que as tornam bastante atractivas para
modelizar as taxas de rendibilidade dos activos financeiros, nomeadamente: (1) são distribuições
leptocúrticas, isto é, apresentam uma maior massa de probabilidade nas abas e no centro
quando comparadas com a distribuição normal; (2) são estáveis ou invariantes em relação à
adição; (3) constituem a distribuição limite para a soma normalizada de variáveis aleatórias
independentes e identicamente distribuídas: as distribuições têm domínios de atracção e (4) são
razoavelmente flexíveis, pois são caracterizadas por quatro parâmetros.
Passamos a explicar a importância de cada uma das propriedades. As distribuições de
Pareto estáveis são adequadas para descrever e modelizar as taxas de rendibilidade dos activos
financeiros, porque as distribuições empíricas dos dados de natureza monetária e financeira são
em geral leptocúrticas.
Quanto às demais propriedades, uma distribuição de Pareto estável é, por definição,
invariante em relação à adição. Isto significa que a soma de variáveis aleatórias com distribuição
de Pareto estável, independentes e identicamente distribuídas, tem também distribuição de
Pareto estável com a mesma forma da distribuição das variáveis aleatórias individuais, à
excepção dos parâmetros de localização e de escala: δ e γ , respectivamente. Quer isto dizer
que o valor dos parâmetros α e β permanece constante na adição.
Sejam
X1, X 2 ,
, Xn
variáveis
aleatórias
com
distribuição
de
Pareto
estável,
independentes e identicamente distribuídas, com parâmetros α , β , δ e γ . Pela propriedade
anterior, S n =
n
∑X
i
continua a ter uma distribuição de Pareto estável em que os parâmetros
i =1
são: α , β , nδ e nγ .
Esta propriedade é muito importante quando se considera uma distribuição de Pareto estável
na modelização das variações sucessivas no preço de uma acção. Admitindo que ocorrem
várias transacções (negócios) de um mesmo título num determinado período de tempo (um dia,
uma semana, um mês, etc.) podemos considerar que a variação do preço do título nesse
período é igual à soma de todas as variações ocorridas durante o período entre transacções
consecutivas do título.
Se as transacções se distribuirem uniformente pelo período de tempo e se as variações no
preço entre transacções consecutivas forem variáveis aleatórias com distribuição de Pareto
estável independentes e identicamente distribuídas, então as variações diárias, semanais e
mensais do preço têm também distribuição de Pareto estável. Por exemplo, se as variações
diárias tiverem distribuição de Pareto estável com parâmetros α , β , δ
e γ , então a
distribuição das variações semanais tem também distribuição de Pareto estável com parâmetros
de localização e de escala proporcionais aos parâmetros da distribuição das variações diárias:
5δ e 5γ , respectivamente; e parâmetros de curtose ( α ) e de assimetria ( β ) constantes (iguais
aos da distribuição das variações diárias do preço).
A terceira propriedade significa que as distribuições de Pareto estáveis têm domínios de
atracção e, por conseguinte, se a distribuição de uma soma estandardizada de variáveis
aleatórias independentes e identicamente distribuídas existir, então deverá ser um membro da
família deste tipo de distribuições. Esta propriedade baseia-se nos teoremas do Limite Central e
do Limite Central Generalizado (Feller, 1966). Assim, se essas variáveis aleatórias tiverem
variância finita, e pelo teorema do Limite Central, a soma tem distribuição aproximadamente
normal. Se as variáveis tiverem variância infinita, e pelo teorema do Limite Central Generalizado,
a soma deverá ter distribuição de Pareto estável com 0 < α < 2 .
Portanto, se considerarmos que as variações sucessivas no logaritmo do preço de uma
acção são variáveis aleatórias independentes e identicamente distribuídas, então as variações
diárias, semanais e mensais (a frequência dos dados é cada vez menor da variação diária para
a variação mensal) que resultam da soma de um grande número de variáveis aleatórias
independentes e identicamente distribuídas e, pelo teorema Limite Central Generalizado, devem
ter distribuição de Pareto estável.
4. Aplicação aos índices PSI20, DAX e DJIA
Para dar início ao estudo empírico, pretendemos verificar se a distribuição das taxas de
rendibilidade dos três índices bolsistas também evidenciam um excesso de curtose em relação à
distribuição normal.
Como podemos observar pelos dados da tabela seguinte, as distribuições das taxas de
rendibilidade diárias são leptocúrticas e assimétricas, o que significa que existe uma maior
concentração de observações no centro e nas abas quando comparadas com a distribuição
normal e que tende a haver uma maior (se bem que ligeira) concentração de observações à
direita da média pois todas as distribuições são assimétricas negativas.
Os valores dos coeficientes de assimetria e de curtose são ambos estatisticamente
diferentes dos valores característicos de uma distribuição normal (0 e 3, respectivamente) e o
valor da curtose é superior a 3 o que significa que as distribuições são leptocúrticas e, por
conseguinte, evidenciam um excesso de curtose em relação à distribuição Gaussiana.
Tabela 2: Medidas de estatística descritiva das TRD
PSI20
Nº de observações
DAX
DJIA
2.226
2.290
2.268
Média
0,043106
0,053001
0,048963
Mediana
0,033884
0,106379
0,066329
Máximo
6,941259
6,415896
4,860544
Mínimo
-9,589772
-8,823020
-7,454935
Variância
1,217006
1,830579
1,011597
Desvio-padrão
1,103180
1,352989
1,005782
-0,663949
-0,482210
-0,532190
-12,789
-9,421
-10,347
10,621450
6,422364
8,241740
Curtose estandardizada
73,400
TRD: Taxas de rendibilidade diárias.
33,430
50,956
Assimetria
Assimetria estandardizada
Curtose
Os histogramas das taxas de rendibilidades (apresentados na figura seguinte) também
sugerem que as distribuições são leptocúrticas em relação à distribuição normal.
Figura 1: Histograma com sobreposição da curva normal
PSI20
DAX
DJIA
Por último decidimos realizar três testes de aderência para avaliar a bondade do
ajustamento das três distribuições empíricas à distribuição normal. Os resultados obtidos são
apresentados na tabela seguinte (os valores são todos estatisticamente significativos a 1%).
Tabela 3: Testes à normalidade da distribuição das taxas de rendibilidade
J-B
K-S
A-D
PSI20
551,068
3,970
35,059
DAX
1206,322
2,607
13,688
DJIA
2703,526
2,882
17,690
Nota: J-B: Jarque-Bera, K-S: Kolmogorov-Smirnov Z e A-D: Anderson-Darling Z.
As conclusões, tendo em conta o valor dos testes e as probabilidades associadas, também
apontam para uma rejeição clara da hipótese da normalidade.
Portanto, as distribuições das taxas de rendibilidade diárias dos três índices bolsistas PSI20,
DAX e DJIA são leptocúrticas, assimétricas e, em consequência, uma distribuição normal com
parâmetros fixos parece não ser o modelo mais adequado para descrever o seu comportamento
ao longo do tempo. Este excesso de curtose das distribuições empíricas das taxas de
rendibilidade dos activos financeiros também já tinha sido detectado noutros estudos empíricos
aplicados:
Ao mercado de capitais português: Garcia (1992), Soares (1994), Afonso e Teixeira
(1997 e 1998) e Godinho (1999);
Às taxas de câmbio do escudo (ao incerto) em relação ao marco alemão (Nicolau, 1999);
Ao índice alemão DAX: Barndorff-Nielsen (1994), Lux (1996) e Jaschke (2000), etc.;
Ao índice norte-americano DJIA: Fama (1965), de Lima (1998), Pandey (1998), Rachev
e Mittnik (2000), etc.
A distribuição das taxas de rendibilidade diárias dos três índices bolsistas é leptocúrtica,
característica que é comum à generalidade dos activos financeiros7.
O excesso de curtose em relação à distribuição normal é pois um facto estilizado deste tipo
de distribuições. Por conseguinte, e atendendo ao resultado dos testes anteriores, a distribuição
normal com parâmetros fixos parece não ser o modelo mais adequado para descrever o
comportamento das taxas de rendibilidade dos três índices bolsistas e dos activos financeiros
em geral. Esta incapacidade da distribuição normal para capturar o excesso de curtose das
distribuições empíricas, contribuiu para o aparecimento de vários processos de modelização
alternativos.
De seguida vamos ensaiar uma distribuição de Pareto estável não Gaussiana. O objectivo é
concluir qual das duas distribuições (de Pareto estável ou normal) parece ser mais adequada
para descrever as taxas de rendibilidade. A metodologia que pretendemos adoptar é a seguinte.
Primeiro, utilizamos o método da máxima verosimilhança e recorremos directamente à versão
3.04 do programa STABLE8 para estimar os quatro parâmetros da distribuição de Pareto estável.
Depois recorremos à função de verosimilhança, à distância de Kolmogorov (Rachev e Mittnik,
2000) e aos critérios AICC9 e SBC10 (Mittnik e Paolella, 2002) para comparar a aderência das
distribuições empíricas à distribuição de Pareto estável e à distribuição normal:
KD = 100 Max Fn ( x ) − F0 ( x ) ,
(8)
x∈R
()
AICC = −2 log L θ̂ +
()
SBC = −2 log L θ̂ +
2n(k + 1)
,
n−k −2
(9)
k log(n)
,
n
(10)
()
em que log L θ̂ é o logaritmo da função de verosimilhança, n é o número de observações e
k é o número de parâmetros a estimar.
Entre as duas distribuições, a mais adequada para descrever as taxas de rendibilidade
diárias de cada índice bolsista deverá ser aquela que apresenta um valor mais elevado para o
logaritmo da função de verosimilhança e um valor mais baixo para os dois outros critérios.
A tabela seguinte apresenta as estimativas para os parâmetros das três distribuições não
condicionadas e os desvios-padrão dos estimadores da máxima verosimilhança (ML). As
estimativas obtidas para o expoente característico da distribuição de Pareto estável são todas
inferiores a 2 (o valor de
desvios-padrão de
α̂
α
quando os dados são gerados por um processo Gaussiano). Os
também sugerem que a distribuição normal não é a mais adequada para
descrever as taxas de rendibilidade dos três índices bolsistas, uma vez que as estimativas para
o expoente característico são todas estatisticamente inferiores a 2.
Tabela 4: Estimativas para os parâmetros das distribuições não condicionadas (TRD)
α̂
βˆ
γˆ
δˆ
Normal
Estável
2,0000
1,5586 (0,0336)
0,0000
0,0512 (0,0703)
0,7801
0,5504 (0,0122)
0,0431
0,0446 (0,0205)
Normal
Estável
2,0000
1,7559 (0,0299)
0,0000
-0,2958 (0,1010)
0,9567
0,8080 (0,0156)
0,0530
0,1348 (0,0296)
Índices
Distribuição
PSI20
DAX
DJIA
Normal
2,000
0,0000
0,7112
0,0490
Estável
1,7133 (0,0314) -0,1716 (0,0918)
0,5763 (0,0115)
0,0922 (0,0213)
Nota: Os desvios-padrão encontram-se entre parêntesis. TRD: Taxas de rendibilidade diárias.
As medidas comparativas da bondade do ajustamento apresentadas na tabela seguinte
evidenciam também que a distribuição de Pareto estável se ajusta melhor às três distribuições
empíricas.
Tabela VIII.1: Bondade do ajustamento das distribuições não condicionadas
L
KD
Índices
Normal
Estável
PSI20
-3.376,64
DAX
DJIA
AICC
SBC
Normal
Estável
Normal
Estável
Normal
Estável
-3.128,86
8,38
1,90
6.755,28
6.261,72
6.753,29
6.257,73
-3.941,17
-3.836,70
4,10
1,69
7.884,34
7.677,40
7.882,35
7.673,41
-3.230,73
-3.086,83
5,44
1,78
6.463,57
6.177,66
6.461,47
6.173,67
Nota: L é o valor do logaritmo da função de verosimilhança.
5. Conclusão
A distribuição das taxas de rendibilidade diárias dos três índices bolsistas (PSI20, DAX e
DJIA) evidencia um excesso de curtose em relação à distribuição normal, característica que é
comum à generalidade dos activos financeiros.
Pelos resultados obtidos, uma distribuição de Pareto estável parece ser mais adequada do
que uma distribuição normal para modelizar a distribuição não condicionada dos três índices
bolsistas.
Apesar das estimativas para o expoente característico serem todas inferiores a 2 e das
medidas da bondade do ajustamento não favorecerem a distribuição normal, não podemos
concluir, no entanto, que as taxas de rendibilidade diárias tenham sido geradas necessariamente
por um processo de Pareto estável não Gaussiano. A única conclusão que podemos tirar é que
as taxas de rendibilidade dos três índices bolsistas se ajustam melhor a uma distribuição deste
tipo.
6. Referências bibliográficas
Afonso, Pedro A. e Teixeira, João C. (1997), Efficiency in Portuguese stock exchange indexes:
runs tests and BDS statistics, Working paper Nº 2/97, ISEG, Departamento de Economia.
Afonso, Pedro A. e Teixeira, João C. (1997), Non-linear tests of weakly efficient markest:
evidence from Portugal, Working paper Nº 6/98, ISEG, Departamento de Economia.
Bachelier, Louis, Theory of Speculation, in P. Cootner, ed., The random character of stock
market prices, Cambridge, MA: MIT Press, 1964. (Originalmente publicado em 1900).
Bandorff-Nielsen, O. E. (1995), Normal inverse Gaussian processes and the modeling of stock
returns, Research report, Aarhus University.
Brockwell, Peter J. e Davis, Richard A., Time series: theory and methods, Springer-Verlag, 2nd
edition, New York.
Campbell, John Y., Lo, Andrew W., MacKinlay. A. Craig (1997), The econometrics of financial
markets, Princeton University Press, New Jersey.
De Lima, Pedro J. F. (1997), Nonlinearities and nonstationarities, Journal of Business &
Economic Statistics, April 1998, Vol. 16, No. 2.
Fama, Eugene F. (1965), The behavior of stock prices, Journal of Business, XXXVIII (1),
January, pp. 34-105.
Feller, W. (1966), An introduction to probability theory and its applications, John Wiley & Sons,
New York.
Garcia, Maria T. (1992), Eficiência do mercado de capitais, Tese de Mestrado, Lisboa: ISEG.
Goria, M. (1978), Fractional absolute moments of the Cauchy distribution, Quaderni di statistica e
matematica applicata alle scienze economico-social, University of Trento , Trento (Italy), 1/2, pp.
89-96.
Gnedenko, B. V. e Kolmogorov, A. N. (1954), Limit distributions for sums of independent random
variables, Cambridge, Mass.: Addison-Wesley.
Hurvich, C. M., Tsai, C. L. (1989), Regression and time series model selection in small samples,
Biometrika, 76, 297-307.
Jaschke, Stefan R. (2000), A note on stochastic volatility, GARCH models and hiperbolic
distributions, [email protected].
Johnson, Norman L., Kotz, Samuel e Balakrishnan, N. (1994), Continuous univariate
distributions, second edition, vols. I-II, John Wiley and Sons, New York.
Kendall, M. (1953), The analysis of economic time series, Part 1. Prices., Journal of Royal
Statistical Society, 96, pp 11-25.
Lux, T. (1996), The stable Paretian hypothesis and the frequency of large returns: an
examination of major German stocks, Applied Financial Economics, Vol. 6, No 6, pp. 463-475.
Mandelbrot, Benoit B.
(1963), The variation of certain speculative prices, The Journal of
Business, 36, pp. 394-419.
Mittnik, Stefan e Paolella, Marc S. (2002), Prediction of financial downside-risk with heavy-tailed
conditional distributions, a publicar em Handbook of heavy tailed distributions in finance, NorthHolland.
Murteira, Bento J. F. (1979), Probabilidades e estatística, vols. I-II, Editora McGraw-Hill de
Portugal, Lisboa.
Nicolau, João Carlos H. C. (1999), Modelos ARCH, Instituto Mercado de Capitais, Associação da
Bolsa de Derivados do Porto.
Nolan, John P. (2002), Stable distributions models for heavy tailed data, cap.1, livro a publicar
em Janeiro de 2003.
Osborne, M. F. M. (1959), Brownian motion in the stock market, Operations Research, 7, pp.
145-173.
Pandey, Vivek, Kohers, Theodor e Kohers, Gerald (1998), Deterministic nonlinearity in the stock
returns of major European equity markets and the United States, The Financial Review, 33, 4564.
Peters, Edgar E. (1996), Chaos and order in the capital markets, second edition, John Wiley &
sons, USA.
Rachev, Svetlozar e Mittnik, Stefan (2000), Stable Paretian models in finance, John Wiley &
Sons, New York.
Schwartz, G. (1978), Estimating the dimension of a model, Annals of Statistics, 6, pp. 461-64.
Soares, João A. O. (1994), Preços de acções na Bolsa de Lisboa: análise, previsão e regras de
compra e venda, Tese de Doutoramento, Lisboa: IST.
NOTAS
1
Esta é a medida de rendibilidade utilizada com maior frequência: rt = 100(log Pt − log Pt −1 ) , em que log é
o logaritmo natural e Pt .é o valor de fecho diário de cada índice.
2
PSI: Portuguese Stock Exchange, DAX: Deutscher Aktienindex e DJIA: Dow Jones Industrial Average.
3
Pode ser encontrada uma exposição matemática rigorosa sobre as distribuições em Gnedenko e
Kolmogorov (1954). Lévy, Gnedenko e Kolmogorov são referidos por Fama (1965). Mais recentemente
ver Rachev e Mittnik (2000).
4
A distribuição não tem momentos de qualquer ordem, mas tem mediana, que é um parâmetro de ordem.
5
Goria, M. (1978), Fractional absolute moments of the Cauchy distribution, Quaderni di statistica e
matematica applicata alle scienze economico-social, University of Trento , Trento (Italy), 1/2, 89-96;
Balanda, K. P. (1987), Kurtosis comparisons of the Cauchy and double exponencial distributions,
Communications in Statistics – Theory and methods, 16, 579-592. Ambos citados por Johnson, Kotz e
Balakrishnan (1994, pág. 299).
6
Nolan (2002) refere outros tipos de parametrização.
7
Pelo menos em distribuições de dados de frequência elevada como é o caso das taxas de rendibilidade
diárias dos três índices bolsistas.
8
Este software está disponível no site do professor John Nolan: http://www.cas.american.edu/~jpnolan.
9
O critério AICC é uma correcção ao enviesamento do Akaike Information Criterion (AIC) (Akaike, 1974)
proposta por Hurvich e Tsai (1989) que é citado por Brockwell e Davis (1991).
10
Schwarz Information Criterion (Schwarz, 1978).
Download