Insper Instituto de Ensino e Pesquisa Programa de Mestrado Profissional em Economia Bruno Jaconias de Andrade Lopes Fernandes Coeficiente de determinação como previsor de desempenho de fundos multimercados São Paulo 2014 Bruno Jaconias de Andrade Lopes Fernandes Coeficiente de determinação como previsor de desempenho de fundos multimercados Dissertação apresentada ao Programa de Mestrado Profissional em Economia do Insper Instituto de Ensino e Pesquisa, como parte dos requisitos para a obtenção do título de Mestre em Economia. Área de concentração: Finanças Orientador: Prof. Dr. Michael Viriato Araujo – Insper São Paulo 2014 Fernandes, Bruno Jaconias de Andrade Lopes Coeficiente de determinação como previsor de desempenho de fundos multimercados / Bruno Jaconias de Andrade Lopes Fernandes; orientador: Michael Viriato Araujo – São Paulo: Insper, 2014. 48 f. Dissertação (Mestrado – Programa de Mestrado Profissional em Economia. Área de concentração: Finanças) – Insper Instituto de Ensino e Pesquisa. 1. Finanças 2. Fundos de investimentos 3. Análise de componentes principais FOLHA DE APROVAÇÃO Bruno Jaconias de Andrade Lopes Fernandes Coeficiente de determinação como previsor de desempenho de fundos multimercados Dissertação apresentada ao Programa de Mestrado Profissional em Economia do Insper Instituto de Ensino e Pesquisa, como requisito parcial para obtenção do título de Mestre em Economia. Área de concentração: Finanças Aprovado em: Dezembro/2014 Banca Examinadora Prof. Dr. Michael Viriato Araujo Orientador Instituição: Insper Assinatura: _________________________ Prof. Dr. Marco Lyrio Instituição: Insper Assinatura: _________________________ Prof. Dr. Ricardo Ratner Rochman Instituição: EESP – FGV Assinatura: _________________________ DEDICATÓRIA “Porque Dele e por Ele, e para Ele, são todas as coisas; glória, pois, a Ele eternamente. Amém.” (Romanos 11:36) AGRADECIMENTOS A minha esposa, Aline, pelo amor, apoio e compreensão em todos os momentos da vida, especialmente nestes últimos dois laboriosos anos. Aos meus pais, Wilson e Sandra, por não medirem esforços para que eu chegasse até aqui. A minha amada avó, Apparecida, pelo carinho, orações e palavras de conforto sempre em que eu pensei em desistir. A Janaína, minha querida irmã, por me inspirar como exemplo de vida em busca pela excelência de forma ética, pela cumplicidade e por me amparar nas mais difíceis decisões. Ao apoio de todos os meus demais familiares, especialmente a minha querida sogra. Ao professor e orientador, Dr. Michael Viriato Araujo, pela paciência e dedicação na orientação deste trabalho. Aos professores membros desta banca, Dr. Marco Lyrio e Dr. Ricardo Ratner Rochman, pelos direcionamentos ao longo do desenvolvimento desta tese. A equipe do Banco Crédit Agricole - especialmente aos meus chefes, Fábio Faria e Fábio Passos, e ao meu amigo de equipe, Guilherme Barredo - por me apoiarem na realização de mais este sonho. Aos meus amigos, Carolina, Cláudio, Douglas, Elano, Jéssica, Luigi, Marcelo, Max e Ronaldo por toda ajuda que me deram ao longo deste curso. Aos colegas de turma pelo companheirismo e por tornarem esta difícil trajetória um pouco mais prazerosa e repleta de momentos inesquecíveis. Especialmente, a Deus, que tornou tudo isto possível. RESUMO FERNANDES, Bruno Jaconias de Andrade Lopes. Coeficiente de Determinação como Previsor de Desempenho de Fundos Multimercados, 2014. 49 f. Dissertação (Mestrado) – Insper Instituto de Ensino e Pesquisa, São Paulo, 2014. Este trabalho tem como objetivo desenvolver um modelo para avaliar se o coeficiente de determinação (R2) pode ser um bom previsor de desempenho para fundos multimercados brasileiros baseando-se nos trabalhos já realizados por Amihud e Goyenko (2013) e Merhy (2013). Ao invés de utilizar os modelos de Fama e French (1993) e Carhart (1997), como realizado pelos estudos supracitados, foi utilizado um modelo de Análise de Componentes Principais (ACP). Com isto, não houve a necessidade de se escolher quais fatores de mercado deveriam fazer parte do modelo e, consequentemente, a heterogeneidade dos portfólios e a diversidade dos tipos de ativos que os compõem não foram entraves ao desenvolvimento da análise. Utilizando uma amostra de fundos multimercados no período de janeiro de 2010 a dezembro de 2013, foram calculados os R2s a partir das séries dos excessos de retornos dos fundos em relação ao CDI estimados pelo modelo dos componentes principais e dos excessos de retornos dos fundos em relação ao CDI reais. O R2 e os excessos de retornos dos fundos em relação ao CDI defasados foram utilizados como critérios de seleção para a criação de carteiras de fundos multimercados. Diferentemente do que foi encontrado nos estudos de Amihud e Goyenko (2013) e Merhy (2013), as carteiras formadas com os fundos com menor valor de R2 defasados não apresentaram desempenho superiores. Palavras-chave: Fundos de Investimentos Multimercados, Análise de Componentes Principais, Análise de Desempenho, Seletividade. (JEL G11, G20, G23) ABSTRACT FERNANDES, Bruno Jaconias de Andrade Lopes. Multimercado Fund’s Coefficient of Determination as Predictor of Performance, 2014. 49 f. Dissertation (Mastership) – Insper Instituto de Ensino e Pesquisa, São Paulo, 2014. This paper proposes to develop a model to assess whether the coefficient of determination (R2) can be a good predictor of performance for Brazilian multimercados funds based on the papers already done by Amihud and Goyenko (2013) and Merhy (2013). Instead of using models of Fama and French (1993) and Carhart (1997), as used by the aforementioned studies, we used a model of Principal Component Analysis (PCA). With this, model there was no need to choose which multifactor of market should be part of the model and hence heterogeneity of the portfolios and the diversity of the types of assets that comprise the barriers were not drag to the analysis development. Using a sample of multimercados funds from January 2010 to December 2013 were calculated R2s from the series of excess fund’s return in relation to CDI estimated by the model of the principal components and excess fund’s return in relation to CDI. The R2 and excesses of fund returns relative to the CDI lagged were used as selection criteria for the creation of portfolios of multimercados funds. Unlike what was found in the studies of Amihud and Goyenko (2013) and Merhy (2013), the portfolios composed with the funds with lower value of R2 lagged did not provide better performance. Keywords: Multimercado Funds, Principal Component Analysis, Performance Analysis, Selectivity. (JEL G11, G20, G23) SUMÁRIO EXECUTIVO Um tema recorrentemente discutido na academia e de interesse dos investidores é saber qual o melhor tipo de estratégia de fundos de investimento: o de gestão ativa ou o de gestão passiva. A resposta definitiva para esta pergunta teria implicações importantes, já que os investidores deixariam de aplicar seus recursos numa estratégia em detrimento da outra. Este assunto tem sido bastante estudado no universo de fundos de ações. Para estes ativos diversos modelos de fatores que conseguem explicar a variação dos retornos já foram consolidados. Dentre os diversos modelos desenvolvidos, o de Fama, French e Carhart (FFC) é um dos mais utilizados. Para os fundos de ações, estudos recentes que utilizaram FFC verificaram que a gestão ativa tem afetado positivamente o desempenho de fundos. O coeficiente de determinação (R2) é um índice que varia de 0 a 1 e que indica quão bem um conjunto de dados se adequa a um modelo estatístico. Portanto, quanto mais próximo de 0, menos aderente é o conjunto de dados ao modelo; e, quanto mais próximo de 1, mais aderente é o conjunto de dados ao modelo. Amihud e Goyenko (2013) utilizam o coeficiente de determinação - obtido por meio da regressão entre os retornos dos fundos e o modelo de FFC - como indicativo de seletividade. Sendo assim, quanto menor o R2, mais seletivo seria o fundo e por isto maior seria sua gestão ativa. Amihud e Goyenko (2013) identificaram que os fundos com menores R2 defasados em geral apresentaram desempenhos superiores em períodos posteriores. Em alguns casos a aplicação de modelos como o de FFC a outras estratégias da indústria não é possível, pois eles requerem a informação dos tipos de ativos que compõem os portfólios a serem analisados e o prévio conhecimento de quais são os fatores que explicam os retornos. No Brasil, a estratégia de fundos que permite uma composição mais heterogênea em termos de tipos de ativos é a categoria ANBIMA denominada como multimercados. A importância desta estratégia para a indústria brasileira pode ser representada por seus números absolutos e relativos: dados de julho de 2014 revelam que ela era a segunda maior categoria de fundos com R$ 497 bilhões de ativos sob gestão, o que representava 19,1% do patrimônio líquido da indústria. Uma maneira de superar as limitações dos modelos de fatores utilizados em estudos anteriores seria a aplicação de Análise de Componentes Principais (ACP). ACP é um modelo que identifica padrões nos dados e que consegue expressar numa forma de destacar suas similaridades e diferenças. ACP é uma poderosa ferramenta de análise de dados principalmente quando é difícil se encontrar padrões em dados de alta dimensão – como é o caso do comportamento dos retornos de fundos multimercados. Este trabalho avaliou se os fundos que obtiveram menores R2s defasados também apresentaram desempenhos superiores em períodos posteriores como ocorrera no trabalho de Amihud e Goyenko (2013). Entretanto, ao invés de se utilizar o modelo de FFC utilizou-se o modelo de ACP para calcular o R2. Algumas adaptações foram necessárias para sua aplicação, sendo a mais relevante delas a substituição do alfa defasado - pois não se sabe ao certo aos quais fatores se referem os coeficientes de regressão calculados pelo ACP - pelo excesso de retorno dos fundos em relação ao ativo livre de risco defasado, neste caso o CDI. No caso do modelo de ACP desenvolvido no estudo, os fundos com um menor R2 defasado em geral não apresentaram um desempenho superior em períodos posteriores. Ou seja, o resultado não foi similar ao encontrado no trabalho de Amihud e Goyenko (2013). Algumas possíveis extensões e adaptações para este trabalho que poderiam porventura apresentar resultados diferentes dos aqui demonstrados são: a utilização de um modelo de ACP que varie o número de componentes principais – ao invés da utilização estática de 4 componentes principais; um estudo que encontre a que fatores de mercado estes componentes principais se referem - já que neste estudo os mesmos não foram identificados; as extensões do período e do horizonte de retornos analisados e a utilização do retorno mediano, ao invés do retorno médio para a formação das carteiras. LISTA DE TABELAS Tabela 1 - Categorias e tipos ANBIMA ................................................................................ 23 Tabela 2 - Estatísticas descritivas da amostra de fundos ....................................................... 27 Tabela 3 - Estatísticas da variância total explicada acumulada por m componentes principais ............................................................................................................................................ 35 Tabela 4 - Excessos de retornos anualizados das carteiras agrupadas por R2t-1 e Excesso de Retornot-1 ............................................................................................................................. 39 Tabela 5 - Estatísticas descritivas dos exct semanais das carteiras......................................... 41 LISTA DE FIGURAS Figura 1 - Variância total acumulada explicada por 4 componentes principais ...................... 36 SUMÁRIO 1 INTRODUÇÃO ................................................................................................................ 13 2 REVISÃO BIBLIOGRÁFICA .......................................................................................... 16 3 DADOS E AMOSTRA ..................................................................................................... 23 3.1 Base de dados ............................................................................................................. 23 3.2 Definição da amostra .................................................................................................. 23 4 METODOLOGIA ............................................................................................................. 28 4.1 Cálculos dos retornos ................................................................................................. 28 4.2 Cálculos dos excessos de retornos .............................................................................. 28 4.3 Análise de componentes principais ............................................................................. 29 4.4 Aplicação da análise de componentes principais ......................................................... 33 4.6 Aplicação do modelo reduzido ................................................................................... 36 4.6 Carteiras agrupadas por R2 e excessos de retornos ...................................................... 37 5 CONCLUSÕES ................................................................................................................ 42 REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................. 44 APÊNDICE ......................................................................................................................... 48 13 1 INTRODUÇÃO Ao longo da história, diversos estudos têm sido desenvolvidos de forma a auxiliar na identificação de fundos que obtêm retornos superiores ao desempenho de mercado ponderado por seus fatores de risco. Neste sentido, pesquisas que tiveram contribuições como a de Fama e French (1993) e Carhart (2007) possuem em comum o fato de utilizarem modelos fatoriais. Apesar dos importantes avanços que estes modelos trouxeram para o campo das finanças, algumas de suas premissas impedem que sua aplicação se estenda a todas as estratégias encontradas na indústria de fundos de investimentos, já que muitos destes requerem a informação da composição do portfólio e dos seus respectivos benchmarks. Algumas vezes, muitas destas informações não estão disponíveis ou até mesmo são difíceis de serem obtidas. Outro problema também surge em determinados tipos de estratégia em que os benchmarks não são claramente definidos. No caso dos fundos de ações, estudos como o de Busse, Goyal e Wahal (2006) e Castro e Minardi (2009), demonstram que em média os gestores de fundos ativos tendem a não superar o seu benchmark. Entretanto, novas pesquisas como a de Cremers e Petajisto (2009) têm indicado que um pequeno grupo de gestores ativos tem apresentado um persistente desempenho acima do benchmark. Nesse trabalho os autores criam o conceito chamado de Active Share, que é uma medida definida pela diferença entre a composição da carteira e seu índice de referência. Sendo assim, quanto maior for o grau de diferença, maior será a participação ativa do fundo. Utilizando o Active Share e o tracking error, o estudo indica que estratégias com alta participação ativa são mais propensas a superar os seus benchmarks e fundos semelhantes. A partir deste estudo, trabalhos têm sido realizados na mesma direção: de forma a avaliar se a seletividade dos fundos de investimentos de gestão ativa tem sido utilizada em prol da geração de excedente de retorno. Amihud e Goyenko (2013) sugerem que a performance dos fundos pode ser prevista pelo coeficiente de determinação (R2) obtido por meio da regressão entre os retornos dos fundos e um modelo multifatorial. Uma maior seletividade seria indicada por um menor R2 e, portanto, preveria uma melhor performance. O trabalho conclui que, controlado pelas características do fundo e pelo desempenho passado, um menor R2 possui um maior excesso de retorno ajustado ao risco. Ao se formar um portfólio com os fundos de ações que obtiveram o menor R2 passado, produziu-se um excesso de retorno anualizado de 3,8% ou mais, dependendo do modelo multifatorial utilizado. 14 Merhy (2013), baseado no trabalho de Amihud e Goyenko (2013), reproduz um estudo parecido para a indústria de fundos de ações de gestão ativa no Brasil. Por meio da metodologia de benchmarks de Carhart (1997), o autor gera o coeficiente de determinação (R2) obtido por meio da regressão entre os retornos dos fundos e do modelo de multifatores. O estudo de Merhy (2013) conclui que também no caso brasileiro o R2 se mostra adequado como parâmetro para prever a geração de retorno excedente dos fundos em relação aos seus respectivos benchmarks. Entretanto, diferentemente do trabalho de Amihud e Goyhenko (2013), a significância deste indicador se deu para horizontes mais longos como o de três e seis meses e não para o horizonte de um mês. Como se pode ver, no caso dos fundos de ações, as pesquisas mencionadas já têm respondido questões importantes. A alocação em fundos de gestão ativa não parece valer a pena, caso se leve em conta os desempenhos médios dos fundos de ações. Entretanto, há um pequeno grupo de gestores ativos que tem apresentado um persistente desempenho acima do benchmark e este parece ser fruto de uma maior participação ativa dos fundos. Mas o que dizer dos demais tipos de fundos de investimentos? Dados da Associação Brasileira das Entidades dos Mercados Financeiros e de Capitais1 (ANBIMA) informam que em Julho de 2014 os fundos de ações representavam 14% do patrimônio líquido da indústria. Portanto, dado que os fundos de ações representam uma parcela desta indústria, supõe-se que os investidores tenham interesse em desenvolver um ferramental analítico também para outras estratégias de forma a selecionar um fundo que obtenha retornos superiores ao mercado. Trabalhos acadêmicos têm tentado adaptar modelos de benchmarks multifatoriais com o objetivo de avaliar fundos de outras classificações. O próprio trabalho de Amihud e Goyenko (2013) o faz com fundos que investem em bonds corporativos. Entretanto, neste modelo as informações dos tipos de ativos que podem compor o portfólio dos fundos e os seus respectivos benchmarks são conhecidos. Sendo assim, sua aplicação torna-se comprometida a uma estratégia de fundos cujas composições dos portfólios não são completamente homogêneas bem como os tipos de ativos que podem fazer parte de suas carteiras. No caso brasileiro, a estratégia de fundos que melhor se enquadra nestas características é a denominada na categoria ANBIMA como multimercados. Dados da ANBIMA informam que em julho de 2014 os multimercados eram a segunda maior categoria de fundos com R$ 497 bilhões de ativos sob gestão representando 19,1% do patrimônio líquido da indústria. 1 Fonte: ANBIMA: www.anbima.com.br 15 Sendo assim, este trabalho tem como objetivo desenvolver um modelo para avaliar se o coeficiente de determinação (R2) pode também ser um bom previsor de desempenho para fundos multimercados brasileiros. Entretanto, ao invés de utilizar o modelo de Carhart (1997), como realizado por Merhy (2013), será utilizado a Análise de Componentes Principais para obter-se a regressão. Com isto não haverá a necessidade de se escolher quais multifatores devem fazer parte do modelo e, consequentemente, a heterogeneidade dos portfólios e a diversidade dos tipos de ativos que os compõem teoricamente não serão mais entraves ao desenvolvimento da análise. Como descrito por Smith (2012), Análise de Componentes Principais (ACP) é uma forma de identificar padrões nos dados e expressá-los numa maneira de destacar suas similaridades e diferenças. ACP é uma poderosa ferramenta de análise de dados principalmente quando é difícil se encontrar padrões em dados de alta dimensão – como é o caso do comportamento dos retornos de fundos. Ela tem sido utilizada nos mais diversos campos de estudos científicos - desde a elaboração de sistemas mais eficazes para detecção de imagens a aplicações em neurociência. Em Finanças, a ACP já tem sido bastante utilizada, especialmente em estudos sobre análise da curva futura de juros, construção de hedge para portfólios de renda fixa, previsão e análise de assimetria de volatilidade e elaboração de algoritmos para alocação de ativos em carteiras de ações e de pares long short. Esperava-se obter neste estudo conclusões similares às encontradas nos trabalhos de Amihud e Goyenko (2013) e Merhy (2013): a de que fundos com menor valor de R2 defasado apresentem desempenho superior, mesmo com a utilização do modelo de ACP. Tal fato corroboraria na direção dos resultados de estudos recentes de que uma maior seletividade em relação aos multifatores – independentemente do que estes sejam – indica para uma propensão à geração de maior excesso de retorno. Entretanto, o R2 não se mostrou adequado como parâmetro de seleção de carteiras de fundos de investimentos multimercados que gerem maior excesso de retorno em relação ao ativo livre de risco. Este trabalho está dividido em cinco partes. Na segunda seção, apresenta-se a revisão bibliográfica dos trabalhos acadêmicos sobre desempenho de fundos, modelos de multifatores e ACP. Na terceira seção, discorre-se sobre o universo da indústria de fundos de investimentos no Brasil e as premissas para a escolha da amostra utilizada. Na quarta seção, demonstram-se a metodologia e os resultados auferidos. Na quinta seção, descrevem-se as conclusões, as comparações dos resultados com outros trabalhos e possíveis extensões e adaptações para este estudo que poderiam porventura apresentar resultados diferentes dos aqui exibidos. 16 2 REVISÃO BIBLIOGRÁFICA Markowitz (1952) em “Portfolio Selection” deu origem ao desenvolvimento da Teoria do Portfólio e é considerado o predecessor dos estudos de desempenho de carteira. Nesse trabalho, o autor considera que os investidores utilizam o processo de diversificação de carteira para otimizar sua alocação de recursos. Para isto os investidores, seguindo sua função utilidade, avaliam na sua seleção de ativos a relação risco-retorno entre eles de forma a buscar minimizar o risco e maximizar o retorno esperados de sua carteira como um todo. Entende-se por risco o desvio-padrão dos retornos dos ativos. Também chamada de volatilidade, a mesma avalia a dispersão dos retornos com relação ao retorno médio e é calculada da seguinte forma: s= n ∑ i =1 (r − r ) 2 i n −1 (1) onde ri é o “i-ésimo” retorno observado; r é a média simples dos retornos observados e n é o número de retornos no período analisado. A partir dos estudos de Markowitz (1952), Sharpe (1963, 1964) e Treynor (1961) desenvolveram quase que simultaneamente uma apropriada medida de sensibilidade para ativos individuais e um modelo de equilíbrio para determinar o preço de mercado ajustado ao risco. Apesar de não haver uma homogeneidade nas citações acadêmicas quanto à contribuição de cada trabalho neste processo, Copeland, Weston e Shastri (2005) citam que os trabalhos realizados por Mossin (1966), Lintner (1965, 1969) e Black (1972) foram necessários para o desenvolvimento e finalização desta teoria. Este modelo que ficou conhecido como Capital Asset Pricing Model (CAPM) é utilizado como ferramenta para determinar a taxa de retorno apropriada de um ativo e a sensibilidade deste ativo ao seu risco sistemático (também chamado como risco não diversificável ou risco de mercado). O risco sistemático está relacionado às variáveis que compõem o sistema, sejam elas econômicas, financeiras ou mesmo políticas. Podem citar como exemplos de variáveis que compõem o risco sistemático: a liquidez do mercado financeiro, o nível de preços, as condições políticas ou a confianças dos investidores. Chama-se o risco sistemático de não diversificável porque, segundo a teoria da diversificação, este não é passível de ser eliminado ou mitigado por meio da diversificação da carteira. Já o risco não sistemático é chamado de risco diversificável pois é passível de ser eliminado ou mitigado por meio da diversificação da carteira. Neste caso, 17 entende-se por diversificação a adição de novos ativos no portfólio. O risco não sistemático refere-se ao conjunto de variáveis que influencia especificamente o ativo em questão. Sendo assim, o modelo do CAPM ficou formalmente conhecido como: E ( Ri ) = Rf + β i ( E ( Rm ) − Rf ) (2) onde: E(Ri) = expectativa de retorno do ativo; Rf = retorno do ativo livre de risco; βi (beta) = sensibilidade da expectativa de excesso de retorno do ativo ao retorno de Cov( Ri , Rm ) mercado. Pode também ser obtido da seguinte forma: βi = . O beta é tido como a Var ( Rm) medida de risco sistemático; E(Rm) = expectativa de retorno do mercado; E(Rm)- Rf = prêmio de mercado. Após o trabalho de Markowitz (1952), muitos estudos foram desenvolvidos para avaliar a performance de portfólios, especialmente mutual funds. Entretanto, trabalhos como o de Treynor (1965) e Sharpe (1966) se detiveram a explorar o desenvolvimento de medidas de performance relativa. Ou seja, mediante a performance de duas carteiras, avaliar qual delas possuía um melhor desempenho. Diante deste contexto, Jensen (1968) propôs um modelo de medida de performance absoluta. Baseado no CAPM, o modelo - que ficou conhecido como Alpha de Jensen - avaliou 115 mutual funds no período de 1945 a 1964 e concluiu que nenhum fundo teve um desempenho acima da média. Além disto, o autor concluiu que os fundos de estratégia passiva obtiveram retornos melhores do que os fundos de estratégia ativa. Baseando-se no método de Jensen (1968), Grinblatt e Titman (1989) estimaram com quatro modelos distintos a existência de retornos anormais para mutual funds americanos no período de 1974 a 1984. A conclusão a que os autores chegaram é a de que alguns fundos que obtiveram retornos brutos superiores eram justamente aqueles que possuíam as maiores despesas. Sendo assim, os investidores não se beneficiaram dos retornos brutos anormais e não houve retornos superiores nas rentabilidades líquidas de despesas. A partir destes trabalhos, acadêmicos voltaram os esforços para tentar encontrar quais multifatores poderiam explicar a variação dos retornos dos ativos que não fossem explicados apenas pelo risco sistemático do CAPM – leia-se o beta de prêmio de mercado. É neste contexto que surge o modelo de benchmark de três multifatores de Fama e French (1993). 18 Tendo como base o CAPM, este modelo de equilíbrio de preços acrescentou ao excesso de retorno esperado em relação ao mercado os multifatores de tamanho das empresas e da relação dos valores book-to-market. Eles verificaram que as empresas com menor valor de mercado e as que apresentavam maior relação do Valor Patrimonial / Valor de Mercado (VP/VM ou book-to-market) obtinham retornos maiores que as demais empresas com características distintas. Com isto, os autores dividiram as ações por meio destas caraterísticas. Aquelas que possuíam valor de mercado maior ou igual que a mediana foram denominadas de Big (B) e as que possuíam valor de mercado menor foram denominadas de Small (S). No que se refere à relação VP/VM, os autores dividiram as ações em percentis de forma a montar três classificações: as que apresentaram uma razão entre 0% a 30% foram denominadas de Low (L) e também chamadas de ações de “crescimento”, entre 30% a 70% foram denominadas de Middle (M) e as entre 70% a 100% foram denominadas de High (H) e também chamadas de ações de “valor”. A partir disto, os autores criaram seis carteiras: SL (Small and Low), SM (Small and Middle), SH (Small and High), BL (Big and Low), BM (Big and Middle) e BH (Big and High). Tendo como multifatores SMB – obtido por meio da diferença entre os retornos médios das carteiras com a característica S e as das carteiras com característica B – e HML – alcançado por meio da diferença dos retornos médios das carteiras com a característica H e as das carteiras com características L – os autores formalizarem o modelo da seguinte forma: Rci , t − Rrft = alfa + beta( Rmt − Rft ) + s ( SMBt ) + h( HMLt ) + ei , t (3) sendo que: Rci,t = retorno da carteira i no mês t; Rrfi = retorno do ativo livre de risco no mês t; Rmt = retorno da carteira de mercado no mês t; SMBt = Small Minus Big ou prêmio pelo fator VM no mês t; HMLt = High Minus Low ou prêmio pelo fator VP/VM no mês t; ei,t = resíduo do modelo referente à carteira i no mês t. Para a análise, os autores retiraram as empresas financeiras da amostra - devido ao alto grau de alavancagem típico do setor - e analisaram o desempenho das ações não-financeiras listadas na AMEX, NASDAQ e NYSE arquivados no Center for Research in Security Prices (CRSP) entre os anos 1963 e 1991. Com esta amostra no período supracitado e com os novos 19 multifatores inclusos o modelo obteve um maior poder explicativo que o CAPM. Os autores também concluíram que as empresas com maior relação book-to-market obtiveram retornos médios maiores do que aquelas com uma relação menor e que as empresas denominadas de “valor” também obtiveram retornos médios maiores do que as que foram denominadas de “crescimento”. Como uma extensão do modelo Fama-French de três multifatores, Carhart (1997) desenvolve um modelo de quatro multifatores ao incluir uma variável que ficou conhecida como momentum. O momentum de um ativo pode ser entendido como a tendência do seu preço continuar subindo, se num passado recente ele subiu, ou dele continuar caindo, se num passado recente ele caiu. Jegadeesh e Titman (1993) já haviam estudado o efeito de momentum e verificaram que as ações que haviam obtido um desempenho melhor do que o mercado nos últimos três a doze meses tendiam a manter um desempenho melhor nos meses seguintes e as ações das empresas que haviam obtido uma performance pior do que o mercado também tendiam a prosseguir com este comportamento. Também utilizando dados da AMEX, NASDAQ e NYSE, Carhart (1997) construiu o fator momentum por meio da diferença dos retornos de 11 meses com defasagem de 1 mês entre o grupo de 30% das ações que apresentaram os maiores retornos e entre o grupo de 30% das ações que apresentaram os menores retornos no período citado. Sendo assim, o modelo de quatro multifatores foi formalizado da seguinte forma: Rci , t − Rrft = alfa + beta( Rmt − Rft ) + s ( SMBt ) + h( HMLt ) + w(WinMLost ) + ei , t (4) em que: WinMLos,t = Win minus Loss ou prêmio pelo fator momentum no mês t. Este modelo, que passou a ser conhecido na academia como modelo de Fama, French e Carhart (FFC), demonstrou um maior poder de explicação dos retornos dos fundos do que o CAPM e o Fama-French, sendo que todos os multifatores foram estatisticamente significantes e não houve problemas de correlações altas entre eles. Após o desenvolvimento destes estudos de modelos multifatores, alguns trabalhos na academia - conforme se demonstrará posteriormente - começaram a estudar quais características em comum poderiam haver entre os fundos que gerassem excesso de retorno e quem sabe criar uma ferramenta que previsse ex-ante os fundos vencedores. Além disto, 20 diversas outras medidas de seletividade passaram a ser criadas para avaliar a capacidade dos gestores de escolherem ações vencedoras. Cremers e Petajisto (2009) criaram uma nova medida de gestão ativa de portfólio chamada de Active Share. Esta medida mensura o desvio dos ativos em carteira em relação aos ativos no portfólio do seu respectivo benchmark da seguinte forma: ActiveShare = 1 N ∑ wfund , i − windex, i 2 i =1 (5) Onde wfund,i e windex,i são os pesos do ativo i no fundo e no índice utilizado como benchmark, sendo que a soma leva em conta todo o universo de ativos. O estudo conclui que os fundos com maior índice de Active Share desempenharam acima dos seus benchmarks tanto antes quanto após o computo das despesas. A avaliação se a seletividade dos fundos de investimentos de gestão ativa tem sido utilizada em prol da geração de excedente de retorno é um tema ainda bastante presente na academia, sendo que estudos ainda utilizam modelos de benchmarks multifatoriais. Amihud e Goyenko (2013) sugerem que o desempenho dos fundos pode ser previsto pelo coeficiente de determinação (R2) obtido por meio da regressão entre os retornos dos fundos e alguns destes modelos. Sendo assim, um menor R2 indicaria uma maior seletividade e, consequentemente, seria esperado um melhor desempenho. O trabalho conclui que um portfólio formado com os fundos de ações que obtiveram o menor R2 passado produz um excesso de retorno anualizado de 3,8% ou mais, dependendo do modelo utilizado. Alguns estudos já têm utilizado Análise de Componentes Principais (ACP) para estudos na indústria de fundos de investimentos. Fung e Hsieh (1997) determinam a classificação de hedge funds endogenamente ao aplicar um modelo quantitativo de ACP. Isto se diferencia de estudos anteriores que para determinar a classificação de fundos baseiam-se apenas em medidas qualitativas ou simplesmente na classificação reportada pelos próprios fundos. Os autores analisaram 409 hedge funds como um único grupo e extraíram cinco componentes principais que explicaram aproximadamente 43% da variação do retorno deste grupo. Ao utilizar os fundos mais correlacionados com estes componentes principais, eles construíram cinco multifatores de estilo cujos retornos são altamente correlacionados com os componentes principais. Todas as correlações dos cinco multifatores de estilo com os seus respectivos componentes principais ficaram acima de 93%. Ao analisar cada fator de estilo, os pesquisadores conseguiram associá-los a algumas estratégias qualitativamente descritas na 21 indústria de hedge funds: “Systems/Opportunistic”, “Global/Macro”, “Value”, “Systems/Trend Following”, e “Distressed”. Como será demonstrado, há diversos trabalhos sobre fundos de investimentos no Brasil: estudos relacionados a características dos veículos, sobre medidas e persistência de desempenho, sobre seletividade, modelos multifatores entre outros. No que se refere a características dos fundos, vale destacar o estudo sobre o efeito do tamanho nos fundos de investimento brasileiros realizado por Milani e Ceretta (2013). Diferentemente do que muitos trabalhos da literatura internacional demonstraram, os autores verificaram que os fundos brasileiros de investimento em ações apresentam indícios de que existe o efeito tamanho, já que, na maior parte das vezes, fundos com patrimônio líquido maior tenderam a apresentar melhor desempenho. Utilizando-se o modelo do CAPM com a inclusão das variáveis referentes a tamanho e idade dos fundos, a análise dos quartis de fundos Ibovespa Ativos e IBr-X Ativos mostrou que o coeficiente alfa foi mais significativo para os fundos de maior PL. Este resultado não foi verificado nos fundos de gestão passiva. No que se refere à idade do fundo, foi também averiguado que o excesso de retorno aumenta conforme for maior o tempo de existência do fundo. Neste caso, a exceção se deu na categoria dos fundos Livres em que os fundos mais novos apresentaram um excesso de retorno superior aos mais antigos. Dos estudos de medidas de desempenho no Brasil, vale destacar os trabalhos de Rochman e Eid Jr. (2006) e Monteiro (2006). Rochman e Eid Jr. (2006) com uma amostra constituída de 699 fundos de investimentos abertos, não exclusivos e de 68 gestores distintos tentam responder se seria melhor investir nos fundos ativos ou passivos, levando em conta o desempenho dos fundos entre fevereiro de 2001 até janeiro de 2006. As conclusões não são tão diretas e dependem de acordo com a estratégia. Nos casos dos fundos de ações e multimercados, a gestão ativa agregou valor para o investidor de forma que os gestores geraram excesso de retorno para os investidores. Já no caso da renda fixa, a conclusão foi a de que a gestão ativa não agrega valor e, no caso dos fundos cambiais, os resultados foram inconclusivos, pois os alfas em geral não se mostraram significativos. Monteiro (2006) utiliza a metodologia de Bollen e Busse (2005) e avalia a persistência de performance em 112 fundos de investimento brasileiros em janelas de três meses e um ano no período de janeiro de 1998 a dezembro de 2005. O autor encontrou evidência de persistência de performance por seletividade e market timing para um pequeno número de fundos por até seis meses. 22 Entre os estudos de seletividade vale destacar o trabalho de Castro e Minardi (2009), que utiliza o modelo FFC desenvolvida por Cahart (1997) para avaliar os fundos de ações no Brasil entre o período entre 1996 e outubro de 2006. A conclusão dos autores condisse com a teoria de eficiência de mercado, pois eles verificaram que um número reduzido de fundos (4,6%) apresentou alfa significativamente positivo quando analisado os retornos líquidos. Em relação aos estudos de modelos multifatores vale destacar o trabalho de Oliveira Filho, Mussa e Gouvêa (2011). Com o objetivo de comparar o poder de explicação dos retornos dos fundos de investimentos em ações brasileiros utilizando os modelos CAPM, Fama-French de três multifatores e FFC de quatro multifatores; os autores concluíram que o último é superior ao Fama-French, que por sua vez indicou superioridade ao CAPM. Entretanto, os resultados dos modelos testados não foram conclusivos na explicação das variações dos retornos dos fundos e os multifatores de momentum e tamanho da empresa mostraram-se não significativos. Merhy (2013) propõe para o mercado brasileiro a aplicação do coeficiente de determinação (R2) de fundos de ações de gestão ativa como previsor do desempenho baseado no modelo apresentado por Amihud e Goyenko (2013). Para efetuar as regressões, o autor utiliza - como no trabalho que originalmente serviu de inspiração - os multifatores do modelo Fama e French (1993) e Carhart (1997). O R2 e o alfa são utilizados para prever o desempenho individual dos fundos a partir de carteiras formadas pelos veículos que apresentaram resultados semelhantes nestas duas variáveis. Merhy (2013) encontra resultados no Brasil bastante parecidos com os verificados por Amihud e Goyenko (2013) nos EUA. As carteiras formadas por fundos com baixo R2 e alto alfa defasados obtiveram excesso de retorno superior nos meses seguintes aos fundos que haviam apresentado alto R2 e baixo alfa. 23 3 DADOS E AMOSTRA 3.1 Base de dados Para o desenvolvimento do modelo, a obtenção das cotas dos fundos foi realizada por meio do sistema Economática®, que por sua vez utiliza como fonte de dados a Base SIANBIMA® e a Comissão de Valores Mobiliários (CVM). 3.2 Definição da amostra De acordo com a classificação ANBIMA de fundos existem as seguintes categorias e tipos de fundos2: Tabela 1 - Categorias e tipos ANBIMA 2 Categoria ANBIMA Tipo ANBIMA Curto Prazo Curto Prazo Referenciado DI Referenciado DI Renda Fixa Renda Fixa Renda Fixa Renda Fixa Crédito Privado Renda Fixa Renda Fixa Índices Multimercados Long and Short – Neutro Multimercados Long and Short – Direcional Multimercados Multimercados Macro Multimercados Multimercados Trading Multimercados Multimercados Multiestratégia Multimercados Multimercados Multigestor Multimercados Multimercados Juros e Moedas Multimercados Multimercados Estratégia Específica Multimercados Balanceados Multimercados Capital Protegido Dívida Externa Investimento no Exterior Fonte: ANBIMA: www.anbima.com.br 24 Ações Ações IBOVESPA Indexado Ações Ações IBOVESPA Ativo Ações Ações IBrX Indexado Ações Ações IBrX Ativo Ações Ações Setoriais Ações Ações FMP – FGTS Ações Ações Small Caps Ações Ações Dividendos Ações Ações Sustentabilidade/Governança Ações Ações Livre Ações Fundos Fechados de Ações Cambial Cambial Previdência Previdência Renda Fixa Previdência Previdência Balanceados – até 15 Previdência Previdência Balanceados – de 15-30 Previdência Previdência Balanceados – acima de 30 Previdência Previdência Multimercados Previdência Previdência Data-Alvo Previdência Previdência Ações Exclusivos Fechados Exclusivos Fechados Off shore Off Shore Renda Fixa Off shore Off shore Renda Variável Off shore Off shore Mistos Fundos de Direitos Creditórios Fomento Mercantil Fundos de Direitos Creditórios Financeiro Fundos de Direitos Creditórios Agro, Indústria e Comércio Fundos de Direitos Creditórios Outros Fundo de Índices (ETF) Fundo de Índices (ETF) Fundos de Participações Fundos de Participações Fundos de Investimento Imobiliário Fundos de Investimento Imobiliário Conforme supracitado, um dos objetivos deste estudo é aplicar o modelo de Análise de Componentes Principais (ACP) a uma estratégia de fundos cuja composição do portfólio não seja homogênea ou os tipos de ativos que possam fazer parte de suas carteiras também não 25 necessariamente sejam. No caso brasileiro, a estratégia de fundos que melhor se enquadra nestas características é a denominada na categoria ANBIMA como Multimercados. Como demonstrado na tabela, existem 10 tipos ANBIMA de fundos nesta categoria. No entanto, nem todos possuem as premissas que se julgam adequadas para serem utilizadas no modelo. Com isto, foram definidos alguns critérios para se chegar à amostra com as características vistas como apropriadas. O primeiro critério foi escolher os tipos ANBIMA de fundos cujos riscos estejam ligados às diversas classes de ativos e em que não haja nenhum tipo de restrição quanto à utilização de alavancagem. Caso este critério não fosse adotado, haveria restrições quanto à utilização de alguns ativos e à realização de algumas operações. Por este critério eliminam-se quatro tipos de fundos: Long and Short – Neutro, Long and Short – Direcional, Balanceados e Capital Protegido. Para os seis tipos de fundos remanescentes, as descrições demonstradas pela ANBIMA foram analisadas individualmente e alguns tipos de fundos foram retirados devido a alguma questão qualitativa que não corroborasse com as premissas do modelo. Com isto, foram retirados quatro tipos de fundos: Trading, Multigestor, Juros e Moedas e Estratégia Específica. No caso do tipo Multimercados Trading, o mesmo foi retirado devido ao fato de explorar oportunidades de ganhos originados por movimentos de curto prazo nos preços dos ativos. Julgou-se conveniente a exclusão porque os tipos de fundos mantidos, além de serem mais representativos em termos de tamanho dentro da categoria de Multimercados, possuem um horizonte de investimento mais longo em suas aplicações. O tipo Multimercados Multigestor foi excluído porque - diferentemente dos demais não aloca diretamente em ativos, mas sim em outros fundos de investimentos. A supressão do Multimercados Juros e Moedas se deu porque este tipo exclui as estratégias que impliquem exposição de renda variável como, por exemplo, ações. Já em relação ao tipo Multimercados Estratégia Específica o mesmo foi excluído por adotar estratégia de investimento que implique riscos específicos – como, por exemplo, commodities e futuro de índice – não havendo uma exposição simultânea a diversos fatores conforme desejado no modelo. Sendo assim os tipos ANBIMA remanescentes foram: Multimercados Macro e Multimercados Multiestratégia. De acordo com a descrição da entidade, os Multimercados Macro atuam de forma direcional e realizam operações em diversas classes de ativos (renda fixa, renda variável, 26 câmbio, entre outros), tendo como base os cenários macroeconômicos de médio e longo prazo para definir suas estratégias de investimento. O tipo Multimercados Multiestratégia é composto por fundos que podem adotar mais de uma estratégia de investimento, sem o compromisso declarado de se dedicarem a uma em particular. Segundo a Economática® os fundos abertos e ativos totalizam 15.508. Destes 388 são do tipo Multimercados Macro e 4.387 são do tipo Multimercados Multiestratégia, totalizando com isto 4.775. O período de análise escolhido foram os anos de 2010 a 2013, ou seja, 48 meses. Estes anos foram escolhidos por estarem num período caracterizado pela ausência de movimentos direcionais expressivos nos principais mercados brasileiros (bolsa, juros e câmbio). Diferentemente dos dois anos anteriores que foram marcados pelos fortes movimentos conjuntos destes mercados. No caso de 2008, houve uma forte queda no mercado acionário, alta dos juros futuros e desvalorização do real frente ao dólar como reflexos da Crise Financeira Global. Já em 2009, houve um movimento contrário nestes ativos devido à forte atuação das principais autoridades monetárias para tentar conter os efeitos daquela crise. Inicialmente, acreditou-se que menores movimentos direcionais nos principais mercados durante um período substancial poderiam melhorar o modelo. Com o período escolhido para análise, da amostra de 4.775 dos Multimercados Macro e Multimercados Multiestratégia excluíram-se os fundos que não existiam antes de 2010. Com isto, o número total da amostra reduziu-se para 1.737 fundos. Evidentemente, esta exclusão trás para a amostra um problema de viés de sobrevivência. O tamanho do patrimônio líquido é uma variável importante a ser considerada na análise. Como patrimônio líquido pequeno pode impactar a rentabilidade do fundo devido aos diversos custos que incidem sobre a estrutura, adotou-se outro filtro para mitigar este problema. Os fundos que possuíam patrimônio líquido abaixo de R$ 10 milhões no início do ano de 2010 foram excluídos. Assim a amostra reduziu-se para 1.087 fundos. Outro critério adotado foi excluir os fundos exclusivos. Fundos exclusivos são aqueles que possuem um único cotista. Como estes são muitas vezes utilizados apenas como veículos de investimentos, os ativos podem não ser marcados a mercado e o gestor pode não possuir total discricionariedade sobre a decisão dos ativos a serem alocados, julgou-se coerente excluí-los da amostra. Sendo assim, chegou-se ao número de 922 fundos da amostra. Para gerar os modelos, foram utilizados os retornos semanais – de acordo com os critérios da Economática®, que utiliza a última cota da semana – no período mencionado. A escolha deste horizonte foi feita de forma a criar uma amostra estatisticamente relevante e ao 27 mesmo tempo suavizar o problema de autocorrelação entre os retornos, que poderia ser maior caso os retornos diários fossem utilizados. Obviamente, este critério pode continuar a trazer problemas de autocorrelação para amostra, já que nem todas as semanas possuem o mesmo número de dias úteis. Com isto foram extraídas 209 cotas semanais de cada fundo. O último critério adotado foi excluir os fundos que por algum motivo não tiveram alguma cota divulgada na Base SI-ANBIMA® no período. No filtro inicial, não foram encontradas 500 cotas semanais de 25 fundos distintos. Estes fundos com cotas ausentes foram retirados e chegou-se ao número final de 897 fundos na amostra. A amostra final pode ser representada por uma matriz 209 x 897 - com 209 linhas com os dados referentes às cotas e 897 colunas referentes aos fundos. Segue abaixo uma tabela com estatísticas descritivas da amostra: Tabela 2 - Estatísticas descritivas da amostra de fundos Média Tx. Adm. (anualizado em %) 0,860 Idade (em anos) 11,531 Mediana 0,400 9,964 Máximo 40,000 27,413 Mínimo 0,000 5,802 Esta tabela foi gerada para se analisar características qualitativas dos fundos que pudessem eventualmente destoar do restante da amostra. O único dado que destoou foi de um fundo que, de acordo com os dados do sistema Economática®, no momento da extração dos dados possuía 40% de taxa de administração anual. Optou-se pela manutenção deste fundo na amostra já que o mesmo adequava-se a todos os demais critérios estabelecidos e possuía um longo histórico, tendo iniciado suas atividades em 28/11/2001. 28 4 METODOLOGIA 4.1 Cálculos dos retornos Com os dados de cotas consolidados, foram realizados os cálculos dos retornos semanais dos fundos no período de 2010 a 2013. Os retornos semanais dos fundos i (Ri) foram computados por meio da variação logarítmica das cotas semanais dos fundos i (Pi,t), conforme apresentado na equação abaixo: = , , (6) Os retornos destes fundos podem ser representados por uma matriz de 208 x 897 - com 208 linhas com os dados referentes aos retornos dos fundos e 897 colunas representando cada um deles. 4.2 Cálculos dos excessos de retornos Após os dados de retornos semanais dos fundos i (Ri) já terem sido calculados, foram realizados os cálculos dos excessos de retornos semanais dos fundos em relação ao ativo livre de risco. O CDI foi escolhido como o ativo livre de risco por ser a taxa que os gestores conseguem remunerar o seu capital sem incorrer em riscos que não o de governo. Outro fator é que os ativos que remuneram a esta taxa são ativos líquidos e geralmente são utilizados como caixa dos fundos. Os retornos semanais do CDI (RCDI) foram computados por meio da variação logarítmica semanal do índice da série histórica do DI divulgadas pela Central de Custódia e Liquidação Financeira de Títulos3 (Cetip) (PCDI,t): = 3 Fonte: Cetip: www.cetip.com.br , , (7) 29 Com os dois dados de retornos necessários já calculados, Ri e RCDI, calculou-se o excesso de retorno dos fundos em relação ao ativo livre de risco: = − (8) Os excessos de retornos destes fundos podem ser representados por uma matriz de 208 x 897 - com 208 linhas com os dados referentes aos retornos dos fundos e 897 colunas representando os fundos. 4.3 Análise de componentes principais O presente trabalho utiliza a metodologia de Análise de Componentes Principais (ACP). Segundo Dunteman (1989) componentes principais são uma combinação linear das variáveis originais. De acordo com Sharma (1996), ACP é uma técnica para formar novas variáveis que são compósitos lineares das variáveis originais. O número máximo de novas variáveis que podem ser formados é igual ao número de variáveis originais, sendo que as novas variáveis originais não são correlacionadas entre elas. Portanto, conforme descrito por Jolliffe (2004), a ideia central da ACP é reduzir a dimensionalidade de um conjunto de dados que possui um grande número de variáveis inter-relacionadas, retendo o máximo possível da variação presente na série de dados. ACP é amplamente utilizada nos mais diversos campos de estudos científicos como, por exemplo, em elaboração de sistemas mais eficazes para detecção de imagens a aplicações em neurociência. Em Finanças, encontram-se estudos sobre análise da curva futura de juros, construção de hedge para portfólios de renda fixa, previsão e análise de assimetria de volatilidade e elaboração de algoritmos para alocação de ativos em carteiras de ações e de pares long short que utilizam ACP. Sharma (1996) demonstra que geometricamente uma série de dados formada por p variáveis pode ser representada graficamente num espaço p-dimensional a partir de p eixos ou então por meio de p novos eixos. O único tratamento dos dados feitos antes da projeção é a sua correção pela média. Em cada uma das variáveis é calculada sua média e a partir de cada dado das observações originais é subtraída esta sua respectiva estatística, formando-se assim uma amostra de números corrigidos pela média. Ao se projetar p novos eixos, a configuração dos pontos ou observações no espaço p-dimensional não muda. Sendo assim, as observações podem ser representadas tanto em relação aos novos ou velhos eixos. As projeções dos pontos 30 em eixos originais dão os valores para as variáveis originais e as projeções dos pontos em novos eixos dão os valores para novas variáveis. Os novos eixos ou variáveis são chamados componentes principais e os valores das novas variáveis são chamados de resultados dos componentes principais. Cada nova variável (por exemplo: x1*, x2*, ... , xp*) é uma combinação linear das variáveis originais e é corrigida pela média, ou seja, sua média é zero. O primeiro novo eixo X1* (os novos eixos podem ser denominados de X1*, X2*, ... , Xp*) resulta uma nova variável, x1*, que contabiliza o máximo da variância total. Esta variância total é calculada de forma a maximizar a variância da variável x1* dividida pela soma das variâncias dos dados corrigidos pela média x1, x2, ... , xp). Um exemplo com duas variáveis é bem-vindo de forma a deixar mais clara esta técnica. Dados dois eixos X1 e X2, os dados corrigidos pela média podem ser projetados no gráfico. Sendo assim, x1* = cos θ * x1 + sen θ * x2 e θ é o ângulo formado pelo eixo X1 e o novo eixo X1*. O ângulo θ que maximizar a variância total (acima explicado como: variância de x1* / (variância de x1 + variância de x2)) será o primeiro novo eixo, aqui denominado de novo eixo X1*. O segundo eixo deverá ser ortogonal ao primeiro eixo e é identificado a sua nova variável correspondente, x2*. Este novo eixo possui a variância máxima que não foi contabilizada pela primeira variável e x1* e x2* são não correlacionados. Este procedimento pode ser realizado até os p novos eixos terem sido identificados de forma às novas variáveis, x1*, x2*, ... , xp*, contabilizarem sucessivamente as variâncias máximas e as variáveis serão não correlacionadas. Nota-se que uma vez que os p-1 eixos foram identificados, a identificação do último p eixo será fixado devido à condição de que todos os eixos devem ser ortogonais. Vale destacar que o número máximo de novas variáveis – e, consequentemente, de componentes principais – é igual ao número de variáveis originais. Sharma (1996) também demonstra que é possível ter uma visão algébrica de análise de componentes principais. Ao assumir que há p variáveis, o interesse é formar p combinações lineares da seguinte forma: ξ1 = w11 x1 + w12 x2 + ... + w1p xp ξ2 = w21 x1 + w22 x2 + ... + w2p xp . . . ξp = wp1 x1 + wp2 x2 + ... + wpp xp (9) 31 em que ξ1, ξ2, ... , ξp são os p componentes principais e wij é o peso das js variáveis para os is componentes principais. Os pesos, wij, são estimados tendo em vista as seguintes condições: 1-) O primeiro componente principal, ξ1, contabiliza a máxima variância no dado, o segundo componente principal, ξ2, contabiliza para a máxima variância que não foi contabilizada pelo primeiro componente principal, assim sucessivamente. 2-) wi12 + wi22 + ... + wip2 = 1, i = 1, ..., p 3-) wi1 wj1 + wi2 wj2 + ... + wip wjp = 0, para todo i ≠ j. A segunda condição que requer que os quadrados dos pesos somem 1 é arbitrária. Esta condição é utilizada para arrumar a escala das novas variáveis e é necessária porque se aumenta a variância da combinação linear pela mudança da escala dos pesos. A terceira condição assegura que os novos eixos sejam ortogonais aos demais. O problema matemático é: como obter os pesos dos componentes principais especificados acima, de forma a satisfazer estas condições mencionadas? Sharma (1996) faz esta comprovação matemática conforme demonstrado abaixo. X é um vetor de p componentes aleatórios e em que p é o número de variáveis. A matriz de covariância, ∑, é dada pela E(XX’). Dado γ’ = (γ1 γ2 ... γp) como o vetor dos pesos para formar a combinação linear das variáveis originais, e ξ = γ’X é a nova variável, que é uma combinação linear das variáveis originais. A variância das novas variáveis é dada por E(ξ ξ’) e é igual a E(γXX’γ) ou γ’∑γ. O problema agora é encontrar o vetor de pesos, γ’, cuja variância, γ’∑γ, da nova variável seja máxima sobre todas as classes de combinações lineares que podem ser formadas sujeitas a seguinte restrição: γ’γ = 1. A solução para a maximização do problema pode ser obtida da seguinte forma: Z = γ’∑γ – λ(γ’γ – 1) (10) em que λ é o multiplicador de Lagrange. Os p componentes da derivada parcial é dado por: = 2∑ − 2λ Igualando os vetores de derivadas parciais a zero chega-se a solução final, que é: (11) 32 (∑ - λI)γ = 0 (12) Para o sistema de equações homogêneas ter uma solução não trivial o determinante det|∑ − λ | = 0. Esta equação é uma polinomial em λ de ordem p, e, portanto, possui p raízes. Dados λ1 ≥, λ2 ≥, ..., λp sejam as p raízes. Com isto a equação resulta em p valores para λ, e cada valor é chamado de autovalor ou raíz da matriz ∑. Cada valor de λ resulta em uma série de pesos dados pelo vetor de p componentes que é resolvido pelas seguintes equações: (∑ - λI)γ = 0 (13) γ’γ = 1 (14) Portanto, o primeiro autovetor, γ1, correspondente ao primeiro autovalor, λ1, é obtido pela resolução das seguintes equações: (∑ - λ1I)γ1 = 0 (15) γ1’γ1 = 1 (16) Ao pré-multiplicar a primeira equação acima por γ1’ tem-se: Γ1’(∑ - λ1I)γ1 = 0 (17) γ1’∑γ1 = λ1γ1’γ1 (18) γ1’∑γ1 = λ1 (19) Como γ1’γ1 = 1, tem-se: O lado esquerdo desta última equação é a variância da nova variável, ξ1, e é igual ao autovalor, λ1. Portanto, o primeiro componente principal é dado pelo autovetor, γ1, correspondente ao maior autovalor, λ1. 33 γ2 será o vetor de pesos para o segundo p-componente para formar uma outra combinação vetorial. A próxima combinação linear pode ser encontrada como a variância de γ2’X que é máxima e sujeita às restrições γ1’γ2 = 0 e γ2’γ2 = 1. Pode-se mostrar que γ2’ é autovetor de λ2, o segundo maior autovalor de ∑. Similarmente, pode-se mostrar que os componentes principais remanescentes: γ3’, γ4’, ..., γp’, são os autovetores correspondentes aos autovalores, λ3, λ4, ..., λp, da matriz de covariância, ∑. Portanto, os autovetores dão os vetores de pesos e os autovalores representam as variâncias das novas variáveis ou os resultados dos componentes principais. 4.4 Aplicação da análise de componentes principais Este trabalho é baseado na metodologia desenvolvida por Amihud e Goyenko (2013). Entretanto, ao invés de se efetuar regressões de log-retornos contra os multifatores do modelo FFC, foi utilizado o modelo de Análise de Componentes Principais (ACP). Como o objetivo é analisar o desempenho dos fundos multimercados, com ACP não há a necessidade de se escolher quais multifatores devem fazer parte do modelo. Consequentemente, a heterogeneidade dos portfólios e a diversidade dos tipos de ativos que os compõem teoricamente não serão mais entraves para o modelo. A escolha do ACP implicou em algumas alterações necessárias na metodologia original. Para avaliar o modelo como previsor de desempenho também foi utilizado o coeficiente de regressão (R2) defasado. Mas, diferente da metodologia desenvolvida por Amihud e Goyenko (2013), não se utilizou o alfa defasado - pois não se sabe ao certo aos quais multifatores se referem os coeficientes de regressão calculados pelo ACP. Ao invés de se utilizar o alfa defasado, utilizou-se o excesso de retorno dos fundos em relação ao ativo livre de risco, neste caso o CDI, defasado. A análise foi efetuada para o período de 2010 a 2013. Um dos motivos de se ter escolhido os retornos semanais foi para tentar mitigar o problema em relação ao tamanho da amostra. Assim como Merhy (2013), os períodos de estimação do modelo são de 24 meses, ou 96 semanas. No período de estimação, foi calculada a matriz de componentes principais dos excessos de retornos dos fundos em relação ao ativo livre de risco, movendo esta janela uma semana de cada vez até percorrer todo o período. 34 Como no período de 2010 a 2013 há 208 retornos semanais e a estimação do modelo utiliza janelas de 96 semanas, foram obtidas 113 amostras – 7 a menos que o modelo de Merhy (2013), que utilizou retornos mensais e analisou o período de julho de 2001 a junho de 2013. Cada fundo representa uma variável do modelo. Com isto são encontradas 897 variáveis referentes a 897 combinações lineares correspondentes a cada janela de 96 semanas: ξ1 = w11 x1 + w12 x2 + ... + w1897 x897 (20) ξ2 = w21 x1 + w22 x2 + ... + w2897 x897 . . . ξ897 = w8971 x1 + w8972 x2 + ... + w897897 x897 em que ξ1, ξ2, ... , ξ897 são os 897 componentes principais e wij é o peso das js variáveis para os 897 componentes principais. Um dos objetivos iniciais de se utilizar neste caso a ACP como modelo é o de se poder reduzir a dimensionalidade deste conjunto de dados, que possui um grande número de variáveis inter-relacionadas, retendo o máximo possível de padrão de variação presente na série. Previamente, isto significa que, dependendo dos resultados obtidos, poderia se explicar uma parte relevante da variância do excesso de retorno dos fundos em relação ao CDI com apenas alguns fatores. Para verificar quantos componentes principais se utilizaria no modelo reduzido, calculou-se inicialmente o modelo com todos os 897 componentes nas 113 janelas com 96 semanas. Após a isto, mensurou-se em cada uma das 113 amostras qual a porção da variância total explicada por cada componente principal i naquela janela: λ / ∑!" λ (21) sendo λ autovalores correspondentes a autovetores unitários de β1, ..., βk ordenados do maior para o menor: λ ≥ ... ≥ λ! . Ao final obteve-se uma matriz 897 x 113. Cada linha nesta matriz representa o quanto aquele componente principal explica da variância levando-se em conta as inter-relações das 35 variáveis naquela janela de 96 semanas. Cada coluna desta matriz representa estes resultados da janela finalizada naquela última semana indicada. Existem na literatura diversas formas de se escolher o número de componentes principais. Neste caso, por se tratar de 113 modelos de componentes principais, julgou-se conveniente adotar o modelo conhecido como elbow scree plot proposto por Sharma (1996) e levar-se em conta alguns fatores qualitativos. Foram plotados os percentuais de variância contabilizados por cada componente principal e procurou-se por um “cotovelo” em cada gráfico de cada uma das janelas. Ou seja, quando o percentual de variância contabilizado pelo próximo componente principal não é tão diferente do anterior de maneira que o contorno parecido com um “cotovelo” se forma, aquele é tido como um número de componente principal adequado a se utilizar. Isto ocorre porque o acréscimo marginal de mais um componente não acrescenta tanto para explicação da variância. Ao se gerar os 113 scree plots, em geral, 4 componentes principais pareceu adequado. Como os autovalores estão ordenados, acumularam-se os valores de forma a verificar o quanto da variância total é explicada pelos m componentes principais ao longo das 113 amostras. Além disto, algumas estatísticas descritivas foram calculadas de forma a se consolidar numa tabela com o objetivo de analisar qualitativamente se a escolha de 4 componentes principais realmente seria adequada. Tabela 3 - Estatísticas da variância total explicada acumulada por m componentes principais m=1 m=2 m=3 m=4 m=5 m=6 m=7 m=8 m=9 m = 10 Média 0,370 0,493 0,549 0,582 0,609 0,632 0,652 0,670 0,685 0,699 Mediana Máximo Mínimo 0,388 0,403 0,302 0,507 0,529 0,432 0,553 0,570 0,526 0,585 0,599 0,565 0,611 0,623 0,592 0,635 0,646 0,616 0,654 0,666 0,635 0,671 0,683 0,654 0,686 0,698 0,669 0,701 0,711 0,684 Como se pode ver na Tabela 2, a utilização de 4 componentes principais parece ser adequada já que em todas as 113 amostras ela explica no mínimo 56,5% da variância do excesso de retorno dos fundos. A amplitude desta explicação também não oscila tanto ao longo do tempo, já que a diferença entre o máximo e o mínimo de explicação é de apenas 36 3,5%. Enquanto o acréscimo do segundo, terceiro e quarto componentes principais acrescentam em média respectivamente 12,33%, 5,58% e 3,32%; os acréscimos dos demais componentes principais não acrescentam mais do que 2,64% no nível de explicação da variância total do excesso de retorno dos fundos. Coincidentemente, o modelo de Fama French Carhart (FFC) possui 4 multifatores. Com isto a utilização dos 4 componentes principais pode ser bem-vinda para efeito de comparações entre os modelos. Vale ressaltar que a diferença entre este modelo de ACP e o de FFC é que neste último caso se sabe quais são multifatores, que possuem significados econômicos, enquanto no ACP eles não foram identificados e são, portanto, puramente estatísticos. A Figura 1 ilustra como esta variância total acumulada explicada por 4 componentes principais oscila ao longo do tempo e demonstra como esta explicação se comporta ao longo das 113 amostras de 96 semanas. 0,610 0,600 0,590 0,580 0,570 0,560 0,550 nov-13 set-13 jul-13 mai-13 mar-13 jan-13 nov-12 set-12 jul-12 mai-12 mar-12 jan-12 nov-11 0,540 Figura 1 - Variância total acumulada explicada por 4 componentes principais (Fonte: elaborado pelo autor). 4.6 Aplicação do modelo reduzido Para reduzir o número de componentes aplicou-se o modelo de análise fatorial proposto por Zaiontz (2014). Na análise foram retidos 4 dos 897 componentes principais. Cada componente principal pode ser calculado por: 37 $ =% ! '" & ' (' (22) sendo que Y = βTX’, onde Y é um vetor 897 x 1, β é uma matriz 897 x 897 cujas colunas são autovetores unitários ordenados pelos autovalores do maior para o menor e X’ é um vetor 897 x 1 dos excessos de retornos dos fundos em relação ao ativo livre de risco das variáveis originais padronizados. Para se padronizar os excessos de retornos dos fundos em relação ao ativo livre de risco foram considerados a média e o desvio-padrão daquela determinada janela de 96 semanas. Como se desejou reter apenas os 4 componentes principais, então Y = βTX’ em que Y é um vetor 4 x 1, β é uma matriz 897 x 4, consistindo de 4 autovalores unitários referentes aos 4 maiores autovalores, e X’ é um vetor 897 x 1 dos excessos de retornos dos fundos em relação ao ativo livre de risco das variáveis originais padronizados. Como o Y é previamente conhecido – já que o mesmo foi calculado anteriormente pela fórmula Y = βTX’ com todos os componentes originais do modelo – foram calculados os valores para X usando o fato que X’ = ββTX’ = β(βTX’) = βY. Como β é uma matriz ortogonal, então ββT = I. Do X’, que está padronizado e foi estimado com os 4 componentes principais, fez-se então a operação inversa para se obter o X estimado. Vale destacar que todo este processo é repetido 113 vezes, já que há 113 janelas de 96 semanas no período a ser analisado com todos os 897 fundos. Ao final de todo este processo, obteve-se uma matriz de 113 x 897, sendo que as 113 linhas representam os excessos de retornos dos fundos em relação ao ativo livre de risco estimados com os 4 componentes principais ao longo de todas 113 janelas de 96 semanas. Cada uma das 897 colunas representa os resultados de cada um dos fundos. 4.6 Carteiras agrupadas por R2 e excessos de retornos Com as séries dos excessos de retornos dos fundos em relação ao ativo livre de risco estimados com os 4 componentes principais e os excessos de retornos dos fundos em relação ao ativo livre de risco reais foram calculados os coeficientes de determinação (R2). De uma 38 forma similar aos trabalhos de Amihud e Goyenko (2013) e Merhy (2013), estes foram calculados ao longo de 96 semanas e com isto foram geradas 113 amostras. Obteve-se novamente uma matriz de 113 x 897, sendo que as 113 linhas representam 2 os R dos fundos ao longo das 113 amostras de 96 semanas e cada uma das 897 colunas representam os resultados de cada fundo. Com o R2 e os excessos de retornos dos fundos em relação ao ativo livre de risco reais, foram construídas carteiras agrupadas por estas características para verificar a capacidade de previsibilidade destas propriedades defasadas em uma semana. Em cada semana da amostra, dividiram-se os fundos em quintis de ) , chamados de “Baixo”, “2”, “3”, “4” e “Alto”. Dentro de cada quintil dividiu-se em outros quintis de excessos de retornos dos fundos em relação ao CDI também defasados numa semana (exct-1). Estes últimos foram chamados igualmente de “Baixo”, “2”, “3”, “4” e “Alto”. Sendo assim, foram obtidas 25 carteiras com as características de ) e exct-1 cruzadas. A divisão por excesso de retornos defasados deve- se às evidências sobre persistência de performance de fundos existentes em estudos como o de Brown e Goetzmann (1995) e Gruber (1996). ) Considerando como primeira e exct-1 como segunda característica as 25 carteiras foram denominadas seguindo respectivamente a ordem destas propriedades: “Alto-Alto”, “Alto-4”, “Alto-3”, “Alto-2”, “Alto-Baixo”, “4-Alto”, “4-4”, “4-3”, “4-2”, “4-Baixo”, ‘3Alto”, “3-4”, “3-3”, “3-2”, “3-Baixo”, “2-Alto”, “2-4”, “2-3”, “2-2”, “2-Baixo”, “BaixoAlto”, “Baixo-4”, “Baixo-3”, “Baixo-2” e “Baixo-Baixo”. Escolheu-se esta quantidade de carteiras para se manter o mesmo padrão utilizado por Amihud e Goyenko (2013). Para se obter a mesma quantidade de fundos em cada um dos 25 portfólios excluíram-se os fundos que apresentavam os maiores e menores ao invés de se excluir 0,5% dos fundos em cada uma das caudas de ) ) . Entretanto, como realizado por Amihud e Goyenko (2013), excluíram-se 11 fundos (1,23% do conjunto de fundos) de cada um dos extremos de ) . Tais exclusões evitam a utilização de fundos passivos e fundos que eventualmente tiveram erros na divulgação de seus dados. Este procedimento permitiu que cada uma das 25 carteiras obtivesse um portfólio com 35 fundos – número suficientemente adequado no que se refere a obter uma carteira diversificada. Já agrupadas em ) e exct-1, calculou-se a média do excesso de retorno em relação ao CDI (exct) das carteiras na semana subsequente t. Este procedimento foi repetido ao longo de 39 todas as semanas da amostra e obteve-se 112 médias de exct4. Estas 112 médias de exct de cada carteira foram acumuladas e anualizadas, sendo o seu retorno demonstrado na Tabela 4 juntamente com a sua t-estatística. Além das carteiras mencionadas acima, outras foram elaboradas para testar se a diferença entre as carteiras selecionadas por ) e exct-1 são significativas. Conforme proposto por Amihud e Goyenko (2013), foram formadas carteiras “compradas” na carteira de baixo ) ) e “vendidas” na carteira de alto , que foram denominadas de “Baixo-Alto”, e carteiras “compradas” na carteira de alto exct-1 e “vendidas” na carteira de baixo exct-1, que foram denominadas de “Alto-Baixo”. Também foram formadas carteiras com apenas uma das características variando e foram chamadas de “Todos”. Tabela 4 - Excessos de retornos anualizados das carteiras agrupadas por R2t-1 e Excesso de Retornot-1 R 2 t-1 Baixo 2 3 4 Alto Todos Baixo-Alto 2,190% 1,225% 0,073% 0,361% -1,385% 0,493% 3,576% (1,61) (1,10) (0,07) (0,32) (0,87) (0,49) (1,84) * 2 0,191% 0,878% 0,725% 0,482% -0,233% 0,410% 0,415% (0,26) (1,16) (1,52) (0,85) (0,31) (0,90) (0,43) 3 0,118% 1,136% 0,554% 0,862% 0,239% 0,582% -0,121% (0,26) (2,47) ** (1,55) (2,22) ** (0,80) (1,81) * (0,27) 4 0,656% -0,284% 0,347% 0,549% -0,209% 0,213% 0,865% (1,31) (0,35) (0,69) (1,20) (0,58) (0,53) (1,71) * Alto -1,533% -0,299% -0,118% 0,205% 0,653% -0,216% -2,202% (1,65) (0,24) (0,13) (0,20) (0,50) (0,25) (1,61) Todos 0,322% 0,534% 0,319% 0,496% -0,181% 0,298% 0,501% (0,58) (0,86) (0,60) (0,98) (0,34) (0,64) (0,84) Alto-Baixo -3,679% -1,525% -0,223% -0,184% 2,003% -0,725% (2,46) ** (1,06) (0,14) (0,10) (0,90) (0,58) A tabela representa os excessos de retornos em relação ao CDI anualizados das carteiras de fundos. As carteiras foram formadas Excesso de Retornot-1 Baixo 2 2 classificando em cada semana todos os fundos em quintis de R t-1 e quintis de Excesso de Retorno t-1 (exct-1). Os R t-1 foram obtidos pela amostra de 96 semanas de excessos de retornos dos fundos em relação ao CDI estimados com 4 componentes principais e os excessos de retornos dos fundos em relação ao CDI reais. Então se calculou o retorno excendente da carteira para a semana subsequente. Este retorno excedente é a média dos retornos excedentes semanais dos fundos. O processo foi repetido se movendo uma semana a frente o período de estimação. Cada carteira também apresenta sua t-estatística. O período utilizado para estudo foi de janeiro de 2010 a dezembro de 2013. Como se utilizou 96 semanas para estimação, o período estimado foi de novembro de 2011 a dezembro de 2013. *, ** e *** denotam significância ao nível de 10%, 5% e 1% respectivamente. Ao se analisar a Tabela 4, verifica-se que os excessos de retornos em relação ao CDI não aumentam conforme se diminui o ) . Isto ocorre em todas as linhas, ou seja, independentemente do nível de exct-1. Portanto, não se pode auferir que quanto maior a seletividade dos fundos, medido por um ) menor, maior os excessos de retornos em relação ao ativo livre de risco. 4 A amostra original possui 113 semanas de dados. Como neste procedimento um R2 e exc defasados devem ser utilizados obtêm-se 112 médias de exct. 40 Outro fato que chama atenção na tabela é que exct-1 não parece indicar excessos de retornos em relação ao CDI no período seguinte. Isto pode ser visto ao se analisar todas as colunas individualmente e verificar que os excessos de retornos em relação ao CDI anualizados não seguem um padrão de comportamento. Esperava-se que quanto maior fosse o exct-1, maior fosse o excessos de retornos em relação ao CDI no período seguinte. A Tabela 4 também demonstra que nenhum excesso de retorno apresenta significância estatística de ser diferente de zero ao nível de 1% e que, mesmo nos demais níveis, poucas carteiras apresentam significância estatística de serem diferentes de zero. Os números da Tabela 5 demonstram que não há outliers que eventualmente indiquem erros na série de dados. De qualquer forma, alguns valores dos extremos foram checados e ratificados. Outro fato importante é que em geral a média e a mediana das carteiras são bastante parecidas. Isto pode ser comprovado pela média destas médias e medianas que são iguais até a terceira casa decimal: 0,004%. Não se encontrou nenhum padrão de resultados no cruzamento das características no que se refere aos valores mínimos e máximos. Mesmo na análise destas estatísticas descritivas não se encontrou nenhum comportamento que indicasse que um menor ) sugeriria um maior exct. Nem mesmo um exct-1 indicando para um maior exct. Segue abaixo a Tabela 5 com as estatísticas descritivas dos excessos de retornos semanais das carteiras: 41 Tabela 5 - Estatísticas descritivas dos exct semanais das carteiras 2 2 Ordem: R t-1-exct-1 (R Alto-Alto Alto-4 Alto-3 Alto-2 Alto-Baixo 4-Alto 4-4 4-3 4-2 4-Baixo 3-Alto 3-4 3-3 3-2 3-Baixo 2-Alto 2-4 2-3 2-2 2-Baixo Baixo-Alto Baixo-4 Baixo-3 Baixo-2 Baixo-Baixo Todos-Alto Todos-4 Todos-3 Todos-2 Todos-Baixo Alto-Todos 4-Todos 3-Todos 2-Todos Baixo-Todos Todos-Todos Alto-Baixo(Alto-) Alto-Baixo(4-) Alto-Baixo(3-) Alto-Baixo(2-) Alto-Baixo(Baixo-) Alto-Baixo(Todos-) Baixo-Alto(-Alto) Baixo-Alto(-4) Baixo-Alto(-3) Baixo-Alto(-2) Baixo-Alto(-Baixo) Baixo-Alto(-Todos) Média Mediana Mínimo Máximo t-1-exc t-1) Média 0,013% -0,004% 0,005% -0,004% -0,026% 0,004% 0,011% 0,017% 0,009% 0,007% -0,002% 0,007% 0,011% 0,014% 0,002% -0,005% -0,005% 0,022% 0,017% 0,024% -0,030% 0,013% 0,002% 0,004% 0,042% -0,004% 0,004% 0,011% 0,008% 0,010% -0,003% 0,010% 0,006% 0,010% 0,006% 0,006% 0,039% -0,003% -0,004% -0,029% -0,072% -0,014% -0,042% 0,017% -0,002% 0,008% 0,068% 0,010% 0,004% 0,006% -0,072% 0,068% Mediana 0,017% 0,001% 0,008% 0,000% 0,004% 0,015% 0,016% 0,013% 0,009% 0,015% 0,005% 0,007% 0,007% 0,011% 0,024% 0,021% 0,000% 0,017% 0,009% 0,023% -0,017% 0,007% 0,008% 0,005% 0,017% 0,006% 0,010% 0,014% 0,011% 0,009% -0,006% 0,007% 0,012% 0,005% 0,002% 0,009% -0,004% -0,040% -0,053% -0,006% -0,036% -0,024% -0,032% 0,008% -0,001% 0,012% 0,016% 0,018% 0,004% 0,008% -0,053% 0,024% Mínimo -0,927% -0,244% -0,268% -1,315% -1,115% -0,907% -0,405% -0,223% -0,610% -0,811% -0,394% -0,426% -0,191% -0,401% -0,998% -0,865% -1,166% -0,223% -1,069% -0,807% -0,759% -0,461% -0,413% -1,020% -0,481% -0,503% -0,267% -0,182% -0,320% -0,578% -0,337% -0,268% -0,345% -0,305% -0,300% -0,258% -1,968% -1,012% -0,590% -0,912% -2,292% -0,775% -1,086% -0,398% -0,337% -0,930% -1,067% -0,320% -0,664% -0,492% -2,292% -0,182% Máximo 0,969% 0,170% 0,168% 0,273% 1,112% 0,855% 0,289% 0,428% 0,708% 0,860% 0,601% 0,252% 0,219% 0,322% 0,534% 0,921% 0,467% 0,388% 0,433% 0,574% 0,565% 0,315% 0,201% 0,469% 2,245% 0,413% 0,203% 0,191% 0,279% 0,569% 0,282% 0,404% 0,216% 0,370% 0,425% 0,198% 1,813% 1,106% 0,974% 0,767% 0,556% 0,582% 0,840% 0,293% 0,278% 1,310% 2,580% 0,528% 0,615% 0,450% 0,168% 2,580% 42 5 CONCLUSÕES Este trabalho analisou se, como indicador de seletividade, o coeficiente de determinação, R2, calculado pelas séries dos excessos de retornos dos fundos em relação ao CDI estimados com os componentes principais e os excessos de retornos dos fundos em relação ao CDI reais poderia ser um critério de seleção para carteiras de fundos multimercados. Calculado utilizando os 4 componentes principais, uma amostra de 96 semanas anteriores a semana de avaliação, uma amostra de 897 fundos multimercados e o período analisado de 2010 a 2013, o indicador não se mostrou adequado como parâmetro de seleção de carteiras de fundos de investimentos multimercados que gerem excesso de retorno em relação ao CDI. Amihud e Goyenko (2013) verificaram para os EUA, assim como Merhy (2013) demonstrou para o Brasil, que carteiras formadas por fundos de ações de gestão ativa com alto alfa e baixo R2 defasados obtiveram alfa superior nos períodos seguintes se comparados aos fundos com baixo alfa e alto R2 defasados. Para isto, ambos utilizaram o modelo Fama, French e Carhart (FFC). O objetivo neste estudo foi avaliar os fundos multimercados, portanto, algumas adaptações ao estudo de Amihud e Goyenko (2013) foram necessárias, sendo as principais: a utilização da Análise de Componentes Principais (ACP) como modelo, o período semanal devido a necessidade de se encontrarem uma amostra e um período de existência dos fundos suficientemente grandes para se realizar a avaliação e o excesso de retorno dos fundos em relação ao CDI, já que não se sabe ao certo a que fatores de mercado os componentes principais se referem. Diferentemente dos outros dois estudos, o modelo não estendeu a avaliação para horizontes maiores que uma semana. A extensão neste caso ficou impossibilitada porque o cálculo dos componentes principais do modelo partiu da matriz de correlação dos fundos na janela de 96 semanas em cada uma das 113 amostras do período, sendo necessário para isto que todos os fundos existissem ao longo do momento analisado. Para que horizontes maiores que uma semana fossem analisados, seria necessário ampliar o período de análise e isto consequentemente não iria de encontro com a premissa de existência de todos os fundos. Preliminarmente, esperava-se que exct indicasse algum comportamento de persistência de desempenho parecido com o encontrado no trabalho de Monteiro (2006), muito embora neste último caso a análise tenha sido realizada sobre o alfat. 43 A utilização do R2 como critério de seleção de carteiras não se mostrou adequado para utilização no mercado brasileiro de fundos de investimento multimercados. As carteiras formadas com os fundos que apresentaram os menores R2 não apresentaram maiores excessos de retornos em relação ao ativo livre de risco. Algumas possíveis extensões e adaptações para este trabalho que poderiam porventura apresentar resultados diferentes dos aqui demonstrados são: a utilização de um modelo que varie o número de componentes principais ao longo do tempo, um estudo que encontre a que fatores de mercado estes componentes principais se referem, as extensões do período e do horizonte de retornos analisados e a utilização da mediana ao invés da média para a formação das carteiras. 44 REFERÊNCIAS BIBLIOGRÁFICAS Amihud, Yakov, and Ruslan Goyenko. "Mutual fund's R2 as predictor of performance." Review of Financial Studies 26.3 (2013): 667-694. Black, Fischer. "Capital market equilibrium with restricted borrowing." The Journal of Business 45.3 (1972): 444-455. Bollen, Nicolas, and Jeffrey Busse. “Short-term persistence in mutual fund performance.”, Review of Financial Studies 18 (2005): 569-597. Busse, Jeffrey A. and Goyal, Amit and Wahal, Sunil. “Performance persistence in institutional investment management”. EFA 2006 Zurich Meetings Paper (2006). Carhart, Mark M. "On persistence in mutual fund performance." The Journal of finance 52, no. 1 (1997): 57-82. Castro, Bruno Ribeiro, e Andrea Maria Accioly Fonseca Minardi. "Comparação do desempenho dos fundos de ações ativos e passivos." Revista Brasileira de Finanças 7.2 (2009): 143-161. Ceretta, Paulo Sérgio e Bruno Milani. "Efeito tamanho nos fundos de investimento brasileiros." Revista de Administração da UFSM 6.1 (2013): 119-138. Cremers, Martijn and Petajisto, Antti. “How active is your fund manager? A new measure that predicts performance”. AFA 2007 Chicago Meetings Paper; EFA 2007 Ljubljana Meetings Paper; Yale ICF Working Paper No. 06-14. (2009). Cremers, Martijn, Antti Petajisto, and Eric Zitzewitz. “Should benchmark indices have alpha? Revisiting performance evaluation”. No. w18050. National Bureau of Economic Research, (2012). Copeland, T.E., Weston, J.F. and Shastri, K. Financial Theory and Corporate Policy. Pearson Addison Wesley, United States. (2005). Cordeiro, Guilherme Vieira Domingues. “Viés de sobrevivência nos fundos de investimento de renda variável no Brasil.” Escola de Economia de São Paulo da Fundação Getúlio Vargas. Dissertação Mestrado em Finanças e Economia de Empresas. (2013). Dunteman, G. “Principal component analysis, quantitative application in the Social Sciences series”, No 69, Sage, Thousands Oaks, CA. (1989). Fama, Eugene F. "Components of investment performance." The Journal of Finance 27.3 (1972): 551-568. Fama, Eugene F., and James D. MacBeth. "Risk, return, and equilibrium: Empirical tests." The Journal of Political Economy (1973): 607-636. 45 Fama, Eugene F., and Kenneth R. French. "The cross-section of expected stock returns." The Journal of Finance 47.2 (1992): 427-465. Fama, Eugene F., and Kenneth R. French. "Common risk factors in the returns on stocks and bonds." Journal of financial economics 33.1 (1993): 3-56. Fung, William and David A. Hsieh. “Empirical characteristics of dynamic trading strategies: The case of hedge funds.” Review of Financial Studies 10 (1997): 275-302. Fung, William and David A. Hsieh. “Survivorship bias and investment style in the returns of CTAs: The information content of performance track records.” Journal of Portfolio Management 24 (1997): 30-41. Grinblatt, Mark and Sheridan Titman. “How to Avoid Games Portfolio Managers Play”. Institutional Investor 23 (1989): 35-36. Grinblatt, Mark and Sheridan Titman. “Adverse Risk Incentives and the Design of Performance-Based Contracts.” Management Science 35 (1989): 807-822. Grinblatt, Mark and Sheridan Titman. “Mutual fund performance: An analysis of quarterly portfolio holdings.” Journal of Business 62 (1989): 393-416. Grinblatt, Mark and Sheridan Titman. “Portfolio performance evaluation: Old issues and new insights.” Review of Financial Studies 2 (1989): 393-421. I. T. Jolliffe. “Principal Component Analysis,” Springer Science+Bussiness Media, Inc., New York. (2004). Jegadeesh, Narasimhan, and Sheridan Titman. "Returns to buying winners and selling losers: Implications for stock market efficiency." The Journal of Finance 48.1 (1993): 65-91. Jensen, Michael C. "The performance of mutual funds in the period 1945–1964." The Journal of Finance 23.2 (1968): 389-416. Lintner, John. "The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets." The review of economics and statistics 47.1 (1965): 13-37. Markowitz, Harry. "Portfolio selection*." The journal of finance 7.1 (1952): 77-91. Matos, Paulo Rogério Faustino e Artur Eduardo da Nave e Castro. "Fundos de investimento em ações no brasil: performance e expertise de gestão." Trabalho apresentado na BBRBrazilian Business Conference, Vitória, Brasil. (2012). Matos, Paulo Rogério Faustino e Rocha, José Alan Teixeira. "Ações e fundos de investimento em ações: Fatores de risco comuns?" BBR-Brazilian Business Review 6.1 (2009): 22-43. Merhy, Rogerio Domingues. “Coeficiente de determinação de fundos de ações como previsor de desempenho.” Insper Instituto de Ensino e Pesquisa. Dissertação Mestrado em Finanças e Economia de Empresas. (2013). 46 Milani, B., & Ceretta, P. S. “Efeito tamanho nos fundos de investimento brasileiros.” Revista de Administração da UFSM, 6 (2013): 119-138. Monteiro, Rogerio. “Persistência de performance nos fundos de investimento em ações no Brasil.” Repositório Científico de Acesso Aberto de Portugal. (2006). Mossin, J. “Equilibrium in a Capital Asset Market.” Econometrica 34 (1966): 768-783. Mussa, Adriano, Ricardo Trovao, José O. Santos, e Rubens Famá. "A estratégia de momento de Jegadeesh e Titman e suas implicações para a hipótese de eficiência do mercado acionário brasileiro." X SEMEAD (2007). Mussa, Adriano, Rubens Famá, e José Odálio dos Santos. “A adição do fator de risco momento ao modelo de precificação de ativos dos três fatores de Fama e French aplicado ao mercado acionário brasileiro.” REGE Revista de Gestão 19.3 (2012). Orso, Ricardo Maule. "Uma análise de risco e retorno baseado no modelo de Fama e French para fundos de investimentos em ações brasileiro com gestão ativa entre o período de 2000 a 2011.". (2013). Rochman, Ricardo Ratner, and William Eid Jr. "Fundos de investimento ativos e passivos no Brasil: Comparando e determinando os seus desempenhos." XXX Enanpad. Salvador-BA (2006). Sharma, S., Applied Multivariate Techniques, John Wiley & Sons, New York, 1996, chap. 4. Sharma, S., Applied Multivariate Techniques, John Wiley & Sons, New York, 1996, chap. 5. Sharpe, William F. "A simplified model for portfolio analysis." Management Science 9 (1963): 277–93. Sharpe, William F. "Capital asset prices – A theory of market equilibrium under conditions of risk." Journal of Finance XIX (1964): 425–42. Sharpe, William F. “Mutual fund performance.” The Journal of Business 39.1 (1966): 119138. Sharpe, William F. “The arithmetic of active management.” Financial Analysts Journal (1991): 7-9. Sharpe, William F. “Asset allocation: Management style and performance measurement.” The Journal of Portfolio Management 18.2 (1992): 7-19. Smith, L. I. “A tutorial on principal components analysis”, Technical report, Cornell University, USA. (2002). Stattman, Dennis. “Book values and stock returns.” The Chicago MBA: A journal of selected papers 4.1 (1980): 25-45. 47 Treynor, J.L. “Market value, time, and risk.” Unpublished manuscript. “Rough Draft” dated 8/8/61, (1961): 95-209. Treynor, J.L. “How to rate management of investment funds.” Harvard Business Review 43, (1965): 63-75. Varga, Gyorgy, e Wengert, Maxim. “A indústria de fundos de investimentos no Brasil.”, Revista de Economia e Administração,10 (2011): 66–109. Varga, Gyorgy. “Índice de Sharpe e outros indicadores de performance aplicados a fundos de ações brasileiros.” Revista de Administração Contemporânea 5.3 (2001): 215-245. Zaiontz, Charles. “Principal Component Analysis”. Disponível em: <http://www.realstatistics.com/multivariate-statistics/factor-analysis/principal-component-analysis/>. Acesso em: 01 aug. 2014. 48 APÊNDICE Datas das cotas semanais utilizadas no estudo 04/11/2011 11/11/2011 18/11/2011 25/11/2011 02/12/2011 09/12/2011 16/12/2011 23/12/2011 30/12/2011 06/01/2012 13/01/2012 20/01/2012 27/01/2012 03/02/2012 10/02/2012 17/02/2012 24/02/2012 02/03/2012 09/03/2012 16/03/2012 23/03/2012 30/03/2012 06/04/2012 13/04/2012 20/04/2012 27/04/2012 04/05/2012 11/05/2012 18/05/2012 25/05/2012 01/06/2012 08/06/2012 15/06/2012 22/06/2012 29/06/2012 06/07/2012 13/07/2012 20/07/2012 27/07/2012 03/08/2012 10/08/2012 17/08/2012 24/08/2012 31/08/2012 07/09/2012 14/09/2012 21/09/2012 28/09/2012 05/10/2012 12/10/2012 19/10/2012 26/10/2012 02/11/2012 09/11/2012 16/11/2012 23/11/2012 30/11/2012 07/12/2012 14/12/2012 21/12/2012 28/12/2012 04/01/2013 11/01/2013 18/01/2013 25/01/2013 01/02/2013 08/02/2013 15/02/2013 22/02/2013 01/03/2013 08/03/2013 15/03/2013 22/03/2013 29/03/2013 05/04/2013 12/04/2013 19/04/2013 26/04/2013 03/05/2013 10/05/2013 17/05/2013 24/05/2013 31/05/2013 07/06/2013 14/06/2013 21/06/2013 28/06/2013 05/07/2013 12/07/2013 19/07/2013 26/07/2013 02/08/2013 09/08/2013 16/08/2013 23/08/2013 30/08/2013 06/09/2013 13/09/2013 20/09/2013 27/09/2013 04/10/2013 11/10/2013 18/10/2013 25/10/2013 01/11/2013 08/11/2013 15/11/2013 22/11/2013 29/11/2013 06/12/2013 13/12/2013 20/12/2013 27/12/2013