MARÇO 2013 Algoritmo Genético Como já dito em cartas anteriores, gostamos bastante de análise bottom-up. Nem todo equity holder é um value investor. Aliás, temos nos posicionado de forma clara ao dizer que percebemos certa hipocrisia em se vender como um adepto de qualquer filosofia de investir. Não achamos que exista uma teoria do campo unificado sobre como ganhar dinheiro. De tempos em tempos, entretanto, testamos ideias com bom histórico de retorno. Desde que respeitadas certa exigências e formalidades. Recentemente nos debruçamos sobre a aplicação do Algoritmo Genético como ferramenta de otimização. Aproveitando o esforço de nossos matemáticos testamos um importante corolário dos value investors segundo o qual o único múltiplo com significado duradouro é a relação entre o preço de mercado da empresa e seu acervo líquido contábil, price-to-book no jargão do mercado. O algoritmo genético, como a maioria dos métodos de otimização, propõe uma maneira eficaz de navegar em conjuntos de dados de dimensão alta. O termo “dimensão alta”, embora possa a princípio causar estranhamento, refere-se apenas ao número de variáveis livres de um dado problema. Uma analogia que talvez acalme os ânimos do leitor menos confortável com a ideia é imaginar um gigantesco painel de controle com dezenas de botões e alavancas, responsável pela produção de uma máquina, onde cada estado possível desse painel é representado por um elemento em nosso conjunto de dados. Embora seja relativamente simples testar todos os resultados possíveis da máquina para as várias posições de um botão específico, alterar posições em todos os botões e alavancas e lidar com todas as possibilidades simultaneamente não é computacionalmente factível. O algoritmo lida com vários desses estados simultaneamente, tratando cada um deles como um "indivíduo" e, geração após geração, promove mudanças nas configurações de cada um, buscando evoluir essa "espécie" na direção da melhor configuração possível. Quando falamos em evolução, o texto que notoriamente nos vem à cabeça é o célebre "A Origem das Espécies", publicado por Darwin em meados do século XIX e cujo conteúdo e estudo sobre a seleção natural servem de alicerce para o que hoje conhecemos como Teoria da Evolução. Muitas das ideias de Darwin floresceram ao longo dos quase cinco anos que passou acompanhando o navio HMS Beagle, quando teve oportunidade de coletar, examinar e catalogar uma enorme variedade de organismos vivos. O pensamento humano, de forma análoga às espécies pesquisadas pelo biólogo inglês em suas viagens, também teve que ser submetido ao teste do tempo, adequar-se a toda sorte de adversidade e competição para que nós, distintos das demais espécies justamente pela proeza intelectual, pudéssemos - como fez Darwin - questionar o status quo, dar espaço para o surgimento de novas abordagens, reavaliar nosso modo de pensar e permitir que as ideias excepcionais se destaquem e sobrevivam mesmo face ao ambiente inóspito dos longos períodos de obscuridade, frequentemente presentes na história de nossa civilização. 1 Embora se trate de um tema ainda presente em nosso zeitgeist, a contenda entre as diferentes ideias acerca da origem das espécies não é nada recente. Anaximandro, no século VI a.C., defendia ideias surpreendentemente semelhantes às de Darwin. Essas mesmas ideias, duzentos anos mais tarde, foram revisitadas por Platão e Aristóteles e, muito mais tarde, Santo Agostinho. Se interpretarmos o ideário humano através das épocas como um sistema evolutivo onde, geração após geração, uma espécie se vê submetida à competição interna e à seleção natural e seus indivíduos se especializam, através de mutações e cruzamentos, adaptando cada detalhe de seu código genético às novas condições, evoluir torna-se inevitável. Não é difícil traçar paralelos entre os aspectos observados nesse processo e as diferentes metodologias de análise de negócios. É esperado que, em circunstâncias de concorrência acirrada, um gestor estimule a especialização e aperfeiçoamento dos processos para manter-se competitivo. Esse enfoque, no entanto, foge do escopo desta carta. Estruturalmente calcado em sistemas intrínsecos ao processo evolucionário, o algoritmo genético, exemplar notável da miríade de métodos computacionais de Machine Learning, encontra no darwinismo seu modo de navegar no oceano de alta dimensão. Aprofundando um pouco o exemplo dos botões num painel de controle; dentro de uma espécie, cada indivíduo é caracterizado unicamente por seu código genético. Sob o prisma do algoritmo, esse código representa o conjunto particular de instruções inerentes à aplicação pretendida. Por exemplo, uma vez fixado um período e dada a série histórica de dados de um ou mais ativos, pode-se caracterizar um indivíduo como o conjunto extenso de parâmetros que determina condições de entrada, saída, alocação e exposição a risco assumidas no decorrer do período dado. Numa outra abordagem, dado um conjunto grande de empresas e séries histórica de preços e indicadores tais como o citado anteriormente price-to-book, um indivíduo se caracteriza pelos critérios utilizados a partir destes indicadores para tomar decisões de compra e venda. i) Seleção A seleção natural ou "sobrevivência do mais adaptado" é talvez a forma mais contundente de garantir a evolução de uma espécie. Num ambiente hostil, é de se esperar que a herança genética dos espécimes mais adaptados seja passada para as gerações seguintes. Na etapa de seleção do algoritmo, os indivíduos são ordenados de acordo com uma função de fitness, responsável por medir o quão bem sucedido é cada indivíduo frente à tarefa proposta pelo método. Apenas os indivíduos mais aptos passarão pelas etapas seguintes. No contexto de mercado, possíveis candidatos para função de fitness são: retorno absoluto, índice Sharpe, DrawDown, ou o que quer que se queira testar. ii) Cruzamento Uma maneira de diversificar o conjunto genético de uma espécie sem comprometer fundamentalmente suas características principais é o cruzamento entre cromossomos. Nessa etapa o algoritmo escolhe, dentre os indivíduos sobreviventes ao processo de seleção natural, partes aleatórias do código genético de dois ou mais membros, promovendo cruzamentos e gerando descendentes, criados a partir dos já existentes. A 2 amplitude dessa diversificação, no entanto, é limitada. Cruzamentos, pela maneira como são definidos, não tem como acrescentar informações totalmente novas ao código genético dos descendentes. iii) Mutação Ao promover uma ou mais alterações pontuais no código genético de um indivíduo, uma mutação pode, ao contrário dos cruzamentos, acrescentar informações totalmente novas ao conjunto genético de uma geração. Embora a princípio todos os indivíduos de uma geração possam ser submetidos à mutação, o índice de mutações expressivas observadas na natureza tende a ser muito baixo, do contrário corre-se o risco de destruir o progresso lento atingido pelos cruzamentos. Num certo sentido, podemos encarar a mutação como uma aposta com uma pequena chance de criar indivíduos extraordinários, mas que, na maioria dos casos, traz pouco benefício diretamente verificável à espécie, uma vez que os mutantes inexpressivos frequentemente sequer sobrevivem à etapa de seleção da geração seguinte. O leitor pode se perguntar, a essa altura, quais benefícios a mutação traz para o conjunto genético, haja vista que a repetição exaustiva de seleções e cruzamentos parece já ser suficiente para que a população convirja para estados cada vez mais eficientes. O que não nos pode escapar, no entanto, é que em todo processo de convergência, a diferença perceptível entre os elementos torna-se cada vez menor. Sem a possibilidade de mudar radicalmente, uma população sujeita apenas a cruzamentos e seleções torna-se estagnada e, consequentemente, aperfeiçoa-se muito pouco entre uma geração e outra. Nesses casos, a mutação surge como a grande alternativa para promover diversidade. O exercício que motivou essa carta, particularmente, foi um estudo conduzido por nossa equipe onde foram analisadas as variáveis earnings per share, price to earnings, price-to-book e return on equity e suas influências na identificação de tendência de ativos pré-selecionados. Essa base de dados compreendia 69 ativos num período de 3000 observações, equivalente a aproximadamente 12 anos. Os indivíduos eram caracterizados por valores distintos das variáveis citadas acima, além de critérios de Stop Gain e Stop Loss. Sendo assim, tendo como função de fitness o Índice Sharpe médio no período, para cada ativo, foi observado que o indivíduo que sobreviveu ao longo de 60 gerações de cruzamentos e mutações apresentou como característica fundamentalista apenas a variável price-to-book. Ode a Benjamin Graham e sua visão sobre investimento. Nossas conclusões ao rodar um algoritmo genético nos moldes do que fizemos corroboram bastante com sua visão. Há algumas razões objetivas para isso. A principal delas é legal. O pouco que o aparato regulatório se posiciona sobre valor da firma garante ao acionista o valor de livro como referência mínima. Não vamos tentar explicar os motivos por trás da força desse indicador. Apenas deixamos abertos os resultados para que o leitor tire suas próprias conclusões. Agradecemos a confiança, Equipe de Gestão Esta carta é publicada somente com o propósito de divulgação de informações e não deve ser considerada como uma oferta de venda dos Fundos Ático, nem tampouco como uma recomendação de investimento em nenhum dos valores mobiliários, quando, aqui citados. Todos os julgamentos e estimativas aqui contidos são apenas exposições de opiniões até a presente data e podem mudar, sem prévio aviso, a qualquer momento. Performance passada não é necessariamente garantia de performance futura. Os investidores em fundos não são garantidos pelo administrador ou por qualquer mecanismo de seguro ou ainda, pelo fundo garantidor de crédito. 3