VII Simpósio Brasileiro de Sistemas de Informação Predição do Valor Econômico de uma Oportunidade Exploratória de Petróleo Trabalho de Mestrado Marcos A. Affonso1 (Aluno), Leila Andrade2 (Orientador), Kate Revoredo3 (Coorientador) Programa de pós-graduação em Informática – Universidade Federal do Estado do Rio de Janeiro UNIRIO 1,2,3 Centro de Ciências Exatas e Tecnologia Avenida Pasteur, 458 - Urca - Rio de Janeiro / RJ - CEP: 22290-240 {marcos.affonso, katerevoredo, Leila}@uniriotec.br Ano de Ingresso no Programa de Mestrado: 2010 Época esperada de conclusão: Março/2012 Etapas já concluídas: Defesa da Proposta Abstract. In this article we propose to use data mining to build a predictive model able to evaluate economically a petroleum exploration opportunity in order to estimate the potential of investment return and as well as help to decide to invest or not in an opportunity. Resumo. Neste artigo propomos utilizar mineração de dados, para construir um modelo preditivo que irá avaliar economicamente uma oportunidade exploratória de petróleo com o objetivo de estimar o potencial de retorno de investimento, assim como auxiliar na decisão de investir ou não na oportunidade. Palavras-chave: sistemas de apoio à decisão, aplicação de Sistemas de Informação em diferentes domínios, mineração de dados 1. Introdução Um dos prontos críticos da atividade exploratória é a avaliação econômica de uma descoberta de petróleo [Teixeira et al 2001], que objetiva estimar o quanto uma oportunidade é promissora. Um dos principais métodos de avaliação econômica é o Valor Presente Líquido (VPL) [Junior 2003] que se baseia no fluxo de caixa descontado dos investimentos e que será explicado na Seção 2. O trabalho de avaliação baseia-se em informações incertas como estimativa do preço futuro do óleo no mercado mundial, profundidade da oportunidade e qualidade do óleo que se espera encontrar. Essas avaliações são realizadas por especialistas da área 459 VII Simpósio Brasileiro de Sistemas de Informação (geólogos e engenheiros) que aplicam seus conhecimentos adquiridos ao longo de anos para estimar se vale a pena investir em uma oportunidade ou não. Esta habilidade adquirida se perde quando este profissional se aposenta, muda de empresa ou fica temporariamente suspensa no caso de uma licença. Esta, também é uma preocupação atual dos investigadores na área de Gestão do Conhecimento, que consiste na busca da melhoria de desempenho das organizações, inclusive por meio do uso de ferramentas e tecnologias de informação eficientes. Seria interessante que esse conhecimento fosse sintetizado através de um modelo, para auxílio à tomada de decisão sobre a viabilidade da oportunidade exploratória. Neste trabalho propomos aplicar técnicas de mineração de dados [Witten et al 2005] sobre o histórico de avaliações com o objetivo de encontrar de forma automática esse modelo. O artigo está estruturado da seguinte forma: na Seção 2 explicamos o objetivo de uma avaliação econômica e suas etapas. Na Seção 3 falamos sobre Descoberta de Conhecimento em Banco de Dados (Knowledge Discovery in Databases - KDD). Na Seção 4 descrevemos a nossa proposta. Na Seção 5 concluímos apresentando trabalhos relacionados. 2.Valor Presente Líquido (VPL) Na indústria de petróleo usa-se basicamente o VPL para se avaliar economicamente o quanto uma descoberta é promissora e se vale a pena fazer um investimento ou abandonar o projeto [Junior 2003]. Quando ocorre uma descoberta, o primeiro passo é elaborar uma curva de produção de óleo, onde a estimativa de produção, ano a ano, ao longo da vida útil do campo é refletida. A Figura 1 ilustra um campo hipotético que começará a produção em 2011, alcançará produção máxima em 2027 e se esgotará em 2041. Figura 1: Curva da Produção de um Campo Hipotético (Fonte: Autores) O segundo passo é o cálculo do fluxo de caixa relativo à curva de produção deste campo de petróleo. O fluxo de caixa representa o retorno líquido (receita menos despesa) ano a ano, por toda vida útil do campo. A Figura 2 representa o fluxo de caixa correspondente à curva de produção hipotética da Figura 1. Note que os investimentos se iniciaram em 2008. O fluxo de caixa se torna positivo na medida em que o campo entra em produção em 2011. 460 VII Simpósio Brasileiro de Sistemas de Informação Figura 2: Exemplo de um fluxo de caixa (Fonte: Autores) De posse destas informações, pode-se calcular o VPL que consistirá no somatório dos fluxos de caixa corrigidos para o valor presente. A Figura 3 exibe a fórmula do VPL. Um componente importante e estratégico desta formula é a Taxa Mínima de Atratividade (TMA) que significa a taxa mínima que uma empresa espera receber como retorno de seu investimento [Junior 2003]. O ajuste da aplicação da TMA é feito por j: se aplicada no início do período j=1, se no meio então j=0,5, se for aplicada no fim do período então j=0. Figura 3: Fórmula básica do Valor Presente Líquido (Fonte: Autores) 3. Mineração de Dados Mineração de dados é parte de um processo maior chamado Descoberta de Conhecimento em Banco de Dados (sigla em inglês KDD). A Figura 4 mostra a sequência de passos para a descoberta de conhecimento. De início os dados recebem um pré-processamento, como limpeza e integração dos dados. Em seguida é realizada a mineração de dados onde são aplicados os algoritmos que extrairão um modelo do conhecimento oculto. Por fim, o modelo passa por um pós-processamento como avaliação e apresentação. O modelo extraído pode ser preditivo (prevê valores desconhecidos baseados em dados conhecidos) ou descritivo (identificam padrões nos dados). O aprendizado do modelo pode ser do tipo supervisionado, quando a classe dos exemplos é levada em consideração, quando isto não ocorre dizemos que o aprendizado é não supervisionado. Nosso trabalho seguirá os passos acima, e o nosso modelo proposto será preditivo com aprendizado supervisionado. 461 VII Simpósio Brasileiro de Sistemas de Informação Figura 4: Processo de Descoberta de Conhecimento em Banco de Dados – KDD Dentre as técnicas para construção de modelos preditivos que conseguem expressar incerteza se destacam as Redes Bayesianas [Witten 2005 et al], pois representam a incerteza através de distribuições de probabilidade conjunta aliada a grafos direcionados acíclicos que expressam os relacionamentos entre os nós. Estas características fazem de RBs um modelo adequado à nossa proposta, pois a área de petróleo lida com muitas incertezas. 4. Cálculo do VPL e Mineração de Dados Estando a curva de produção finalizada, procede-se, então, a elaboração do fluxo de caixa necessário para tornar esta curva viável. Para isto consideram-se as variáveis econômicas envolvidas no projeto como preço do óleo no mercado, TMA, impostos e outros. Dependendo da complexidade da oportunidade (quantidade de objetivos, quantidade de fluidos), uma avaliação pode demorar de 2 a 4 dias segundo nossas pesquisas junto aos especialistas. Além disso, por serem as avaliações baseadas apenas em estatística convencional e modelos econômicos, tendem a apresentar baixo desempenho [Lean Yu et al 2007]. Dessa forma, neste trabalho propomos construir automaticamente a partir de dados históricos um modelo para predição do VPL. Após consultarmos os especialistas, as seguintes variáveis foram consideradas relevantes para o cálculo do VPL: volume estimado de petróleo, lâmina d’agua, profundidade da oportunidade, qualidade do óleo, impostos, TMA, preço do óleo no mercado, tipo de fluido (óleo/gás), distância da costa e bacia sedimentar. Com relação às características da rocha que conterá o petróleo, são importantes: área, espessura, porosidade, permeabilidade e saturação. Para testar a nossa proposta consideraremos 600 exemplos de avaliações cedidas por uma empresa de petróleo. Além das 15 variáveis, utilizaremos o valor calculado do VPL como variável de classe, permitindo assim aplicar um algoritmo de aprendizado supervisionado. Com o apoio de plataformas tipo WEKA, o toolbox BNT da Matlab e o software SamIam, desenvolveremos o modelo proposto. Devido ao fato de haver um grau de incerteza nas atividades exploratórias, a aplicação de Redes Bayesianas é a abordagem de mineração de dados que propomos para predição do VPL. Rede Bayesiana (RB) é um modelo estatístico, com forte 462 VII Simpósio Brasileiro de Sistemas de Informação embasamento teórico, que representa distribuições de probabilidade de modo conciso e utiliza grafos para expressar as dependências entre as variáveis [Witten et al 2005]. Nosso trabalho propõe, de forma automática, construir o grafo de dependências entre as variáveis do domínio, aprender as distribuições de probabilidades conjuntas para que então essa rede aprendida possa ser utilizada para predição do VPL de oportunidades exploratórias. Para efeito de avaliação do produto final, procuraremos perseguir o índice de 95% de certeza, que é considerado, em estatística, suficientemente alto para a maioria das aplicações (Wazlawick, 2009), Outra forma de validar o modelo será através da realização de uma pesquisa entre os especialistas. 5. Conclusão Neste artigo expusemos os problemas envolvidos na avaliação de uma oportunidade exploratória de petróleo e mencionamos como pretendemos contribuir para resolver estes problemas. Alguns trabalhos anteriores efetuam predições neste domínio como: predição do preço do óleo no mercado [Lean Yu, et al 2007], predição da curva de produção [Junior, et al 2010], predição da viscosidade [Omole, et al 2007]. Entretanto, nenhum trabalho propos, como o nosso, predizer o valor do VPL. 6. Referências Junior, Repsol (2003) “A Competição e a Cooperação na Exploração e Produção de Petróleo” – COPPE/UFRJ - Dissertação Mestrado. Pag 62-63; 171. Planejamento Energético Yu, L. e Lai, K. e Wang, S. e He, K. (2007) “Oil Price Forecasting with an EMD-Based Multiscale Neural Network Learning Paradigm”, Part III, LNCS 4489, pags 1; 925– 932, Springer-Verlag Berlin Heidelberg Teixeira, J. e Rocha, K. e Batista F. e Neto, S. (2001) “Avaliação de Opções de Expansão em Projetos de Petróleo Através da Teoria de Opções Reais”, PUC- Rio, paper. Pag 1. Junior, A. (2010) “Predição não-linear de Curvas de Produção de Petróleo Via Redes Neurais Recursivas”, Dissertação de Mestrado – Universidade Federal do Rio Grande do Norte – UFRN – Engenharia de Petróleo Omole, O. e Falode, O. e Deng D. (2009) “Prediction of Nigerian Crude Oil Viscosity Using Artificial Neural Network”, University of Ibadan, Nigeria. Department of Petroleum Engineering Witten, I. Frank, E. (2005) “Data Mining: Practical Machine Learning Tools and Techniques”, 2nd ed. Elsevier. Pag 5; 9; 278-279. Ben-Gal, I. e Ruggeri, F. e Faltin F. e Kenett R., (2007) “Bayesian Networks” , Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons – Paper Wazlawick, Raul (2009) “Metodologia de Pesquisa para Ciência da Computação”, Editado por Campus, Rio de Janeiro. Pag. 63 463