Predição do Valor Econômico de uma Oportunidade Exploratória de

Propaganda
VII Simpósio Brasileiro de Sistemas de Informação
Predição do Valor Econômico de uma Oportunidade
Exploratória de Petróleo
Trabalho de Mestrado
Marcos A. Affonso1 (Aluno), Leila Andrade2 (Orientador), Kate Revoredo3 (Coorientador)
Programa de pós-graduação em Informática – Universidade Federal do Estado do Rio de
Janeiro UNIRIO
1,2,3
Centro de Ciências Exatas e Tecnologia
Avenida Pasteur, 458 - Urca - Rio de Janeiro / RJ - CEP: 22290-240
{marcos.affonso, katerevoredo, Leila}@uniriotec.br
Ano de Ingresso no Programa de Mestrado: 2010
Época esperada de conclusão: Março/2012
Etapas já concluídas: Defesa da Proposta
Abstract. In this article we propose to use data mining to build a predictive
model able to evaluate economically a petroleum exploration opportunity in
order to estimate the potential of investment return and as well as help to
decide to invest or not in an opportunity.
Resumo. Neste artigo propomos utilizar mineração de dados, para construir
um modelo preditivo que irá avaliar economicamente uma oportunidade
exploratória de petróleo com o objetivo de estimar o potencial de retorno de
investimento, assim como auxiliar na decisão de investir ou não na
oportunidade.
Palavras-chave: sistemas de apoio à decisão, aplicação de Sistemas de
Informação em diferentes domínios, mineração de dados
1. Introdução
Um dos prontos críticos da atividade exploratória é a avaliação econômica de uma
descoberta de petróleo [Teixeira et al 2001], que objetiva estimar o quanto uma
oportunidade é promissora. Um dos principais métodos de avaliação econômica é o
Valor Presente Líquido (VPL) [Junior 2003] que se baseia no fluxo de caixa descontado
dos investimentos e que será explicado na Seção 2.
O trabalho de avaliação baseia-se em informações incertas como estimativa do
preço futuro do óleo no mercado mundial, profundidade da oportunidade e qualidade do
óleo que se espera encontrar. Essas avaliações são realizadas por especialistas da área
459
VII Simpósio Brasileiro de Sistemas de Informação
(geólogos e engenheiros) que aplicam seus conhecimentos adquiridos ao longo de anos
para estimar se vale a pena investir em uma oportunidade ou não.
Esta habilidade adquirida se perde quando este profissional se aposenta, muda de
empresa ou fica temporariamente suspensa no caso de uma licença. Esta, também é uma
preocupação atual dos investigadores na área de Gestão do Conhecimento, que consiste
na busca da melhoria de desempenho das organizações, inclusive por meio do uso de
ferramentas e tecnologias de informação eficientes.
Seria interessante que esse conhecimento fosse sintetizado através de um
modelo, para auxílio à tomada de decisão sobre a viabilidade da oportunidade
exploratória. Neste trabalho propomos aplicar técnicas de mineração de dados [Witten et
al 2005] sobre o histórico de avaliações com o objetivo de encontrar de forma
automática esse modelo.
O artigo está estruturado da seguinte forma: na Seção 2 explicamos o objetivo de
uma avaliação econômica e suas etapas. Na Seção 3 falamos sobre Descoberta de
Conhecimento em Banco de Dados (Knowledge Discovery in Databases - KDD). Na
Seção 4 descrevemos a nossa proposta. Na Seção 5 concluímos apresentando trabalhos
relacionados.
2.Valor Presente Líquido (VPL)
Na indústria de petróleo usa-se basicamente o VPL para se avaliar economicamente o
quanto uma descoberta é promissora e se vale a pena fazer um investimento ou
abandonar o projeto [Junior 2003]. Quando ocorre uma descoberta, o primeiro passo é
elaborar uma curva de produção de óleo, onde a estimativa de produção, ano a ano, ao
longo da vida útil do campo é refletida. A Figura 1 ilustra um campo hipotético que
começará a produção em 2011, alcançará produção máxima em 2027 e se esgotará em
2041.
Figura 1: Curva da Produção de um Campo Hipotético (Fonte: Autores)
O segundo passo é o cálculo do fluxo de caixa relativo à curva de produção deste
campo de petróleo. O fluxo de caixa representa o retorno líquido (receita menos
despesa) ano a ano, por toda vida útil do campo. A Figura 2 representa o fluxo de caixa
correspondente à curva de produção hipotética da Figura 1. Note que os investimentos
se iniciaram em 2008. O fluxo de caixa se torna positivo na medida em que o campo
entra em produção em 2011.
460
VII Simpósio Brasileiro de Sistemas de Informação
Figura 2: Exemplo de um fluxo de caixa (Fonte: Autores)
De posse destas informações, pode-se calcular o VPL que consistirá no
somatório dos fluxos de caixa corrigidos para o valor presente. A Figura 3 exibe a
fórmula do VPL. Um componente importante e estratégico desta formula é a Taxa
Mínima de Atratividade (TMA) que significa a taxa mínima que uma empresa espera
receber como retorno de seu investimento [Junior 2003]. O ajuste da aplicação da TMA
é feito por j: se aplicada no início do período j=1, se no meio então j=0,5, se for aplicada
no fim do período então j=0.
Figura 3: Fórmula básica do Valor Presente Líquido (Fonte: Autores)
3. Mineração de Dados
Mineração de dados é parte de um processo maior chamado Descoberta de
Conhecimento em Banco de Dados (sigla em inglês KDD). A Figura 4 mostra a
sequência de passos para a descoberta de conhecimento. De início os dados recebem um
pré-processamento, como limpeza e integração dos dados. Em seguida é realizada a
mineração de dados onde são aplicados os algoritmos que extrairão um modelo do
conhecimento oculto. Por fim, o modelo passa por um pós-processamento como
avaliação e apresentação. O modelo extraído pode ser preditivo (prevê valores
desconhecidos baseados em dados conhecidos) ou descritivo (identificam padrões nos
dados). O aprendizado do modelo pode ser do tipo supervisionado, quando a classe dos
exemplos é levada em consideração, quando isto não ocorre dizemos que o aprendizado
é não supervisionado. Nosso trabalho seguirá os passos acima, e o nosso modelo
proposto será preditivo com aprendizado supervisionado.
461
VII Simpósio Brasileiro de Sistemas de Informação
Figura 4: Processo de Descoberta de Conhecimento em Banco de Dados – KDD
Dentre as técnicas para construção de modelos preditivos que conseguem
expressar incerteza se destacam as Redes Bayesianas [Witten 2005 et al], pois
representam a incerteza através de distribuições de probabilidade conjunta aliada a
grafos direcionados acíclicos que expressam os relacionamentos entre os nós. Estas
características fazem de RBs um modelo adequado à nossa proposta, pois a área de
petróleo lida com muitas incertezas.
4. Cálculo do VPL e Mineração de Dados
Estando a curva de produção finalizada, procede-se, então, a elaboração do fluxo
de caixa necessário para tornar esta curva viável. Para isto consideram-se as variáveis
econômicas envolvidas no projeto como preço do óleo no mercado, TMA, impostos e
outros. Dependendo da complexidade da oportunidade (quantidade de objetivos,
quantidade de fluidos), uma avaliação pode demorar de 2 a 4 dias segundo nossas
pesquisas junto aos especialistas. Além disso, por serem as avaliações baseadas apenas
em estatística convencional e modelos econômicos, tendem a apresentar baixo
desempenho [Lean Yu et al 2007]. Dessa forma, neste trabalho propomos construir
automaticamente a partir de dados históricos um modelo para predição do VPL.
Após consultarmos os especialistas, as seguintes variáveis foram consideradas
relevantes para o cálculo do VPL: volume estimado de petróleo, lâmina d’agua,
profundidade da oportunidade, qualidade do óleo, impostos, TMA, preço do óleo no
mercado, tipo de fluido (óleo/gás), distância da costa e bacia sedimentar. Com relação às
características da rocha que conterá o petróleo, são importantes: área, espessura,
porosidade, permeabilidade e saturação.
Para testar a nossa proposta consideraremos 600 exemplos de avaliações cedidas
por uma empresa de petróleo. Além das 15 variáveis, utilizaremos o valor calculado do
VPL como variável de classe, permitindo assim aplicar um algoritmo de aprendizado
supervisionado. Com o apoio de plataformas tipo WEKA, o toolbox BNT da Matlab e o
software SamIam, desenvolveremos o modelo proposto.
Devido ao fato de haver um grau de incerteza nas atividades exploratórias, a
aplicação de Redes Bayesianas é a abordagem de mineração de dados que propomos
para predição do VPL. Rede Bayesiana (RB) é um modelo estatístico, com forte
462
VII Simpósio Brasileiro de Sistemas de Informação
embasamento teórico, que representa distribuições de probabilidade de modo conciso e
utiliza grafos para expressar as dependências entre as variáveis [Witten et al 2005].
Nosso trabalho propõe, de forma automática, construir o grafo de dependências entre as
variáveis do domínio, aprender as distribuições de probabilidades conjuntas para que
então essa rede aprendida possa ser utilizada para predição do VPL de oportunidades
exploratórias.
Para efeito de avaliação do produto final, procuraremos perseguir o índice de
95% de certeza, que é considerado, em estatística, suficientemente alto para a maioria
das aplicações (Wazlawick, 2009), Outra forma de validar o modelo será através da
realização de uma pesquisa entre os especialistas.
5. Conclusão
Neste artigo expusemos os problemas envolvidos na avaliação de uma
oportunidade exploratória de petróleo e mencionamos como pretendemos contribuir
para resolver estes problemas.
Alguns trabalhos anteriores efetuam predições neste domínio como: predição do preço
do óleo no mercado [Lean Yu, et al 2007], predição da curva de produção [Junior, et al
2010], predição da viscosidade [Omole, et al 2007]. Entretanto, nenhum trabalho
propos, como o nosso, predizer o valor do VPL.
6. Referências
Junior, Repsol (2003) “A Competição e a Cooperação na Exploração e Produção de
Petróleo” – COPPE/UFRJ - Dissertação Mestrado. Pag 62-63; 171. Planejamento
Energético
Yu, L. e Lai, K. e Wang, S. e He, K. (2007) “Oil Price Forecasting with an EMD-Based
Multiscale Neural Network Learning Paradigm”, Part III, LNCS 4489, pags 1; 925–
932, Springer-Verlag Berlin Heidelberg
Teixeira, J. e Rocha, K. e Batista F. e Neto, S. (2001) “Avaliação de Opções de
Expansão em Projetos de Petróleo Através da Teoria de Opções Reais”, PUC- Rio,
paper. Pag 1.
Junior, A. (2010) “Predição não-linear de Curvas de Produção de Petróleo Via Redes
Neurais Recursivas”, Dissertação de Mestrado – Universidade Federal do Rio Grande
do Norte – UFRN – Engenharia de Petróleo
Omole, O. e Falode, O. e Deng D. (2009) “Prediction of Nigerian Crude Oil Viscosity
Using Artificial Neural Network”, University of Ibadan, Nigeria. Department of
Petroleum Engineering
Witten, I. Frank, E. (2005) “Data Mining: Practical Machine Learning Tools and
Techniques”, 2nd ed. Elsevier. Pag 5; 9; 278-279.
Ben-Gal, I. e Ruggeri, F. e Faltin F. e Kenett R., (2007) “Bayesian Networks” ,
Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons – Paper
Wazlawick, Raul (2009) “Metodologia de Pesquisa para Ciência da Computação”,
Editado por Campus, Rio de Janeiro. Pag. 63
463
Download