Comparação entre regressão logística e redes neurais na previsão de falência de bancos brasileiros Fernando Carvalho de Almeida Faculade de Economia Administração e Contabilidade - Campus Ribeirão Preto Departamento de Administração USP C.P. 11498 CEP. 05422-970 - Sao Paulo SP E-mail: [email protected] José de Oliveira Siqueira Faculade de Economia Administração e Contabilidade - Campus Ribeirão Preto Departamento de Administração USP C.P. 11498 CEP. 05422-970 - Sao Paulo SP E-mail: [email protected] Resumo Este trabalho explora o uso de redes neurais com método de backpropagation na previsão de falência de bancos brasileiros. Os resultados de classificação das redes são comparados com a técnica estatística de regressão logística. As redes neurais mostraram algumas vantagens em relação à regressão logística, como por exemplo consideração de instituições que foram desprezadas pela técnica estatística.. Palavras-Chave: Previsão de Falência, Redes Neurais, Estatística Abstract This paper explores the use of neural networks in bankruptcy prediction of Brazilian banks. Backpropagation was used to construct the neural networks. The classification results are compared with a statistical technique called logistic regression. Neural networks has shown some advantage in comparison with logistic regression as for example, the statistical technique has discarded some of the banks in reason of lack of information. The neural network model has considered these institutions, being able to classify them. Keywords: Bankruptcy prediction, Neural Networks, statistical methods Diversos estudos têm explorado o uso de redes neurais na avaliação de riscos de insolvência nos últimos anos (DE ALMEIDA 1993; WILSON & SHARDA 1994; PODDIG 1995; etc.). Este estudo explora, em particular, o setor bancário brasileiro. A avaliação de risco de insolvência de bancos brasileiros é uma questão particularmente importante no contexto econômico atual. Em função do processo de estabilização da moeda brasileira, os bancos brasileiros tem sido obrigados a passar por processo rigoroso de adaptação: a forte e rápida redução dos ganhos inflacionários forçou os bancos a aumentarem seus volumes de crédito e, em consequência, os volumes de créditos em liquidação em momento econômico marcado por elevação dos níveis de recolhimento compulsório. Em decorrência da necessidade de fortes ajustes afloraram problemas de liquidez, levando o Banco Central a decretar a liquidação de diversas instituições e efetivar intervenção em diversas outras. 1. Avaliação de Riscos de Insolvência A avaliação de riscos de insolvência têm sido extensamente efetuada a partir da década de 60, essencialmente voltada para o segmento empresarial não-financeiro (COHEN 1966; BEAVER 1966; ALTMAN 1968; Terceiro Congresso Brasileiro de Redes Neurais, 4. Florianópolis, p. 1-6, 1997 ABATE 1969), fundamentados no uso de regressão e análise discriminante e classificatória. Só mais recentemente partiu-se para a utilização de redes neurais na avaliação de riscos de insolvência, ainda no segmento não-financeiro das economias (ALMEIDA 1993; JOHNSEN 1994; WILSON 1994; PODDIG 1995). A insolvência bancária no Brasil constitui-se em segmento novo de pesquisa, notadamente em razão da política governamental de suporte ao sistema financeiro até agora. Este estudo usa um modelo de retro-propagação baseado nos Modelos de Processamento Distribuído Paralelo propostos por RUMELHART et al. (1986). A propagação de informação através da rede é efetuada como se segue (figura 1): os valores de entrada são transmitidos de uma camada para a outra e transformados através de pesos de conexões entre os neurônios (Wji: peso da conexão entre o neurônio I e neurônio J). A rede acumula seu conhecimento através dos pesos de conexão. 2. Redes Neurais Figura 1.- Propagação de sinais na rede neural . As redes neurais artificiais reproduzem o funcionamento do cérebro de maneira simplificada. Noções sobre o funcionamento da memória, como por exemplo, princípios associativos ou capacidade de aprendizado inspiram os modelos de redes neurais artificiais (KOHONEN, 1988). O uso de técnicas de representação do conhecimento sobre avaliação de riscos de insolvência é de especial interesse, pois essas técnicas podem tratar dados quantitativos e qualitativos. 2.1 Redes Feed-forward Podemos tomar como exemplo um neurônio J na camada Jc: 1 O neurônio J recebe as saídas Oi dos neurônios precedentes e o valor Nj é computado: Nj=ΣWji0i. 2 Nj é introduzido numa função de ativação f (Nj) que produz um valor de ativação Aj. No modelo de RUMELHART o valor de ativação é igual a Nj. 3 A intensidade do sinal enviado de um neurônio para o outro é uma função da intensidade do valor de ativação. Uma função de transferência toma em conta o valor de ativação e produz o sinal de saída Oj. 1 Oj(t+1) = _______________ (eq.1) Diversos modelos de redes neurais são encontrados na literatura (STANLEY, 1990). Os modelos são divididos em dois grupos principais: redes feedforward e redes feed-backward. Uma rede neural compreende um conjunto de nós interligados. Esses dois modelos diferem quanto à maneira pela qual estes nós, os neurônios, se interligam para transmitir a informação. Em redes feed-backward há apenas uma camada de neurônios e todos os neurônios são interligados entre si. Nesta pesquisa foram utilizadas redes feed-forward. Neste tipo de rede várias camadas são organizadas horizontalmente (figura 1). Cada neurônio se conecta e envia informação para todos os neurônios da camada seguinte. Neurônios pertencentes à mesma camada não são interligados. Estas redes são freqüentemente constituídas de três camadas: a camada de entrada com os neurônios de entrada, a camada intermediária com os neurônios intermediários e a camada de saída com os neurônios de saída. Os neurônios de entrada introduzem informação na rede. Os neurônios de saída transmitem as respostas da rede. Neurônios e camadas intermediárias são colocados entre as camadas de entrada e saída. -(ΣWiOi + θj) 1+e Método de Aprendizado por Retro-Propagação As redes são construídas, isto é, pesos de conexão apropriados entre os neurônios são determinados, usando-se um método de aprendizado. Esses pesos são geralmente valores arbitrários no início do processo de aprendizado. São corrigidos ao passo que o aprendizado evolui usando-se exemplos (ou fatos) representativos do problema em estudo. Estes fatos são relidos sucessivas vezes até que todos sejam aprendidos pela rede. A retro-propagação é um método de aprendizado supervisionado pois os resultados observados na saída dos neurônios são usados para ajustar os pesos de conexão. O vetor O modelo de retro-propagação é um modelo feedforward sendo o modelo mais conhecido e referenciado na literatura (SHARDA 1994). 2 obtido na saída dos neurônios é comparado com o vetor de saída desejado. Se houver uma diferença entre os dois vetores, os pesos de conexão são corrigidos ocorrendo assim o aprendizado. O modelo de RUMELHART et al. é baseado em uma regra de aprendizado chamada Regra Delta Generalizada: ∆Wji(n+1) = µδjOi + α∆Wji(n) Desde OHLSON (1980) a análise LOGIT é usada freqüentemente para a avaliação de riscos de inadimplência, baseada em características financeiras (índices) das empresas. O modelo LOGIT cria para cada empresa um score Z: Z=α+βXi (eq. 3) onde Xi é o valor da i-ésima variável (i.e. características financeiras) (eq. 2) P = ∆Wji(n+1) é o ajuste introduzido em n+1 no peso de conexão entre os neurônios i e j. µ é uma constante chamada taxa de aprendizado que controla a intensidade de correção feita nos pesos de conexão a cada iteração do processo. Quanto maior a taxa de aprendizado tanto maiores as mudanças que serão introduzidas nos pesos em cada iteração. α é uma constante chamada fator suavizante que faz o processo de aprendizado considerar o valor do peso no momento n. ### é o sinal de erro na saída do neurônio. 1 -( α +β X i ) 1 + e (eq. 4) Como P sempre se situa entre 0 e 1, o score Z é freqüentemente interpretado como a probabilidade de inadimplência. 5. O Estudo 5.1 Indicadores de Diagnóstico Financeiro de Bancos Neste estudo, estamos considerando, para a análise de risco de Bancos, 9 indicadores financeiros, expostos na tabela 1 a seguir, descritos nos Manuais de Análise da Austin Asis, empresa brasileira de análise de risco bancário. Além de tais indicadores, foi considerada a variável de indicação de porte log(Ativo). 3. Análise de Riscos de Insolvência - Visão Geral do Processo A maioria dos modelos de avaliação de riscos de insolvência são construídos usando-se amostras pareadas: uma parte da amostra contem informações sobre empresas insolventes; a outra parte contem informações sobre empresas não insolventes. Variáveis são então selecionadas segundo seu interesse potencial na avaliação de riscos de insolvência. Um método estatístico é então usado para desenvolver um modelo discriminante (i.e., uma combinação de variáveis que melhor distingua os dois tipos de empresa). Finalmente o sucesso da discriminação é avaliado através de uma amostra de controle (i.e., uma amostra diferente da usada para obter o modelo). TABELA 1. Índices Financeiros ESTRUTURA 1.CAPITAL DE GIRO ((Patrimônio Líq. Ativo Permanente)/ Patrimônio Líquido) 2.ALAVANCAGEM (Captação Total/ Patrimônio Líquido) SOLVÊNCIA 3.COMPROMETIME NTO Em geral a amostra de controle contém empresas solventes e empresas comprovadamente insolventes, isto é empresas que estão em processo de concordata, em liquidação, ou no caso de bancos e instituições financeiras, sob intervenção do Banco Central. CUSTOS E DESPESAS 4.INTERMEDIAÇÃO (Oper.Créd.Liq Significativo ao.Duvidosa/ Patrimônio Líquido) (Despesa Interm. Financ. Prov. CL Ajuste Prog.Est.Econ./ Capt.Total) 5.PESSOAL (Despesa Pessoal/ Captação Total) 6.ADMINISTRATIVO (Despesa Administrativa/ Captação Total) No caso desta pesquisa em razão do número reduzido de bancos insolventes na amostra global, não utilizamos bancos insolventes na amostra de controle. Ao invés disto confrontamos os resultados obtidos com a avaliações feitas pela empresa Austin Asis especializada em diagnóstico financeiro de empresas. 4. Regressão Logística RENTABILIDADE 3 7.GERAÇÃO DE RENDAS 8.RENTABILIDADE DO PL CRESCIMENTO 9.CAPTAÇÕES TOTAIS OUTROS 10. ATIVO TOTAL (Receita Intermediação Financeira/Ativo Real Ativo Permanente) (Resultado Líquido/ Patrimônio Líquido) observar a existência de diferença entre as médias de cada um dos grupos para as diversas variáveis explicativas. Captação Total do último período/Captação Total do período anterior INDICE TABELA 2 - Comparação de médias entre os dois grupos de empresas (solvenes e insolventes) ESTRUCTURA 1.CAPITAL DE GIRO 2.ALAVANCAG EM Valor do ativo total (logaritmo) SOLVÊNCIA 3.COMPROMETI MENTO CUSTO E DESPESA 4.INTERMEDIA ÇÃO 5.PESSOAL CONCEITOS ATIVO REAL Ativo Total - Relações Interfinanceiras Relações Interdependênciais PASSIVO REAL Passivo Total - Relações Interfinanceiras Relações Interdependênciais APLICAÇÃO TOTAL Ativo Real - Ativo Permanente Diversos CAPTAÇÃO TOTAL Passivo Real Patrimônio Líquido Diversos 6.ADMINISTRA TIVO RENTABILIDA DE 7.GERAÇÃO DE RENDAS 8.RENTABILID ADE DO PL 5.2. Amostra e seleção dos dados Para a criação de modelos de análise de risco de insolvência, dois grupos são necessários. Um primeiro grupo contendo instituições insolventes e um segundo grupo contendo instituições solventes. As instituições consideradas insolventes neste estudo são aquelas que sofreram processos de liquidação ou intervenção do Banco Central do Brasil. Para o grupo de solventes, foi escolhido um grupo de bancos considerados tradicionais (27 bancos). CRESCIMENT O 9.CAPTAÇÕES TOTAIS OUTROS 10. ATIVO TOTAL tProbabi Significa Student l. tivo ao nível 0.1 - 0.25 0.805 - 0.72 0.475 1.84 0.072 x 3.22 0.003 x 1.53 0.131 2.17 0.034 x 3.25 0.002 x -1.54 0.147 0.72 0.474 -5.1 0.000 x Dentre as variáveis selecionadas, 5 são significativas no nível de 0.1%, e 4 são significativas no nível de 0.05%. Foram obtidas, através das bases de dados da Austin Asis, informações econômico-financeiras e cadastrais de 225 Bancos atuantes no Brasil. A amostra usada para a criação das redes neurais e das funções logísticas contém 54 bancos, sendo 27 bancos solventes e 27 insolventes. A amostra foi constituída a partir do último balanço disponível (julho de 1995). 5.3 Desenvolvimento dos experimentos O experimento foi efetuado através da construção de 54 redes e em seguida de 54 funções logísticas. Cada um dos grupos de 54 modelos, das redes neurais e da regressão logística, foram criados utilizando-se do método de Lachenbruch. No A tabela 2 apresenta uma comparação de médias entre entre os dois grupos. Para comparação de médias foi utilizado o teste-t de Student que permite 4 método de Lachenbruch um modelo é construido contendo n-1 observações. O modelo é então utilizado para a previsão da observação n, colocada de lado. O procedimento é repetido n vezes (54 vezes neste experimento) e a classificação das observações efetuadas é utilizada para avaliar a precisão do modelo. Estes valores são sugeridos como default pela ferramenta de concepção de redes neurais utilizada (BRAINMAKER - ver Stanley 1990). Número de iterações (o número de vezes em que a amostra de base será lida durante o processo de aprendizado): O número de iterações foi limitado a 1500 iterações nas experiências realizadas, uma vez que o processo de aprendizado, não evoluiu com um número maior de iterações, isto o número aprendidas não mais evoluiu. O processo de aprendizado foi encerrado automaticamente quando a taxa de precisão requerida foi alcançada. O processo é descrito por LACHENBRUCH (1976): “Crie a função discriminate para cada amostra possível contendo n1+n2 - 1, obtida omitindo-se uma observação da amostra original e registre para cada uma destas funções se a observação foi incorretamente classificada. Se m1 e m2 são a quantidade de observações classificadas incorretamente, podemos estimar P1 e P2 a partir de m1/n1 e m2/n2. A estimativa do erro obtida é “unbiased” para a probabilidade de classificação incorreta para uma função discriminante baseada em n1-1 e n2 observações e n1 e n2-1 observações, respectivamente. “ Número de neurônios na camada intermediária: Não existe um critério racional que permita definilo (MAGNIER 1991; DUTTA, SHEKHAR & WONG 1992; WILSON & SHARDA 1994; etc.). Neste estudo foram criadas redes com 5 neurônios na camada intermediária (figura 2). Figura 2 - Modelo de rede criado Este procedimento foi utilizado para criar e avaliar a capacidade preditiva das redes, e foi repetido para avaliar a capacidade preditiva da regressão logística. 5.4. Definição de parâmetros na criação das redes neurais Existe uma série parâmetros na constituição de uma rede neural, que poderão influenciar sua capacidade preditiva. No entanto a falta de metodologia na concepção de redes neurais (MAGNIER 1991, DE ALMEIDA 1993), impossibilita sua escolha de maneira racional (número de neurônios na camada intermediária, número de iterações, taxa de aprendizado, etc.). 2 neurônios de saida Neurônios de entrada 5 neurônios intermediários Segundo MAGNIER (1991), a escolha adequada dos valores dos parâmetros tende a ficar baseada na experiência e sensibilidade do operador que conduz a construção da rede. Neste estudo assumimos os seguintes valores de parâmetros: 6. Resultados Como resultado obtivemos porcentagem de classificação superior através da técnica Logit, principalmente quando foi utilizado o método enter. Este método não desconsidera nenhuma variável mesmo que exista correlação entre elas. No entanto apenas 16 das 27 instituições solventes puderam ser utilizadas na regressão logística por indisponibilidade de dados de algumas variáveis. Este problema não ocorre com as redes que podem levar em consideração informações incompletas. taxa de aprendizado (α α ): igual a 1 momentum (η η ) igual a 0,9, Lembramos que estes parâmetros que intervém no algoritmo de aprendizado (∆Wji(n+1) = µδjOi + α∆Wji(n), eq. 2, apresentada anteriormente). Taxa de precisão do aprendizado: igual a 10%. 5 TABELA 3 - Resultados de Previsão Grupo Porcentagem de classificação correta Redes R. L. R. L. Neurais (Forward (Enter) stepwise) Instituições 63 92 88 solventes Instituições 70 43 68 insolventes Classificação 67 68 78 global Solventes não 0 0 4 classificadas Insolventes 0 40 40 não classificadas systèmes d'aide à la décision.- Tese de Doutorado em Administração. -Ecole Supérieure des Affaires, Universidade de Grenoble, 1993. DUTTA, S., S. SHEKHAR e W.Y. WONG “Decision Support in Non-Conservative Domains: Generalization with Neural Networks” - WP n 92-31, INSEAD, 1992. KOHONEN, T.- "An Introduction to Neural Computing".- Neural Networks, vol.1, p.3-16, 1988. JOHNSEN, T. e MELICHER, R.W. -“Predictiong corporate bankruptcy and financial distress: Information Value Added by Multinominal Logit Models”. -Journal of Economics & Business, vol.46, n.4, p.269-286, Outubro 1994. LACHENBRUCH, P.A. “An Almost Unbiased Method of Obtaining Confidence Intervals for the Probability of Misclassification in Discriminant Analysis”. Biometrics, December, 1967. MAGNIER, J.P. Utilisation des réseaux de neurones pour le développement de systèmes d'aide à la décision. Montpelier: Intitut d'Administratio d'Entreprises, 1991. (mimeo). OHLSON, J.A. Financial ratios ande the probabilistic prediction of bankruptcy. Journal of Accounting Research, p.109131, Spring 1980. PODDIG, T. “Bankruptcy Prediction: A Comparison with Discriminant Analysis”. in Neural Networks in Capital Markets. Editado por A.P. REFENES, New York.John Wiley & Sons, 1995. RUMELHART, D.E., J.C. McCLELLAND, PDP Research Group.- Parallel Distributed Processing - Exploration in the Microtexture of Cognition.- Volume 1.London.- The MIT Press.- 1986. SHARDA, R.- “Neural Networks for the MS/OR analyst: An application bibliography”. Interfaces, vol.24, n.2, p.116-130, 1994. STANLEY J. - Introduction to Neural Networks.CA:Sierra Madre.-Cal. Scientific Software.-3rd edition.-1990. WILSON, R.L. & SHARDA, R. -”Bankruptcy Prediction Using Neural Networks”. Decision Support Systems, vol. 11, n. 5, p. 545-557, junho 1994. Regressão logística 1 - Método FORWARD STEPWISE com estatística WALD Regressão logística 2 - Método ENTER - todas as variáveis obrigatoriamente entram no modelo 5. Conclusões Apesar dos resultados de classificação não superiores das redes neurais, esta foi capaz de considerar bancos que a regressão logística não pode classificar por falta de dados. A qualidade de classificação das redes poderia eventualmente melhorar a partir da exploração de outros métodos. Em nosso grupo estamos no momento trabalhando com redes não supervisionadas, que podem ser utilizadas previamente à backpropagation. 7. Referências ABATE, R.P. - “Numerical Scoring Systems for Commercial Loans” Bankers Monthly, January, 1969. ALTMAN, E. -“Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy”. -Journal of Finance, vol. 23, n.4, p.589-609, setembro, 1968. BEAVER, W. “Financial ratios as predictors of failures”, in Empirical Research in Accounting, selected studies, 1966, in supplement to the Journal of Accounting Research, January, 1967. COHEN, I. J., T.C. GILMORE, e F.A. SINGER, “Bank procedures for analyzing business loan applications” in Analytical Methods in Banking, K.J. Cohen e F.S. Hammer, Homewood, Ill: R.D. Irwin, 1966. DE ALMEIDA, F.C. -L'Evaluation des risques de défaillance des entreprises à partir des réseaux de neurones insérés dans les 6