do Artigo

Propaganda
Comparação entre regressão logística e redes neurais na previsão de
falência de bancos brasileiros
Fernando Carvalho de Almeida
Faculade de Economia Administração e
Contabilidade - Campus Ribeirão Preto
Departamento de Administração
USP
C.P. 11498 CEP. 05422-970 - Sao
Paulo SP
E-mail: [email protected]
José de Oliveira Siqueira
Faculade de Economia Administração e
Contabilidade - Campus Ribeirão Preto
Departamento de Administração
USP
C.P. 11498 CEP. 05422-970 - Sao Paulo SP
E-mail: [email protected]
Resumo
Este trabalho explora o uso de redes neurais com método de backpropagation na previsão de falência de
bancos brasileiros. Os resultados de classificação das redes são comparados com a técnica estatística de
regressão logística. As redes neurais mostraram algumas vantagens em relação à regressão logística,
como por exemplo consideração de instituições que foram desprezadas pela técnica estatística..
Palavras-Chave: Previsão de Falência, Redes Neurais, Estatística
Abstract
This paper explores the use of neural networks in bankruptcy prediction of Brazilian banks.
Backpropagation was used to construct the neural networks. The classification results are compared with
a statistical technique called logistic regression. Neural networks has shown some advantage in
comparison with logistic regression as for example, the statistical technique has discarded some of the
banks in reason of lack of information. The neural network model has considered these institutions,
being able to classify them.
Keywords: Bankruptcy prediction, Neural Networks, statistical methods
Diversos estudos têm explorado o uso de redes
neurais na avaliação de riscos de insolvência nos
últimos anos (DE ALMEIDA 1993; WILSON &
SHARDA 1994; PODDIG 1995; etc.). Este
estudo explora, em particular, o setor bancário
brasileiro. A avaliação de risco de insolvência de
bancos
brasileiros
é
uma
questão
particularmente
importante
no
contexto
econômico atual. Em função do processo de
estabilização da moeda brasileira, os bancos
brasileiros tem sido obrigados a passar por
processo rigoroso de adaptação: a forte e rápida
redução dos ganhos inflacionários forçou os
bancos a aumentarem seus volumes de crédito e,
em consequência, os volumes de créditos em
liquidação em momento econômico marcado por
elevação
dos
níveis
de
recolhimento
compulsório. Em decorrência da necessidade de
fortes ajustes afloraram problemas de liquidez,
levando o Banco Central a decretar a liquidação
de diversas instituições e efetivar intervenção em
diversas outras.
1.
Avaliação de Riscos de Insolvência
A avaliação de riscos de insolvência têm sido
extensamente efetuada a partir da década de 60,
essencialmente voltada para o segmento
empresarial não-financeiro (COHEN 1966;
BEAVER 1966; ALTMAN 1968;
Terceiro Congresso Brasileiro de Redes Neurais, 4. Florianópolis, p. 1-6, 1997
ABATE 1969), fundamentados no uso de regressão
e análise discriminante e classificatória. Só mais
recentemente partiu-se para a utilização de redes
neurais na avaliação de riscos de insolvência, ainda
no segmento não-financeiro das economias
(ALMEIDA 1993; JOHNSEN 1994; WILSON
1994; PODDIG 1995). A insolvência bancária no
Brasil constitui-se em segmento novo de pesquisa,
notadamente em razão da política governamental de
suporte ao sistema financeiro até agora.
Este estudo usa um modelo de retro-propagação
baseado nos Modelos de Processamento Distribuído
Paralelo propostos por RUMELHART et al. (1986).
A propagação de informação através da rede é
efetuada como se segue (figura 1): os valores de
entrada são transmitidos de uma camada para a
outra e transformados através de pesos de conexões
entre os neurônios (Wji: peso da conexão entre o
neurônio I e neurônio J). A rede acumula seu
conhecimento através dos pesos de conexão.
2. Redes Neurais
Figura 1.- Propagação de sinais na rede neural .
As redes neurais artificiais reproduzem o
funcionamento do cérebro de maneira simplificada.
Noções sobre o funcionamento da memória, como
por exemplo, princípios associativos ou capacidade
de aprendizado
inspiram os modelos de redes
neurais artificiais (KOHONEN, 1988). O uso de
técnicas de representação do conhecimento sobre
avaliação de riscos de insolvência é de especial
interesse, pois essas técnicas podem tratar dados
quantitativos e qualitativos.
2.1 Redes Feed-forward
Podemos tomar como exemplo um neurônio J na
camada Jc:
1 O neurônio J recebe as saídas Oi dos neurônios
precedentes e o valor Nj é computado:
Nj=ΣWji0i.
2 Nj é introduzido numa função de ativação f (Nj)
que produz um valor de ativação Aj. No modelo
de RUMELHART o valor de ativação é igual a
Nj.
3 A intensidade do sinal enviado de um neurônio
para o outro é uma função da intensidade do
valor de ativação. Uma função de transferência
toma em conta o valor de ativação e produz o
sinal de saída Oj.
1
Oj(t+1) = _______________ (eq.1)
Diversos modelos de redes neurais são encontrados
na literatura (STANLEY, 1990). Os modelos são
divididos em dois grupos principais: redes feedforward e redes feed-backward. Uma rede neural
compreende um conjunto de nós interligados. Esses
dois modelos diferem quanto à maneira pela qual
estes nós, os neurônios, se interligam para
transmitir a informação. Em redes feed-backward
há apenas uma camada de neurônios e todos os
neurônios são interligados entre si.
Nesta pesquisa foram utilizadas redes feed-forward.
Neste tipo de rede várias camadas são organizadas
horizontalmente (figura 1). Cada neurônio se
conecta e envia informação para todos os neurônios
da camada seguinte. Neurônios pertencentes à
mesma camada não são interligados. Estas redes são
freqüentemente constituídas de três camadas: a
camada de entrada com os neurônios de entrada, a
camada
intermediária
com
os
neurônios
intermediários e a camada de saída com os
neurônios de saída. Os neurônios de entrada
introduzem informação na rede. Os neurônios de
saída transmitem as respostas da rede. Neurônios e
camadas intermediárias são colocados entre as
camadas de entrada e saída.
-(ΣWiOi + θj)
1+e
Método de Aprendizado por Retro-Propagação
As redes são construídas, isto é, pesos de conexão
apropriados entre os neurônios são determinados,
usando-se um método de aprendizado. Esses pesos
são geralmente valores arbitrários no início do
processo de aprendizado. São corrigidos ao passo
que o aprendizado evolui usando-se exemplos (ou
fatos) representativos do problema em estudo. Estes
fatos são relidos sucessivas vezes até que todos
sejam aprendidos pela rede. A retro-propagação é
um método de aprendizado supervisionado pois os
resultados observados na saída dos neurônios são
usados para ajustar os pesos de conexão. O vetor
O modelo de retro-propagação é um modelo feedforward sendo o modelo mais conhecido e
referenciado na literatura (SHARDA 1994).
2
obtido na saída dos neurônios é comparado com o
vetor de saída desejado. Se houver uma diferença
entre os dois vetores, os pesos de conexão são
corrigidos ocorrendo assim o aprendizado.
O modelo de RUMELHART et al. é baseado em
uma regra de aprendizado chamada Regra Delta
Generalizada:
∆Wji(n+1) = µδjOi + α∆Wji(n)
Desde OHLSON (1980) a análise LOGIT é usada
freqüentemente para a avaliação de riscos de
inadimplência,
baseada
em
características
financeiras (índices) das empresas. O modelo
LOGIT cria para cada empresa um score Z:
Z=α+βXi
(eq. 3)
onde Xi é o valor da i-ésima variável (i.e.
características financeiras)
(eq. 2)
P =
∆Wji(n+1) é o ajuste introduzido em n+1 no peso de
conexão entre os neurônios i e j. µ é uma constante
chamada taxa de aprendizado que controla a
intensidade de correção feita nos pesos de conexão a
cada iteração do processo. Quanto maior a taxa de
aprendizado tanto maiores as mudanças que serão
introduzidas nos pesos em cada iteração. α é uma
constante chamada fator suavizante que faz o
processo de aprendizado considerar o valor do peso
no momento n. ### é o sinal de erro na saída do
neurônio.
1
-( α +β X i )
1 + e
(eq. 4)
Como P sempre se situa entre 0 e 1, o score Z é
freqüentemente interpretado como a probabilidade
de inadimplência.
5. O Estudo
5.1 Indicadores de Diagnóstico Financeiro de
Bancos
Neste estudo, estamos considerando, para a análise
de risco de Bancos, 9 indicadores financeiros,
expostos na tabela 1 a seguir, descritos nos Manuais
de Análise da Austin Asis, empresa brasileira de
análise de risco bancário. Além de tais indicadores,
foi considerada a variável de indicação de porte
log(Ativo).
3. Análise de Riscos de Insolvência - Visão Geral
do Processo
A maioria dos modelos de avaliação de riscos de
insolvência são construídos usando-se amostras
pareadas: uma parte da amostra contem
informações sobre empresas insolventes; a outra
parte contem informações sobre empresas não
insolventes. Variáveis são então selecionadas
segundo seu interesse potencial na avaliação de
riscos de insolvência. Um método estatístico é então
usado para desenvolver um modelo discriminante
(i.e., uma combinação de variáveis que melhor
distingua os dois tipos de empresa). Finalmente o
sucesso da discriminação é avaliado através de uma
amostra de controle (i.e., uma amostra diferente da
usada para obter o modelo).
TABELA 1. Índices Financeiros
ESTRUTURA
1.CAPITAL DE GIRO ((Patrimônio Líq. Ativo Permanente)/
Patrimônio Líquido)
2.ALAVANCAGEM
(Captação Total/
Patrimônio Líquido)
SOLVÊNCIA
3.COMPROMETIME
NTO
Em geral a amostra de controle contém empresas
solventes e empresas comprovadamente insolventes,
isto é empresas que estão em processo de
concordata, em liquidação, ou no caso de bancos e
instituições financeiras, sob intervenção do Banco
Central.
CUSTOS E
DESPESAS
4.INTERMEDIAÇÃO
(Oper.Créd.Liq
Significativo
ao.Duvidosa/
Patrimônio Líquido)
(Despesa Interm.
Financ. Prov. CL Ajuste Prog.Est.Econ./
Capt.Total)
5.PESSOAL
(Despesa Pessoal/
Captação Total)
6.ADMINISTRATIVO (Despesa
Administrativa/
Captação Total)
No caso desta pesquisa em razão do número
reduzido de bancos insolventes na amostra global,
não utilizamos bancos insolventes na amostra de
controle. Ao invés disto confrontamos os resultados
obtidos com a avaliações feitas pela empresa Austin
Asis especializada em diagnóstico financeiro de
empresas.
4. Regressão Logística
RENTABILIDADE
3
7.GERAÇÃO DE
RENDAS
8.RENTABILIDADE
DO PL
CRESCIMENTO
9.CAPTAÇÕES
TOTAIS
OUTROS
10. ATIVO TOTAL
(Receita Intermediação
Financeira/Ativo Real Ativo Permanente)
(Resultado Líquido/
Patrimônio Líquido)
observar a existência de diferença entre as médias
de cada um dos grupos para as diversas variáveis
explicativas.
Captação Total do
último
período/Captação Total
do
período anterior
INDICE
TABELA 2 - Comparação de médias entre os dois
grupos de empresas (solvenes e insolventes)
ESTRUCTURA
1.CAPITAL DE
GIRO
2.ALAVANCAG
EM
Valor do ativo total
(logaritmo)
SOLVÊNCIA
3.COMPROMETI
MENTO
CUSTO E
DESPESA
4.INTERMEDIA
ÇÃO
5.PESSOAL
CONCEITOS
ATIVO REAL
Ativo Total - Relações
Interfinanceiras Relações
Interdependênciais
PASSIVO REAL
Passivo Total - Relações
Interfinanceiras Relações
Interdependênciais
APLICAÇÃO TOTAL Ativo Real - Ativo
Permanente Diversos
CAPTAÇÃO TOTAL Passivo Real Patrimônio Líquido Diversos
6.ADMINISTRA
TIVO
RENTABILIDA
DE
7.GERAÇÃO DE
RENDAS
8.RENTABILID
ADE DO PL
5.2. Amostra e seleção dos dados
Para a criação de modelos de análise de risco de
insolvência, dois grupos são necessários. Um
primeiro grupo contendo instituições insolventes e
um segundo grupo contendo instituições solventes.
As instituições consideradas insolventes neste
estudo são aquelas que sofreram processos de
liquidação ou intervenção do Banco Central do
Brasil. Para o grupo de solventes, foi escolhido um
grupo de bancos considerados tradicionais (27
bancos).
CRESCIMENT
O
9.CAPTAÇÕES
TOTAIS
OUTROS
10. ATIVO
TOTAL
tProbabi Significa
Student
l.
tivo ao
nível 0.1
- 0.25
0.805
- 0.72
0.475
1.84
0.072
x
3.22
0.003
x
1.53
0.131
2.17
0.034
x
3.25
0.002
x
-1.54
0.147
0.72
0.474
-5.1
0.000
x
Dentre as variáveis selecionadas, 5 são
significativas no nível de 0.1%, e 4 são
significativas no nível de 0.05%.
Foram obtidas, através das bases de dados da Austin
Asis,
informações econômico-financeiras e
cadastrais de 225 Bancos atuantes no Brasil. A
amostra usada para a criação das redes neurais e das
funções logísticas contém 54 bancos, sendo 27
bancos solventes e 27 insolventes. A amostra foi
constituída a partir do último balanço disponível
(julho de 1995).
5.3 Desenvolvimento dos experimentos
O experimento foi efetuado através da construção de
54 redes e em seguida de 54 funções logísticas.
Cada um dos grupos de 54 modelos, das redes
neurais e da regressão logística, foram criados
utilizando-se do método de Lachenbruch. No
A tabela 2 apresenta uma comparação de médias
entre entre os dois grupos. Para comparação de
médias foi utilizado o teste-t de Student que permite
4
método de Lachenbruch um modelo é construido
contendo n-1 observações. O modelo é então
utilizado para a previsão da observação n, colocada
de lado. O procedimento é repetido n vezes (54
vezes neste experimento) e a classificação das
observações efetuadas é utilizada para avaliar a
precisão do modelo.
Estes valores são sugeridos como default pela
ferramenta de concepção de redes neurais utilizada
(BRAINMAKER - ver Stanley 1990).
Número de iterações (o número de vezes em que a
amostra de base será lida durante o processo de
aprendizado): O número de iterações foi limitado a
1500 iterações nas experiências realizadas, uma vez
que o processo de aprendizado, não evoluiu com um
número maior de iterações, isto o número
aprendidas não mais evoluiu. O processo de
aprendizado foi encerrado automaticamente quando
a taxa de precisão requerida foi alcançada.
O processo é descrito por LACHENBRUCH (1976):
“Crie a função discriminate para cada amostra
possível contendo n1+n2 - 1, obtida omitindo-se uma
observação da amostra original e registre para cada
uma destas funções se a observação foi
incorretamente classificada. Se m1 e m2 são a
quantidade
de
observações
classificadas
incorretamente, podemos estimar P1 e P2 a partir de
m1/n1 e m2/n2. A estimativa do erro obtida é
“unbiased” para a probabilidade de classificação
incorreta para uma função discriminante baseada
em n1-1 e n2 observações e n1 e n2-1 observações,
respectivamente. “
Número de neurônios na camada intermediária:
Não existe um critério racional que permita definilo (MAGNIER 1991; DUTTA, SHEKHAR &
WONG 1992; WILSON & SHARDA 1994; etc.).
Neste estudo foram criadas redes com 5 neurônios
na camada intermediária (figura 2).
Figura 2 - Modelo de rede criado
Este procedimento foi utilizado para criar e avaliar
a capacidade preditiva das redes, e foi repetido para
avaliar a capacidade preditiva da regressão
logística.
5.4. Definição de parâmetros na criação das
redes neurais
Existe uma série parâmetros na constituição de uma
rede neural, que poderão influenciar sua capacidade
preditiva. No entanto a falta de metodologia na
concepção de redes neurais (MAGNIER 1991, DE
ALMEIDA 1993), impossibilita sua escolha de
maneira racional (número de neurônios na camada
intermediária, número de iterações, taxa de
aprendizado, etc.).
2 neurônios de
saida
Neurônios de
entrada
5 neurônios intermediários
Segundo MAGNIER (1991), a escolha adequada
dos valores dos parâmetros tende a ficar baseada na
experiência e sensibilidade do operador que conduz
a construção da rede.
Neste estudo assumimos os seguintes valores de
parâmetros:
6. Resultados
Como resultado obtivemos porcentagem de
classificação superior através da técnica Logit,
principalmente quando foi utilizado o método enter.
Este método não desconsidera nenhuma variável
mesmo que exista correlação entre elas. No entanto
apenas 16 das 27 instituições solventes puderam ser
utilizadas
na
regressão
logística
por
indisponibilidade de dados de algumas variáveis.
Este problema não ocorre com as redes que podem
levar em consideração informações incompletas.
taxa de aprendizado (α
α ): igual a 1
momentum (η
η ) igual a 0,9,
Lembramos que estes parâmetros que intervém no
algoritmo de aprendizado (∆Wji(n+1) = µδjOi +
α∆Wji(n), eq. 2, apresentada anteriormente).
Taxa de precisão do aprendizado: igual a 10%.
5
TABELA 3 - Resultados de Previsão
Grupo
Porcentagem de
classificação correta
Redes
R. L.
R. L.
Neurais (Forward
(Enter)
stepwise)
Instituições
63
92
88
solventes
Instituições
70
43
68
insolventes
Classificação
67
68
78
global
Solventes não
0
0
4
classificadas
Insolventes
0
40
40
não
classificadas
systèmes d'aide à la décision.- Tese de
Doutorado em Administração. -Ecole
Supérieure des Affaires, Universidade de
Grenoble, 1993.
DUTTA, S., S. SHEKHAR e W.Y. WONG “Decision Support in Non-Conservative
Domains: Generalization with Neural
Networks” - WP n 92-31, INSEAD, 1992.
KOHONEN, T.- "An Introduction to Neural
Computing".- Neural Networks, vol.1,
p.3-16, 1988.
JOHNSEN, T. e MELICHER, R.W. -“Predictiong
corporate bankruptcy and financial
distress: Information Value Added by
Multinominal Logit Models”. -Journal of
Economics & Business,
vol.46, n.4,
p.269-286, Outubro 1994.
LACHENBRUCH, P.A. “An Almost Unbiased
Method of Obtaining Confidence Intervals
for the Probability of Misclassification in
Discriminant
Analysis”.
Biometrics,
December, 1967.
MAGNIER, J.P. Utilisation des réseaux de neurones
pour le développement de systèmes d'aide
à la décision. Montpelier: Intitut
d'Administratio
d'Entreprises,
1991.
(mimeo).
OHLSON, J.A. Financial ratios ande the
probabilistic prediction of bankruptcy.
Journal of Accounting Research, p.109131, Spring 1980.
PODDIG, T. “Bankruptcy Prediction:
A
Comparison with Discriminant Analysis”.
in Neural Networks in Capital Markets.
Editado por A.P. REFENES, New York.John Wiley & Sons, 1995.
RUMELHART, D.E., J.C. McCLELLAND, PDP
Research Group.- Parallel Distributed
Processing - Exploration in the
Microtexture of Cognition.- Volume 1.London.- The MIT Press.- 1986.
SHARDA, R.- “Neural Networks for the MS/OR
analyst: An application bibliography”. Interfaces, vol.24, n.2, p.116-130, 1994.
STANLEY J. - Introduction to Neural Networks.CA:Sierra
Madre.-Cal.
Scientific
Software.-3rd edition.-1990.
WILSON, R.L. & SHARDA, R. -”Bankruptcy
Prediction Using Neural Networks”. Decision Support Systems, vol. 11, n. 5,
p. 545-557, junho 1994.
Regressão logística 1 - Método FORWARD
STEPWISE com estatística WALD
Regressão logística 2 - Método ENTER - todas as
variáveis obrigatoriamente entram no modelo
5. Conclusões
Apesar dos resultados de classificação não
superiores das redes neurais, esta foi capaz de
considerar bancos que a regressão logística não
pode classificar por falta de dados. A qualidade de
classificação das redes poderia eventualmente
melhorar a partir da exploração de outros métodos.
Em nosso grupo estamos no momento trabalhando
com redes não supervisionadas, que podem ser
utilizadas previamente à backpropagation.
7. Referências
ABATE, R.P. - “Numerical Scoring Systems for
Commercial Loans” Bankers Monthly,
January, 1969.
ALTMAN, E. -“Financial Ratios, Discriminant
Analysis and the Prediction of Corporate
Bankruptcy”. -Journal of Finance, vol. 23,
n.4, p.589-609, setembro, 1968.
BEAVER, W. “Financial ratios as predictors of
failures”, in Empirical Research in
Accounting, selected studies, 1966, in
supplement to the Journal of Accounting
Research, January, 1967.
COHEN, I. J., T.C. GILMORE, e F.A. SINGER,
“Bank procedures for analyzing business
loan applications” in Analytical Methods
in Banking, K.J. Cohen e F.S. Hammer,
Homewood, Ill: R.D. Irwin, 1966.
DE ALMEIDA, F.C. -L'Evaluation des risques de
défaillance des entreprises à partir des
réseaux de neurones insérés dans les
6
Download