Redes Neurais Uso de Redes Neurais MLP para resolver problemas de reconhecimento de padrões Alexandre de Oliveira Stauffer Modelo Geral X1 X2 W1 W2 ... XN WN Função de Ativação Função de Propagação Y Modelo bidimensional X11 X02 W 21 1, se Z>=1 W Z=2 Z=X W +X W 1 1 2 2 -3 2 0, cc 1Y Modelo bidimensional X2 1 2X1-3X2-1=0 1 X1 Treinamento Regra Delta: ΔWi=-λεX Reconhecer função lógica OR; Pesos Iniciais: [1, 1] Bias Inicial: 3 Y=1, se X1+X2-3>=0 Y=0, cc Dinâmica de Treinamento X1+X2-3=0 X2 1 X1+2X2-2=0 2X1+2X2-1=0 1 X1 X1 X2 Y T ε 0 0 0 0 0 0 1 0 1 -1 1 0 0 1 -1 1 1 1 1 0 Redes MLP – Backpropagation X Y MLP: Treinamento Conjuntos: treinamento, testes e validação; devem possuir amostras de todas as classes; devem possuir amostras bem distribuídas de todas as classes; MLP: Treinamento Erro T Treinamento MLP: Normalização Ordenadas da entrada com magnitudes diferentes: Pressão Sangüínea; Idade; Taxa de colesterol no sangue; Xi=(Xi-μ)/σ μ – estimador da média; σ - estimador do desvio padrão; MLP: Iniciar Pesos 1 0 Devem ser próximos de zero; Devem ser inicializados de forma randômica (uniformemente distribuídos); MLP: Tx. Aprendizagem Erro W Solução: Taxa de aprendizagem adaptativa, que diminua com o tempo de aprendizagem; MLP: Termo Momentum Erro W Diminui instabilidade da rede; Regra Delta: ΔWi+1=-λεX+α ΔWi MLP: Matriz de Confusão Resultado Esperado Dígitos Dígitos Letras Resultado da RNA Total: 0 1 2 5 I O S Z Letras 0 1 2 5 I O S Z 235 0 0 0 0 116 0 0 385 0 181 3 0 165 1 2 0 416 0 4 387 0 0 0 0 46 492 0 0 0 211 0 0 69 0 299 0 14 8 2 243 0 1 8 332 242 0 0 0 0 165 0 0 463 0 0 0 188 0 0 182 0 388 0 0 67 0 0 0 0 451 557 MLP: Estimadores Estimador da média: centro de cada classe; Estimador de desvio padrão: grau de dispersão da classe em torno de sua média; Mais Dispersas Menos Dispersas Classe DP Classe DP 2 93,3293 B 71,4913 R 89,0912 P 72,0197 1 88,4283 F 72,5803 N 87,4772 Zero 72,6019 M 87,1319 O 72,6642 MLP: PCA Redução na dimensão do vetor de entradas; Perda de informação; Diminuição na complexidade da RNA; Eliminação de Ruídos; Calculado a partir da matriz de covariância; Referências C. M. Bishop, Neural Network for Pattern Recognition, Oxford University, 1995. A. P. Braga, A. P. L. F. Carvalho, T. B. Ludemir, Fundamentos de Redes Neurais Artificiais, XI Escola de Computação, 1998. http://ltc.nutes.ufrj.br/stauffer/rna [email protected]