UNVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE INFORMÃTICA E ESTATÍSTICA CURSO DE GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO Resumo do artigo: Um Esquema de Neurocontrole com Treinamento em Tempo Real Aplicado ao Posicionamento de um Servomotor Autores do artigo: José Augusto Dantas de Rezende e André Laurindo Maitelli Extraído de: http://petroleo.dca.ufrn.br/bpcas/artigos/maitelli/SBAI_servo.pdf Júnior Barbosa Dymow Maio de 2005 Resumo: É abordado neste artigo um método de neurocontrole para o posicionamento de um servomotor, onde o controlador usa vários métodos de otimização para aumentar a velocidade de convergência. O treinamento é feito em tempo real com o uso de Rede Perceptron Multicamadas. 1. Introdução Até pouco tempo atrás, aplicações que envolvessem treinamento on-line de RNAs não eram possíveis, devido ao lento processo de treinamento e convergência. Com o desenvolvimento da tecnologia e a proposição de novas técnicas de otimização dos processos de treinamento, aplicações com treinamento on-line passaram a ser possíveis. O treinamento on-line de neurocontroladores possui vantagens, como capacidade de adaptatividade, e desvantagens, como o desempenho durante o início processo de treinamento. Pretende-se demonstrar aqui a capacidade do controlador de executar tarefas em um tempo de treinamento relativamente baixo e com uma boa performance de controle. 2. Planta Física do Servomotor O servomotor em questão consiste de um pequeno motor DC acoplado através de um sistema de engrenagens a uma carga, sobre a qual faz-se um controle de posição. Acoplado à carga existe também um potenciômetro, que faz parte do circuito de transdução da posição da carga. O controle digital efetivado sobre esta planta toma como variável a ser controlada a posição da carga, medida indiretamente através da tensão sobre o potenciômetro. 3. Redes Neurais Artificiais O cérebro pode ser visto como um computador paralelo altamente complexo e não-linear. Ele tem a capacidade de organizar suas unidades básicas, os neurônios, em grupos que irão operar funções bastante específicas e complexas, como a visão, reconhecimento de padrões e a coordenação motora. Como representação do modelo natural, a RNA possui uma série de características bastante semelhantes ao seu modelo inspirador. Entre essas características, podemos citar as apresentadas a seguir, que estão diretamente relacionadas às aplicações da rede em controle de sistemas: Não-Linearidade. Um neurônio é basicamente um sistema não linear. Conseqüentemente, uma rede neural consistindo da conexão de unidades não-lineares é também necessariamente não-linear. Mapeamento Entrada-Saída. A Rede Neural absorve conhecimento, assim como em seu modelo inspirador biológico, através do processo de aprendizagem. Tal processo dá-se basicamente aplicando sinais à entrada, informando a saída esperada. A saída observada comparada à esperada é o parâmetro utilizado na correção dos valores de sinapse. Quando a rede está treinada (valores esperados próximos dos observados), aplicam-se novos conjuntos de dados para validar a eficiência da rede. Adaptatividade. A RNA tem a capacidade de adaptar suas sinapses, caso o ambiente ao qual está inserida modifique suas características, ou seja, caso a rede passe a operar em outro sistema. Essa característica alarga bastante as aplicações das RNA’s em sistemas de filtragem e controle adaptativo. 4. Neurocontrolador Implementado O esquema do neurocontrolador implementado baseia-se no método de otimização em malha fechada. Consiste basicamente do uso de duas estruturas neurais, conhecidas como Neuro-emulador (responsável pelo aprendizado da dinâmica da planta) e Neuro-controlador, que usará as informações adquiridas pelo Neuro-emulador e efetuará o controle da planta. O Neuro-controlador aprende primeiramente a controlar o Neuro-emulador, fazendo-o acompanhar um sinal de referência. Após o treinamento, espera-se que o Neuro-controlador esteja pronto para gerar os sinais de controle que serão colocados na entrada da planta para fazê-la seguir o modelo de referência. A arquitetura das Redes Neurais Artificiais utilizadas foi do tipo Perceptron de Múltiplas Camadas com apenas uma camada intermediária composta por cinco neurônios. 5. Técnicas de Melhoria da Velocidade de Treinamento A questão da velocidade de processamento influi diretamente sobre a qualidade do controle proporcionado. Caso o treinamento da rede seja rápido, ao final do período de amostragem os pesos estarão mais próximos do valor ótimo. A arquitetura utilizada nesse esquema de neurocontrole foi a Perceptron de Múltiplas Camadas, cujo método de treinamento gradiente pode ser substituído por um algoritmo adaptativo, no qual se faz o ajuste automático de alguns dos parâmetros da rede em função do comportamento do erro na saída. Normalmente, o parâmetro ajustado é o coeficiente de aprendizado. Foram realizados testes nesse problema com três algoritmos diferentes, o Eta-Adaptativo, o Delta-Bar-Delta e o SuperSAB . Destes, o que obteve os melhores resultados foi o Delta-Bar-Delta. 5.1. Delta-Bar-Delta O algoritmo Delta-Bar-Delta é baseado na regra Delta-Delta. Esta regra propõe um ajuste dos coeficientes de aprendizado a partir do gradiente do erro da rede em função do coeficiente de aprendizado. A estimação é baseada na observação da vizinhança das derivadas parciais durante os últimos dois pesos sucessivos. Se as derivadas têm o mesmo sinal, o coeficiente de aprendizado é incrementado linearmente por uma pequena constante, para acelerar o processo de convergência nas regiões de pequeno erro. Por outro lado, uma mudança no sinal entre duas derivadas sucessivas indica que o treinamento levou a uma ultrapassagem do mínimo local, ou seja, o último incremento no peso foi muito grande. Como conseqüência, o coeficiente é decrementado exponencialmente. O aumento linear e a redução exponencial do coeficiente de aprendizado permite ao algoritmo uma rápida reação às mudanças do perfil da curva da função erro. 6. Resultados Obtidos Na análise dos resultados obtidos vale ressaltar que durante as primeiras 50 amostras da planta, foi feita uma saturação do sinal de controle em 10% do valor máximo. Isto foi feito para impedir que valores muito altos fossem colocados na entrada das redes durante um período em que a rede não estava suficientemente bem treinada. Como resultado, a saída da planta segue a referência, porém o desempenho do controlador nos primeiros 50 períodos não é muito satisfatório, mas após isto o sistema passa a ter um comportamento excelente. As oscilações detectadas podem ser creditadas ao ruído presente na medida do potenciômetro. 7. Resultados Obtidos Constatou-se que o uso de RNAs em aplicações relacionadas a servomotores foi bastante eficiente, pois a planta seguiu, com erros pequenos, uma entrada senoidal e uma entrada do tipo onda quadrada. As técnicas de aceleração de convergência utilizadas permitem a aplicação do esquema mesmo com períodos de amostragem baixos, e o aumento na capacidade de novos processadores irá tornar este processo cada vez mais rápido.