unversidade federal de santa catarina

Propaganda
UNVERSIDADE FEDERAL DE SANTA CATARINA
DEPARTAMENTO DE INFORMÃTICA E ESTATÍSTICA
CURSO DE GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO
Resumo do artigo: Um Esquema de Neurocontrole com Treinamento
em Tempo Real Aplicado ao Posicionamento de um Servomotor
Autores do artigo: José Augusto Dantas de Rezende e André Laurindo Maitelli
Extraído de: http://petroleo.dca.ufrn.br/bpcas/artigos/maitelli/SBAI_servo.pdf
Júnior Barbosa Dymow
Maio de 2005
Resumo: É abordado neste artigo um método de neurocontrole para o posicionamento de um
servomotor, onde o controlador usa vários métodos de otimização para aumentar a velocidade de
convergência. O treinamento é feito em tempo real com o uso de Rede Perceptron Multicamadas.
1. Introdução
Até pouco tempo atrás, aplicações que envolvessem treinamento on-line de RNAs não eram
possíveis, devido ao lento processo de treinamento e convergência. Com o desenvolvimento da
tecnologia e a proposição de novas técnicas de otimização dos processos de treinamento, aplicações
com treinamento on-line passaram a ser possíveis.
O treinamento on-line de neurocontroladores possui vantagens, como capacidade de
adaptatividade, e desvantagens, como o desempenho durante o início processo de treinamento.
Pretende-se demonstrar aqui a capacidade do controlador de executar tarefas em um tempo de
treinamento relativamente baixo e com uma boa performance de controle.
2. Planta Física do Servomotor
O servomotor em questão consiste de um pequeno motor DC acoplado através de um sistema de
engrenagens a uma carga, sobre a qual faz-se um controle de posição. Acoplado à carga existe também
um potenciômetro, que faz parte do circuito de transdução da posição da carga.
O controle digital efetivado sobre esta planta toma como variável a ser controlada a posição da
carga, medida indiretamente através da tensão sobre o potenciômetro.
3. Redes Neurais Artificiais
O cérebro pode ser visto como um computador paralelo altamente complexo e não-linear. Ele tem
a capacidade de organizar suas unidades básicas, os neurônios, em grupos que irão operar funções
bastante específicas e complexas, como a visão, reconhecimento de padrões e a coordenação motora.
Como representação do modelo natural, a RNA possui uma série de características bastante
semelhantes ao seu modelo inspirador. Entre essas características, podemos citar as apresentadas a
seguir, que estão diretamente relacionadas às aplicações da rede em controle de sistemas:
Não-Linearidade. Um neurônio é basicamente um sistema não linear. Conseqüentemente, uma
rede neural consistindo da conexão de unidades não-lineares é também necessariamente não-linear.
Mapeamento Entrada-Saída. A Rede Neural absorve conhecimento, assim como em seu modelo
inspirador biológico, através do processo de aprendizagem. Tal processo dá-se basicamente aplicando
sinais à entrada, informando a saída esperada. A saída observada comparada à esperada é o parâmetro
utilizado na correção dos valores de sinapse. Quando a rede está treinada (valores esperados próximos
dos observados), aplicam-se novos conjuntos de dados para validar a eficiência da rede.
Adaptatividade. A RNA tem a capacidade de adaptar suas sinapses, caso o ambiente ao qual
está inserida modifique suas características, ou seja, caso a rede passe a operar em outro sistema. Essa
característica alarga bastante as aplicações das RNA’s em sistemas de filtragem e controle adaptativo.
4. Neurocontrolador Implementado
O esquema do neurocontrolador implementado baseia-se no método de otimização em malha
fechada. Consiste basicamente do uso de duas estruturas neurais, conhecidas como Neuro-emulador
(responsável pelo aprendizado da dinâmica da planta) e Neuro-controlador, que usará as informações
adquiridas pelo Neuro-emulador e efetuará o controle da planta. O Neuro-controlador aprende
primeiramente a controlar o Neuro-emulador, fazendo-o acompanhar um sinal de referência. Após o
treinamento, espera-se que o Neuro-controlador esteja pronto para gerar os sinais de controle que serão
colocados na entrada da planta para fazê-la seguir o modelo de referência.
A arquitetura das Redes Neurais Artificiais utilizadas foi do tipo Perceptron de Múltiplas Camadas
com apenas uma camada intermediária composta por cinco neurônios.
5. Técnicas de Melhoria da Velocidade de Treinamento
A questão da velocidade de processamento influi diretamente sobre a qualidade do controle
proporcionado. Caso o treinamento da rede seja rápido, ao final do período de amostragem os pesos
estarão mais próximos do valor ótimo.
A arquitetura utilizada nesse esquema de neurocontrole foi a Perceptron de Múltiplas Camadas,
cujo método de treinamento gradiente pode ser substituído por um algoritmo adaptativo, no qual se faz o
ajuste automático de alguns dos parâmetros da rede em função do comportamento do erro na saída.
Normalmente, o parâmetro ajustado é o coeficiente de aprendizado. Foram realizados testes nesse
problema com três algoritmos diferentes, o Eta-Adaptativo, o Delta-Bar-Delta e o SuperSAB . Destes, o
que obteve os melhores resultados foi o Delta-Bar-Delta.
5.1. Delta-Bar-Delta
O algoritmo Delta-Bar-Delta é baseado na regra Delta-Delta. Esta regra propõe um ajuste dos
coeficientes de aprendizado a partir do gradiente do erro da rede em função do coeficiente de
aprendizado.
A estimação é baseada na observação da vizinhança das derivadas parciais durante os últimos
dois pesos sucessivos. Se as derivadas têm o mesmo sinal, o coeficiente de aprendizado é incrementado
linearmente por uma pequena constante, para acelerar o processo de convergência nas regiões de
pequeno erro. Por outro lado, uma mudança no sinal entre duas derivadas sucessivas indica que o
treinamento levou a uma ultrapassagem do mínimo local, ou seja, o último incremento no peso foi muito
grande. Como conseqüência, o coeficiente é decrementado exponencialmente. O aumento linear e a
redução exponencial do coeficiente de aprendizado permite ao algoritmo uma rápida reação às
mudanças do perfil da curva da função erro.
6. Resultados Obtidos
Na análise dos resultados obtidos vale ressaltar que durante as primeiras 50 amostras da planta,
foi feita uma saturação do sinal de controle em 10% do valor máximo. Isto foi feito para impedir que
valores muito altos fossem colocados na entrada das redes durante um período em que a rede não
estava suficientemente bem treinada. Como resultado, a saída da planta segue a referência, porém o
desempenho do controlador nos primeiros 50 períodos não é muito satisfatório, mas após isto o sistema
passa a ter um comportamento excelente. As oscilações detectadas podem ser creditadas ao ruído
presente na medida do potenciômetro.
7. Resultados Obtidos
Constatou-se que o uso de RNAs em aplicações relacionadas a servomotores foi bastante
eficiente, pois a planta seguiu, com erros pequenos, uma entrada senoidal e uma entrada do tipo onda
quadrada. As técnicas de aceleração de convergência utilizadas permitem a aplicação do esquema
mesmo com períodos de amostragem baixos, e o aumento na capacidade de novos processadores irá
tornar este processo cada vez mais rápido.
Download