controle - DCA

Introdução ao controle de robôs
Luiz Marcos
www.dca.ufrn.br/~lmarcos/courses/robotica
Cinemática x Dinâmica
Dinâmica x Atraso
Contínuo x Discreto
Tipos de Sistemas de Controle
Malha aberta
Malha fechada
Malha aberta
A entrada define o comportamento do
controlador, cérebro do sistema, e este
responde agindo no ambiente, sem
verificar depois se o nível da grandeza
física corresponde de fato à entrada;
Não há sensor para observar algum
eventual desvio, nem realimentação, para
corrigi-lo.
Exemplo
Uma fonte de alimentação regulada com
transistor é, na realidade, um sistema de
controle de malha aberta;
Se a corrente da carga variar, a tensão na
saída pode variar até algumas dezenas de
mV, devido à variação na tensão Vbe.
Transistor
Diagrama de blocos (Malha Aberta)
A entrada é o nível desejado da grandeza
controlada (comando ou programação). O
controlador avalia este sinal e envia um
sinal (que pode ser elétrico ou mecânico,
conforme o sistema) ao atuador, que é o
elemento que age no ambiente de modo a
alterar a grandeza.
Diagrama de blocos (M. Aberta)
CONTROLADOR
ATUADOR
Sistema de Malha Aberta
Grandeza não Automático
Aplicações
Os SC em malha aberta são usados onde
a freqüência ou a conseqüência dos
desvios não justificam a complexidade e o
custo maior dos em malha fechada.
Não são aplicados em robótica (a não ser
em casos onde não é necessário checar o
erro).
Malha fechada
É verificada a ocorrência de desvios
Sensor monitora saída, fornecendo um
sinal que retorna à entrada, formando
uma malha de realimentação.
A entrada e esta realimentação se juntam
num comparador, que combina ambos e
fornece um sinal de erro, diferença entre
os sinais, que orienta o controlador.
Exemplo simples
 O operador de um reservatório verifica se o
nível máximo foi atingido através de uma régua
de nível, que é o sensor.
 Sinal de erro, a diferença entre o nível máximo
(saída desejada) e o nível atual (saída real), é
analisado para abrir ou fechar o registro.
 Operador é ao mesmo tempo o comparador, o
controlador e o atuador neste sistema
elementar.
Diagrama blocos (Malha Fechada)
Adicionar sensor ao SC de m. aberta;
Enviar sinal de erro ao bloco somador que
fornece um sinal efetivo ao controlador.
Este sinal é a entrada do controlador, que
o avalia e tenta corrigir o desvio captado
pelo sensor, através de um novo comando
ao atuador.
Diagrama de blocos (M. Fechada)
ENTRADA
SOMADOR
CONTROLADOR
SENSOR
ATUADOR
REALIMENTAÇÃO
Sistema de Malha Fechada
Grandeza Automática
SAÍDA
Aplicações
SC em malha fechada são mais precisos,
pois detectam e corrigem os desvios.
A maioria dos sistemas atuais, analógicos
ou digitais, é deste tipo.
Sistemas controle para robótica são
necessariamente desta categoria.
Controle
Sistema robótico: mede o seu próprio
estado e age (decisões autônomas)
Feedback Control: originou-se na Grécia
antiga.
Relógios de água: um grande tanque, um
orifício pequeno para medir a vazão, uma
válvula para regular a quantidade de água
no tanque (mantendo o nível, a pressão é
constante).
Redescobrindo os controladores
1600: Controle da temperatura num fogão
 Variação do volume de mercúrio fecha e abre
a entrada de ar
1700: mesmo sistema utilizado para
chocar ovos
 Final do século 16: mecanismo melhorado
com melhor sensibilidade. Primeiro
controlador comercial...
Sistema de Controle
Sinal de erro
Energia de entrada
Estado desejado
Sinal de feedback
Amplificador
Soma
s(t)
e(t)
y´(t)
Estado medido ou real
E(t)
Sensor
Robô ou
dispositivo
y(t)
Exemplo: seguidor de paredes
Material: um robo móvel equipado com
sensor infra-vermelho
 Void calibrate(int goal); /*Calibra o sensor








definindo uma distância da parede*/
void main() {
calibrate(goal); left(100); right(100);
while (1) {
int wall = analog(LEFT_WALL);
if(wall<goal) {left(100); right(0);}
else {right(100); left(0); }
}
}
Gráficos (distância x tempo)
D=40
Distância x tempo
D=30
Virando mais suave
 void main() {






 }
calibrate(goal); left(100); right(100);
while (1) {
int wall = analog(LEFT_WALL);
if(wall<goal) {left(100); right(50);}
else {right(100); left(50); }
}
Distância x tempo
D=40
Sistema de Controle
(t)
Perturbação
s(t)
e(t)
u(t)
Sensor
y´(t)
Robô
y(t)
Motores
Controladores
• Liga-Desliga (on-off)
• Proporcional (P)
• Proporcional + Integral (PI)
• Proporcional + Derivativo (PD)
• Proporcional + Integral + Derivativo (PID)
Controle liga-desliga :
Compara sinal de entrada com realimentação
Se saída supera entrada, desliga o atuador;
se a realimentação for menor, liga o atuador.
Ex.: fornos elétricos e geladeiras:
Calefator ou compressor controlado por um termostato
(é um controlador liga-desliga).
Vantagens: simples, baixo custo
Desvantagens: contínua oscilação da saída, histerese,
não garante precisão e pode desgastar controlador e
atuador.
Mecanismo (roda)
0
Roda (massa grande)
Sensor
(encoder)
Engrenagens
Motor
Proporcional
Ganho é proporcional ao erro medido
Exemplo: controlar a posição de um motor
 void main() {






 }
int posit_goal=0;
encoder_posit=100; /*Var. compartilhada*/
while (1) {
power = posit_goal - encoder_posit;
motor(power);
}
Posição e potência x tempo
100
0
-100
Melhorando o Proporcional
 Introdução de um fator multiplicativo faz ir mais
rápido ao ponto desejado
 void main() {
 int posit_goal=100;
 encoder_posit=0;
while (1) {

power=p_gain*(posit_goal- encoder_posit);

motor(power);
 }
 }

 Problema com ganhos altos: over-shoot, oscilações.
Potência total é desejada se longe do objetivo. Ganho
alto pode causar potência alta mesmo estando próximo.
Posição e potência x tempo
Ganho = 10
100
0
-100
Posição e potência x tempo
Ganho = 20
100
0
-100
Posição e potência x tempo
Ganho = 50
100
0
-100
Proporcional derivativo
 Problema: momento faz ir além do ponto,
mesmo desligando o motor
 Momento = massa x velocidade (diretamente
proporcional a velocidade)
 Dobra velocidade => dobra momento).
 Termo derivativo resolve overshooting e
oscilações
Proporcional derivativo
 Introdução do term d_gain (velocidade)
 void main() {







 }
int posit_goal=0;
encoder_posit=100;
while (1) {
power=p_gain*(posit_goal- encoder_posit) +
d_gain*encoder_velocity;
motor(power);
}
Posição e potência x tempo
100
0
-100
Integral
Usa um integrador como controlador (um
circuito
que
executa
a
operação
matemática da integração).
Soma produtos dos valores instantâneos
de entrada por intervalos de tempo t.
Desde o instante inicial até o final
(período de integração).
Isto corresponde à área entre a curva da
grandeza e o eixo do tempo, num gráfico.
Integral (cont.)
Ex.: Se grandeza = G (const), integral
entre t1 = 0 e t2=j será igual a G t2 (ou
Gj) = área, no gráfico da grandeza, de um
retângulo naquele intervalo de tempo.
Um gráfico da integral de t1 a t2 é uma
reta desde 0 até Gj, pois a área (ou o
somatório) aumenta à medida que o
tempo passa.
Integral (cont)
Integrador torna o sistema lento
Resposta depende da acumulação do
erro na entrada
Leva a um erro de regime nulo (não é
necessário um sinal de entrada para haver
saída do controlador)
Acionamento do atuador após o período
transitório.
 Assim o controle é muito preciso, embora
mais lento.
Posição e potência x tempo
100
0
-100
Hierarquia de controle (robô móvel)
Sensores
Externos
Planejamento
da Trajetória
Posição
Velocidade
Controlador
Sensor
interno
Motores
Sensor
interno
Níveis de controle
Obstáculo
 3 níveis de controle:
 controlador de velocidade
dos motores;
 controlador de ângulo e
velocidade linear do robô;
 desvio de obstáculos e
busca pelo alvo.
Alvo
Obstáculo
Controlador dos motores
SP1
-
u1
e1
PID
+
Motor 1
v1
SP2
+
-
v2
u2
e2
PID
Motor 2
Controlador de ângulo e velocidade
linear
SP1
+
Controlador
de Velocidade
Linear
+
e
+
Controlador
de
Ângulo
SP1
-
e1
+
SP
e
+
-
SP2
u1
PID
Motor 1
v1
Controlador
SP2
e2
+
-
PID
u2
Motor 2
v2
Cinemática do
Robô
X
Obstáculo
Desvio de obstáculos
Obstáculo
teta=180/pi*atan((S1*sin(pi/4)-S3*sin(pi/4))/(S2+S1*cos(pi/4)+S3*cos(pi/4)));
Busca do alvo
dx
dy
Alvo
e
d
Sensores
de distância
Obstáculo
Alvo
Decisão
Velocidade
Angulo e
velocidade linear
Velocidade dos
motores
Motores
Posição
(integração dos enconders)
Controle de alto nível
(Comportamento)
O relacionamento funcional dos
estímulos sensoriais com as
ações efetuadas sobre os
atuadores do robô
Ações devem ser executadas a
partir de um plano de ação e de
um modelo interno do ambiente
Tipos de controle
1) Reactive control
2) Deliberative control
3) Hybrid control
4) Behavior based control (sub-sumption)
Controle reativo
Não pense, reaja!
 Ambiente imprevisível cheio de
obstáculos estáticos e dinâmicos
 Restrição de tempo de execução da
tarefa
 Desenvolvimento de sistemas onde as
ações dos robôs móveis são
determinadas pelas situações
imediatas do ambiente, detectadas
por
seus sensores.
Controle reativo (cont.)
 Facilmente implementável
 Não requer intermédio do cérebro
 Apenas um mapeamento de sensores a
ações:





Construir um conjunto de regras
Exige pouco processamento on-line
Alta velocidade
Similar a reflexos em seres humanos
Muito usado em seres inferiores (siris)
Exemplo visto
 Robô com emissores/sensores IR na
frente e duas rodas laterais:
 Nenhum sensor satura: em frente
 Satura direito: vire à esquerda
 Satura esquerdo: vire à direita
 Satura os dois: vire
aleatoriamente para um dos lados
Controle deliberativo
Planeje e pense bastante, então execute
ação!
 Certas tarefas permitem uma melhor
análise do ambiente e planejamento
baseado em informações adquiridas
via sensores e dados conhecidos
 Pode levar o robô a encontrar uma
boa solução para sua tarefa, mesmo
perdendo tempo de processamento
para tomar a decisão
Controle híbrido
Seja eficiente! Pense se der tempo!
Comportamento deliberativo pode
comprometer o tempo de resposta
de um robô
Idéia: unir os comportamentos
 Caso seja necessário (e dê tempo
para) pensar, faça, caso contrário,
execute uma ação de forma reativa.
Arquitetura subsumption (MIT)
Baseado em comportamentos básicos
Comportamentos de mais alto nível são
definidos por vários de mais baixo nível
Processo markoviano (definir ação de alto
nível em função do estado perceptual
atual de um robô).
Uso de aprendizado ou de heurísticas para
definir políticas (Q-Learning, NN).