5º. Capítulo: Transformações lineares em frações 5.1 O que são LFT’s. Propriedades Este termo, transformações lineares em frações (“linear fractional transformations” = LFT) é bem conhecido da teoria de funções de uma variável complexa, por exemplo: a + bs , com a, b, c e d ∈ C . c + ds Se c ≠ 0 , temos F ( s ) = α + β s (1 − γ s ) −1 , para α , β e γ ∈ C apropriados. (Calculando, obtemos α = a / c, β = (bc − ad ) / c 2 , γ = − d / c ). F ( s ) : C → C tal que F ( s ) = A ideia acima pode ser generalizada para funções vetoriais e matriciais: (1) Definição: Seja a matriz complexa ⎡M M = ⎢ 11 ⎣ M 21 M 12 ⎤ ∈ C( p1 + p2 )×( q1 + q2 ) e sejam ∆ l ∈ C q2 × p2 e ∆ u ∈ C q1× p1 . ⎥ M 22 ⎦ (Os índices l e u acima significam “lower” e “upper”, respectivamente). Definem-se então as LFT do seguinte modo: Y l ( M , •) : C q2 × p2 → C p1×q1 , , com Y l ( M , ∆ l ) := M 11 + M 12 ∆ l ( I − M 22 ∆ l ) −1 M 21 , (2) supondo, é claro, que ( I − M 22 ∆ l ) −1 exista. Se M e ∆ l forem matrizes de transferência, uma interpretação importante para a expressão acima é dada pelo seguinte diagrama de blocos ⎡M M = ⎢ 11 ⎣ M 21 z M 12 ⎤ M 22 ⎥⎦ ∆l y r u Figura 24a Com efeito, do diagrama de blocos acima, temos z = M 11r + M 12u , y = M 21r − M 22 y, u = ∆ l y . Substituindo a 2ª. na 3ª., temos u = ∆ l M 21r − ∆ l M 22u ∴ u = ( I + ∆ l M 22 ) −1 ∆ l M 21r = ∆ l ( I + M 22 ∆ l ) −1 M 21r E substituindo esta na 1ª. acima, temos z = M 11r + M 12 ∆ l ( I + M 22 ∆ l ) −1 M 21r . 1 Portanto a matriz de transferência entre z e r é M 11 + M 12 ∆ l ( I − M 22 ∆ l ) −1 M 21 = Y l ( M , ∆ l ) , conforme definido em (2). Analogamente, define-se Y u ( M , •) : C q1× p1 → C p2 ×q2 , com Y u ( M , ∆ u ) := M 22 + M 21∆ u ( I − M 11∆ u ) −1 M 12 , (3) supondo que ( I − M 11∆ u ) −1 exista. Abaixo o diagrama de blocos correspondente na interpretação, que será amplamente dominante, como é natural, neste curso. ∆u u2 y2 z2 M w2 Figura 24b Utilizando procedimento semelhante ao de cima, é fácil provar que a matriz de transferência entre z2 e w2 é dada por Tz2 w2 = Y u ( M , ∆ u ) . Mais ainda, podemos verificar que Y u ( N , ∆ u ) = Y l ( M , ∆ l ) , com ⎡M N = ⎢ 22 ⎣ M 12 M 21 ⎤ . M 11 ⎥⎦ (3*) Com efeito, de (3), temos Y u ( N , ∆ u ) = N 22 + N 21∆ u ( I − N11∆ u ) −1 N12 = Y l ( M , ∆ l ) , dado em (2), em vista de (3*). Nos diagramas de blocos acima, “M” é, tipicamente, a planta (junto, usualmente, com atuadores e sensores), enquanto que os ∆ ’s podem representar seja uma perturbação seja um controlador. A matriz “M” nas LFTs é chamada frequentemente, em outros contextos, “matriz coeficiente”. (4) Definição: Uma LFT Y l ( M , ∆ l ) é dita bem definida (ou bem posta) se I − M 22 ∆ l tiver inversa. Dualmente, Y u ( M , ∆ u ) será bem definida se I − M 11∆ u tiver inversa. 2 Claro que Y l ( M ,0) e Y u ( M ,0) são bem definidas, qualquer que seja M. Uma função que não for bem definida na origem não pode ser uma LFT, como por exemplo f (δ ) = 1/ δ . Alguns autores definem LFT’s através das seguintes matrizes: ( A + BQ)(C + DQ) −1 e (C + QD) −1 ( A + QB) , onde se supõe que a matriz C tenha inversa, tal como mencionado antes para o caso escalar: F (s) = a + bs c + ds Lema: Suponha que C tenha inversa. Então, ( A + BQ)(C + DQ) −1 = Y l ( M , Q) , (5) (C + QD) −1 ( A + QB ) = Y l ( N , Q) , ⎡ AC −1 onde M = ⎢ −1 ⎣C ⎡ C −1 A B − AC −1D ⎤ C −1 ⎤ e . = N ⎥ ⎢ −1 −1 ⎥ −C −1D ⎦ ⎣ B − DC A − DC ⎦ Prova: Vamos provar a 1ª. igualdade acima, a prova da outra sendo dual. Recordamos de (2) que Y l ( M , Q) := M 11 + M 12Q( I − M 22Q ) −1 M 21 Identificamos na expressão de M acima: M 11 = AC −1 , M 12 = B − AC −1D, M 21 = C −1 e M 22 = −C −1D . Portanto, Y l ( M , Q ) = AC −1 + ( B − AC −1 D )Q ( I + C −1 DQ ) −1 C −1 ( = AC −1 + ( B − AC −1 D )Q C −1 (C + DQ ) ( ) ) −1 C −1 = AC −1 + ( B − AC −1D)Q(C + DQ) −1 = AC −1 (C + DQ ) + ( B − AC −1 D )Q (C + DQ ) −1 = ( A + BQ)(C + DQ) −1 , onde na última passagem foram cancelados, por subtração, os termos AC −1 DQ . • A recíproca do Lema anterior também vale se M satisfizer às condições mencionadas no lema que segue: (6) Lema: ⎡ M 11 ⎣ M 21 Seja a LFT Y l ( M , Q ) com M = ⎢ M 12 ⎤ . Então, M 22 ⎥⎦ (a) se M 12 tiver inversa, Y l ( M , Q) = (C + QD) −1 ( A + QB ) , com A = M 12 −1M 11 , B = M 21 − M 22 M 12 −1M 11 , C = M 12 −1 e D = − M 22 M 12 −1 . 3 ⎡A Alem disso, ⎢ ⎣B ⎛⎡ 0 ⎜⎢ M = Y l ⎜ ⎢ 21 ⎜⎢ ⎜⎜ ⎢ ⎝ ⎣ M 11 0 0 I ⎛⎡ 0 ⎞ −I ⎤ 0 ⎜⎢ ⎟ ⎥ M 0 M C⎤ 21 22 − 1 ⎜ ⎥ , −M ⎟ =Yl ⎢ 12 ⎥ ⎜ ⎟ ⎢ ⎥ ⋅ D⎦ ⎜⎜ ⎢ ⎟⎟ ⎥ I ⎦ ⎝ ⎣ M 11 I ⎠ ⎞ −I ⎤ ⎟ ⎥ M 22 ⎥ −1 ⎟ ,E , para qualquer E não singular. ⎟ ⎥ ⋅ ⎟⎟ ⎥ M 12 + E ⎦ ⎠ (b) se M 21 tiver inversa, Y l ( M , Q) = ( A + BQ)(C + DQ ) −1 , com A = M 11M 21−1 , B = M 12 − M 11M 21−1M 22 , C = M 21−1 e D = − M 21−1M 22 . ⎛ 0 M 12 M 11 ⎞ ⎜ ⎟ 0 0 I ⎡A C⎤ −1 ⎟ ⎜ Alem disso, ⎢ , − M 21 ⎥ =Yl ⎜ ⎟ ⋅ ⎣B D⎦ ⎜⎜ ⎟⎟ I ⎝ − I M 22 ⎠ ⎛ 0 M 12 ⎞ M 11 ⎜ ⎟ 0 0 I −1 ⎟ ⎜ , − E , para qualquer matriz não singular E. =Yl ⎜ ⎟ ⋅ ⎜⎜ ⎟⎟ M 21 + E ⎝ − I M 22 ⎠ Prova: Será esboçada a prova da 1ª. parte, o esboço da prova da 2ª. segue os mesmos passos. ⎡A C⎤ acima. D ⎥⎦ (a) Vamos provar a igualdade das duas expressões de ⎢ ⎣B Da 2ª. expressão acima, temos −1 ⎡ A C ⎤ ⎡ 0 0⎤ ⎡ − I ⎤ +⎢ − E −1 ) I − ( M 12 + E ) ( − E −1 ) [ M 11 ( ⎥ ⎥ ⎢B D⎥ = ⎢M ⎣ ⎦ ⎣ 21 0 ⎦ ⎣ M 22 ⎦ −1 ⎡ 0 0⎤ ⎡ − I ⎤ −1 −1 = ⎢ + − ( − − ) − E E M E E [ M 11 I ] ( ) ( ) 12 ⎥ ⎢ ⎥ ⎣ M 21 0 ⎦ ⎣ M 22 ⎦ ( ( ⎡ 0 0⎤ ⎡ − I ⎤ −1 +⎢ ( − M 12 ) [ M 11 ⎥ ⎥ ⎣ M 21 0 ⎦ ⎣ M 22 ⎦ ⎡A C⎤ de ⎢ ⎥. B D ⎣ ⎦ = ⎢ ) I] ) I ] , que é claramente igual à primeira expressão 4 Agora haveria que provar que, efetivamente, ⎛⎡ 0 ⎜⎢ ⎡A C⎤ ⎜ ⎢ M 21 ⎢B D⎥ = Y l ⎜ ⎢ ⎣ ⎦ ⎜⎜ ⎢ ⎝ ⎣ M 11 0 0 I ⎞ −I ⎤ ⎟ ⎥ M 22 ⎥ −1 ⎟ , − M 12 . ⎟ ⎥ ⋅ ⎟⎟ ⎥ I ⎦ ⎠ • O lema seguinte resume algumas das propriedades das LFT’s: Lema: Sejam as matrizes particionadas de forma apropriada: ⎡ A B1 B2 ⎤ ⎡ M 11 M 12 ⎤ ⎡ Q11 Q12 ⎤ , G = ⎢⎢ C1 D11 D12 ⎥⎥ . Então, M =⎢ , Q=⎢ ⎥ ⎥ ⎣ M 21 M 22 ⎦ ⎣Q21 Q22 ⎦ ⎣⎢C2 D21 D22 ⎦⎥ (7) ⎡0 I ⎤ ⎡ 0 I ⎤ ⎡ M 22 M 21 ⎤ (i) Y u ( M , ∆) = Y l ( N , ∆ ) com N = ⎢ ⎥. ⎥M ⎢ ⎥=⎢ ⎣ I 0 ⎦ ⎣ I 0 ⎦ ⎣ M 12 M 11 ⎦ (ii) Suponha que Y u ( M , ∆ ) seja quadrada e bem definida e M 22 não singular. Então a inversa de Y u ( M , ∆ ) existe e é também uma LFT com respeito a ∆ : ⎡ M 11 − M 12 M 22−1M 21 (Y u ( M , ∆)) = Y u ( N , ∆) , com N = ⎢ M 22−1M 21 ⎣ (iii) Y u ( M , ∆1 ) + Y u (Q, ∆ 2 ) = Y u ( N , ∆ ) , com −1 − M 12 M 22−1 ⎤ ⎥. M 22−1 ⎦ M 12 ⎤ ⎡ M 11 0 ⎢ 0 Q Q12 ⎥⎥ ⎡ ∆1 0 ⎤ 11 ⎢ e ∆=⎢ N= ⎥. ⎢ ⎥ ⋅ ⎣ 0 ∆2 ⎦ ⎢ ⎥ M 22 + Q22 ⎦ ⎣ M 21 Q21 (iv) Y u ( M , ∆1 )Y u (Q, ∆ 2 ) = Y u ( N , ∆ ) , com ⎡ M 11 ⎢ 0 N =⎢ ⎢ ⎢ ⎣ M 21 M 12Q22 ⎤ Q12 ⎥⎥ ⎡ ∆1 0 ⎤ e ∆=⎢ ⎥. ⎥ ⋅ ⎣ 0 ∆2 ⎦ ⎥ M 22Q21 M 22Q22 ⎦ (v) Considere o seguinte sistema, as dimensões de ∆1 sendo compatíveis com as de A : M 12Q21 M 11 5 z w Y u (G , ∆1 ) Y u (Q, ∆ 2 ) Figura 8 Então, a matriz de transferência de w a z é dada por Y l (Y u (G, ∆1 ), Y u (Q, ∆ 2 )) = Y u (Y Ä (G, Y u (Q, ∆ 2 )), ∆1 ) = Y u ( N , ∆ ) , com ⎡ A + B2Q22 L1C2 ⎢ Q12 L1C2 N =⎢ ⎢ ⎢ ⎣C1 + D12 L2Q22C2 B2 L2Q21 Q11 + Q12 L1 D22Q21 D12 L2Q21 L1 := ( I − D22Q22 )−1 , L2 := ( I − Q22 D22 )−1 B1 + B2Q22 L1 D21 ⎤ ⎥ Q12 L1 D21 ⎥ , onde ⎥ ⋅ ⎥ D11 + D12Q22 L1 D21 ⎦ 0⎤ ⎡∆ e ∆=⎢ 1 ⎥. ⎣ 0 ∆2 ⎦ Prova (parcial / esboçada): ⎡0 I ⎤ ⎡0 I ⎤ (i) Em primeiro lugar, note-se que N = ⎢ ⎥M ⎢ ⎥ ⎣ I 0⎦ ⎣ I 0⎦ ⎡0 I ⎤ ⎡ M 11 M 12 ⎤ ⎡ 0 I ⎤ ⎡ 0 I ⎤ ⎡ M 12 M 11 ⎤ ⎡ M 22 M 21 ⎤ =⎢ ⎥⎢ ⎥=⎢ ⎥ , efetivamente. ⎥⎢ ⎥=⎢ ⎥⎢ ⎣ I 0 ⎦ ⎣ M 21 M 22 ⎦ ⎣ I 0 ⎦ ⎣ I 0 ⎦ ⎣ M 22 M 21 ⎦ ⎣ M 12 M 11 ⎦ A seguir, recorda-se de (3) que Y u ( M , ∆ ) := M 22 + M 21∆ ( I − M 11∆ ) −1 M 12 e que de (2), temos Y l ( N , ∆ ) := N11 + N12 ∆ ( I − N 22 ∆ ) −1 N 21 ; e em vista da definição de N acima, temos a igualdade das duas LFT’s. (ii) Temos que provar que (M 22 + M 21∆ ( I − M 11∆ ) −1 M 12 ) −1 ( = M 22−1 − M 22−1M 21∆ I − ( M 11 + M 12 M 22−1M 21 ) ) −1 M 12 M 22−1 , o que não parece trivial. (iii) Y u ( M , ∆1 ) = M 22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 , Y u (Q, ∆ 2 ) = Q22 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 e 6 ⎡∆ Q21 ] ⎢ 1 ⎣0 Y u ( N , ∆ ) = M 22 + Q22 + [ M 21 = M 22 + Q22 + [ M 21 = M 22 + Q22 + [ M 21 −1 0 ⎤⎛ ⎡ M 11 0 ⎤ ⎡ ∆1 0 ⎤ ⎞ ⎡ M 12 ⎤ ⎜I −⎢ ⎥ ⎥⎢ ⎥⎟ ⎢ ⎥ ∆2 ⎦ ⎝ ⎣ 0 Q11 ⎦ ⎣ 0 ∆ 2 ⎦ ⎠ ⎣ Q12 ⎦ −1 0 ⎤ ⎡ I − M 11∆1 0 ⎡∆ ⎤ ⎡ M 12 ⎤ Q21 ] ⎢ 1 ⎥ ⎢ 0 I − Q11∆ 2 ⎥⎦ ⎢⎣ Q12 ⎥⎦ ⎣ 0 ∆2 ⎦ ⎣ ⎡ ∆ ( I − M 11∆1 ) −1 ⎤ ⎡ M 12 ⎤ 0 Q21 ] ⎢ 1 ⎥ −1 ⎥ ⎢ ∆ 2 ( I − Q11∆ 2 ) ⎦ ⎣ Q12 ⎦ 0 ⎣ = M 22 + Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 , conferindo. (iv) Y u ( M , ∆1 )Y u (Q, ∆ 2 ) = ( M 22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 )( Q22 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 ) = M 22Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12Q22 + M 22Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 + M 21∆1 ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 , enquanto que Y u ( N , ∆) = = M 22Q22 + [ M 21 0 ⎤⎛ ⎡∆ ⎡ M 11 M 22Q21 ] ⎢ 1 ⎜I −⎢ ⎥ ⎣ 0 ∆2 ⎦ ⎝ ⎣ 0 = M 22Q22 + [ M 21 0 ⎤ ⎡ I − M 11∆1 ⎡∆ M 22Q21 ] ⎢ 1 ⎥⎢ 0 ⎣ 0 ∆2 ⎦ ⎣ ⎡ ∆1 0 ⎤ M 22Q21 ] ⎢ ⎥ ⎣ 0 ∆2 ⎦ = M 22Q22 + [ M 21 (8*) M 12Q21 ⎤ ⎡ ∆1 M 11 ⎥⎦ ⎢⎣ 0 −1 0 ⎤ ⎞ ⎡ M 12Q22 ⎤ ⎟ ∆ 2 ⎥⎦ ⎠ ⎢⎣ Q12 ⎥⎦ −1 M 12Q21∆ 2 ⎤ ⎡ M 12Q22 ⎤ M 11∆ 2 ⎥⎦ ⎢⎣ Q12 ⎥⎦ −1 ⎛ ⎡I − M ∆ 0 ⎤ ⎡ I ( I − M 11∆1 )−1 M12Q21∆ 2 ⎤ ⎞ ⎡ M 12Q22 ⎤ 11 1 ×⎜ ⎢ ⎢ ⎥⎟ ⎢ ⎥ ⎜ ⎢⎣ 0 M11∆ 2 ⎥⎥⎦ ⎢⎣0 I ⎥⎦ ⎟⎠ ⎣ Q12 ⎦ ⎝ 0⎤ ⎡∆ = M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢ 1 ⎥ ⎣ 0 ∆2 ⎦ ⎛ ⎡ I −( I − M 11∆1 )−1 M 12Q21∆ 2 ⎤ ⎡( I − M 11∆1 )−1 ⎤ ⎞ ⎡ M 12Q22 ⎤ 0 ×⎜ ⎢ ⎟ ⎥⎢ ⎥ −1 ⎥ ⎟ ⎢ ⎜ ⎣0 0 ( ∆ ) M I 11 2 ⎦⎣ ⎦ ⎠ ⎣ Q12 ⎦ ⎝ ⎡ ∆1 = M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢ ⎣0 0⎤ ∆ 2 ⎥⎦ ⎛ ⎡I −( I − M11∆1 )−1 M 12Q21∆ 2 ⎤ ⎡( I − M 11∆1 )−1 M 12Q22 ⎤ ⎞ ⎥ ⎟⎟ ⎥⎢ −1 ⎜ ⎣0 ( M ∆ ) Q I 11 2 12 ⎦⎣ ⎦⎠ ⎝ ×⎜ ⎢ 7 ⎡ ∆1 = M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢ ⎣0 0⎤ ∆ 2 ⎥⎦ ⎡( I − M 11∆1 ) −1 M 12Q22 − ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ⎤ ×⎢ ⎥ ( M 11∆ 2 ) −1 Q12 ⎣ ⎦ = M 22Q22 + [ M 21∆1 M 22Q21∆ 2 ] ⎡ ( I − M 11∆1 ) −1 M 12Q22 − ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ⎤ ⎢ ⎥ ( M 11∆ 2 ) −1 Q12 ⎣ ⎦ −1 −1 −1 = M 22Q22 + M 21∆1 ( ( I − M 11∆1 ) M 12Q22 − ( I − M 11∆1 ) M 12Q21∆ 2 ( M 11∆ 2 ) Q12 ) −1 + M 22Q21∆ 2 ( M 11∆ 2 ) Q12 = M 22 Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 (Q22 − Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ) + M 22Q21∆ 2 ( M 11∆ 2 ) −1 Q12 (8**) Agora “só” falta conferir que esta expressão é igual a (8*), caso não haja erro... (v) prova omitida. Lema: (9) ⎡ P11 ⎣ P21 Sejam P = ⎢ P12 ⎤ e K matrizes de transferência racionais e seja G = Y l ( P, K ) . P22 ⎥⎦ Então, (a) G é própria se P e K forem próprias com det( I − P22 K )(∞) ≠ 0 . (b) Y l ( P, K1 ) = Y l ( P, K 2 ) implica K1 = K 2 se P12 e P21 tiverem posto normal cheio de linha e coluna, respectivamente. ⎛ ⎡G 0 ⎤ ⎞ ⎥ ⎟ (∞) ≠ 0 e se 0 0 ⎣ ⎦⎠ (c) Se P e G forem próprias, det( P)(∞) ≠ 0 , det ⎜ P − ⎢ ⎝ P12 e P21 forem quadradas e tiverem inversa para quase todo s, então K é própria e K = Y u ( P −1 , G ) . Prova: (a) Lembra-se que Y l ( P, K ) := P11 + P12 K ( I − P22 K ) −1 P21 . É claro que se as condições forem satisfeitas, G = Y l ( P, K ) será própria. (b) Y l ( P, K1 ) − Y l ( P, K 2 ) = P11 + P12 K1 ( I − P22 K1 ) −1 P21 − P11 − P12 K 2 ( I − P22 K 2 ) −1 P21 = P12 K1 ( I − P22 K1 ) −1 P21 − P12 K 2 ( I − P22 K 2 ) −1 P21 = P12 ( K1 ( I − P22 K1 ) −1 − K 2 ( I − P22 K 2 ) −1 ) P21 . Se esta expressão for nula e se forem satisfeitas as condições de posto, então é preciso que K1 ( I − P22 K1 ) −1 = K 2 ( I − P22 K 2 ) −1 ∴ ( I − K1P22 ) −1 K1 = K 2 ( I − P22 K 2 ) −1 ∴ K1 ( I − P22 K 2 ) = ( I − K1P22 ) K 2 ∴ K1 − K1P22 K 2 = K 2 − K1P22 K 2 ; donde finalmente, 8 K1 = K 2 . (c) Prova omitida (ver ZDG, p. 253). • Observação: (10) Uma interpretação simples de (c) do lema é dada, considerando os sinais no SMF da figura 11, supondo que o sistema seja bem posto: z w P u y K Figura 11 ⎡z⎤ ⎡ w⎤ ⎢ y ⎥ = P ⎢ u ⎥ , u = Ky ⇒ z = Y Ä ( P, K ) w = Gw ; e portanto, supondo que P tenha ⎣ ⎦ ⎣ ⎦ inversa, ⎡ w⎤ −1 ⎡ z ⎤ ⎢ u ⎥ = P ⎢ y ⎥ , z = Gw . ⎣ ⎦ ⎣ ⎦ Ou seja, podemos construir o seguinte diagrama de blocos G w z P −1 y u Figura 11* e deste diagrama de blocos, temos u = Y â ( P −1 , G ) y , ou seja, K = Y â ( P −1 , G ) . 5.2 Exemplos de LFT’s As LFT’s são um instrumento conveniente para a formulação de muitos objetos matemáticos. Nesta seção e nas seguintes, mostraremos que várias estruturas matemáticas conhecidas adquirem nova compreensão através do uso das LFT’s. 9 Realizações no espaço de estado Seja o sistema no espaço de estado: x = Ax + Bu , y = Cx + Du , cuja matriz de transferência é G ( s ) = D + C ( sI − A) −1 Bu , a qual pode ser expressa como ⎛⎡A B⎤ 1 ⎞ uma LFT: G ( s ) = Y u ⎜ ⎢ ⎥ , I ⎟ , que corresponde, como sabemos, ao seguinte ⎝ ⎣C D ⎦ s ⎠ diagrama de blocos: I /s ⎡A B⎤ ⎢C D ⎥ ⎣ ⎦ Figura 12 −1 ⎛⎡A B⎤ 1 ⎞ 1⎛ 1⎞ , I ⎟ = D + C ⎜ I − A ⎟ B = D + C ( sI − A) −1 B = G ( s ) . Com efeito, Y u ⎜ ⎢ ⎥ s⎝ s⎠ ⎝ ⎣C D ⎦ s ⎠ (O livro tem outros exemplos, e alguns estão errados). 5.3 Um Princípio Básico O princípio básico a que nos referimos nesta seção é comumente tratado como “tirar os ∆ ’s para fora”. Já veremos de que se trata. Considere-se a figura 15, um diagrama de blocos qualquer: 10 Figura 15 Este diagrama de blocos pode ser re-escrito como na figura 16. Repare-se que os ∆ i ’s são perturbações da planta, “dentro” dela, conforme a figura 15, a qual inclui também, sem distinguir da planta, o controlador. Na figura 16 os ∆ i ’s são tirados para fora da planta, bem como o controlador. Como veremos, esta operação tornará o tratamento analítico do problema bem mais fácil. Figura 16 11 Vamos ilustrar esta ideia com um exemplo: Suponha que a relação entre a entrada e a saída de um sistema em malha fechada seja dada por: z = a + bδ 2 + cδ1δ 22 w =: Gw, 1 + dδ1δ 2 + eδ12 (10*) onde a, b, c, d e e são constantes ou funções de transferência. Queremos escrever G como uma LFT em termos de δ1 e δ 2 . Isto é feito em três passos: 1. Construir o diagrama de blocos para a relação entre a entrada w e a resposta z com cada δ separado, conforme mostrado na figura 17. 2. Marcar as entradas e saídas dos δ ’s como y’s e u’s, respectivamente. 3. Escrever z e os y’s em termos de w e u’s, respectivamente com os δ ’s e K fora. (No caso presente, (10*), não existe K). Este passo é equivalente a calcular a transformação na área cinzenta da figura 16. Vamos ao exemplo enunciado em (10*): 1. Vamos mostrar que o diagrama de blocos dado abaixo corresponde, de fato, a (10*). z = ay1 + δ 2 (by1 + cδ 2δ1 ) y1 = (ay1 + bδ 2 + cδ1δ 22 ) y1 , y1 = w − eδ12 y1 − dδ 2δ1 y1 ∴ (1 + dδ1δ 2 + eδ12 ) y1 = w ∴ y1 = 1 1 + d δ1δ 2 + eδ12 w. Substituindo esta na expressão acima, obtemos efetivamente (10*). Observo que foi fácil provar isto, mas construir o diagrama de blocos a partir de (10*) não parece tarefa trivial. 12 a z y4 δ2 b u4 c u3 y3 u1 δ2 w δ1 y1 -d y2 δ1 u2 −e Figura 17 ⎡0 ⎢1 ⎢ ⎢1 Vamos mostrar agora que z = Y u ( M , ∆ ) w com M = ⎢ ⎢0 ⎢ ⎢ ⎣0 0 ⎤ ⎡δ I ∆=⎢ 1 2 ⎥. ⎣ 0 δ2I2 ⎦ −e − d 0 0 0 0 −be −bd 0 0 0 0 ⋅ − ae − ad 1 1⎤ 0 ⎥⎥ 0⎥ ⎥ e b⎥ ⎥ ⎥ a⎦ Construído o diagrama de blocos, passamos ao segundo passo enunciado acima, que é o de “marcar as entradas e saídas dos δ ’s como y’s e u’s, respectivamente”. Após esta marcação, já na figura 17, temos: 13 y1 = w − eu2 − du3 ; y2 = u1 ; y3 = u1; y4 = cu3 + b( w − eu2 − du3 ) = −beu2 + (c − bd )u3 + bw , ou em forma vetorial, −d ⎡ y1 ⎤ ⎡0 −e ⎢ y ⎥ ⎢1 0 0 ⎢ 2⎥ = ⎢ ⎢ y3 ⎥ ⎢1 0 0 ⎢ ⎥ ⎢ ⎣ y4 ⎦ ⎣0 −be c − bd 0 ⎤ ⎡ u1 ⎤ ⎡1 ⎤ ⎡ u1 ⎤ ⎢ ⎥ ⎢u ⎥ ⎥ ⎢ ⎥ 0 ⎥ ⎢u 2 ⎥ ⎢ 0 ⎥ + w =: M 11 ⎢ 2 ⎥ + M 12 w . ⎢ ⎥ ⎢ u3 ⎥ ⎥ ⎢ ⎥ u 0 3 0 ⎢ ⎥ ⎥⎢ ⎥ ⎢ ⎥ 0 ⎦ ⎣u 4 ⎦ ⎣ b ⎦ ⎣u 4 ⎦ Por outro lado, do diagrama de blocos, temos também ⎡ y1 ⎤ ⎡ y1 ⎤ ⎡ y1 ⎤ ⎡ u1 ⎤ ⎡ y1 ⎤ ⎢ ⎥ ⎢ ⎥ ⎢y ⎥ ⎢u ⎥ δ I ⎢ ⎥ y2 ⎥ ⎢ y2 ⎥ 0 ⎤ ⎢ y2 ⎥ ⎢ ⎢ 2⎥ = ⎡ 1 2 =: ∆ ∴ = M 11∆ ⎢ 2 ⎥ + M 12 w ⎢ ⎥ ⎢ y3 ⎥ ⎢ y3 ⎥ ⎢ u3 ⎥ ⎣ 0 δ 2 I 2 ⎦ ⎢ y3 ⎥ ⎢ y3 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ y4 ⎦ ⎣ y4 ⎦ ⎣u4 ⎦ ⎣ y4 ⎦ ⎣ y4 ⎦ ⎡ y1 ⎤ ⎡ y1 ⎤ ⎢y ⎥ ⎢y ⎥ 2⎥ ⎢ ∴ ( I 4 − M 11∆ ) = M 12 w ∴ ⎢ 2 ⎥ = ( I 4 − M 11∆ ) −1 M 12 w ⎢ y3 ⎥ ⎢ y3 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ y4 ⎦ ⎣ y4 ⎦ ⎡ u1 ⎤ ⎢u ⎥ ∴ ⎢ 2 ⎥ = ∆ ( I 4 − M 11∆ ) −1 M 12 w . ⎢ u3 ⎥ ⎢ ⎥ ⎣u4 ⎦ (11) E do diagrama de blocos temos ainda ⎡ u1 ⎤ ⎡ u1 ⎤ ⎢u ⎥ ⎢u ⎥ 2⎥ ⎢ z = u4 + a ( w − eu2 − du3 ) = [ 0 − ae − ad 1] + aw =: M 21 ⎢ 2 ⎥ + M 22 w . ⎢u3 ⎥ ⎢u3 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣u 4 ⎦ ⎣u 4 ⎦ E em vista de (11), vem z = ( M 21∆ ( I 4 − M 11∆ ) −1 M 12 + M 22 ) w , ou seja, z = Y u ( M , ∆ ) w , ⎡ M 11 ⎣ M 21 com M = ⎢ M 12 ⎤ . M 22 ⎥⎦ • 5.5 Produto estrelado de Redheffer A mais importante propriedade das LFT’s é que qualquer interconexão de LFT’s é uma LFT. Esta propriedade é usada extensivamente no uso de LFT’s. Como veremos, a maioria das estruturas de conexão, como em cascata e realimentação, podem ser vistas como casos especiais do assim chamado produto estrelado. 14 Sejam as matrizes e submatrizes com dimensões compatíveis para o produto PK : ⎡P P = ⎢ 11 ⎣ P21 P12 ⎤ ⎡ K11 K12 ⎤ , K =⎢ ⎥ ⎥. P22 ⎦ ⎣ K 21 K 22 ⎦ Suponha que P21 K11 seja quadrada e que I − P21 K11 tenha inversa. O produto estrelado de P e K com respeito a esta partição é definido como: ⎡ Y l ( P, K11 ) S ( P, K ) := ⎢ −1 ⎣ K 21 ( I − P21K11 ) P21 P12 ( I − P21K11 ) −1 K12 ⎤ ⎥, Y u ( K , P22 ) ⎦ (12) onde lembramos mais uma vez que Y l ( P, K11 ) = P11 + P12 K11 ( I − P22 K11 ) −1 P21 , (13) −1 Y u ( K , K 22 ) = K 22 + K 21K 22 ( I − K11K 22 ) K12 (14) Observe-se que esta definição é essencialmente dependente da partição das matrizes P e K. Efetivamente, o produto estrelado pode ser bem definido para uma partição e não para outra. O uso do produto estrelado leva à representação em diagrama conforme a figura 18. z w P y u K ŵ ẑ Figura 18 Do diagrama de blocos acima, vemos que se trata de um sistema em que estamos interessados em controlar não somente a saída da planta, mas também do controlador. Este tipo de sistema ocorre em algumas situações em queremos monitorar a resposta do compensador, de modo a evitar saturação, por exemplo. Do diagram de blocos acima, temos u = K11 y + K12 wˆ , y = P21w + P22u ∴ u = K11 ( P21w + P22u ) + K12 wˆ ∴ ( I − K11P22 )u = K11P21w + K12 wˆ ∴ u = ( I − K11P22 ) −1 ( K11P21w + K12 wˆ ) . Mas, z = P11w + P12u = P11w + P12 ( I − K11P22 ) −1 ( K11P21w + K12 wˆ ) ∴ z = ( P11 + P12 ( I − K11P22 ) −1 K11P21 ) w + P12 ( I − K11P22 ) −1 K12 wˆ . (15) 15 Ora, a matriz de transferência entre z e w é igual a Y l ( P, K11 ) , de acordo com (12), coincidindo com (15), tendo em vista que P11 + P12 ( I − K11P22 ) −1 K11P21 = P11 + P12 K11 ( I − P22 K11 ) −1 P21 . E vemos também que a matriz de transferência entre z e ŵ de acordo com (12) também coincide com a dada em (15). Por outro lado, pode-se verificar que a matriz de transferência entre a resposta do controlador e as entradas da planta e do controlador é dada pela segunda “linha” de (12). Suponha agora que conheçamos as realizações da matrizes de transferência P e K: ⎡A P = ⎢⎢ C1 ⎢⎣C2 B1 D11 D21 B2 ⎤ D12 ⎥⎥ , D22 ⎥⎦ ⎡ AK BK1 BK 2 ⎤ K = ⎢⎢CK1 DK11 DK12 ⎥⎥ ⎢⎣CK 2 DK 21 DK 22 ⎥⎦ ⎡ w⎤ ⎡ z ⎤ Então a matriz de transferência desejada S ( P, K ) : ⎢ ⎥ → ⎢ ⎥ tem a representação: ⎣ wˆ ⎦ ⎣ zˆ ⎦ ⎡A ⎢ S ( P, K ) = ⎢ ⎢ C1 ⎢ ⎣ C2 onde ⎡ A + B2 R −1 DK 11C2 A=⎢ BK 1 R −1C2 ⎣ B1 D11 D21 B2 ⎤ ⎥ ⎡A ⎥=⎢ D12 ⎥ ⎢ ⎥ ⎢C D22 ⎦ ⎣ B⎤ ⎥ ⎥ D ⎥⎦ ⎤ ⎥, AK + BK 1 R D22CK 1 ⎦ ⎡ B + B2 R −1DK 11D21 B=⎢ 1 BK 1R −1D21 ⎣ ⎡C + D12 DK 11R −1C2 C=⎢ 1 DK 21R −1C2 ⎣ B2 R −1CK 1 −1 ⎤ B2 R −1DK 12 ⎥, BK 2 + BK 1R −1D22 DK 12 ⎦ ⎤ D12 R −1CK 1 ⎥ e CK 2 + DK 21R −1D22CK 1 ⎦ ⎡ D11 + D12 DK 11R −1D21 ⎤ D12 R −1DK 12 D=⎢ ⎥, DK 21 R −1 D21 DK 22 + DK 21R −1D22 DK 12 ⎦ ⎣ com R = I − D22 DK 11 e R = I − DK 11 D22 . 16 Efetivamente, é fácil (?) mostrar que ⎛⎡ A A = S⎜⎢ ⎝ ⎣ C2 ⎛ ⎡C C = S⎜⎢ 1 ⎝ ⎣ C2 ⎛ ⎡ B1 B2 ⎤ ⎡ DK 11 DK 12 ⎤ ⎞ B2 ⎤ ⎡ DK 11 CK 1 ⎤ ⎞ ,⎢ ⎟, B = S ⎜ ⎢ ⎥,⎢ B ⎥⎟, ⎥ ⎥ D22 ⎦ ⎣ BK 1 AK ⎦ ⎠ D D B 21 22 1 2 K K ⎣ ⎦ ⎣ ⎦⎠ ⎝ ⎛ ⎡ D11 D12 ⎤ ⎡ DK 11 DK 12 ⎤ ⎞ D12 ⎤ ⎡ DK 11 CK 1 ⎤ ⎞ ,⎢ ⎟ e D = S⎜⎢ ⎥ , ⎢D ⎥⎟. ⎥ ⎥ D22 ⎦ ⎣ DK 21 CK 2 ⎦ ⎠ D D D 22 ⎦ ⎣ K 21 K 22 ⎦ ⎠ ⎝ ⎣ 21 Nestas quatro expressões, está sendo usado o produto estrelado para matrizes definidas sobre os números reais e não sobre funções racionais. 6º. Capítulo: Valor Singular Estruturado Pode-se observar que os critérios de estabilidade robusta e de desempenho robusto desenvolvidos no 4º. Capítulo variam com as hipóteses a respeito das descrições da incerteza e exigências de desempenho. Será mostrado neste capítulo que eles podem ser tratados de modo unificado usando o conceito de LFT introduzido no capítulo anterior e o de valor singular estruturado, a ser introduzido neste capítulo. Isto não significa, claro, que aqueles problemas especiais e suas soluções não sejam importantes; pelo contrario, eles são muito esclarecedores para a nossa compreensão de problemas complexos pois estes são formados a partir de problemas simples. Mas por outro lado uma abordagem unificada pode aliviar as dificuldades matemáticas oriundas do tratamento de diferentes problemas. 6.1 A estrutura geral para a robustez de sistemas Como foi mostrado no último capítulo, qualquer sistema com interligações pode ser “rearrumado” de modo a se enquadrar na estrutura geral da figura 19. 17 ∆ z P w K Figura 19 No diagrama acima, ∆ é tipicamente uma matriz de “perturbações” no sentido amplo, como observado poucas linhas abaixo; é obtida a partir do método de “puxar para fora” as perturbações, método que foi estudado no capítulo anterior. K é tipicamente o controlador e P é a planta, nela incluídos os sensores e atuadores. Embora a estrutura original do sistema seja bastante complicada, é sempre possível chegar à estrutura da figura. Efetivamente, há softwares que permitem obter a estrutura da figura acima a partir de sistemas originais, como o SIMULINK e µ -TOOLS . Ou seja, estes softwares fazem a operação de “tirar para fora” as perturbações, algo que não é trivial, como vimos. Observe-se que as incertezas, caracterizadas pela matriz ∆ podem provir não somente de perturbações dos parâmetros do modelo, mas também de entradas externas (distúrbios determinísticos ou ruídos aleatórios). O desempenho do sistema é medido a partir da resposta ou do erro, seja que se deseja rejeitar um distúrbio, seja que se deseja rastrear um sinal, seja que queremos as duas coisas. Conforme a figura 19, a planta é definida pela sua matriz de transferência ⎡ P11 ( s ) P12 ( s ) P13 ( s ) ⎤ P ( s ) = ⎢⎢ P21 ( s ) P22 ( s ) P23 ( s ) ⎥⎥ e o sistema em malha fechada é dado por ⎢⎣ P31 ( s ) P32 ( s ) P33 ( s ) ⎥⎦ z = Y u (Y l ( P, K ), ∆ ) w = Y l (Y u ( P, ∆ ), K ) w . Se agora absorvermos o controlador dentro de uma estrutura maior, definamos ⎡ M ( s ) M 12 ( s ) ⎤ M ( s ) = Y l ( P ( s ), K ( s )) = ⎢ 11 ⎥ , obtendo-se ( ) ( ) M s M s 22 ⎣ 21 ⎦ −1 z = Y u ( M , ∆ ) w = [ M 22 + M 21∆ ( I − M 11∆ ) M 12 ( s )]w . 18 ∆ M z w Figura 20 Suponha que K seja um controlador que estabiliza o SMF nominal (ou, no jargão, “estabiliza a planta” nominal). Então, M ( s ) ∈ RH ∞ . Supomos, sem perda de generalidade, que ∆ é bloco-diagonal, conforme a expressão logo abaixo e, usando pesos apropriados, supomos também que ∆ ∞ < 1 . Dizemos que não há perda de generalidade supor que ∆ seja bloco-diagonal, porque, na pior das hipóteses, podemos considerar que ∆ tenha um único bloco. Então estamos supondo que ∆ ( s ) tem a forma ∆ ( s ) = {diag[δ1I1 ,..., δ s I s , ∆1 ,..., ∆ F ] : δ i ∈ RH ∞ , ∆ j ∈ RH ∞ } , com δ i ∞ <1 e ∆j ∞ (1) < 1. Na expressão acima os δ 's são supostos escalares, enquanto que os ∆ 's são supostos matrizes. 6.2 Valor singular estruturado Do ponto de vista conceitual, o valor singular estruturado nada mais é que uma “generalização imediata” (quem o inventou é o segundo autor de ZDG) do valor singular para matrizes constantes. Para ser mais específico, considere-se novamente o diagrama de blocos padrão da figura 22 abaixo, onde M e ∆ são supostos estáveis. ∆ w1 e1 M e2 w2 Figura 22 19 Uma pergunta básica a respeito do SMF da figura 22 é quão grande pode ser ∆ (no sentido de ∆ ∞ ) sem desestabilizar o sistema. Os polos do SMF são dados pela equação det( I − M ( s ) ∆ ( s )) = 0 . Portanto o SMF é instável se a eq. acima for satisfeita para algum s ∈ C + , o semiplano complexo fechado da direita estendido, isto é, incluindo o infinito. Supomos, como dito acima, que o sistema nominal, isto é, M, seja estável. Seja α > 0 suficientemente pequeno tal que o SMF da figura 22 seja estável para todos os ∆ ∞ < α . A seguir fazemos α aumentar até α max de modo que o sistema da figura 22 se torne instável. Então dizemos que α max é a margem de estabilidade robusta. Ora, pelo teorema do pequeno ganho, temos 1 α max = M ∞ := sup σ ( M ( s )) = sup σ ( M ( jω )) . ω s∈C+ (2) Em vista disso, podemos escrever σ ( M ( s )) = 1 . min{σ (∆ ) : det( I − M ( s )∆ ) = 0, ∆ é não-estruturado} (3) Ou por outras palavras, a recíproca do maior valor singular de M é uma medida do menor ∆ desestruturado que causa instabilidade no sistema com realimentação. Para quantificar o menor ∆ estruturado que desestabiliza o SMF, é introduzido o valor singular estruturado: 1 . min{σ (∆ ) : det( I − M ( s )∆ ) = 0, ∆ é estruturado} Observe-se que a definição indica o valor singular de M ( s ) com relação a ∆ . µ∆ ( M ( s )) = (4) De (2) e (4), temos: 1 α max = sup µ ∆ ( M ( s )) = sup µ∆ ( M ( jω )) . ω s∈C+ (5) A última igualdade é demonstrada de modo rigoroso em ZDG, pp.277s, em que se prova que: sup µ∆ ( M ( s)) = sup µ∆ ( M ( s )) = sup µ∆ ( M ( jω )) . s∈C+ s∈C+ ω Definições de µ O valor singular estruturado µ (⋅) foi definido em (4) acima. O que se entende por estrutura em ∆ já vimos em (1), sem mencionar então a palavra “estruturado”. Vamos agora explicar e formalizar melhor esta definição. Consideremos matrizes M ∈ C n×n . Na definição de µ ( M ) há uma estrutura subjacente ∆ , que é um conjunto de matrizes bloco-diagonais. Para cada problema esta estrutura é diferente, dependendo das incertezas e dos objetivos de pesquisa do sistema. Definir a estrutura de ∆ depende de três coisas: o tipo de cada bloco do diagrama de blocos, o número total de blocos e suas respectivas dimensões. 20 Há dois tipos de blocos, como vimos em (1): escalares repetidos e blocos cheios; o número de cada um será representado por S e F, respectivamente. E as dimensões de cada bloco serão dadas por r1 ,..., rS e m1 ,..., mF , respecitvamente, ou seja, o i-ésimo bloco de escalares repetidos tem dimensão ri × ri , enquanto que o j-ésimo bloco cheio tem dimensão m j × m j . Com estes números em mente, definimos ∆ ∈ C n×n como { ∆ = diag[δ1I r1 ,..., δ S I rs , ∆1 ,..., ∆ F ] : δ i ∈ C,δ j ∈ C m j ×m j }. (5*) Às vezes precisaremos de subconjuntos de ∆ que sejam limitados por norma, pelo que é introduzida a notação: (6a) B∆={∆ ∈ ∆ : σ (∆ ) ≤ 1} , B0∆={∆ ∈ ∆ : σ (∆ ) < 1} . (6b) Observe-se que os blocos cheios ∆ i não precisam ser quadrados, mas suporemos aqui que o sejam para tornar a notação mais compacta. Definição: Para M ∈ C n×n , µ ∆ ( M ) é definido como (7a) 1 , (7b) min{σ (∆ ) : ∆ ∈ ∆, det( I − M ∆ ) = 0} a não ser que não exista ∆ ∈ ∆ que torne I − M ∆ singular, e neste caso, define-se µ∆ ( M ) := 0. µ∆ ( M ) := (8) Observação: - Quando não existe ∆ ∈ ∆ que torne I − M ∆ singular, define-se µ ∆ ( M ) := 0, coerentemente com o fato que então a margem de estabilidade é infinita. - Sem perda de generalidade, os blocos cheios em ∆ podem ser escolhidos como díades (de posto igual a 1). Para ver isto, suponha, para simplificar, que S = 0, isto é, todos os blocos são cheios. Suponha que I − M ∆ é singular para algum ∆ ∈ ∆ . Então existe um x ∈ C n tal que M ∆x = x . Particionemos x: ⎡ x1 ⎤ ⎢x ⎥ x = ⎢ 2 ⎥ , xi ∈ Cmi , i = 1,..., F . ⎢ ⎥ ⎢ ⎥ ⎣ xF ⎦ ⎧ ∆ i xi xi∗ ⎪ 2 , se xi ≠ 0 Definamos: ∆ i = ⎨ xi ⎪ ⎩0, se xi = 0 { para i = 1,..., F , (8*) } ∆ = diag ∆1 , ∆ 2 ,..., ∆ F . 21 xi xi∗ ∆ i xi xi∗ xi xi∗ Ora, ∆ i = ≤ ∆i , ≤ ∆i 2 xi2 xi2 xi (8**) porque xi2 é o produto escalar de xi por ele mesmo. Para calcularmos o numerador da última expressão, consideremos, para maior clareza de idéias, e “quase” sem perda de generalidade, o caso em que xi tem apenas duas componentes, que denominaremos, para simplificar a notação, por x1 e x2 . Então, supondo que x seja real (de novo para não ⎡ x1 ⎤ sobrecarregar a notação), temos x x = ⎢ ⎥ [ x1 ⎣ x2 ⎦ T i i ⎡ x12 x2 ] = ⎢ ⎣ x1 x2 x1 x2 ⎤ ⎥ . Ora a norma-2 x22 ⎦ induzida de uma matriz é a raiz quadrada do seu maior autovalor; temos ⎛ ⎛ ⎡ λ − x12 − x1 x2 ⎤ ⎞ ⎡ x 2 x1 x2 ⎤ ⎞ det ⎜ λ I 2 − ⎢ 1 det = ⎜⎜ ⎢ 2 ⎥⎟ 2⎥⎟ ⎜ ⎟ ⎟ ⎣ x1 x2 x2 ⎦ ⎠ ⎝ ⎝ ⎣ − x1 x2 λ − x2 ⎦ ⎠ = λ 2 − x12λ − x22λ + x12 x22 − x12 x22 = λ (λ − x12 − x22 ) . E é claro que o maior auto valor é x12 + x22 , donde que xi xi∗ = x12 + x22 . Então a última fração de (8*) é igual a 1 e portanto temos ∆ i ≤ ∆ i . Logo, σ (∆ ) ≤ σ (∆ ) . Agora note-se de (8*) que, supondo ainda, para simplificar, que xi tenha apenas duas componentes, ∆ i xi = ∆ i 1 ⎡ x1 ⎤ ⎢ ⎥ [ x1 xi2 ⎣ x2 ⎦ ⎡x ⎤ 1 x2 ] ⎢ 1 ⎥ = ∆ i 2 x1 + x22 ⎣ x2 ⎦ ⎡ x1 ⎤ 2 2 ⎢ x ⎥ ( x1 + x2 ) = ∆ i xi . ⎣ 2⎦ Donde, ∆x = ∆x e, portanto ( I − M ∆ ) x = ( I − M ∆ ) x = 0 , isto é, I − M ∆ também é singular. Portanto, nós substituímos a perturbação geral ∆ que satisfaz à condição de singularidade por uma perturbação ∆ que não é maior (no sentido de σ (⋅) ) e que tem posto igual a um em cada bloco, mas ainda satisfaz a condição de singularidade. Segue-se uma expressão alternativa da definição de µ ∆ ( M ) : (9) = , µ ∆ ( M ) max ∆∈B∆ ρ ( M ∆ ) onde ρ (⋅) é o raio spectral da matriz, isto é , o valor absoluto do auto-valor de maior valor absoluto. Lema: Prova: Segue de (3), lembrando que o maior valor singular é a raiz quadrada do maior autovalor. • Em virtude deste lema, a continuidade da função µ : C n×n → R fica evidente. 22 Em geral, entretanto, a função µ : C n×n → R não é uma norma, pois se pode mostrar que ela não satisfaz à desigualdade do triângulo. Entretanto, para qualquer α ∈ C temos µ (α M ) = α µ ( M ) , portanto, em algum sentido, µ (⋅) está relacionado a quão “grande” uma matriz é. Podemos relacionar µ∆ ( M ) a quantidades familiares na álgebra linear quando ∆ é um dos conjuntos: (10) Fato: Se ∆ = {δ I : δ ∈ C} , (ou seja, S = 1, F = 0, r1 = n ), então, µ∆ ( M ) = ρ ( M ) . Prova: Os únicos ∆ ' s em ∆ que satisfazem a det( I − M ∆ ) = 0 correspondem aos autovalores não nulos de M. E o menor deles é associado com o maior autovalor, donde a conclusão. • Fato: Se ∆ = Cn×n , ou seja, S = 0, F = 1, m1 = n , então µ∆ ( M ) = σ ( M ) . (11) 1 , então I − M ∆ é não singular, por aplicação do teorema do σ (M ) pequeno ganho. Aplicando a definição (7b) e (3), temos µ∆ ( M ) ≤ σ ( M ) . (12) Prova: Se σ ( ∆ ) < A possivel desigualdade anterior se deve ao fato que no lado esquerdo temos perturbação estruturada. Ora, quando temos um bloco único cheio, a perturbação é de fato desestruturada, daí a igualdade. • É claro que para um ∆ geral como em (5*), devemos ter: {δ I n : δ ∈ C} ⊂ ∆ ⊂ C n×n . Consequentemente, da definição de µ e dos dois casos especiais acima, temos ρ ( M ) ≤ µ∆ ( M ) ≤ σ ( M ) . (13) (14) Mas estes limitantes não são suficientes para nossos propósitos, porque a diferença entre ρ ( M ) e σ ( M ) pode ser arbitrariamente grande. Assim, por exemplo, suponha que ⎡δ 0 ⎤ ∆=⎢ 1 ⎥ e δ 0 2⎦ ⎣ ⎡0 β ⎤ 1º. caso: M = ⎢ ⎥ , com β > 0 , de resto qualquer. Então, ρ ( M ) = 0 e σ ( M ) = β , ⎣0 0 ⎦ porque os valores singulares são as raizes quadradas dos autovalores de MM T . E µ ( M ) = 0 , visto que det( I − M ∆ ) = 1 para todos os ∆ ' s admissíveis. ⎡ −1/ 2 1/ 2 ⎤ 2º. Caso: M = ⎢ ⎥ . Neste caso, temos ρ ( M ) = 0 e σ ( M ) = 1 . E visto que ⎣ −1/ 2 1/ 2 ⎦ 23 det( I − M ∆) = 1 + δ1 − δ 2 2 ⎧ ⎩ , é fácil ver que min ⎨ max i δ i :1 + δ1 − δ 2 2 ⎫ = 0⎬ = 1 , ⎭ portanto µ (M) = 1. Poranto, nem ρ nem σ proveem limitantes úteis mesmo em casos simples. Eles são úteis se ρ ( M ) ≈ σ ( M ) . Entretanto estes limitantes podem ser refinados considerando transformações em M que não afetam µ∆ ( M ) , mas afetam ρ e σ . Com este objetivo, definamos os seguintes dois subconjuntos de Cn×n : U = {U ∈ ∆ : UU ∗} = I n , { D = diag[ D1 ,..., DS , d1I m1 ,..., d F −1I mF −1 , I mF ] : Di ∈ C (15) ri ×ri } , Di = Di ∗ > 0, d j ∈ R, d j > 0 Note-se que para todo ∆ ∈ ∆, U ∈ U e D ∈ D, temos U ∗ ∈ U , U ∆ ∈ ∆, ∆U ∈ ∆, σ (U ∆) = σ (∆U ) = σ (∆ ), D∆ = ∆D . (16) (17) Em vista disso, temos Teorema: Para todo U ∈ U e D ∈ D, (18) µ∆ ( MU ) = µ∆ (UM ) = µ∆ ( M ) = µ∆ ( DMD −1 ) Prova: Para todo D ∈ D e ∆ ∈ ∆, det( I − M ∆) = det( I − MD −1∆D) = det( I − DMD −1∆ ) , a primeira igualdade porque D comuta com ∆ e a segunda porque, em geral, det(I – AB) = det(I – BA). Portanto, µ∆ ( M ) = µ∆ ( DMD −1 ) . Alem disso, para todo U ∈ U , det( I − M ∆ ) = 0 se só se det( I − MUU ∗∆) = 0 . Mas visto que U ∗∆ ∈ ∆ (ver (17), e σ (U ∗ ∆ ) = σ (∆ ) (idem), obtemos µ∆ ( MU ) = µ∆ ( M ) . E o argumento para UM segue a mesma linha. • Em vista disto, os limitantes em (14) podem ser mais “apertados”: maxU ∈U ρ (UM ) ≤ max ∆∈B∆ ρ (∆M ) = µ∆ ( M ) ≤ inf D∈D σ ( DMD −1 ) , (19) onde a igualdade acima vem do lema (9). Então, de (19), temos maxU∈U ρ (UM ) ≤ µ∆ ( M ) ≤ inf D∈D σ ( DMD −1 ) (19*) A seguir temos o resultado, cuja prova é remetida para um artigo (ver ZDG, p. 281): Teorema: maxU ∈U ρ ( MU ) = µ∆ ( M ) (19#) 24 Boa definição e desempenho para LFT’s constantes ⎡ M 11 ⎣ M 21 Seja uma matriz complexa: M = ⎢ M 12 ⎤ M 22 ⎥⎦ (20) e sejam duas estruturas ∆1 e ∆ 2 que são compatíveis em dimensões com M 11 e M 22 . Defina-se uma terceira estrutura: ⎧⎪ ⎡ ∆ ⎫⎪ 0⎤ ∆ = ⎨⎢ 1 (21) ⎥ : ∆1 ∈ ∆1 , ∆ 2 ∈ ∆ 2 ⎬ . ⎩⎪ ⎣ 0 ∆ 2 ⎦ ⎭⎪ Vamos computar µ com respeito a estas três estruturas. Usaremos a seguinte notação: µ1 se refere a ∆1 , µ 2 se refere a ∆ 2 e µ∆ se refere a ∆ . Com esta notação, µ1 ( M 11 ), µ2 ( M 22 ) e µ∆ ( M ) todas fazem sentido, mas µ1 ( M ) , por exemplo, não faz. Estamos interessados em resolver os seguintes problemas: - Determinar se a LFT Y l ( M , ∆ 2 ) é bem definida para todo ∆ 2 ∈ ∆ 2 com σ ( ∆ 2 ) ≤ β (< β ) e - se este for o caso, determinar quão “grande” Y l ( M , ∆ 2 ) pode ser. Então, seja ∆ 2 ∈ ∆ 2 . Lembremo-nos que Y l ( M , ∆ 2 ) é bem definida se I − M 22 ∆ 2 tiver inversa. O próximo teorema nada mais é que uma reformulação da definição de µ : (22) Teorema: A LFT Y l ( M , ∆ 2 ) é bem definida (a) para todo ∆ 2 ∈ B∆ 2 se só se µ 2 ( M 22 ) < 1 , (b) para todo ∆ 2 ∈ B0 ∆ 2 se só se µ2 ( M 22 ) ≤ 1 . • Quando a “perturbação” ∆ 2 é diferente de zero, a matriz Y l ( M , ∆ 2 ) se torna diferente de M 11 . Os valores que µ1 (Y l ( M , ∆ 2 )) pode ter são intimamente relacionados a µ∆ ( M ) , conforme o teorema segunte: Teorema da malha principal: (23) ⎧⎪ µ 2 ( M 22 ) < 1 e ⎫⎪ µ∆ ( M ) < 1 se só se ⎨ ⎬, ⎩⎪max ∆2∈B∆2 µ1 (Y l ( M , ∆ 2 )) < 1⎭⎪ ⎪⎧ µ 2 ( M 22 ) ≤ 1 e ⎪⎫ µ∆ ( M ) ≤ 1 se só se ⎨ ⎬. ⎪max ∆ ∈B ∆ µ1 (Y l ( M , ∆ 2 )) ≤ 1⎪ ⎩ 0 2 2 ⎭ Prova: (apenas da 1ª. parte, a da 2ª. sendo análoga) (Suficiência): Sejam ∆1 ∈ ∆1 e ∆ 2 ∈ ∆ 2 , com σ ( ∆1 ) ≤ 1 e σ (∆ 2 ) ≤ 1 e defina-se ∆ = diag[∆1 , ∆ 2 ] . É claro que ∆ ∈ ∆ . Ora, 25 ⎡ I − M 11∆1 det( I − M ∆) = det ⎢ − M 12 ∆ 2 ⎤ . I − M 22 ∆ 2 ⎥⎦ (24) ⎣ − M 21∆1 Por hipótese I − M 22 ∆ 2 tem inversa e, portanto, det( I − M ∆ ) = det( I − M 22 ∆ 2 ) det ( I − M 11∆1 − M 12 ∆ 2 ( I − M 22 ∆ 2 ) −1 M 21∆1 ) , ou seja, (25) det( I − M ∆ ) = det( I − M 22 ∆ 2 ) det( I − Y l ( M , ∆ 2 )∆1 ) . Mas µ1 (Y l ( M , ∆ 2 )) < 1 por hipótese (enunciado do teorema), e ∆1 ∈ B∆1 (primeira linha da prova deste teorema), donde que I − Y l ( M , ∆ 2 )∆1 é não singular. Então I − M ∆ é não singular e, por definição (?), µ∆ ( M ) < 1 . (Necessidade): Basicamente, reverte-se o argumento acima. De novo, ∆1 ∈ ∆1 e ∆ 2 ∈ ∆ 2 e ∆ = diag[∆1 , ∆ 2 ] . Então ∆ ∈ B∆ e, por hipótese, det( I − M ∆ ) ≠ 0 . Pode-se verificar da definição de µ que temos sempre µ ( M ) ≥ max{µ1 ( M 11 ), µ 2 ( M 22 )} . Mais ainda, como por hipótese µ2 ( M 22 ) < 1 , temos I − M 22 ∆ 2 é não singular. Então, (25) é valida, dando det( I − M 22 ∆ 2 ) det( I − Y l ( M , ∆ 2 )∆1 ) = det( I − M ∆ ) ≠ 0 . Então é claro que I − Y l ( M , ∆ 2 )∆1 é não singular para todos ∆1 ∈ B∆1 e ∆ 2 ∈ B∆ 2 , provando o teorema. • 6.3 Estabilidade robusta estruturada e desempenho Estabilidade robusta O uso mais conhecido de µ como ferramenta de análise de robustez é no domínio da frequência. Seja G ( s ) uma matriz de transferência racional, com coeficientes reais e estável. Para maior concretude, suponha que a matriz tenha q1 entradas e p1 saídas. Seja ∆ como em (5*) e suponha que as dimensões sejam tais que ∆ ⊂ C q1× p1 . Seja M (∆) o conjunto de todas as matrizes racionais, estáveis e bloco-diagonais com estrutura de blocos como em ∆ , e tais que M (∆) := ∆ (⋅) ∈ RH ∞ : ∆ ( s0 ) ∈ ∆ para todo s0 ∈ C + . { } Então, temos Teorema: Seja β > 0 . Então o SMF abaixo é bem posto e internamente estável para todo ∆ (⋅) ∈ M (∆) com ∆ ∞ (26) < 1/ β se só se supω∈R µ∆ (G ( jω )) ≤ β . 26 ω1 e1 ∆ G( s) ω2 e2 Figura 27 Prova: (Suficiência): Temos sup s∈C µ∆ (G ( s )) = supω∈R µ∆ (G ( jω )) ≤ β , esta desigualdade + por hipótese do teorema. Portanto, det( I − G ( s )∆ ( s )) ≠ 0 para todo s ∈ C + ∪ {∞} sempre que ∆ ∞ < 1/ β , isto é, o sistema é robustamente estável. (Necessidade): Suponha que supω∈R µ∆ (G ( jω )) > β . Então existe um ω0 , 0 < ω0 < ∞ , tal que µ∆ (G ( jω0 )) > β . De acordo com a observação (8), existe um complexo ∆ c ∈ ∆ tal que cada bloco cheio tenha posto 1 , σ ( ∆ c ) < 1/ β e tal que I − G ( jω ) ∆ c é singular. A seguir, usando o mesmo tipo de prova do teorema do pequeno ganho, pode-se encontrar uma matriz racional ∆ ( s ) tal que ∆ ( s ) ∞ = σ (∆ c ) < 1/ β , ∆ ( jω0 ) = ∆ c e ∆ ( s ) desestabiliza o sistema. • Desempenho robusto Suponha que G p seja uma matriz de transferência racional, real, estavel e própria com q1 + q2 entradas e p1 + p2 saídas. G12 ⎤ ⎡G . Seja ∆ ⊂ C q1× p1 uma estrutura em blocos como em (5*). DefinaG p ( s ) = ⎢ 11 ⎥ ⎣G21 G22 ⎦ ⎧⎪ ⎡ ∆ 0 ⎤ ⎫⎪ se uma estrutura em bloco aumentada: ∆ p := ⎨ ⎢ : ∆ ∈ ∆ , ∆ f ∈ C q2 × p2 ⎬ . ⎥ ⎩⎪ ⎣ 0 ∆ f ⎦ ⎭⎪ Queremos estudar o problema do desempenho robusto conforme a figura 28. 27 ∆( s) G p (s) z w Figura 28 A matriz de transferência de w a z é, como sabemos, Y u (G p , ∆ ) . Teorema Seja β > 0 Para todo ∆ ( s ) ∈ M (∆) com ∆ internamente estável e Y u (G p , ∆ ) ∞ (29) <1/β o SMF da figura 28 é bem posto, ∞ ≤ β se só se supω∈R µ∆ p (G p ( jω )) ≤ β . • Observe-se que estabilidade interna implica supω∈R µ∆ (G11 ( jω )) ≤ β . Portanto a prova deste teorema é ao longo das linhas do teorema (26). Este é um teorema muito útil, ele é, como se pode ver, uma extensão do teorema do pequeno ganho. Ele nos diz que o problema do desempenho robusto é equivalente ao problema da estabilidade robusta com a incerteza ∆ . 6.4 Visão de conjunto da síntese usando µ Nesta seção mostraremos como a teoria de análise discutida nas seções anteriores leva naturalmente aos problemas de síntese. Dos resultados obtidos vimos como cada caso leva a calcular (31) M α com α =2, ∞ ou então µ . Obtemos, com a malha fechada sempre uma LFT, como na figura 32 que segue. z G w K Figura 32 28 Y l (G , K ) = G11 + G12 K ( I − G22 K ) −1 G21 , ⎡ G11 G12 ⎤ onde G = ⎢ ⎥ é escolhida respectivamente como: G G 22 ⎦ ⎣ 21 ⎡ P22 - no caso de apenas desempenho nominal ( ∆ = 0 ): G = ⎢ ⎣ P32 ⎡ P11 P13 ⎤ - no caso de estabilidade robusta somente: G = ⎢ ⎥. ⎣ P31 P33 ⎦ P23 ⎤ P33 ⎥⎦ - no caso de desempenho robusto: ⎡ P11 P12 | P13 ⎤ ⎢P P | P ⎥ 23 ⎥ . G = P = ⎢ 21 22 ⎢− − ⋅ −⎥ ⎢ ⎥ ⎣ P31 P32 | P33 ⎦ E cada situação leva ao problema de síntese min K Y l (G , K ) α , com α =2, ∞, ou µ , (33) sujeito à estabilidade interna do sistema nominal. O problema de síntese com α =2 foi resolvido nos anos 60’s, o problema com α = ∞ foi resolvido ao final dos anos 80’s, o segundo autor de ZDG tendo tido atuação de liderança, o terceiro autor também tendo contribuído. O problema com µ ainda é (?) objeto de pesquisa. Estes três problemas são o foco do resto deste texto. 7º. Capítulo: Parametrização dos controladores estabilizadores A configuração básica dos problemas deste capítulo é uma LFT como a figura 34, onde G é uma planta generalizada com dois conjuntos de entradas: os sinais exógenos w que incluem distúrbios e comandos e os sinais de controle u , usulamente através de atuadores, incorporados a G. A planta tem também dois conjuntos de saídas: as respostas medidas, usulamente através de sensores, incorporados a G, e as respostas reguladas z. 29 z w G y u K Figura 34 Neste capítulo nos ocuparemos somente do problema de síntese de estabilização do SMF, ou seja, como diz mais ou menos o título do capítulo, achar o conjunto de todos os controladores que estabilizam o SMF. 7.1 Existência de Controladores estabilizadores Suponnha que G tenha uma realização estabilizável e detectável dada por: ⎡A ⎡ G11 ( s ) G12 ( s ) ⎤ ⎢ G (s) = ⎢ ⎥ = ⎢ C1 ⎣G21 ( s ) G22 ( s ) ⎦ ⎢C ⎣ 2 B1 D11 D21 B2 ⎤ D12 ⎥⎥ D22 ⎥⎦ (1) Definição: (1*) Um controlador próprio K(s) é dito admissível se estabilizar internamente G (isto é, se ele estabilizar internamente a malha). (2) Lema: Existe um controlador K que estabiliza internamente a malha se só se ( A, B2 ) é estabilizável e (C2 , A) é detectável. Isto posto, sejam F e L tais que A + B2 F e A + LC2 sejam estáveis; então um controlador estabilizador é dado por ⎡ A + B2 F + LC2 + LD22 F K (s) = ⎢ F ⎣ −L⎤ 0 ⎥⎦ (O controlador do tipo acima é chamado de controlador com base em observador). Prova: (Suficiência): Sendo G estabilizável e detectável, existem F e L tais que A + B2 F e A + LC2 são estáveis. Temos as eqs. da planta x = Ax + B2u , y = C2 x + D22u . (2*) 30 Usemos o controlador sugerido pelo enunciado do Lema: u ( s) = F ( sI − A − B2 F − LC2 − LD22 F )−1 (− L) y ( s) , isto é, xˆ = ( A + B2 F + LC2 + LD22 F ) xˆ − Ly , u = Fxˆ . (2**) (2#) De (2**) em vista de (2#) e da segunda eq. de (2*), temos xˆ = ( A + B2 F + LC2 + LD22 F ) xˆ − LC2 x − LD22 Fxˆ = ( A + B2 F + LC2 ) xˆ − LC2 x . Da primeira de (2*) com (2#) e desta última, temos as eqs. de estado do SMF: ⎡ x⎤ ⎡ A ⎢ ⎥=⎢ ⎣ xˆ ⎦ ⎣ − LC2 ⎤ ⎡ x⎤ . ⎥ A + B2 F + LC2 ⎦ ⎢⎣ xˆ ⎥⎦ B2 F (2##) ⎡I 0⎤ Premultiplicando a matriz do sistema acima por ⎢ ⎥ e pós multiplicando pela sua ⎣−I I ⎦ inversa (uma transformação de similaridade) obtemos ⎡ A + B2 F ⎢ 0 ⎣ B2 F ⎤ . A + LC2 ⎥⎦ (2$) A matriz que premultiplica a matriz do sistema, também tem que multiplicar o lado esquerdo de (2##), obtendo-se ⎡ x ⎤ ⎢ ⎥ , a segunda componente desta sendo a derivada do “erro” entre os dois estados. ⎣ xˆ − x ⎦ Isto é algo familiar, pois não? Trata-se da diferença que apareceu na eq. do observador entre o estado estimado e o estado da planta. Eis porque o controlador deste Lema é chamado de “controlador baseado em observador”. Ora, de (2$) vemos que seus autovalores são os de A + B2 F e os de A + LC2 . Isto prova a suficiência da condição do Lema. (Necessidade): Se ( A, B2 ) não for estabilizável ou se (C2 , A) não for detectável, a matriz de sistema dada em (2$) não será estável. • A esabilizabilidade e detectabilidade de ( A, B2 , C2 ) serão pressupostas no resto deste capítulo. Lema: Suponha que a realização “herdada” ⎡A G22 = ⎢ ⎣ C2 B2 ⎤ D22 ⎥⎦ (3) (3*) 31 seja estabilizável e detectável. Então o SMF da figura 34 é internamente estável se só se o da figura 35 o for: G22 y u K Figura 35 Ou por outras palavras, K estabiliza internamente G se só se estabilizar internamente G22 . Prova: Reportamo-nos à matriz de transferência da planta dada em (1), em que a primeira “linha” se refere à resposta controlada da planta, enquanto que a segunda “linha” é a que nos interessa, pois se refere à resposta realimentada da planta, que é a entrada do controlador K. Mas na segunda linha a coluna que nos interessa do ponto de vista da estabilidade é a segunda, uma vez que a primeira relaciona a resposta realimentada com o sinal exógeno, o qual não afeta a estabilidade da planta. • (4) Observação: Sabemos que uma realização de uma matriz não é única. Claro que outras realizações de G22 acima podem não ser estabilizáveis e/ ou detectáveis. Assim por exemplo, se G22 = ⎡ −1 1 ⎤ 1 =⎢ s + 1 ⎣ 1 0 ⎥⎦ é claro que esta é uma realização mínima, isto é, controlável e observável. E a fortiori é estabilizável e detectável. Mas a realização seguinte ⎡ −1 0 1 ⎤ 1 G22 = ⎢⎢ 0 1 0 ⎥⎥ = s +1 ⎢⎣ 1 0 0 ⎥⎦ nem é estabilizável nem detectável. 32 7.2 Dualidade e problemas especiais Nesta seção discutiremos quatro problemas, dos quais são obtidas as soluções para o sistema com realimentação da resposta. Como vimos, dizemos que os conceitos de controlabilidade (estabilizabilidade, respectivamente) e observabilidade (detectabilidade, respectivamente) são duais por causa da dualidade entre (C , A, B ) e ( BT , AT , C T ) , ou seja a primeira tripla é controlável (estabilizável) se a segunda for observável (detectável) e vice-versa. Este conceito de dualidade pode ser generalizado, como segue. Considere o diagrama de blocos padrão: z w G y u K Figura 36 Agora considere o sistema: z w GT u y KT Figura 37 Da figura 36 temos a matriz de transferência entre z e w dada por Y l (G , K ) = G11 + G12 K ( I − G22 K ) −1 G21 . Consequentemente, temos (Y l (G , K ))T = (G11 )T + (G21 )T ( I − K T (G22 )T ) K T (G12 )T −1 ( = (G11 )T + (G21 )T K T I − (G22 )T K T ) −1 (G12 )T . T ⎡ G11T ( s ) G21 (s) ⎤ ⎥. T T G ( s ) G ( s ) ⎣ 12 ⎦ 22 E portanto a matriz de transferência entre z e w da figura 37 é Por outro lado, G T ( s ) = ⎢ 33 T T Y l (G T , K T ) = G11T + G21 K T ( I − G22 K T ) −1 G12T ( s ) . Portanto, (Y l (G , K ))T P Y l (G T , K T ) E então é claro que K estabiliza internamente G se só se K T estabilizar internamente G T . Consideremos agora os quatro problemas mencionados antes. FI (“full information”) com a planta: ⎡ ⎢ ⎢ A GFI = ⎢⎢ C1 ⎢⎡ I ⎤ ⎢⎢ ⎥ ⎢⎣ ⎣0⎦ B1 D11 ⎡0⎤ ⎢ ⎥ ⎣I ⎦ ⎤ ⎥ B2 ⎥ D12 ⎥⎥ ⎡0⎤ ⎥ ⎢ ⎥⎥ ⎣0⎦ ⎥⎦ O nome “full information” fica claro quando se vê que a resposta realimentada da planta ⎡ x⎤ é y =⎢ ⎥. u ⎣ ⎦ FC (“full control”) com a planta: A B1 GFC = C1 C2 D11 D21 [I [0 [0 0] I] 0] A justificativa do nome fica clara em vista do fato que a resposta do controlador, u, entra diretamente na planta, sem passar pelas matrizes “ B2 ” e “ D2 ”. DF (“disturbance forward”) com a planta correspondente: GDF ⎡A = ⎢⎢ C1 ⎢⎣C2 B1 D11 I B2 ⎤ D12 ⎥⎥ 0 ⎥⎦ Agora é o sinal exógeno que entra diretamente. OE (“output estimation”) com a planta correspondente: 34 GOE ⎡A = ⎢⎢ C1 ⎢⎣C2 B1 D11 D21 B2 ⎤ I ⎥⎥ 0 ⎥⎦ Agora a saida do controlador entra diretamente na parte da planta que dá o sinal controlado, z. A seguir, temos Lema: Sejam GFI e GDF dados acima. Então, (5) ⎡ I 0 0⎤ (i) GDF ( s ) = ⎢ ⎥ GFI ( s ) , ⎣ 0 C2 I ⎦ (ii) GFI = S(GDF , PDF ) , onde S(⋅,⋅) é o produto estrelado, indicado no diagrama de blocos da figura 38 e PDF é dado também abaixo. GDF PDF Figura 38 PDF ( s ) = A − B1C2 B1 B2 0 0 I ⎡ I ⎤ ⎢ −C ⎥ ⎣ 2⎦ ⎡0⎤ ⎡0⎤ ⎢ I ⎥ ⎢0⎥ ⎣ ⎦ ⎣ ⎦ Prova: O Lema usa o “produto estrelado” de Redheffer. As ligações entre entradas e resposta é “arrevesada”, e isto tem implicações em termos de complicação das expressões, a saber: 35 ⎡ P11 ⎣ P21 Sejam P = ⎢ P12 ⎤ ⎡ K11 e K =⎢ ⎥ P22 ⎦ ⎣ K 21 K12 ⎤ . K 22 ⎥⎦ Então o produto estrelado de Redheffer é definido como ⎡ Y l ( P, K11 ) S ( P, K ) := ⎢ −1 ⎣ K 21 ( I − P22 K11 ) P12 ( I − K11P22 ) −1 K12 ⎤ ⎥. Y u ( K , P22 ) ⎦ A prova do Lema, bem como as dos resultados que se segume são omitidas, posto que • muito complicadas. (6) Teorema: Sejam GFI , GDF e PDF dados acima. Então, (i) K FI = K DF [C2 I ] estabiliza internamente GFI se K DF estabilizar internamente GDF . Alem disso, Y l ( GFI , K DF [C2 I ]) = Y l ( GDF , K DF ) . (ii) Suponha que A − B1C2 seja estável. Então K DF = Y l ( PDF , K FI ) (mostrada na figura 39) estabiliza internamente GDF se K FI estabilizar inernamente GFI . Alem disso, Y l ( GDF , Y l ( PDF , K FI ) ) = Y l ( GFI , K FI ) . u PDF yDF u ŷ K FI Figura 39 36 Vejamos agora a equivalência entre os problemas FC e OE, que aparecem na figura 40. z w GFC w z GOE u yFC K FC u yOE K OE Figura 40 Temos resultados semelhantes aos anteriores: Lema: Sejam GFC e GOE dados acima. Então, (7) ⎡I 0 ⎤ (i) GOE ( s ) = GFC ( s ) ⎢⎢0 B2 ⎥⎥ , ⎢⎣0 I ⎥⎦ (ii) GFC = S(GOE , POE ) , onde, A − B2C1 0 POE ( s ) = C1 0 C2 I [ I − B2 ] [0 I ] [ 0 0] Teorema: Sejam GOE , POE e GFC dados acima. (8) ⎡B ⎤ (i) K FC := ⎢ 2 ⎥ K OE estabiliza internamente GFC se K OE estabilizar internamente GOE . ⎣I ⎦ ⎛ ⎞ ⎡B ⎤ Alem disso, Y l ⎜ GFC , ⎢ 2 ⎥ K OE ⎟ = Y l ( GOE , K OE ) . ⎣I ⎦ ⎝ ⎠ (ii) Suponha que A − B2C1 seja estável. Então, K OE = Y l ( POE , K FC ) (figura 41) estabiliza internamente GOE se K FC estabilizar internamente GFC . Alem disso, Y l ( GOE , Y l ( POE , K FC ) ) = Y l ( GFC , K FC ) . 37 u y POE û ŷ K FC Figura 41 7.3 Parametrização de todos os controladores estabilizadores Considere novamente o diagrama de blocos padrão da figura 34, repetida abaixo z w G y u K Figura 34 bis onde, como vimos ao início do capítulo, G é definido como ⎡A ⎡ G11 ( s ) G12 ( s ) ⎤ ⎢ G (s) = ⎢ ⎥ = ⎢ C1 ( ) ( ) G s G s ⎣ 21 ⎦ ⎢C 22 ⎣ 2 B1 D11 D21 B2 ⎤ D12 ⎥⎥ D22 ⎥⎦ Supomos, como antes, que ( A, B2 ) é estabilizável e (C2 , A) é detectável. Nosso objetivo nesta seção é resolver o seguinte problema: dada a planta G, parametrizar todos os controladores K que estabilizam internamente G. A parametrização de todos os controladores estabilizadores é chamada usualmente de “parametrização de Youla”. Como visto antes, os controladores estabilizadores dependem somente de G22 . Suponhamos primeiramente que a planta G seja estável. Teorema (9) 38 Suponha que G ∈ RH ∞ . Então, o conjunto de todos os controladores estabilizadores pode ser dado por K = Q( I + G22Q) −1 , onde Q ∈ RH ∞ , I + D22Q(∞) não singular. Prova: Do diagrama de blocos, temos y = G21w + G22u , u = Ky = KG21w + KG22u ∴ u = ( I − KG22 ) −1 KG21w . A estabilidade fica definida pelos zeros de I − KG22 , ou seja, ( I − KG22 ) −1 tem que ser estável. Substituindo K dado acima, temos ( I − KG22 ) −1 = ( I − Q( I + G22Q) −1 G22 ) = ( I − QG22 ( I + QG22 ) −1 ) −1 ( = ( I + QG22 − QG22 )( I + QG22 ) −1 ) −1 −1 = I + QG22 ∈ RH ∞ , estabelecendo a suficiência da condição Por outro lado, suponha que K seja um controlador estabilizador. Vimos no capítulo (?) que −1 −K ⎤ ⎡ I Estabilidade interna ⇔ ⎢ ∈ RH ∞ . Mas o elemento (1,2) desta matriz é, I ⎥⎦ ⎣ −G22 como vimos, K ( I − G22 K ) −1 . Definamos Q := K ( I − G22 K ) −1 ∴ Q − QG22 K = K ∴ ( I + QG22 ) K = Q ∴ K = ( I + QG22 ) −1 Q = Q( I + G22Q) −1 E observe-se que a invertibilidade na última eq. é garantida pelo fato de o SMF ser bem posto, visto que I + D22Q (∞ ) = ( I − D22 K (∞ )) −1 . • Quando G não é estável, a parametrização é mais complicada. Mais adiante, neste capítulo, daremos a prova do respectivo teorema usando o método das fatorações coprimas, que foi o método usado por Youla, que deu o nome a esta parametrizacao. Por ora, temos o resultado usando as matrizes das eqs. de estado: (10) Teorema: Sejam F e L tais que A + LC2 e A + B2 F são estáveis. Então, todos os controladores que estabilizam G no SMF podem ser parametrizados como a matriz de transferência entre y e u na figura abaixo: 39 u y J Q Figura 42 onde J é dado por ⎡ A + B2 F + LC2 + LD22 F J = ⎢⎢ F ⎢⎣ −(C2 + D22 F ) − L B2 + LD22 ⎤ ⎥ 0 I ⎥ I − D22 ⎥⎦ com qualquer Q ∈ RH ∞ tal que I + D22Q(∞) seja não singular. A prova deste teorema segue os mesmos passos do anterior, mas não dá muita compreensão do problema. No que se segue, é apresentada uma nova (à época da edição do livro) abordagem, reduzindo o problema de realimentação da resposta a problemas mais simples como o FI e OE, ou FC e DF Controladores estabilizadores para os problemas FI e FC Vamos examinar primeiramente a estrutura FI, conforme a figura 43 abaixo z GFI yFI w u K FI Figura 43 onde, como vimos, 40 ⎡ ⎢ ⎢ A GFI = ⎢⎢ C1 ⎢⎡ I ⎤ ⎢⎢ ⎥ ⎢⎣ ⎣0⎦ B1 D11 ⎡0⎤ ⎢ ⎥ ⎣I ⎦ ⎤ ⎥ B2 ⎥ D12 ⎥⎥ ⎡0⎤ ⎥ ⎢ ⎥⎥ ⎣0⎦ ⎥⎦ Queremos obter a classe de todos os compensadores K FI que estabilizam GFI no SMF. E obtemos um resultado bastante simples: (11) Lema: Seja F uma matriz constante tal que A + B2 F seja estável. Então a classe de todos os compensadores para o problema FI pode ser parametrizada por K FI ( s ) = [ F Q( s ) ] , com qualquer Q( s ) ∈ RH ∞ . Prova: imediata: com efeito, conforme a expressao de GFI acima, ⎡I ⎤ yFI = ⎢ ⎥ ( sI − A) −1 B2u . ⎣0 ⎦ • Agora consideramos o problema dual do anterior, o FC, dado na figura 44 abaixo: z GFC yFC w u K FC Figura 44 (12) Lema Seja L uma matriz constante tal que A + LC2 é estável. Então a classe de todos os ⎡ L ⎤ controladores estabilizadores pode ser parametrizada por K FC ( s ) = ⎢ ⎥ , Q ( s ) ∈ RH ∞ ⎣Q ( s ) ⎦ e de resto qualquer. Controladores estabilizadores para problemas DF e OE No caso do problema DF temos o diagrama de blocos da fig. 45 abaixo. 41 z GDF yDF w u K DF Figura 45 Recorda-se que a matriz de transferência acima é: GDF ⎡A = ⎢⎢ C1 ⎣⎢C2 B1 D11 I B2 ⎤ D12 ⎥⎥ 0 ⎦⎥ Obtem-se o seguinte resultado, com a restrição que A − B1C2 seja estável. Esta hipótese é feita para simplificar, ela não é necessária para a solução do problema. (13) Lema Supondo que A − B1C2 seja estável, todos os controladores estabilizadores para o problema DF podem ser caracterizados por K DF = Y l ( J DF , Q ) , com Q ∈ RH ∞ e J DF ⎡ A + B2 F − B1C2 F = ⎢⎢ ⎢⎣ − C2 B1 0 I B2 ⎤ I ⎥⎥ 0 ⎥⎦ Prova: ZDG, p. 315. E passamos ao dual do problema anterior, o OE. O diagrama de blocos correspondente está na figura 46 abaixo: z GOE yOE w u K OE Figura 46 42 Agora suporemos que A − B2C1 seja estável. Tal como no problema anterior, esta hipótese é feita para simplificar, ela não é necessária para a solução do problema. (14) Lema: Suponha que A − B2C1 seja estável. Então todos os controladores estabilizadores para o problema OE podem ser caracterizados como Y l ( J OE , Q0 ) , com Q0 ∈ RH ∞ e J OE dado por: ⎡ A − B2C1 + LC2 L − B2 ⎤ J OE = ⎢⎢ C1 I ⎥⎥ 0 ⎢⎣ I − C2 0 ⎥⎦ Prova: ZDG, p. 316 Realimentação da resposta e separação: A partir do que foi visto agora, pode-se demonstrar o Teorema (10), cuja prova é dada, como dito, por ZDG, pp. 317s. Observação: O Teorema (10) mostra que qualquer controlador estabilizador K(s) pode ser caracterizado como uma LFT de um parâmetro matricial Q ∈ RH ∞ , isto é, (15) K ( s ) = Y l ( J , Q ) . Mais ainda, usando os argumentos (omitidos neste texto, mas encontrados em ZDG no local indicado) do Lema (13), uma realização de Q( s ) em termos de K(s) pode ser obtida como Q = Y l Jˆ , K , ( ) onde ⎡ A Jˆ = ⎢⎢ − F ⎢⎣ C2 −L 0 I B2 ⎤ I ⎥⎥ D22 ⎥⎦ e K(s) tem realização estabilizável e detectável. 7.4 Estrutura da parametrização do controlador Recordando o que fizemos: começamos com uma realização estabilizável e detectável de G22 : 43 ⎡A G22 = ⎢ ⎣ C2 B2 ⎤ D22 ⎥⎦ Escolhemos F e L tais que A + B2 F e A + LC2 são estáveis. Definimos J pela fórmula do Teorema (10), que repetimos aqui: ⎡ A + B2 F + LC2 + LD22 F J =⎢ F ⎢ −(C2 + D22 F ) ⎣⎢ −L B2 + LD22 ⎤ 0 I I − D22 ⎥ ⎥ ⎦⎥ Então os K’s próprios que estabilizam internamente o SMF são preciasamente aqueles da Figura 47 abaixo Figura 47 com K = Y l ( J , Q ) , Q ∈ RH ∞ e I + D22Q(∞) , não singular. É fato interessante que na figura acima, o que está dentro do tracejado é um controlador estabilizador baseado em observador, caracterizado pelo fato de que não somente y, mas também u, são entradas para o controlador. O resultado acima também sugere outra interpretação interessante: toda estabilização interna consiste em adicionar dinâmicas estáveis à planta e então estabilizar a planta aumentada por meio de um observador. O resultado preciso desta afirmação é dado pelo Teorema (16) abaixo, onde, para simplificar os cálculos, e sem perda de generalidade, supomos que G22 e K são estritamente próprias. 44 Teorema: (16) Suponha que G22 e K sejam estritamente próprias e que o sistema da figura 34, repetida abaixo, seja internamente estável. Então o sistema pode ser embutido (“imbedded”) em um sistema ⎡ Ae ⎢C ⎣ e Be ⎤ , com 0 ⎥⎦ ⎡A 0 ⎤ Ae = ⎢ ⎥, ⎣ 0 Aa ⎦ ⎡B ⎤ Be = ⎢ 2 ⎥ , ⎣0⎦ Ce = [ C 2 0] , Aa estável e K ⎡ A + Be Fe + LeCe K =⎢ e Fe ⎣ − Le ⎤ 0 ⎥⎦ onde Ae + Be Fe e Ae + LeCe são estáveis. Prova: Repetimos a figura 34: z w G y u K Figura 34 ter K pode ser representado pela figura 47 para algum Q ∈ RH ∞ . Para que K seja estritamente própria, Q tem que ser também estritamente própria. Considere uma realização mínima de Q: ⎡A Q=⎢ a ⎣ Ca Ba ⎤ 0 ⎥⎦ Como Q ∈ RH ∞ , então Aa é estável. Sejam x e xa vetores de estado correspondentes a J e Q, respectivamente. As eqs. do sistema da figura 47 são: x = ( A + B2 F + LC2 ) x − Ly + B2 y1 , u = Fx + y1 , u1 = −C2 x + y . 45 Por outro lado, xa = Aa xa + Ba u1 y1 = Ca xa . Definamos: ⎡x⎤ ⎡ L ⎤ xe := ⎢ ⎥ , Fe := [ F Ca ] , Le := ⎢ ⎥ ⎣ xa ⎦ ⎣ − Ba ⎦ As eqs. acima nos levam a xe = ( Ae + Be Fe + LeCe ) xe − Le y , u = Fe xe . • 7.5 Matriz de transferência do SMF Lembra-se que o SMF entre w e z é uma LFT, Y l ( G , K ) , e que K estabiliza G se só se estabilizar G22 . Ora, da figura 47 obtemos a figura 48, definindo tudo o que não é Q como T de acordo com z = Y l ( G, K ) w = Y l ( G, Y l ( J , Q) ) w = Y l (T , Q ) w . z w T Q Figura 48 . Uma realização de T é dada pelo (17) Teorema: Sejam F e L tais que A + BF e A + LC sejam estáveis. Então, o conjunto de todas as matrizes de transferência de w para z que podem ser obtidas com um contralador estabilizador próprio é igual a Y l (T , Q ) = {T11 + T12QT21 : Q ∈ RH ∞ , I + D22Q (∞) tem inversa} , onde T é dada por ⎡T T = ⎢ 11 ⎣T21 ⎡ A + B2 F 0 T12 ⎤ ⎢⎢ = ⎥ T21 ⎦ ⎢C1 + D12 F ⎢ 0 ⎣ − B2 F A + LC2 B1 B1 + LD21 − D12 F D11 C2 D21 B2 ⎤ 0 ⎥⎥ D12 ⎥ ⎥ 0 ⎦ 46 Prova: A prova é, segundo ZDG, p. 323, “imediata” usando o produto estrelado no espaço de estado, “com alguma álgebra tediosa”. 7.6 Parametrização de Youla através de fatorações coprimas. Damos agora o que foi anunciado algumas páginas antes: Teorema: Sejam G22 = NM −1 = M −1 N , fatorações c.d. e c.e., respectivamente, sobre (18) RH ∞ . Sejam U 0 ,V0 , U 0 e V0 ∈ RH ∞ e tais que satisfaçam a identidade de Bezout: ⎡ V0 −U 0 ⎤ ⎡ M U 0 ⎤ ⎡ I 0 ⎤ ⎢ ⎥⎢ ⎥=⎢ ⎥ . (A existência de U 0 , V0 , U 0 e V0 ∈ RH ∞ satisfazendo a ⎣ − N M ⎦ ⎣ N V0 ⎦ ⎣0 I ⎦ esta igualdade é garantida pelo fato de NM −1 = M −1 N serem fatorações coprimas). Então o conjunto de todos os compensadores estabilizadores é parametrizado por uma das duas fórmulas seguintes: (18a) K = (U 0 + MQr )(V0 + NQr ) −1 , det( I + V0−1 NQr )(∞) ≠ 0, Qr ∈ RH ∞ , K = (V0 + Ql N ) −1 (U 0 + Ql M ), det( I + Ql NV0 −1 )(∞) ≠ 0, Ql ∈ RH ∞ . (18b) Como Qr e Ql têm a mesma dimensão, nada impede de igualá-los, uma vez que são arbitrários, a menos das condições det( I + V0−1 NQr )(∞) ≠ 0 e det( I + Ql NV0 −1 )(∞) ≠ 0 , as quais são equivalentes, isto é, uma ocorre se só se a outra ocorrer. Então, definindo Qy := Qr = Ql , temos K = (U 0 + MQy )(V0 + NQy ) −1 = (V0 + Qy N ) −1 (U 0 + Qy M ) = Y l ( J y , Qy ) , ⎡U V −1 V0−1 ⎤ onde J y = ⎢ 0 −01 ⎥. V0−1 N ⎦ ⎣ V0 (18c) (18d) Prova: Vamos provar (18a), a prova da outra sendo dual. Primeiramente, vamos provar que se K for da forma (18a), estabiliza o SMF e é própria. Sejam definidos U := U 0 + MQr , V := V0 + NQr , que são o numerador e denominador, respectivamente, de (18a). Ora, MV − NU = M (V0 + NQr ) − N (U 0 + MQr ) = MV0 − NU 0 + ( MN − NM )Qr = I , o que prova que K estabiliza o SMF e é própria, pois det( I + V0−1 NQr )(∞) ≠ 0 . Agora vamos provar que se K for própria e estabilizar o SMF, então tem a forma de (18a). Seja K = UV −1 , uma fatoração c.d. em RH ∞ . Então, Z := MV − NU tem inversa em RH ∞ porque K estabiliza o SMF. Definamos Qr pela equação: U 0 + MQr = UZ −1 , ou seja, Qr = M −1 (UZ −1 − U 0 ) . Então, usando a identidade de Bezout, temos (19) 47 V0 + NQr = V0 + NM −1 (UZ −1 − U 0 ) = V0 + M −1 N (UZ −1 − U 0 ) = M −1 ( MV0 − NU 0 + NUZ −1 ) = M −1 ( I + NUZ −1 ) = M −1 ( Z + NU ) Z −1 = M −1MVZ −1 = VZ −1 . Portanto K = UV −1 = (U 0 + MQr )(V0 + NQr )−1 . Para ver que Qr ∈ RH ∞ , note que, como observado, Z tem inversa em (20) RH ∞ e portanto, de (19), MQr ∈ RH ∞ e de (20) vemos que NQr ∈ RH ∞ . Ora, Qr = (V0 M − U 0 N )Qr = V0 MQr − U 0 NQr ∈ RH ∞ . • E temos o Corolário imediato: Corolário: (21) Seja um controlador admissível (isto é que estabiliza o SMF e é próprio) K com as fatorações coprimas K = UV −1 = V −1U . Então o parâmetro livre Qy ∈ RH ∞ na parametrização de Youla é dado por Qy = M −1 (UZ −1 − U 0 ) , onde Z = MV − NU . O teorema seguinte dá a relação entre a parametrização acima, de Youla, e a que foi obtida nas seções anteriores, utilizando LFT´s. Teorema: Sejam as fatorações coprimas de G22 tais que ⎡M ⎢N ⎣ ⎡ V0 ⎢ ⎣− N ⎡ A + B2 F U0 ⎤ ⎢ = F V0 ⎥⎦ ⎢ ⎢⎣C2 + D22 F ⎡ A + LC2 −U 0 ⎤ ⎢ F ⎥= M ⎦ ⎢ ⎢⎣ C2 B2 I D22 (22) −L⎤ 0 ⎥⎥ I ⎥⎦ −( B2 + LD22 ) L ⎤ I 0 ⎥⎥ − D22 I ⎥⎦ onde F e L são escolhidos tais que A + B2 F e A + LC2 são estáveis. Então, pode-se verificar que ⎡ A + B2 F + LC2 + LD22 F J y = ⎢⎢ F ⎢⎣ −(C2 + D22 F ) − L B2 + LD22 ⎤ ⎥ 0 I ⎥ ⎥⎦ 0 I Prova: segue de álgebra “tediosa”, segundo ZDG, p. 326. Observação: (23) −1 J y acima é o mesmo J do Teorema (10) e K 0 := U 0V0 é um controlador estabilizador baseado em observador com 48 ⎡ A + B2 F + LC2 + LD22 F K 0 := ⎢ F ⎣ −L⎤ 0 ⎥⎦ 8º. Capítulo: Equações algébricas de Riccati As eqs. algébricas de Riccati (abreviada ARE, “algebric Riccati equations”) têm várias aplicações em problemas de síntese de Controle. De modo particular, elas têm um papel central na solução dos problemas de controle ótimo em H 2 e H ∞ . Sejam A, Q, e R matrizes reais, n × n, sendo Q e R simétricas. Então, a ARE em X é definida por A* X + XA + XRX + Q = 0 . (1) Associemos a esta equação a matriz ⎡A R ⎤ . H := ⎢ *⎥ ⎣Q − A ⎦ (2) (Uma matriz desta forma é chamada de hamiltoniana). Esta matriz será usada para obtermos as soluções de (2). Observe-se que σ ( H ) , o spectrum de H, é simétrico em relação ao eixo imaginário. Para ver isto, considere a seguinte matriz 2n × 2n ⎡0 − I ⎤ , a qual satisfaz à propriedade J 2 = − I ∴ J −1 = − J . J := ⎢ ⎥ ⎣I 0 ⎦ Temos então J −1 HJ = − JHJ = − H * . Consequentemente, H e − H * são similares, o que implica que λ é um autovalor de H se só se −λ o for. Para nosso curso estamos interessados somente nas chamadas soluções estabilizadoras das ARE’s. (Ver logo abaixo a definição). Para a solução geral, o leitor interessado poderá ver, entre outros textos, ZDG, pp.328-333. 8.1 Soluções estabilizadoras e o Operador de Riccati Nesta seção veremos quando uma solução da eq. de Riccati é dita estabilizadora, isto é, quando σ ( A + RX ) ⊂ C− . (Observe-se a notação que é padrão: σ (⋅) é o spectrum de uma matriz, isto é, o conjunto de seus autovalores; para valores singualares, usa-se σ i (⋅) , indicando o i-ésimo valor singular, ou σ (⋅) , que indica o maior valor singular e σ (⋅) , que indica o menor valor singular). 49 Suponha que H, definida em (2), não tenha autovalor no eixo imaginário. Então terá n autovalore em Re[s] > 0 e outros tantos autovalores em Re[s] < 0, simétricos com relação ao eixo imaginário. Definamos os espaços invariantes X − ( H ) e X + ( H ) , o primeiro correspondendo a autovalores em Re[s] < 0 da matriz H e o segundo correspondendo a autovalores em Re[s] > 0. ⎡1 0 ⎤ ⎧0⎫ ⎧1 ⎫ . Então, X − ( H ) = ⎨ ⎬ e X + ( H ) = ⎨ ⎬ . A título de exemplo, seja H = ⎢ ⎥ ⎣0 −1⎦ ⎩ −1⎭ ⎩0 ⎭ ⎡1 a ⎤ ⎡1 0 ⎤ Observe-se que teremos os mesmos espaços se H = ⎢ ou H = ⎢ ⎥ ⎥ . É fácil, ⎣0 −1⎦ ⎣ a −1⎦ com efeito, verificar que por “operações elementares”, os dois espaços geram qualquer destas matrizes. X − ( H ) é por definição um espaço invariante com relação ao operador H (que no caso é uma matriz) se H (X − ( H )) ⊂ X − ( H ) ; ou seja, aplicando-se o operador ao espaço, fica-se ⎧1 ⎫ dentro do espaço. Assim, por exemplo, o espaço gerado pelo vetor x = ⎨ ⎬ é invariante ⎩0 ⎭ ⎡a b⎤ com relação a qualquer matriz A da forma A = ⎢ ⎥ , com a, b e c números reais ⎣0 c ⎦ ⎧a ⎫ quaisquer. Com efeito, Ax = ⎨ ⎬ . (Estamos distinguindo aqui a notação de vetor para ⎩0 ⎭ aquela de matrix coluna; frequentemente estas notações são confundidas). Seja uma base para X − ( H ) , consideremos cada vetor da base como matriz coluna e coloquemos um ao lado do outro. Definamos as matrizes X 1 e X 2 , ambas pertencentes a Cn×n (mas a base pode ser sempre escolhida de modo que estas matrizes sejam reais) e ⎡X ⎤ ⎡X ⎤ tais que X − ( H ) = Im ⎢ 1 ⎥ , onde “Im” significa o espaço gerado pelo argumento ⎢ 1 ⎥ . ⎣X2 ⎦ ⎣X2 ⎦ As matrizes X 1 e X 2 têm o mesmo número de linhas, conforme a partição da matriz H. ⎡0 ⎤ Se X 1 for não singular, ou equivalentemente se X − ( H ) e Im ⎢ ⎥ forem ⎣I ⎦ complementares, definamos X := X 2 X 1−1 . Pode-se provar que X é unicamente determinada por H. Denominemos “Ric” a função que leva de H a X e “dom(Ric)” o conjunto das matrizes hamiltonianas H com duas propriedades já mencionadas, a saber, H não tem autovalor no eixo imaginário e os dois espaços mencionados acima são complementares. Estas propriedades serão chamadas de “propriedade de estabilidade” e “propriedade de complementaridade”, respectivamente da matriz H. E a solução correspondente da eq. de Riccati será chamada de “solução estável”. Temos X = Ric(H) e Ric : dom( Ric) ⊂ R 2 n×2 n → R n×n . 50 Os resultados “bem conhecidos” (segundo ZDG) seguintes dão algumas propriedades de X bem como condições para que H pertença a dom(Ric). (3) Teorema: Suponha que H ∈ dom( Ric) e X = Ric(H). Então, (i) X é real e simétrica; (ii) X satisfaz à ARE: AT X + XA + XRX + Q = 0 ; (iii) A + RX é estável. (1bis) Prova: ZDG, pp. 334s (4) Teorema Suponha que H não tenha autovalor imaginário e que R seja ou positiva semidefinida ou negativa semidefinida. Então, H ∈ dom( Ric) se só se (A, R) for estabilizável. Prova: ZDG, pp. 335s Uma situação que ocorre com frequência é a da matriz H dada no enunciado do teorema seguinte: (5) Teorema ⎡ A − BB ⎤ . Então, H ∈ dom( Ric) se só se (A, Suponha que H tenha a forma H = ⎢ T T ⎥ ⎣ −C C − A ⎦ B) for estabilizável e (C, A) não tiver modo inobservável no eixo imaginário. Alem disso, X = Ric(H) ≥ 0 (ou seja, é positiva semidefinida) se H ∈ dom(Ric) e Ker( X ) = 0 se só se (C, A) não tiver modos inobserváveis estáveis. T (Note-se que Ker( X ) ⊂ Ker(C ) ). Prova do Teorema (5): ZDG, pp. 337s Exemplo: (6) Este exemplo mostra que a observabilidade de (C, A) não é condição necessária para a existência de uma solução estabilizadora positiva definida: ⎡1 0 ⎤ ⎡1⎤ A=⎢ , B = ⎢ ⎥ e C = [ 0 0] . É fácil verificar que ( A, B) é estado-estabilizável e ⎥ ⎣0 2 ⎦ ⎣1⎦ ⎡ 18 −24 ⎤ (C, A) não é detectável. Enretanto, X = ⎢ ⎥ > 0 é a solução estabilizadora. ⎣ −24 36 ⎦ ⎡1 0 ⎤ ⎡1⎤ ⎡ −1 −1⎤ Com efeito, R = − BBT = − ⎢ ⎥ [1 1] = ⎢ , A + RX = ⎢ ⎥+ ⎥ ⎣1⎦ ⎣ −1 −1⎦ ⎣0 2 ⎦ ⎡ −1 −1⎤ ⎡ 18 −24 ⎤ ⎢ −1 −1⎥ ⎢ −24 36 ⎥ = ⎣ ⎦⎣ ⎦ ⎡1 0 ⎤ ⎡6 −12 ⎤ ⎢0 2 ⎥ + ⎢6 −12 ⎥ = ⎣ ⎦ ⎣ ⎦ ⎡7 −12 ⎤ ⎢ 6 −10 ⎥ , cujos autovalores são dados ⎣ ⎦ 51 ⎛ ⎡λ 0 ⎤ ⎡ 7 −12 ⎤ ⎞ 2 pelas raízes do polinômio característico: det ⎜ ⎢ −⎢ ⎟ = λ + 3λ + 2 , que é ⎥ ⎥ ⎝ ⎣ 0 λ ⎦ ⎣ 6 −10 ⎦ ⎠ um polinômio Hruwitz, pois polin. do 2º. grau com todos os coeficientes com o mesmo sinal são Hurwitz. (7) Corolário: Suponha que ( A, B) seja estabilizável e (C, A) detectável. Então a eq. de Riccati AT X + XA − XBBT X + C T C = 0 tem uma única solução positiva definida. Além disso, esta solução é estabilizadora. Prova: ZDG, p. 339. 8.2 Funções positivas reais Definição: (9) Uma matriz quadrada G ( s ) ∈ RH ∞ é dita real positiva (RP) se G ( jω ) + G ∗ ( jω ) ≥ 0 para todo ω ∈ R . A função é dita estritamente real positiva (ERP) se G ( jω ) + G ∗ ( jω ) > 0 para todo ω ∈ R . Antes de enunciar o próximo teorema, relembramos a notação padrão: G ~ ( s ) = GT (− s ) . (10a) Teorema Seja ⎡ ⎤ G ( s) = ⎢ A B ⎥ ⎣⎢C D ⎦⎥ com A estavel, uma realização que não é necessariamente mínima. Suponha que existam X ≥ 0, Q e R tais que XA + AT X = −QT Q , B T X +W TQ = C , D + DT = W T W . Então, G ( s ) é RP e G ( s ) + G ~ ( s ) = M ~ ( s ) M ( s ) , (10b) (10c) (10d) onde ⎡A B⎤ M (s) = ⎢ ⎥ ⎣Q W ⎦ . Alem disso, se M ( jω ) tiver posto de coluna cheio para todo ω real, então G ( s ) é estritamente positiva real. Prova: ZDG, p. 362 52 8.3 Funções “inner” Definição: (11) ~ Uma matriz de transferência N é chamada “inner” se N ∈ RH ∞ e N N = I . Uma função de transferência N é chamada “co-inner” se N ∈ RH ∞ e NN ~ = I . As duas noções são claramente duais, isto é, N é “inner” se só se N T for “co-inner”. Definição: (12) Uma matriz de transferência N ∈ RL∞ é chamada passa-tudo (“all pass”) se for quadrada e N~N = I . É claro que uma função “inner” quadrada é passa-tudo. Observe-se que se uma matriz for inner, ela terá pelo menos tantas linhas quanto colunas. Se N for inner, com m colunas, para qualquer q ∈C m (um vetor complexo), temos Nq = q , porque N ( jω )∗ N ( jω ) = I . E pela mesma razão, se v ∈ L2 , temos Nv 2 = v 2 . Por causa desta propriedade de preservação da norma, as funções inner têm muita aplicação nos problemas de síntese em controles. (12*) Lema Seja ⎡A B⎤ N =⎢ ⎥ ∈ RH ∞ ⎣C D ⎦ e uma matriz X = X * ≥ 0 tal que A* X + XA + C *C = 0 . Então, (a) D*C + B* X = 0 implica N ~ N = D* D . (b) (A, B) controlável e N ~ N = D* D implicam D*C + B* X = 0 . Prova: Da definição de N ~ , temos ⎡ − A* N ~ ( s) = N T (− s) = ⎢ * ⎣B −C * ⎤ ⎥ D* ⎦ Utilizando a fórmula do produto de matrizes de transferência (matrizes em cascata), temos 53 ⎡ A N ~ N = ⎢⎢ −C *C ⎢⎣ D*C 0 − A* B* B ⎤ −C * D ⎥⎥ D* D ⎥⎦ Apliquemos a esta matriz de transferência uma transformação de similaridade (que sabemos que não a altera): ⎡ I ⎢− X ⎣ ⎡ I ⎢− X ⎣ 0⎤ ⎡ A 0 ⎤ ⎡ I 0⎤ ⎡ A 0 ⎤ = ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ I ⎦ ⎣ −C *C − A* ⎦ ⎣ X I ⎦ ⎣ − XA − C *C − A* X − A* ⎥⎦ 0⎤ ⎡ B ⎤ ⎡ B ⎤ ⎡ I 0⎤ * * , ⎡ D*C B* ⎤⎦ ⎢ =⎢ ⎥ ⎢ ⎥ = ⎡⎣ D C + B X ⎤⎦ . * ⎥ * ⎥ ⎣ I ⎦ ⎣ −C D ⎦ ⎣ − XB − C D ⎦ X I ⎣ ⎦ Donde, A 0 ⎡ ⎢ * * N N = ⎢ −C C − A X − XA − A* ⎢⎣ B* X + D*C B* ~ B ⎤ * ⎥ − XB − C D ⎥ D* D ⎥⎦ Mas por hipótese (enunciado do Lema), o elemento (2,1) da matriz “A” acima é nulo, donde A ⎡ ⎢ 0 N N =⎢ ⎢⎣ B* X + D*C ~ 0 − A* B* B ⎤ * ⎥ − XB − C D ⎥ D* D ⎥⎦ Ora, se (a), isto é, se D*C + B* X = 0 , então −1 0 ⎤ ⎡B⎤ ⎡ sI − A N N = ⎣⎡0 B ⎦⎤ ⎢ + D* D = D* D . *⎥ ⎢ ⎥ sI + A ⎦ ⎣ 0 ⎦ ⎣ 0 ~ * Se (b), usando o critério PBH do posto, então não há cancelamento nem em ( sI − A) −1 B nem em B* ( sI + A* ) −1 , donde a conclusão. • Observação: Este lema conduz imediatamente à caracterização de matrizes “inner” em termos de suas representações no espaço de estado: acresecente-se simplemente a condição D* D = I ao último Lema anterior para se obter N ~ N = I . Observe-se ainda que na condição A* X + XA + C *C = 0 do enunciado do Lema, X é o gramiano de observabilidade. Em vista destas duas observações e do Lema anterior, temos imediatamente: Corolário: (13) 54 Suponha que N ⎡A B⎤ ⎥ seja estável e mínima. ⎣C D ⎦ =⎢ Seja X o gramiano de observabilidade. Então N é inner se só se (a) DT C + BT X = 0 , (b) DT D = I . 8.4 Fatorações “inner” O livro aborda este tema de modo abrangente, incluindo as fatorações “outer”. Aqui nos limitamos ao seguinte resultado: (13*) Teorema: ⎡A B⎤ G=⎢ ⎥ seja própria ⎣C D ⎦ e que (C, A) seja detectável. Então existe uma fatoração coprima G = M −1 N tal que M é “inner” se só se G não tiver polo no eixo imaginário. Uma realização particular no espaço de estado destes fatores é ⎡⎣ M ⎡ A + LC N ⎤⎦ = ⎢ ⎣ C L B + LD ⎤ I D ⎥⎦ ⎡ A* onde L = −YC * e Y = Ric ⎢ ⎣0 −C *C ⎤ ⎥ ≥ 0. −A ⎦ 8.5 Fatorações coprimas normalizadas (14) Definição: −1 Sejam N , M ∈ RL∞ , G = NM , uma fatoração c.d. Esta fatoração é dita normalizada se M ~M + N ~ N = I , ⎡M ⎤ ou seja, se ⎢ ⎥ for inner. ⎣N⎦ De modo semelhante, G = M −1 N é uma fatoração c.e. normalizada se ⎡⎣ M N ⎤⎦ for coinner. O livro apresenta um teorema sobre isso, com enunciado enorme, de quase uma página (ZDG, pp. 370s) 55 9º. Capítulo: Controle ótimo H 2 9.1 Introdução ao problema do Regulador Neste capitulo trataremos de problema bastante comum na prática do controle ótimo com um critério de desempenho quadrático, que logo adiante será pecisado. Considere o sistema dinâmico: (1) x = Ax + B2u, x(t0 ) = x0 , onde x0 é dado (arbitrário). Nosso objetivo é achar um controle u (t ) definido em [0, T], o qual pode ser uma função do estado x(t ) , tal que o estado do sistema seja levado para uma (pequena) vizinhança da origem do espaço de estado em um tempo T. Este é o chamado Problema do Regulador. Sabemos que este problema tem solução par qualquer T > t0 se o sistema for controlável. Mas isto é verdade somente se o controle puder ser arbitrariamente grande. Ora, este não é o caso em problemas reais, evidentemente, não somente por limitações de potência, mas também porque um sistema submetido a grandes esforços deixa de operar na faixa de linearidade, eventualmente “queimando”, ou “explodindo”. Consequentemente, os controles devem ser submetidos a restrições na maioria dos problemas reais. As restrições nos problemas de controle podem ser medidas de muitos modos como por exemplo através de T T ∫ t 0 u dt , ∫ t 2 u dt e supt∈[t0 ,T ] u , que são as normas L1 , L2 e L∞ , respectivamente. 0 E podemos ponderar o controle através de “pesos”, que são matrizes no caso multivariável: T ∫ t T Wu u dt , 0 ∫t W u 2 dt e supt∈[t 0 ,T ] u Wu u . 0 E também é frequente desejar-se impor restrições no estado, de modo especial no transiente, de modo que não haja um “overshoot” grande: T ∫ t 0 T Wx x dt , ∫t W x x 2 dt e supt∈[t0 ,T ] Wx x . 0 Neste texto nos concentraremos no regulador de tempo infinito, isto é quando T → ∞ . Na prática, T → ∞ significa T “muito grande”, o que ocorrre com bastante frequência nos problemas reais. Efetivamente, se o regime transitório for relativamente curto, chegase usualmente ao regime permanente ( T → ∞ ) em tempo médio e até rápido. Nosso problema é então o seguinte: Achar o controle u (t ) definido em [0, ∞) tal que o estado x(t ) seja levado à origem do espaço de estado em t → ∞ e de tal modo que o seguinte índice de desempenho seja minimizado (ou maximizado, bastando inverter o sinal algébrico): 56 ∞ T ⎡ x(t ) ⎤ ⎡ Q S ⎤ (2) min u ∫ ⎢ ⎥ ⎢ T dt , u (t ) ⎦ ⎣ S R ⎥⎦ 0 ⎣ onde supomos Q = QT e R = RT > 0 . Este problema é chamado usualmente problema do regulador linear quadrático (LQR = linear quadratic regulator). ⎡Q S⎤ De modo geral, supõe-se também que ⎢ T (3) ≥0. R ⎥⎦ ⎣S Como R é positiva definida, tem uma raiz quadrada, R1/ 2 , que também é positiva definida. Substituindo u ← R1/ 2u , podemos fazer R =I . Mais ainda, podemos supor S = 0, usando uma pré-realimentação do estado u = − S T x + v . Mas não faremos esta hipótese no que se segue. Como (3) é positiva semi-definida, com R=I, podemos fatorar: ⎡ Q S ⎤ ⎡ CT ⎤ (4) ⎢ T ⎥ = ⎢ 1T ⎥ ⎡⎣C1 D12 ⎤⎦ . I ⎦⎥ ⎢⎣ D12 ⎥⎦ ⎣⎢ S Com isto, (2) pode ser re-escrita como min u∈L2 [0,∞ ) C1 x + D12u 2 . 2 Efetivamente, o problema LQR é definido tradicionalmente como ⎧⎪min u∈L [0,∞ ) C1 x + D12u 2 2 2 . ⎨ ⎪⎩ x = Ax + Bu , x(0) = x0 (5) (Observe-se a diferença de notação nesta e na eq. precedente com relação a (1)). Efetivamente, sendo o sistema invariante no tempo, a escolha do instante inicial é irrelevante). A definição do LQR acima não menciona que o estado deva ser levado à origem. Ao invés, colocam-se condições em Q, S e R (ou equilvalentemente em C1 e D12 ) de modo que o controle ótimo tenha esta propriedade. Vejamos um exemplo simples para entender isto: A = B = R = 1, Q = S = 0. Portanto, o problema é ∞ min u∈L2 [0,∞ ) ∫ u 2 dt , x = x + u, x(0) = x0 . 0 É claro que a solução deste problema é u = 0. Porem, com esta solução o sistema é instável, pois o estado diverge exponencialmente para o infinito, x(t ) = et x(0) . Portanto, este problema está mal formulado, o índice de desempenho não faz sentido em termos reais, pois ele não “vê” o estado instável x(t ) . E isto vale como um preceito na definição do índice de desempenho: é necessário que ele “veja”, todas as componentes do vetor de estado que podem representar alguma “ameça” à estabilidade. E isto é obtido se: 57 (6) - O par (C1 , A) deve ser detectável. Com esta condição satisfeita, o problema LQR é dito padrão. Mas o problema tem solução em alguns casos, como veremos, se (6) não for satisfeita. Neste caso o problema é chamado estendido. 9.2 O Problema LQR padrão Seja o sistema: x = Ax + Bu , x(0) = x0 z = C1 x + D12u e suponha que o sistema satisfaz às seguintes condições: (i) ( A, B2 ) é estabilizável; (5bis) (7) (8a) ⎡0 D12 ⎤ D⊥ ] unitário, onde D = ⎢ ⎥ e D⊥ ⎣0 0 ⎦ ⎡D⎤ (8b) é o complemento ortogonal de D, isto é, tal que ⎢ ⎥ é unitário (ortogonal) ; ⎣ D⊥ ⎦ (ii) D12 tem posto de coluna cheio, com [ D12 (iii) (C1 , A) é detectável; (8c) ⎡ A − jω B2 ⎤ (iv) ⎢ tem posto de coluna cheio para todo ω . (8d) D12 ⎥⎦ ⎣ C1 A primeira condição acima é necessaria para que o problema tenha solução; a segunda é feita para simplificação da notação que se segue; a terceira, como já foi mencionado, é dispensada no problema estendido, ela deixa claro que a solução do problema vai levar a uma lei de controle que estabiliza o sistema; efetivamente a 1ª. e 3ª. condições garantem que a estabilidade da relação saída/entrada implica a estabilidade interna, ou seja, u ∈ L2 e z ∈ L2 implicam x ∈ L2 . Lema (9) No sistema dado por (5bis) e (7), se u , z ∈ L2 [0, ∞) e se (C1 , A) é detectável, então x ∈ L2 [0, ∞) . Alem disso, x → 0 se t → ∞ . Prova: Como (C1 , A) é detectável, existe L tal que A + LC1 é estável. Seja x̂ a estimação do estado x através do observador: xˆ = ( A + LC1 ) xˆ + ( LD12 + B2 )u − Lz . Donde que xˆ ∈ L2 [0, ∞) , visto que z e u estão em L2 [0, ∞) . Defina-se agora o erro de estimação e = x − xˆ . Donde, e = ( A + LC1 )e , portanto e ∈ L2 [0, ∞) . Donde que x = xˆ + e ∈ L2 [0, ∞) . Mas e → 0 se t → ∞ , em vista da expressão de e . Donde finalmente x → 0 se t → ∞ em vista do fato que xˆ ∈ L2 [0, ∞) . • 58 Antes de enunciar o próximo teorema, definamos: T F = −( B2 X + D12 C1 ) , onde X é a solução da eq. de Riccati ( A − B2 D12T C1 )T X + X ( A − B2 D12T C1 ) − XB2 B2T X + C1T D⊥ D⊥T C1 = 0 , Definam-se AF = A + B2 F , CF = C1 + D12 F e ⎡A Gc ( s ) = ⎢ F ⎣C F I⎤ 0 ⎥⎦ Teorema: Existe um controle ótimo único para o problema LQR definido acima, a saber, u = Fx . Alem disso, min u∈L2 [0, ∞ ) z 2 = Gc x0 2 . (10) Prova: ZDG, pp. 378ss. 9.3 O problema LQR estendido Neste problema, não há hipótese quanto à detectabilidade de (C1, A) . Nosso problema é então, repetindo a formulação do problema anterior x = Ax + Bu , x (0) = x0 , z = C1 x + D12u , com as seguintes hipóteses - ( A, B2 ) é estabilizável; - D12 tem posto de coluna cheio com [ D12 D⊥ ] unitario; (5ter) (7bis) (8a, bis ) (8b, bis) ⎡ A − jω B2 ⎤ - ⎢ tem posto de coluna cheio para todo ω . (8d, bis). D12 ⎥⎦ ⎣ C1 Nosso problema, tal como no caso anterior, é achar uma lei de controle u ∈ L2 [0, ∞) tal que o sistema seja internamente estável , isto é, x ∈ L2 [0, ∞) e o índice de desempenho z 2 seja minimizado. E obtemos um teorema com o mesmo enunciado do anterior: Teorema: Existe um controle ótimo único para o problema LQR definido acima, a saber, u = Fx . Alem disso, min u∈L2 [0, ∞ ) z 2 = Gc x0 2 . (11) Prova: ZDG, pp. 381. 59 9.4 O problema H 2 padrão (outra versão) Vamos considerar o problema padrão sob nova ótica. O problema desta seção é dado pelo seguinte diagrama de blocos z w G y u K Figura 34 ter onde ⎡A ⎢ G ( s ) = ⎢ C1 ⎢⎣C2 B1 0 D21 B2 ⎤ ⎥ D12 ⎥ 0 ⎥⎦ Observe-se que D22 = 0, donde que G22 ( s ) é estritamente própria. São feitas as seguintes hipóteses: (i) ( A, B2 ) é estabilizável e (C2 , A) é detectável; (ii) D12 tem posto de coluna cheio com [ D12 D⊥ ] unitário e D21 tem posto de linha ⎡D ⎤ cheio com ⎢ 21 ⎥ unitário; ⎣ D⊥ ⎦ ⎡ A − jω B2 ⎤ tem posto de colunas cheio para todo ω ; (iii) ⎢ D12 ⎥⎦ ⎣ C1 ⎡ A − jω B1 ⎤ tem posto de linhas cheio para todo ω . (iv) ⎢ D21 ⎥⎦ ⎣ C2 O Problema H 2 : Achar um controlador real, racional e próprio K que estabilize internamente G e minimize a norma H 2 da matriz de transferência entre w e z, Tzw . Definamos as seguintes matrizes: T F2 := −( B2T X 2 + D12T C1 ), L2 := −(Y2C2T + B1D21 ), AF2 := A + B2 F2 , C1F2 := C1 + D12 F2 , AL2 := A + L2C2 , B1L2 := B1 + L2 D21 , Aˆ 2 := A + B2 F2 + L2C2 e as seguintes matrizes de transferência 60 ⎡ AF Gc ( s) = ⎢ 2 ⎢C1F 2 ⎣ I⎤ ⎥, 0⎥ ⎦ ⎡ AL B1L2 ⎤ ⎢⎣ I 0 ⎥⎦ G f ( s) = ⎢ ⎥ 2 Teorema: Existe um único controlador ótimo (12) ⎡ˆ ⎤ K opt (s) = ⎢ A2 − L2 ⎥ . ⎢⎣ F2 0 ⎥⎦ Alem disso, min Tzw 2 2 = Gc B1 2 + F2G f 2 2 2 • 2 = Gc L2 2 + C1G f 2 . 2 Este controlador tem a propriedade da separação, que será estudada mais adiante. Para melhor compararmos este resultado com aqueles em H ∞ , que estudaremos adiante, vejamos agora os controladores subótimos no H 2 . São chamados “subótimos”, porque, como já veremos no próximo teorema, procura-se um índice de desempenho cujo valor seja inferior a um número escolhido, “pequeno”. Recorda-se neste ponto que um controlador “admissível” é aquele que estabiliza o SMF e é próprio. Teorema (13) A família de todos os controladores admissíveis tais que Tzw 2 < γ é igual ao conjunto de todas as matrizes de transferência de y para u no seguinte diagrama de blocos u M2 y Q Figura 49 com ⎡ A ˆ ⎢ 2 M 2 ( s) = ⎢ F2 ⎢ −C ⎢⎣ 2 − L2 B2 ⎤ ⎥ I ⎥ 0 I 0 ⎥⎥ ⎦ 61 onde Q ∈ RH 2 , ( Q 2 < γ 2 − Gc B1 2 + F2G f 2 2 2 2 ). • Como se vê, os controladores sub-ótimos são parametrizados por uma LFT independente de γ com um “parâmetro” livre Q. Com Q = 0, nós obtemos K opt do teorema anterior. É digno de nota que a parametrização deste teorema dá Tzw afim em Q e nos dá uma parametrização a la Youla. (Na parametrização de Youla, ao invés de Q ∈RH ∞ ). Q∈ RH 2 , temos 10º. Capítulo: Controle H ∞ - o caso simples Neste capitulo estudaremos o ótimo e o sub-ótimo controle com norma em Enfatizaremos o problema sub-ótimo e daremos a razão para isto. H∞. 10.1 A formulação do problema Considere-se de novo o diagram de blocos padrão: z w G y u K Figura 34 bis bis No diagrama de blocos acima, tanto G como K têm as matrizes de transferência reais, racionais e próprias. As realizações das duas serão supostas estabilizáveis e detectáveis. É claro que a estabilidade é uma propriedade fundamental de qualquer sistema que faça sentido do ponto de vista prático, eis porque o controlador será suposto admissível. Problema do Controle Ótimo no H∞: Achar todos os controladores admissíveis K ( s) tais que Tzw ∞ é minimizado. Há que se notar que a solução do problema acima, no caso de sistemas MIMO, não é, em geral, única. Alem disso, achar tal (tais) controlador(es) é tanto teoricamente como numericamente complicado. Eis porque é mais importante do ponto de vista prático a solução do 62 Problema do Controle sub – ótimo no H∞: Dado γ > 0 , achar todos os controladores admissíveis K ( s) , se existir algum, tais que Tzw ∞ < γ . 10.2 Controle com realimentação da resposta Suponha que K seja um controlador estabilizador para a planta G. Então a a establidade interna garante que Tzw = Y l ( G, K ) ∈ RH ∞ , mas a recíproca não é verdadeira, ou seja, a última condição não implica estabilidade interna. O lema seguinte provê condições (brandas) para a equivalência entre estabilidade interna e Tzw = Y l ( G , K ) ∈ RH ∞ . Para estabelecer o resultado, suporemos que a planta e o controlador sejam estabilizáveis e detectáveis com as seguintes realizações ⎡A G ( s) = ⎢⎢ C1 ⎢⎣C2 B1 B2 ⎤ ⎡ Aˆ Bˆ ⎤ ⎥ D11 D12 ⎥⎥ , K ( s) = ⎢ ˆ Dˆ ⎥ ⎢ C ⎣ ⎦ D21 D22 ⎥⎦ Lema: (1) Suponha que as realizações de G e K sejam ambas estabilizáveis e detectáveis. Então o SMF com Tzw = Y l ( G , K ) é ⎡ A − λ I B2 ⎤ (a) detectável se ⎢ tiver posto de colunas cheio para todo Re[λ ] ≥ 0 ; D12 ⎥⎦ ⎣ C1 ⎡ A − λ I B1 ⎤ (b) estabilizável se ⎢ ⎥ tiver posto de linhas cheio para todo Re[λ ] ≥ 0 . C D 2 21 ⎣ ⎦ Além disto, se (a) e (b) forem satisfeitas, então K é um controlador que estabiliza internamente o SMF se só se Tzw ∈ RH ∞ . Prova: Obtem-se através de cálculo tedioso Y l ( G, K ) ⎡ A + B DL ˆ C 2 1 2 ⎢ ⎢ ˆ C =⎢ BL 1 2 ⎢ ˆ ⎢⎣C1 + D12 L2 DC2 ˆ D ⎤ B2 L2Cˆ B1 + B2 DL 1 21 ⎥ ⎥ ˆ D Cˆ ˆ D Aˆ + BL BL 1 22 1 21 ⎥ ˆ ˆ D12 L2C D11 + D12 DL1D21 ⎥⎥ ⎦ ⎡ ⎤ =: ⎢ Ac Bc ⎥ ⎢⎣Cc Dc ⎥⎦ 63 onde L1 := ( I − D22 Dˆ ) −1 , ˆ L2 := ( I − DD 22 ) −1 . ⎡x⎤ Suponha que Y l ( G, K ) tenha um estado indetectável ⎢ ⎥ , com o respectivo modo λ ⎣ y⎦ ⎡ A − λI ⎤ ⎡ x⎤ tal que Re[λ ] ≥ 0 . Então o teste PBH nos dá: ⎢ c ⎥ ⎢ ⎥ = 0, ⎣ Cc ⎦ ⎣ y ⎦ o que, tendo em vista as expressões de Ac e Cc , nos dá ⎡ A − λI ⎢ C ⎣ 1 x ⎤ B2 ⎤ ⎡ ˆ ) + Ay ˆ −λy = 0. ˆ (C x + D Cy = 0 e BL ⎢ˆ 1 2 22 ⎥ ˆ ⎥ D12 ⎦ ⎣ DL1C2 x + L2Cy ⎦ ⎡ A − λ I B2 ⎤ tiver posto de coluna cheio, então x = 0 e Ĉy = 0 e Ora, daí vemos que se ⎢ D12 ⎥⎦ ⎣ C1 a segunda igualdade acima implica Ây = λ y . Mas como por hipótese (Cˆ , Aˆ ) é detectável, temos y = 0, levando a uma contradição, provando a parte (a). A parte (b) é demonstrada da mesma forma, ou por dualidade. • O seguinte teorema é importante para o desenvolvimento posterior. Teorema: Considere o sistema da figura abaixo: z (2) w P r v Q Figura 50 ⎡P P ⎤ com P = ⎢ 11 12 ⎥ . Suponha que P ~ P = I , P21−1 ∈RH ∞ e Q é uma matriz racional ⎣ P21 P21 ⎦ própria. Então, as seguintes afirmações são equivalentes: (a) O SMF é bem posto, internamente estável e Tzw ∞ < 1 ; (b) Q ∈ RH ∞ e Q ∞ <1. Prova: ZDG, pp. 416s. Hipóteses simplificadoras 64 Neste capitulo estamos tratando o caso mais simples do controle em H ∞ , a razão disso sendo que o caso geral é bem mais difícil do ponto de visa algébrico, pelo que, se for tratado logo, ficarão obscurecidos certos aspectos fundamentais para o aluno aplicado (e para o professor idem). A primeira simplificação é que consideramos que são nulos os elementos bloco-diagonais da matriz D, a saber, ⎡A G ( s ) = ⎢⎢ C1 ⎢⎣C2 B1 0 D21 B2 ⎤ D12 ⎥⎥ 0 ⎥⎦ E são feitas as seguintes hipóteses adicionais: (i) ( A, B1 ) é estabilizável e (C1 , A) é detectável; (ii) ( A, B2 ) é estabilizável e (C2 , A) é detectável; T ⎡ (iii) D12 C D12 ⎤⎦ = ⎡⎣0 I ⎤⎦ ; ⎣ 1 ⎡ B ⎤ T ⎡0⎤ (iv) ⎢ 1 ⎥ D21 =⎢ ⎥. ⎢⎣ D21 ⎥⎦ ⎣⎢ I ⎦⎥ As duas primeiras hipóteses garantem que as duas matrizes hamiltonianas, H 2 e J 2 do capitulo anterior pertencem a dom(Ric). Estas hipóteses permitem uma demonstração mais simples. Como vimos, a hipótese (ii) é necessária e suficiente para G ser internamente estabilizável. Corolário: (3) Suponha que a planta satisfaça às hipóteses (i), (iii) e (iv). Então um controlador K é admissível (isto é, estabiliza o SMF e é próprio) se só se Tzw ∈ RH ∞ . Prova: Como a planta é estabilizável e detectável de acordo com a hipótese (i), só temos que verificar as condições de posto das duas matrizes do Lema (1). Suponha que as duas condições sejam satisfeitas e seja D⊥ tal que [ D12 D⊥ ] seja uma matriz unitária (na realidade, ortogonal, pois estamos lidando com matrizes reais). Então, 0 ⎤ ⎡I ⎡ A − λ I B2 ⎤ ⎡ A − λ I B2 ⎤ ⎢ T ⎥ ⎡ D12 ⎤⎥ ⎢ Posto ⎢ ⎥ = Posto ⎢ D12 ⎦ D12 ⎥⎦ ⎣ C1 ⎢0 ⎢ DT ⎥ ⎥ ⎣ C1 ⎣ ⊥ ⎦⎦ ⎣ ⎡ A − λ I B2 ⎤ ⎢ ⎥ = Posto ⎢ ⎡ 0 ⎤ ⎡ I ⎤ ⎥ . ⎢ ⎢ D⊥T C1 ⎥ ⎢0 ⎥ ⎥ ⎦ ⎣ ⎦⎦ ⎣⎣ 65 ⎡ A − λI ⎣ C1 B2 ⎤ tem posto cheio para todo Re[λ ] ≥ 0 se só se D12 ⎥⎦ Consequentemente, ⎢ ⎡ A − λI ⎤ ⎢ T ⎥ tiver posto cheio para todo Re[λ ] ≥ 0 . ⎣ D⊥ C1 ⎦ Mas esta matriz tem posto cheio para todo Re[λ ] ≥ 0 se só se ( D⊥T C1 , A) for detectável.. T Mas visto que D⊥ ( D⊥T C1 ) = ( I − D12 D12 C1 ) = C1 , segue-se que ( D⊥T C1, A) é detectável se só se (C1 , A) o for. E a condição de posto para a outra matriz • vem por dualidade. Controladores H ∞ sub-ótimos { Definamos γ opt = min Tzw ∞ : K ( s ) é admissivel} . Em um controlador sub-ótimo, γ > γ opt . H ∞ são mais difíceis de caracterizar do que os sub-ótimos, e esta é uma grande diferença com relação aos controladores no H 2 . Recorde-se que esta Os controladores ótimos no dificuldade apareceu tembém no calculo da norma. A solução do problema desta subseção involverá o uso das seguintes matrizes hamiltonianas: ⎡ A ⎡ AT γ −2 B1B1T − B2 B2T ⎤ H ∞ := ⎢ T ⎥ e J ∞ := ⎢ T − AT ⎣ − B1B1 ⎣ −C1 C1 ⎦ Teorema Existe um controlador admissível tal que Tzw ∞ <γ γ −2C1T C1 − C2T C2 ⎤ −A ⎥. ⎦ (4) se só se as três seguintes condições forem satisfeitas: (i) H ∞ ∈ dom( Ric) e X ∞ := Ric( H ∞ ) ≥ 0 ; (ii) J ∞ ∈ dom( Ric) e Y∞ := Ric( J ∞ ) ≥ 0 ; (iii) ρ ( X ∞Y∞ ) < γ 2 , lembrando que ρ (⋅) denota o raio spectral de uma matriz. Alem disso, se estas condições forem satisfeitas, um controlador que resolve o problema é ⎡ Aˆ K sub ( s) = ⎢ ∞ ⎢⎣ F∞ − Z ∞ L∞ ⎤ ⎥ 0 ⎥⎦ com Aˆ∞ := A + γ −2 B1B1T X ∞ + B2 F∞ + Z ∞ L∞C2 , F∞ := − B2T X ∞ , L∞ := −Y∞C2T e Z ∞ := ( I − γ −2Y∞ X ∞ ) −1 . • 66 O teorema seguinte parametriza todos os controladores que obtêm uma norma sub-ótima menor que γ . (5) Teorema Se as condições (i)-(iii) do teorema anterior forem satisfeitas, o conjunto de todos os controladores admissíveis tais que Tzw ∞ < γ é igual ao conjunto de todas as matrizes de transferência de y para u em u M∞ y Q Figura 51 onde ⎡ Aˆ∞ ⎢ M ∞ ( s ) = ⎢ F∞ ⎢ −C ⎣ 2 − Z ∞ L∞ 0 I com Q ∈ RH ∞ , Q ∞ Tal como no problema Z ∞ B2 ⎤ ⎥ I ⎥ 0 ⎥⎦ <γ . • H 2 , os controladores sub-ótimos são parametrizados por uma LFT com um parâmetro livre Q. Com Q = 0 (no “centro” do conjunto Q ∞ < γ ), recuperamos o controlador central K sub ( s ) . 10.3 Controle com informação completa (FI) (Como vimos, FI significa “full information”) Nosso diagrama de blocos desta seção é o padrão: 67 z w G y u K Figura 34, 5ª. com ⎡ ⎤ ⎢ ⎥ B1 B2 ⎥ ⎢ A G ( s ) = ⎢ C1 0 D12 ⎥ ⎢ ⎥ ⎢ ⎡ I ⎤ ⎡0⎤ ⎡0⎤ ⎥ ⎢ ⎢0 ⎥ ⎢ I ⎥ ⎢0⎥ ⎥ ⎣⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎦ Este problema não é, estritamente falando, um caso particular do problema do controle pela resposta, porque não satisfaz as hipóteses do mesmo. Em particular, no problema FI (bem como no FC na próxima seção), a estabilidade interna não é equivalente a ⎡ A − λI Tzw ∈ RH ∞ visto que ⎢⎢ ⎡ I ⎤ ⎢⎣ ⎢⎣ 0 ⎥⎦ B1 ⎤ ⎥ ⎡ 0 ⎤ ⎥ nunca pode ter posto de linha cheio. Lembramos ⎢I ⎥⎥ ⎣ ⎦⎦ que no problema FI, K admissível significa estabilidade interna e não somente Tzw ∈ RH ∞ . As hipóteses relevantes para o problema do FI são: (i) (C1 , A) é detectável; (ii) ( A, B2 ) é estabilizável; T (iii) D12 [C1 D12 ] = [ 0 I ] . Teorema: Existe um controlador admissível K ( s ) para o problema FI tal que Tzw ∞ (6) < γ se só se H ∞ ∈ dom( Ric) e X ∞ = Ric( H ∞ ) ≥ 0 . Alem disto, se estas condições forem satisfeitas, uma classe de controladores admissíveis que satisfazem a Tzw ∞ < γ pode ser parametrizada como K ( s ) = ⎡⎣ F∞ − γ −2Q ( s ) B1T X ∞ Q ( s ) ⎤⎦ , (7) 68 com Q ∈ RH ∞ , Q ∞ <γ . • Prova: ZDG, pp. 426-428. Comparando a solução do problema em H∞ com o problema em H 2 , verifica-se que uma diferença fundamental entre os dois é que o primeiro depende do distúrbio através de B1 , o que não é o caso do segundo. O teorema seguinte dá todos os controladores de FI. Teorema (8) Suponha que as condições do teorema anterior sejam satisfeitas. Então o conjunto de todos os controladores satisfazendo a Tzw ∞ < γ pode ser parametrizado por Y l ( M FI , Q ) , onde u y M FI Q Figura 52 ⎡ ⎢ ⎢ A + B2 F∞ M FI ( s) = ⎢ 0 ⎢ ⎢ ⎡− I ⎤ ⎢ ⎢ ⎥ ⎣⎢ ⎣ 0 ⎦ onde Q = [Q1 ⎡⎣0 B1 ⎤⎦ ⎡⎣ F∞ 0 ⎤⎦ I ⎡ ⎢ −2 T ⎣γ B1 X ∞ Q2 ] ∈ RH ∞ , Q2 ∞ 0⎤ I ⎥⎦ ⎤ B2 ⎥⎥ I ⎥ ⎥ ⎥ 0⎥ ⎥⎦ <γ . Prova: ZDG, pp. 427s. • Observação: (9) É fácil verificar que com Q1 = 0 , temos K = ⎡⎣ F∞ − γ −2Q2 B1T X ∞ parametrização do teorema anterior. Q2 ⎤⎦ , que é a 69 10.4 Controle total (FC = “full control”) Este problema é dual do anterior; isto pode ser visto tanto comparando as matrizes G(s), a seguir, como as hipóteses que se seguem. ⎡A ⎢ G ( s) = ⎢ C1 ⎢C2 ⎣ B1 0 D21 ⎡⎣ I 0⎤⎦ ⎤ ⎥ ⎡⎣0 I ⎤⎦ ⎥ ⎡⎣0 0⎤⎦ ⎥⎦ As hipóteses tb. são duais: (i) ( A, B1 ) é estabilizável; (ii) (C2 , A) é detectável; ⎡ B1 ⎤ T ⎡0 ⎤ ⎥ D21 = ⎢ I ⎥ . ⎣ ⎦ ⎣ D21 ⎦ (iv) ⎢ Teorema Existe um controlador admissível K ( s) para o problema FC tal que Tzw ∞ (10) < γ se só se J ∞ ∈ dom( Ric) e Y∞ = Ric( J ∞ ) ≥ 0 . Se estas condições forem satisfeitas, uma classe de controladores admissíveis satisfazendo a Tzw ∞ < γ pode ser parametrizada por ⎡ L∞ − γ −2Y∞C1T Q( s ) ⎤ K ( s) = ⎢ ⎥ , onde Q ∈ RH ∞ , Q Q ( s ) ⎣ ⎦ ∞ <γ . 10.5 Controle com “Disturbance feedforward” (DF) Teorema Existe um controlador admissível K ( s) para o problema DF tal que Tzw ∞ (11) < γ se só se H ∞ ∈ dom( Ric)∞ e X ∞ ∈ dom( Ric) ≥ 0 . Se estas condições forem satisfeitas, todos os controladores admissíveis satisfazendo a Tzw ∞ < γ pode ser parametrizada por um conjunto de matrizes de transferencia de y para u, com 70 u y M∞ Q Figura 53 ⎡ A + B2 F∞ − B1C2 M ∞ ( s) = ⎢⎢ F∞ ⎢⎣ −C2 − γ −2 B1T X ∞ Q ∈ RH ∞ , Q ∞ B1 B2 ⎤ 0 I ⎥⎥ I 0 ⎥⎦ <γ . Prova: ZDG, pp. 432s 10.7 Controle com estimação da resposta (“output estimation = OE) ⎡A ⎢ G ( s) = ⎢ C1 ⎢C2 ⎣ B1 B2 ⎤ ⎥ 0 I ⎥ D21 0 ⎥⎦ O problema é dual do DF. As hipóteses são: (i) ( A, B1 ) é estabilizável e A − B2C1 é estável; (ii) (C2 , A) é detectável; ⎡ B1 ⎤ T ⎡0 ⎤ ⎥ D21 = ⎢ I ⎥ . D ⎣ ⎦ ⎣ 21 ⎦ (iv) ⎢ Teorema Existe um controlador admissível K ( s) para o problema OE tal que Tzw (12) ∞ < γ se só se J ∞ ∈ dom( Ric) e Ric( J ∞ ) ≥ 0 . Se estas condições forem satisfeitas, todos os controladores admissíveis satisfazendo a Tzw ∞ < γ pode ser parametrizada por um conjunto de matrizes de transferencia de y para u, com 71 u y M∞ Q Figura 53 bis ⎡ A + L∞C2 − B2C1 ⎢ M ∞ (s) = ⎢ C1 ⎢ C2 ⎣ com Q ∈ RH ∞ , Q ∞ L∞ − B2 − γ −2Y∞C1T ⎤ I 0 0 I ⎥ ⎥ ⎥ ⎦ <γ . • 11º. Capítulo: Controle H ∞ - o caso geral. Consideremos novamente, repetido agora pela 5ª. vez, o diagrama de blocos z w G y u K Figura 34, 6ª. onde G e K são supostas, como usulamente, reais, isto é, com coeficientes reais, racionais e próprias, sendo que K torna o SMF estável, portanto K é admissível. A planta é dada por 72 ⎡A ⎡A B⎤ ⎢ G ( s) = ⎢ ⎥ = ⎢ C1 ⎣C D ⎦ ⎢C ⎣ 2 B1 B2 ⎤ ⎥ D11 D12 ⎥ D21 0 ⎥⎦ São feitas as seguintes hipóteses: (A1) ( A, B2 ) é estabilizável e (C2 , A) é detectável ; (A2) ⎡0⎤ D12 = ⎢ ⎥ e D21 = [ 0 I ] ; I ⎣ ⎦ ⎡ A − jω I (A3) ⎢ ⎢⎣ C1 ⎡ A − jω I (A4) ⎢ ⎣⎢ C2 B2 ⎤ tem posto de colunas cheio para todo ω ; D12 ⎥⎥⎦ B1 ⎤ D21 ⎥⎦⎥ tem posto de linhas cheio para todo ω. As matrizes identidade que aparecem na hipótese (A2) parecem muito restritivas mas não são: basta usar unidades convenientes para w, u, z e y. Para enunciar o teorema, precisamos das seguintes definições: ⎡D ⎤ D12 ] , D•1 := ⎢ 11 ⎥ , ⎣ D21 ⎦ ⎡γ 2 I m 0 ⎤ ⎡γ 2 I p 0 ⎤ T T 1 1 R := D1• D1• − ⎢ ⎥ , R := D•1D•1 − ⎢ ⎥, 0 ⎥⎦ 0 ⎥⎦ ⎢⎣ 0 ⎢⎣ 0 onde m1 é a dimensão de w e p1 é a dimensão de z, 0 ⎤ ⎡ B ⎤ −1 T ⎡ A H ∞ := ⎢ T − ⎢ T ⎥ R ⎡⎣ D•1C1 BT ⎤⎦ , T⎥ ⎣ −C1 C1 − A ⎦ ⎣ −C1 D1• ⎦ D1• := [ D11 ⎡ AT J ∞ := ⎢ T ⎣⎢ − B1B1 0 ⎤ ⎡ C T ⎤ −1 R ⎡⎣ D•1B1T C ⎤⎦ , ⎥−⎢ T ⎥ − A⎦⎥ ⎣⎢ − B1D•1 ⎦⎥ X ∞ := Ric( H ∞ ) , Y∞ := Ric( J ∞ ) , ⎡F ⎤ F = ⎢ 1∞ ⎥ := − R −1 ( D1T•C1 + BT X ∞ ) , ⎣ F2 ∞ ⎦ L := [ L1∞ L2 ∞ ] := − ( B1D•T1 + Y∞C T ) R −1 . Fazemos as seguintes partições: ⎡ F11∞ ⎤ F = ⎢⎢ F12 ∞ ⎥⎥ , L = [ L11∞ ⎢⎣ F2 ∞ ⎥⎦ L12 ∞ ⎡ D1111 L2 ∞ ] , D = ⎢⎢ D1121 ⎢⎣ 0 D1112 D1122 I 0⎤ I ⎥⎥ . 0 ⎥⎦ 73 Observe-se que na partição acima algumas matrizes podem não existir, dependendo de D12 e D21 serem matrizes quadradas, ou não. Teorema: Suponha que G satisfaça às condições (A1)-(A4) acima. (a) Existe um controlador admissível K(s) tal que Y l ( G , K ) se só se ( (1) ∞ < γ (isto é, Tzw ∞ <γ ) ) (i) γ > max σ [ D1111 T T ⎤⎦ ; D1112 ] ,σ ⎡⎣ D1111 D1121 (ii) H ∞ ∈ dom( Ric) , com X ∞ = Ric( H ∞ ) ≥ 0 ; (iii) J ∞ ∈ dom( Ric) , com Y∞ = Ric( J ∞ ) ≥ 0 ; (iv) ρ ( X ∞Y∞ ) < γ 2 . (b) Se as condições acima forem satisfeitas, então todos os controladores estabilizadores K(s) tais que Y l ( G, K ) < γ são dados por ∞ K ( s) = Y l ( M ∞ , Q ) , com Q ∈ RH ∞ , Q ∞ < γ , de resto arbitrário e M∞ ⎡ Aˆ ⎢ = ⎢ Cˆ1 ⎢ ⎢Cˆ 2 ⎣ Bˆ1 Dˆ 11 Bˆ2 ⎤ ⎥ Dˆ ⎥ Dˆ 21 0 ⎥ 12 ⎥ ⎦ T T (γ 2 I − D1111 D1111 ) −1 D1112 − D1122 , com Dˆ 11 = − D1121 D1111 Dˆ 12 e Dˆ 21 são quaisquer matrizes que satisfaçam a T T T (γ 2 I − D1111 D1111 ) −1 D1112 . Dˆ 12 Dˆ 12T =I − D1121 (γ 2 I − D1111 D1111 ) −1 e Dˆ 21T Dˆ 21 = I − D1112 Temos ainda: Z ∞ = ( I − γ −2Y∞ X ∞ ) −1 , Bˆ 2 = Z ∞ ( B2 + L12 ∞ ) Dˆ12 , Cˆ 2 = − Dˆ 21 (C2 + F12 ∞ ) , Bˆ1 = − Z ∞ L2 ∞ + Bˆ 2 Dˆ12−1Dˆ11 , Cˆ1 = F2 ∞ + Dˆ11Dˆ 21−1Cˆ 2 , Aˆ = A + BF + Bˆ1Dˆ 21−1Cˆ 2 . • Vejamos alguns casos especiais: Caso 1: D12 = I - A parte (a) se torna γ > σ ( D1121 ) ; T T ˆ T Dˆ = I . = I − γ −2 D1121 D1121 e D - Na parte (b): D̂11 = − D1112 , Dˆ12 Dˆ12 21 21 Caso 2: D21 = I - Na parte (a), (i) se torna γ > σ ( D1112 ) , T T ˆ T - Na parte (b), obtemos D̂11 = − D1122 , Dˆ12 Dˆ12 = I e Dˆ 21 D21 = I − γ −2 D1112 D1112 . Caso 3: D12 = I & D21 = I 74 - Na parte (a), (i) é cancelado; T T ˆ - Na parte (b), obtemos D̂11 = − D1122 , D12 Dˆ12 = I , Dˆ 21 D21 = I . 12º. Capítulo: “Loop shaping” com H∞ O título do capítulo segue o do livro, mas não estudaremos com profundidade que seria desejável este topico, “loop shaping”, muito utilizado na prática. A técnica proposta usa somente os conceitos básicos de “loop shaping” e a partir disso é obtido um controlador. 12.1 Estabilização robusta com fatores coprimos Seja uma planta perturbada a partir do modelo nominal: P∆ = ( M + ∆ M ) −1 ( N + ∆ N ) , com M , N , ∆ M , ∆ N ∈ RH ∞ e ⎡⎣ ∆ N ∆ M ⎤⎦ < ε . ∞ Abaixo o diagrama de blocos do SMF com a planta perturbada _ ∆M ∆N z1 z2 w r K N M −1 y _ Figura 54 A planta nominal é uma fatoração c.e. P = M −1 N e K estabiliza a planta nominal. Vimos em capítulo anterior que o SMF é robustamente estável se só se (por aplicação do teorema do pequeno ganho) ⎡K ⎤ −1 −1 ⎢ I ⎥ ( I + PK ) M ⎣ ⎦ ≤ 1/ ε ∞ Suponha que a planta tenha uma realização que seja estabilizável e detectável: ⎡A B⎤ ⎥ ⎣C D ⎦ P=⎢ 75 Seja uma matriz L tal que A + LC é estável. Então uma fatoração c.e. de P é dada por ⎡N ⎣ ⎡ A + LC M ⎤⎦ = ⎢ ⎣ C B + LD L ⎤ D I ⎥⎦ Definamos K̂ = − K . Então o SMF pode ser descrito por uma LFT na forma da figura 55, com a planta generalizada B ⎤ ⎡ A −L ⎡⎡ 0 ⎤ ⎡ I ⎤⎤ ⎢ ⎥ ⎢ ⎢ −1 ⎥ ⎢ ⎥ ⎥ ⎢ ⎡ 0 ⎤ ⎡0 ⎤ ⎡ I ⎤ ⎥ G ( s) = ⎢ ⎢⎣ M ⎥⎦ ⎣ P ⎦ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎣C ⎦ ⎣ I ⎦ ⎣ D ⎦ ⎥ −1 P ⎥⎦ ⎣⎢ M I D ⎥⎦ ⎢⎣ C ⎡A =: ⎢⎢ C1 ⎢⎣C2 B1 B2 ⎤ D11 D12 ⎥⎥ D21 D22 ⎥⎦ z1 w z2 M −1 N y u K̂ Figura 55 Para aplicar as fórmulas do capítulo anterior, são necessárias algumas manipulações algébricas, dadas em ZDG, pp. 479s. Obtemos: Teorema: (1) Suponha que D = 0 e seja L definido antes. Então existe um controlador K tal que ⎡K ⎤ −1 ⎢ I ⎥ ( I + PK ) ⎣ ⎦ < γ se só se γ > 1 e existe uma solução X ∞ > 0 da seguinte ∞ equação de Riccati: T ⎛ T ⎛ LC ⎞ ⎛ LC ⎞ LLT ⎞ γ 2C T C X ∞ ⎜ A − 2 ⎟ + ⎜ A − 2 ⎟ X ∞ − X ∞ ⎜ BB − 2 ⎟ X ∞ + 2 = 0. γ −1 ⎠ ⎝ γ −1⎠ γ −1⎠ γ −1 ⎝ ⎝ 76 Além disso, um controlador “central” é dado por: ⎡ A − BBT X ∞ + LC K =⎢ −B X ∞ T ⎣ L⎤ ⎥ 0⎦ • 12.2 “Loop shaping” usando estabilização coprima normalizada Vamos tratar agora do problema enunciado no título deste capítulo: projeto (síntese) com loop shaping e H ∞ . Considere o diagrama de blocos da figura 56: d di r K P y u _ n Figura 56 Recorda-se que bom desempenho do SMF exige que os seguintes números sejam “pequenos” na faixa de frequências de interesse: σ (( I + PK )-1 ), σ (( I + PK )-1 P), σ (( I + KP)-1 ) e σ ( K ( I + PK )-1 ). (2) E, por outro lado, boa robustez exige que os seguintes sejam “pequenos” nas altas frequências: (3) σ ( PK ( I + PK )-1 ) e σ ( KP( I + KP)-1 ). Estas condições, como vimos, são equivalentes a que, na faixa de frequências de interesse, tenhamos: σ ( PK ) 1, σ ( KP) 1 e σ ( K ) 1, nas frequências baixas, e σ ( PK ) 1, σ ( KP) 1 e σ (K ) M , nas freqüências altas, onde M não pode ser muito grande. Procedimento para o projeto por loop shaping (1) Usando um pré-compensador W1 e / ou um pós-compensador W2 , os valores singulares desejados da malha aberta são obtidos. (Ver a primeira da figura 57). A planta com as funções W1 e W2 formam uma nova “planta” Ps , isto é, Ps = W2 PW1 . Supomos que W1 e W2 são tais que Ps não contenha modos escondidos, ou seja, não há cancelamento no produto. (Ver depois da figura o significado de K ∞ ). 77 W1 K∞ W2 P W1 P W2 W1 P _ W2 K∞ _ Figura 57 (2) Estabilização robusta: a) Seja uma fatoração c.e. normalizada Calcular ε max dado por: −1 Ps = M N s s , e portanto, M s M s~ +N s N s~ = I −1 ⎛ ⎞ 2 ⎡I ⎤ −1 −1 ⎡ ⎤ = + ε max = ⎜ inf ( ) 1 − N M <1 . I P K M ⎟ s⎦ s s ⎣ s ⎜ K estabilizador ⎢⎣ K ⎥⎦ ⎟ H ∞⎠ ⎝ Se ε max 1 , voltar a (1) e ajustar W1 e W2 . b) Selecionar ε ≤ ε max e calcular um controlador K ∞ que satisfaça a ⎡ I ⎤ −1 −1 ⎢ K ⎥ ( I + Ps K ∞ ) M s ⎣ ∞⎦ ≤ 1/ ε . ∞ (3) O controlador final K é então construído combinando o controlador K ∞ com os “pesos” W1 e W2 , conforme a 3ª. da figura 56: K = W1 K ∞W2 . Observação: (4) O objetivo acima pode ser visto de outra forma, como um problema padrão em H ∞ . Com efeito, temos as seguintes igualdades: 78 ⎡ I ⎤ −1 −1 ⎢ K ⎥ ( I + Ps K ∞ ) M s = ⎣ ∞⎦ ∞ ⎡ W2 ⎤ = ⎢ −1 ⎥ ( I + PK ) −1 ⎣⎡W2−1 ⎣W1 K ⎦ ⎡W ⎤ −1 ⎥ ( I + KP) ⎡⎣W1 ⎣W2 P ⎦ = ⎢ −1 1 ⎡ I ⎤ −1 ⎢ K ⎥ ( I + Ps K ∞ ) [ I Ps ] ⎣ ∞⎦ ∞ ⎡I ⎤ PW1 ⎦⎤ = ⎢ ⎥ ( I + K ∞ Ps ) −1 [ I ⎣ Ps ⎦ ∞ K∞ ] ∞ PW2−1 ⎤⎦ . ∞ A partir disso, temos a seguinte formulação do problema, indicado na figura 58: ⎡ z1 ⎤ ⎡ W2 ⎤ −1 −1 ⎢ z ⎥ = ⎢W −1K ⎥ ( I + PK ) ⎣⎡W2 ⎣ 2⎦ ⎣ 1 ⎦ z2 ⎡w ⎤ PW1 ⎦⎤ ⎢ 1 ⎥ . ⎣ w2 ⎦ w2 W1−1 w1 W1 K W2 P z1 W2−1 _ Figura 58 12.3 Justificação teórica para loop shaping com H ∞ Trata-se de justificar o uso do parâmetro ε como um indicador para o projeto. Pode-se provar que ε é um bom indicador tanto para a estabilidade robusta do SMF e para o sucesso do projeto ao se alcançar as especificações desejadas no loop shaping. Examinaremos primeiramente a possibilidade de deterioração do loop shaping em projetos de alto ganho (tipicamente, de frequências baixas). Esta deterioração pode ser medida comparando σ ( PW1 K ∞W2 ) com σ ( Ps ) = σ (W2 PW1 ) . Agora, note-se que σ ( PK ) = σ ( PW1K ∞W2 ) = σ (W2−1W2 PW1K ∞W2 ) ≥ σ (W2 PW1 )σ ( K ∞ ) , κ (W2 ) (5) onde κ (⋅) , como vimos, é o número condicionante. De modo semelhante, para deterioração da loop shaping na entrada da planta, temos −1 σ ( KP) = σ (W1K ∞W2 P) = σ (W1K ∞W2 PWW 1 1 )≥ σ (W2 PW1 )σ ( K ∞ ) . κ (W1 ) (6) 79 Observe-se que tanto κ (W1 ) como κ (W2 ) são escolhidos pelo projetista. A seguir, notando-se que Ps designa a planta “shaped” e que K ∞ estabiliza robustamente a fatoração normalizada de Ps com margem de estabilidade ε , temos ⎡ I ⎤ −1 −1 (7) ≤ ε −1 := γ , ⎢ K ⎥ ( I + Ps K ∞ ) M s ⎣ ∞⎦ ∞ onde M s é o denominador da fatoração normalizada de Ps e o parâmetro γ é introduzido para simplificar a notação no que se segue. O resultado seguinte mostra que σ ( K ∞ ) é limitado por funções de ε e de σ ( Ps ) . Teorema (8) Qualquer controlador satisfazendo a (7), onde se supõe que Ps seja uma matriz quadrada, σ ( Ps ( jω )) − γ 2 − 1 também satisfaz a σ ( K ∞ ( jω )) ≥ para todo ω tal que Além disso, se igual a 1/ γ 2 − 1σ ( Ps ( jω )) + 1 σ ( Ps ( jω )) > γ 2 − 1 . σ ( Ps ( jω )) γ 2 −1 , então σ ( K ∞ ( jω )) é assintoticamente maior ou γ 2 −1 quando σ ( Ps ) → ∞ • Prova: ZDG, pp. 490-492. A implicação mais importante deste teorema é que o limite em σ ( K ∞ ) depende somente da loop shape escolhida e da margem de estabilidade da planta “shaped”. A seguir temos: Teorema Qualquer controlador K ∞ que satisfaça a (7) também satisfaz a σ ( K ∞ ( jω )) ≤ γ 2 − 1 + σ ( Ps ( jω )) 1 − γ 2 − 1σ ( Ps ( jω )) para todo ω tal que σ ( Ps ( jω )) < Além disso, se σ ( Ps ( jω )) igual a (9) 1 γ 2 −1 1 γ 2 −1 . , então σ ( K ∞ ( jω )) é assintoticamente menor ou γ 2 − 1 quando σ ( Ps ) → 0 . Prova: ZDG, pp. 492s. • 80 Os resultados destes dois teoremas confirmam que γ (ou alternativamente ε ) indicam a compatibilidade entre a “loop shape” especificada e as especificações de estabilidade do SMF. 81